「特定保健指導を3年やってきたが、本当に効果があったのかわからない」——健康保険組合の担当者からよく聞く言葉です。指導を受けた被保険者のBMIや腹囲が翌年どう変化したかは追えるものの、「指導があったから改善した」のか「もともと改善しやすい人が指導を受けただけ」なのか、判然としないのが実情です。
この記事では、特定保健指導の効果検証に必要な統計解析の考え方と、実務で使われる主な手法、そして健保・健診施設の担当者が陥りがちな落とし穴を解説します。
なぜ特定保健指導の効果検証は難しいのか
1. 選択バイアスの問題
特定保健指導の対象者は、メタボリックシンドロームの基準を満たした人です。このグループは健診を受けていること自体、健康意識が高い傾向があります。また、指導を受けた人の中でも「完了者」と「途中離脱者」は大きく異なります。単純に「指導完了者は翌年の腹囲が○cm減少した」と報告しても、それが指導の効果なのか、もともと自発的に改善する意欲が高い人だったからなのか、区別できません。
2. 平均への回帰
健診でメタボ基準に引っかかった人は、その年たまたま数値が悪かっただけの人も含まれます。翌年再測定すると、指導なしでも自然に改善するケースが一定数あります(平均への回帰)。これを指導の効果として計上してしまうと、実際より効果を過大評価します。
3. 追跡不能者の問題
転職・退職等で翌年の健診データが取れない人が発生します。こうした「追跡不能者」の特性が偏っていると(たとえば指導効果があって転職した場合など)、結果が歪みます。
実務で使われる3つの効果検証手法
手法①:単純前後比較(最も基本)
指導を受けた群の、指導前後の値(腹囲・体重・血圧・HbA1c等)を比較する方法です。実施が簡単で報告書にも使いやすい一方、上述の選択バイアスや平均への回帰を補正できません。「指導受けた人の腹囲平均が○cm減った」という事実の記述には使えますが、「指導の効果で減った」という因果推論には限界があります。
適した使い方:毎年の定点観測・経年変化のモニタリング
手法②:傾向スコアマッチング(バイアス補正の定番)
指導を受けた群(介入群)と受けなかった群(対照群)で、年齢・性別・過去の検査値・BMI等の特性をマッチさせた上で効果を比較する手法です。ランダム化比較試験(RCT)が実施できない実世界データで、疑似的に「指導の有無だけが異なる集団」を作り出します。
R言語やPythonのMatchItパッケージ等で実装可能です。ただし、観察できない交絡因子(意欲・家族の協力等)は補正できないという限界があります。
適した使い方:データヘルス計画の評価報告書、学会発表、保険者交流会向け資料
手法③:差の差分析(DiD:Difference-in-Differences)
指導が強化された年・対象拡大された年等、「介入の切り替わり」がある場合に有効な手法です。指導対象群と非対象群のそれぞれの変化量の差を取ることで、指導の純粋な効果を推定します。
たとえば「指導対象者は対前年比でBMIが平均0.3減ったが、非対象者は平均0.1減にとどまった。この差0.2が指導の効果」という形で解釈します。時間変化(季節性・社会的トレンド)を除去できる点が傾向スコアマッチングより優れています。
適した使い方:プログラム変更の前後比較、委託先変更時の効果比較
効果検証で明らかにすべき3つの指標
特定保健指導の効果として、以下の3つを軸に分析することをお勧めします。
- プロセス指標:対象者把握率・初回面接実施率・終了率・積極的支援完了率。指導の「届き方」を測る。
- アウトカム指標(短期):腹囲・体重・BMI・血圧・HbA1c・中性脂肪の変化量。指導後6〜12ヶ月の値で評価する。
- アウトカム指標(中長期):メタボリックシンドローム該当者数の変化、医療費(レセプト)の変化。3〜5年スパンで評価する。
多くの健保では①と②は集計できますが、③まで到達できているケースは少数です。医療費との連結分析には健診データとレセプトデータの突合が必要で、個人ID管理の精度が問われます。
担当者がよく犯す3つの落とし穴
落とし穴①:完了者だけで効果を語る
「積極的支援完了者の腹囲が平均2.1cm減少」は事実かもしれませんが、完了者は全対象者の中でも意欲・健康意識が高い層に偏ります。「指導を受けた全対象者」ベースで分析しないと、効果を過大評価します。「Intention-to-Treat(ITT)分析」の考え方を念頭に置くことが重要です。
落とし穴②:翌年の健診未受診者を無視する
追跡不能者を「消えた人」として分析から除外すると、残った人(比較的健康な人が多い傾向)の数値で評価することになり、実際より良い結果が出ます。未受診者の割合とその属性(年齢・指導完了状況)を毎年記録しておくことが、正確な評価の前提になります。
落とし穴③:対照群なしに効果を結論づける
「指導を受けた人の体重が翌年平均1.2kg減少した」だけでは、指導の効果かどうか判断できません。同時期に指導を受けなかった被保険者はどう変化したか? 社会全体の健康意識向上や外的要因(コロナ禍による食習慣変化等)の影響はないか? 対照群との比較なしに効果を語ることは、統計的に誤りです。
外部専門家への依頼で得られること
上記のような分析を内製するには、R言語やPythonでの統計解析スキルと、健診・レセプトデータの前処理知識が必要です。これを担当者が一から習得するより、外部の専門家(医師×データサイエンティスト)に依頼することで、以下のメリットが得られます。
- バイアス補正済みの分析結果:傾向スコアマッチングや差の差分析を適用した、説明責任に耐える分析。
- 報告書・スライドへの落とし込み:理事会・保険者交流会・国への報告に使えるレベルの資料作成。
- 改善提案まで一貫:「どのプログラムが効いていないか」「次年度はどこを変えるべきか」という実行可能な提言。
- 医療費との連結分析:健診データ×レセプトデータの突合を含む、費用対効果の試算。
キバロク株式会社では、東京大学大学院での健診データ機械学習研究と、10年以上の健保・企業保健事業コンサルティングの経験を持つ市川太祐(医師・医学博士)が、特定保健指導の効果検証をデータから一気通貫で支援します。「うちの指導は本当に効いているのか知りたい」というご相談から承ります。
特定保健指導の効果検証・統計解析について、まずはお気軽にご相談ください。
30分無料相談を予約する