特定保健指導の効果検証と統計解析

医師が解説する実務の手法と落とし穴

「特定保健指導を3年やってきたが、本当に効果があったのかわからない」——健康保険組合の担当者からよく聞く言葉です。指導を受けた被保険者のBMIや腹囲が翌年どう変化したかは追えるものの、「指導があったから改善した」のか「もともと改善しやすい人が指導を受けただけ」なのか、判然としないのが実情です。

この記事では、特定保健指導の効果検証に必要な統計解析の考え方と、実務で使われる主な手法、そして健保・健診施設の担当者が陥りがちな落とし穴を解説します。

なぜ特定保健指導の効果検証は難しいのか

1. 選択バイアスの問題

特定保健指導の対象者は、メタボリックシンドロームの基準を満たした人です。このグループは健診を受けていること自体、健康意識が高い傾向があります。また、指導を受けた人の中でも「完了者」と「途中離脱者」は大きく異なります。単純に「指導完了者は翌年の腹囲が○cm減少した」と報告しても、それが指導の効果なのか、もともと自発的に改善する意欲が高い人だったからなのか、区別できません。

2. 平均への回帰

健診でメタボ基準に引っかかった人は、その年たまたま数値が悪かっただけの人も含まれます。翌年再測定すると、指導なしでも自然に改善するケースが一定数あります(平均への回帰)。これを指導の効果として計上してしまうと、実際より効果を過大評価します。

3. 追跡不能者の問題

転職・退職等で翌年の健診データが取れない人が発生します。こうした「追跡不能者」の特性が偏っていると(たとえば指導効果があって転職した場合など)、結果が歪みます。

実務で使われる3つの効果検証手法

手法①:単純前後比較(最も基本)

指導を受けた群の、指導前後の値(腹囲・体重・血圧・HbA1c等)を比較する方法です。実施が簡単で報告書にも使いやすい一方、上述の選択バイアスや平均への回帰を補正できません。「指導受けた人の腹囲平均が○cm減った」という事実の記述には使えますが、「指導の効果で減った」という因果推論には限界があります。

適した使い方:毎年の定点観測・経年変化のモニタリング

手法②:傾向スコアマッチング(バイアス補正の定番)

指導を受けた群(介入群)と受けなかった群(対照群)で、年齢・性別・過去の検査値・BMI等の特性をマッチさせた上で効果を比較する手法です。ランダム化比較試験(RCT)が実施できない実世界データで、疑似的に「指導の有無だけが異なる集団」を作り出します。

R言語やPythonのMatchItパッケージ等で実装可能です。ただし、観察できない交絡因子(意欲・家族の協力等)は補正できないという限界があります。

適した使い方:データヘルス計画の評価報告書、学会発表、保険者交流会向け資料

手法③:差の差分析(DiD:Difference-in-Differences)

指導が強化された年・対象拡大された年等、「介入の切り替わり」がある場合に有効な手法です。指導対象群と非対象群のそれぞれの変化量の差を取ることで、指導の純粋な効果を推定します。

たとえば「指導対象者は対前年比でBMIが平均0.3減ったが、非対象者は平均0.1減にとどまった。この差0.2が指導の効果」という形で解釈します。時間変化(季節性・社会的トレンド)を除去できる点が傾向スコアマッチングより優れています。

適した使い方:プログラム変更の前後比較、委託先変更時の効果比較

効果検証で明らかにすべき3つの指標

特定保健指導の効果として、以下の3つを軸に分析することをお勧めします。

  1. プロセス指標:対象者把握率・初回面接実施率・終了率・積極的支援完了率。指導の「届き方」を測る。
  2. アウトカム指標(短期):腹囲・体重・BMI・血圧・HbA1c・中性脂肪の変化量。指導後6〜12ヶ月の値で評価する。
  3. アウトカム指標(中長期):メタボリックシンドローム該当者数の変化、医療費(レセプト)の変化。3〜5年スパンで評価する。

多くの健保では①と②は集計できますが、③まで到達できているケースは少数です。医療費との連結分析には健診データとレセプトデータの突合が必要で、個人ID管理の精度が問われます。

担当者がよく犯す3つの落とし穴

落とし穴①:完了者だけで効果を語る

「積極的支援完了者の腹囲が平均2.1cm減少」は事実かもしれませんが、完了者は全対象者の中でも意欲・健康意識が高い層に偏ります。「指導を受けた全対象者」ベースで分析しないと、効果を過大評価します。「Intention-to-Treat(ITT)分析」の考え方を念頭に置くことが重要です。

落とし穴②:翌年の健診未受診者を無視する

追跡不能者を「消えた人」として分析から除外すると、残った人(比較的健康な人が多い傾向)の数値で評価することになり、実際より良い結果が出ます。未受診者の割合とその属性(年齢・指導完了状況)を毎年記録しておくことが、正確な評価の前提になります。

落とし穴③:対照群なしに効果を結論づける

「指導を受けた人の体重が翌年平均1.2kg減少した」だけでは、指導の効果かどうか判断できません。同時期に指導を受けなかった被保険者はどう変化したか? 社会全体の健康意識向上や外的要因(コロナ禍による食習慣変化等)の影響はないか? 対照群との比較なしに効果を語ることは、統計的に誤りです。

外部専門家への依頼で得られること

上記のような分析を内製するには、R言語やPythonでの統計解析スキルと、健診・レセプトデータの前処理知識が必要です。これを担当者が一から習得するより、外部の専門家(医師×データサイエンティスト)に依頼することで、以下のメリットが得られます。

キバロク株式会社では、東京大学大学院での健診データ機械学習研究と、10年以上の健保・企業保健事業コンサルティングの経験を持つ市川太祐(医師・医学博士)が、特定保健指導の効果検証をデータから一気通貫で支援します。「うちの指導は本当に効いているのか知りたい」というご相談から承ります。

特定保健指導の効果検証・統計解析について、まずはお気軽にご相談ください。

30分無料相談を予約する

関連コラム