特定保健指導の効果検証とデータ分析——医師が解説する統計解析の手法と落とし穴

2026年4月18日著者: 市川太祐（医師・医学博士 / キバロク株式会社代表取締役）

「特定保健指導を3年やってきたが、本当に効果があったのかわからない」——健康保険組合の担当者からよく聞く言葉です。指導を受けた被保険者のBMIや腹囲が翌年どう変化したかは追えるものの、「指導があったから改善した」のか「もともと改善しやすい人が指導を受けただけ」なのか、判然としないのが実情です。

この記事では、特定保健指導の効果検証に必要な統計解析の考え方と、実務で使われる主な手法、そして健保・健診施設の担当者が陥りがちな落とし穴を解説します。

なぜ特定保健指導の効果検証は難しいのか

1. 選択バイアスの問題

特定保健指導の対象者は、メタボリックシンドロームの基準を満たした人です。このグループは健診を受けていること自体、健康意識が高い傾向があります。また、指導を受けた人の中でも「完了者」と「途中離脱者」は大きく異なります。単純に「指導完了者は翌年の腹囲が○cm減少した」と報告しても、それが指導の効果なのか、もともと自発的に改善する意欲が高い人だったからなのか、区別できません。

2. 平均への回帰

健診でメタボ基準に引っかかった人は、その年たまたま数値が悪かっただけの人も含まれます。翌年再測定すると、指導なしでも自然に改善するケースが一定数あります（平均への回帰）。これを指導の効果として計上してしまうと、実際より効果を過大評価します。

3. 追跡不能者の問題

転職・退職等で翌年の健診データが取れない人が発生します。こうした「追跡不能者」の特性が偏っていると（たとえば指導効果があって転職した場合など）、結果が歪みます。

実務で使われる3つの効果検証手法

手法①：単純前後比較（最も基本）

指導を受けた群の、指導前後の値（腹囲・体重・血圧・HbA1c等）を比較する方法です。実施が簡単で報告書にも使いやすい一方、上述の選択バイアスや平均への回帰を補正できません。「指導受けた人の腹囲平均が○cm減った」という事実の記述には使えますが、「指導の効果で減った」という因果推論には限界があります。

適した使い方：毎年の定点観測・経年変化のモニタリング

手法②：傾向スコアマッチング（バイアス補正の定番）

指導を受けた群（介入群）と受けなかった群（対照群）で、年齢・性別・過去の検査値・BMI等の特性をマッチさせた上で効果を比較する手法です。ランダム化比較試験（RCT）が実施できない実世界データで、疑似的に「指導の有無だけが異なる集団」を作り出します。

R言語やPythonのMatchItパッケージ等で実装可能です。ただし、観察できない交絡因子（意欲・家族の協力等）は補正できないという限界があります。

適した使い方：データヘルス計画の評価報告書、学会発表、保険者交流会向け資料

手法③：差の差分析（DiD：Difference-in-Differences）

指導が強化された年・対象拡大された年等、「介入の切り替わり」がある場合に有効な手法です。指導対象群と非対象群のそれぞれの変化量の差を取ることで、指導の純粋な効果を推定します。

たとえば「指導対象者は対前年比でBMIが平均0.3減ったが、非対象者は平均0.1減にとどまった。この差0.2が指導の効果」という形で解釈します。時間変化（季節性・社会的トレンド）を除去できる点が傾向スコアマッチングより優れています。

適した使い方：プログラム変更の前後比較、委託先変更時の効果比較

効果検証で明らかにすべき3つの指標

特定保健指導の効果として、以下の3つを軸に分析することをお勧めします。

プロセス指標：対象者把握率・初回面接実施率・終了率・積極的支援完了率。指導の「届き方」を測る。
アウトカム指標（短期）：腹囲・体重・BMI・血圧・HbA1c・中性脂肪の変化量。指導後6〜12ヶ月の値で評価する。
アウトカム指標（中長期）：メタボリックシンドローム該当者数の変化、医療費（レセプト）の変化。3〜5年スパンで評価する。

多くの健保では①と②は集計できますが、③まで到達できているケースは少数です。医療費との連結分析には健診データとレセプトデータの突合が必要で、個人ID管理の精度が問われます。

担当者がよく犯す3つの落とし穴

落とし穴①：完了者だけで効果を語る

「積極的支援完了者の腹囲が平均2.1cm減少」は事実かもしれませんが、完了者は全対象者の中でも意欲・健康意識が高い層に偏ります。「指導を受けた全対象者」ベースで分析しないと、効果を過大評価します。「Intention-to-Treat（ITT）分析」の考え方を念頭に置くことが重要です。

落とし穴②：翌年の健診未受診者を無視する

追跡不能者を「消えた人」として分析から除外すると、残った人（比較的健康な人が多い傾向）の数値で評価することになり、実際より良い結果が出ます。未受診者の割合とその属性（年齢・指導完了状況）を毎年記録しておくことが、正確な評価の前提になります。

落とし穴③：対照群なしに効果を結論づける

「指導を受けた人の体重が翌年平均1.2kg減少した」だけでは、指導の効果かどうか判断できません。同時期に指導を受けなかった被保険者はどう変化したか？社会全体の健康意識向上や外的要因（コロナ禍による食習慣変化等）の影響はないか？対照群との比較なしに効果を語ることは、統計的に誤りです。

外部専門家への依頼で得られること

上記のような分析を内製するには、R言語やPythonでの統計解析スキルと、健診・レセプトデータの前処理知識が必要です。これを担当者が一から習得するより、外部の専門家（医師×データサイエンティスト）に依頼することで、以下のメリットが得られます。

バイアス補正済みの分析結果：傾向スコアマッチングや差の差分析を適用した、説明責任に耐える分析。
報告書・スライドへの落とし込み：理事会・保険者交流会・国への報告に使えるレベルの資料作成。
改善提案まで一貫：「どのプログラムが効いていないか」「次年度はどこを変えるべきか」という実行可能な提言。
医療費との連結分析：健診データ×レセプトデータの突合を含む、費用対効果の試算。

キバロク株式会社では、東京大学大学院での健診データ機械学習研究と、10年以上の健保・企業保健事業コンサルティングの経験を持つ市川太祐（医師・医学博士）が、特定保健指導の効果検証をデータから一気通貫で支援します。「うちの指導は本当に効いているのか知りたい」というご相談から承ります。

特定保健指導の効果検証・統計解析について、まずはお気軽にご相談ください。

30分無料相談を予約する

特定保健指導の効果検証と統計解析