CREST [S5基盤ソフト]

安全性と有用性の保証のある
ヘルスケア匿名コホート基盤

研究概要

ヘルスケアデータエコシステムと4つの課題

  • 1本人同意

    不十分な本人同意

  • 2事業者選定

    テストの為の個人データがなく、
    加工技術の質が保証できない

    公平なベンチマークの必要性

  • 3安全性

    15種類の個人属性から99.98%の
    米国人が再識別可能である

    [Rocher 2019] “Estimating the success of reidentifications in incomplete datasets using generative models”, Nature Comm. , 2019.

  • 4有用性

    不自然な加工の例(年齢分布)

    National Health and Nutrition Examination Survetion Survey CDC (米国疾病対策センター)の国民健康栄養調査プログラム

達成目標(成果物)ヘルスケア匿名コホート基盤

研究実施体制

研究実施体制

データ名 個人数 詳細 レコード数 属性数 属性例 レセプト枚数
健康診断データ 198,740 健康診断結が
記録されている
964,636 49 身長,体重
健康分布
-
傷病レセプトデータ 288,568 患者が診断された
傷病が記録されている
39,363,878 15 傷病分類
コード
11,912,236
医薬品レセプトデータ 279,199 患者が処方された
医薬品が記録されている
31,465,504 21 医薬品
分類コード
9,000,249

分析2. 機械学習による罹患予測

一部の傷病の予測精度が高いが
女性特有の傷病の予測精度が高いため
別分類影響の可能性

3年以内の傷病の平均精度(F値) 0.65
ORの誤差は平均 2.5 x 10-4

ヘルスケアデータエコシステムと4つの課題

  • 各種リスクを低減した
    安全なデータを作る

  • 医療データとして実用
    的な有用性を目指す