CREST [S5基盤ソフト]
1本人同意
不十分な本人同意
2事業者選定
テストの為の個人データがなく、
加工技術の質が保証できない
公平なベンチマークの必要性
3安全性
15種類の個人属性から99.98%の
米国人が再識別可能である
[Rocher 2019] “Estimating the success of reidentifications in incomplete datasets using generative models”, Nature Comm. , 2019.
4有用性
不自然な加工の例(年齢分布)
National Health and Nutrition Examination Survetion Survey CDC (米国疾病対策センター)の国民健康栄養調査プログラム
データ名 | 個人数 | 詳細 | レコード数 | 属性数 | 属性例 | レセプト枚数 |
---|---|---|---|---|---|---|
健康診断データ | 198,740 | 健康診断結が 記録されている |
964,636 | 49 | 身長,体重 健康分布 |
- |
傷病レセプトデータ | 288,568 | 患者が診断された 傷病が記録されている |
39,363,878 | 15 | 傷病分類 コード |
11,912,236 |
医薬品レセプトデータ | 279,199 | 患者が処方された 医薬品が記録されている |
31,465,504 | 21 | 医薬品 分類コード |
9,000,249 |
一部の傷病の予測精度が高いが
女性特有の傷病の予測精度が高いため
別分類影響の可能性
3年以内の傷病の平均精度(F値) 0.65
ORの誤差は平均 2.5 x 10-4
各種リスクを低減した
安全なデータを作る
医療データとして実用
的な有用性を目指す