このブログでは、統計解析ソフトStataのプログラミングのTipsや便利コマンドを紹介しています.
Facebook groupでは、ちょっとした疑問や気づいたことなどを共有して貰うフォーラムになっています. ブログと合わせて個人の学習に役立てて貰えれば幸いです.
さて、併存疾患をまとめてスコア化するCharlson comorbidity indexというものがあります.複数の併存疾患がある場合にそれを点数化して、入院中死亡などの予後を予測するというツールで、コホート研究だけでなく、最近ではadministrative dataを用いたデータベース研究においても広く用いられています.(オリジナルの研究はCharlson et al. Journal of Chronic Diseases 1987; 40: 373)
今回は、データベース研究におけるCharlson Comorbidity Indexの活用について説明したいと思います.
1.疾患コードからCharlson Comorbidity Indexを割り出す
データベース研究では大量のデータを処理するために病名や処置に対してのコードを元にしてデータを整えていくのですが、ICD9-CMやICD10コードをよく知られた併存疾患コードに読み替えるという作業を行う必要があります.
その作業を行ったという論文があり、非常によく引用されていますのでご紹介します.(Quan et al. Med Care. 2005;43(11):1130–1139.) この論文は、もともとはICD-9-CMコードを使って分類を試みたDeyoさんのアルゴリズムを”translate”した、というものですが、同じ論文できちんと実際のデータを使ってvalidationしてくれています.アルゴリズムの中で採用されているものがこちらです.
Comorbidities | Deyo’s ICD-9-CM | ICD-10 | Enhanced ICD-9-CM |
---|---|---|---|
Myocardial infarction | 410.x, 412.x | I21.x, I22.x, I25.2 | 410.x, 412.x |
Congestive heart failure | 428.x | I09.9, I11.0, I13.0, I13.2, I25.5, I42.0, I42.5–I42.9, I43.x, I50.x, P29.0 | 398.91, 402.01, 402.11, 402.91, 404.01, 404.03, 404.11, 404.13, 404.91, 404.93, 425.4–425.9, 428.x |
Peripheral vascular disease | 443.9, 441.x, 785.4, V43.4, Procedure 38.48 | I70.x, I71.x, I73.1, I73.8, I73.9, I77.1, I79.0, I79.2, K55.1, K55.8, K55.9, Z95.8, Z95.9 | 093.0, 437.3, 440.x, 441.x, 443.1–443.9, 47.1, 557.1, 557.9, V43.4 |
Cerebrovascular disease | 430.x–438.x | G45.x, G46.x, H34.0, I60.x–I69.x | 362.34, 430.x–438.x |
Dementia | 290.x | F00.x–F03.x, F05.1, G30.x, G31.1 | 290.x, 294.1, 331.2 |
Chronic pulmonary disease | 490.x–505.x, 506.4 | I27.8, I27.9, J40.x–J47.x, J60.x–J67.x, J68.4, J70.1, J70.3 | 416.8, 416.9, 490.x–505.x, 506.4, 508.1, 508.8 |
Rheumatic disease | 710.0, 710.1, 710.4, 714.0–714.2, 714.81, 725.x | M05.x, M06.x, M31.5, M32.x–M34.x, M35.1, M35.3, M36.0 | 446.5, 710.0–710.4, 714.0–714.2, 714.8, 725.x |
Peptic ulcer disease | 531.x–534.x | K25.x–K28.x | 531.x–534.x |
Mild liver disease | 571.2, 571.4–571.6 | B18.x, K70.0–K70.3, K70.9, K71.3–K71.5, K71.7, K73.x, K74.x, K76.0, K76.2–K76.4, K76.8, K76.9, Z94.4 | 070.22, 070.23, 070.32, 070.33, 070.44, 070.54, 070.6, 070.9, 570.x, 571.x, 573.3, 573.4, 573.8, 573.9, V42.7 |
Diabetes without chronic complication | 250.0–250.3, 250.7 | E10.0, E10.1, E10.6, E10.8, E10.9, E11.0, E11.1, E11.6, E11.8, E11.9, E12.0, E12.1, E12.6, E12.8, E12.9, E13.0, E13.1, E13.6, E13.8, E13.9, E14.0, E14.1, E14.6, E14.8, E14.9 | 250.0–250.3, 250.8, 250.9 |
Diabetes with chronic complication | 250.4–250.6 | E10.2–E10.5, E10.7, E11.2–E11.5, E11.7, E12.2–E12.5, E12.7, E13.2–E13.5, E13.7, E14.2–E14.5, E14.7 | 250.4–250.7 |
Hemiplegia or paraplegia | 344.1, 342.x | G04.1, G11.4, G80.1, G80.2, G81.x, G82.x, G83.0–G83.4, G83.9 | 334.1, 342.x, 343.x, 344.0–344.6, 344.9 |
Renal disease | 582.x, 583–583.7, 585.x, 586.x, 588.x | I12.0, I13.1, N03.2–N03.7, N05.2–N05.7, N18.x, N19.x, N25.0, Z49.0– Z49.2, Z94.0, Z99.2 | 403.01, 403.11, 403.91, 404.02, 404.03, 404.12, 404.13, 404.92, 404.93, 582.x, 583.0–583.7, 585.x, 586.x, 588.0, V42.0, V45.1, V56.x |
Any malignancy, including lymphoma and leukemia, except malignant neoplasm of skin | 140.x–172.x, 174.x.–195.8, 200.x–208.x | C00.x–C26.x, C30.x–C34.x, C37.x–C41.x, C43.x, C45.x–C58.x, C60.x–C76.x, C81.x–C85.x, C88.x, C90.x–C97.x | 140.x–172.x, 174.x–195.8, 200.x–208.x, 238.6 |
Moderate or severe liver disease | 456.0–456.21, 572.2–572.8 | I85.0, I85.9, I86.4, I98.2, K70.4, K71.1, K72.1, K72.9, K76.5, K76.6, K76.7 | 456.0–456.2, 572.2–572.8 |
Metastatic solid tumor | 196.x–199.1 | C77.x–C80.x | 196.x–199.x |
AIDS/HIV | 042.x–044.x | B20.x–B22.x, B24.x | 042.x–044.x |
当然ながらコードの組み合わせがきちんと研究に耐えられるかを検証する必要があります.国の保険診療システムが異なる場合もそうですが、同じ国の中でもデータベースが異なれば使い勝手が変わってくる、ということになります.
日本で最も利活用が進んでいるのはDPCデータを用いた研究ではないかと思います.すでにバリデーションのための研究がいくつか行われていて、検証されています.
2.我が国でのCharlson Comorbidity Indexのバリデーション
日本では以下のような研究が行われていて、データベース研究への道が徐々に開かれているように思います.
1.Charlson Comorbidity Indexの改良バージョンに関する国際研究
6カ国のhospital discharge abstract dataにおいて記録されている病名コード(ICD-10)を組み合わせて、新たな重み付けを行ったCharlson Comorbidity Indexを、1年後の予後予測に使えるかを検証した研究です(Am J Epidemiol 2011;173:676–682).
2004年のカナダのカルガリー地方の医療データを用いて院内死亡、30日以内死亡、1年後の生存率をアウトカムとして予測性能についての検証をしました.日本からもデータが提供され、validationに使用されています.
… hospital discharge data from Australia (Victoria State data), Canada (national data), France (national data), Japan (national data), New Zealand (national data), and Switzerland (national data) …
Am J Epidemiol 2011;173:676–682
この時期のデータですのでDPCデータはまだ研究として整備されていなかったと思われますのでレセプトデータが元になっていると推測します.
新しいスコアは12疾患に絞られたがオリジナルのものと遜色ない性能だったというものです.
他の国のデータは予測分類能としてAUC 0.8~0.9なのに対して日本のデータは0.7台でした.
恐らくレセプトデータでは検査や処方のためにつけられた病名が誤分類を生じさせていると思われます.レセプト病名を研究に用いるにはそれなりの工夫が必要そうです.
2.日本のDPCデータからCCIをどのくらい計算できるかを検証
2つめの研究はバリデーション研究で315名の患者カルテをレビューして感度・特異度などの指標を出しています(J Epidemiol 2017:27;476-482).この研究は非常に意義の高いものと思います.これから医療ビッグデータの利活用をしようという人達の礎になることは間違いないでしょう.実際に病院のカルテを300人分開けて検証する、というのはとても骨の折れる作業に違いありません.
方法としては、
- 2015年11月 ~ 2016年2月の間にカルテレビュー
- 2014年4月~ 2015年3月に4つの中規模急性期病院に入院した患者315名をreference standardとした
- カルテレビューは、二人の著者が独立して実施。結果が異なる時は協議
- DPC data を用いて17 diagnosis and 10 common proceduresの感度・特異度を算出
- DPCの様式1主病名、入院の契機となった傷病、入院時併存病名×4のフィールドにある診断名を、処置についてはEFファイル入院日の実施の有無を確認.(疑い病名は除く)
結果の概要としては、DPC病名は感度があまり高くなく、特異度は高いという特徴があり、誤った病名を入力することはあまりないけど足りないことはある、といった感じでしょうか.処置については感度も特異度も高く、しっかりと正確に入っていたようです.
3.JMDCのDPCデータを活用したQuanのアルゴリズム検証
この研究はQuanらのアルゴリズムを実際に使って研究をしています(Jpn J Pharmacoepidemiol, 2019;24: 53).日本の人口の約2%をカバーするとされるJMDCのデータを利用しています.アステラス製薬の方が研究をされたようです.
Charlson Comorbidity IndexとElixhauser Comorbidity Indexの定義(Quan’s algorhythmを使っている):
- ICD-10 codes recorded in the Diagnosis-Procedure Combination(DPC)data
- ICD-10 codes for definitions of individual conditions for CCI and ECI in the present publication.
Otcome定義:
- Hospital death and re-admission were the outcomes considered for this analysis:hospital death and re-admission within one month(30 days)from the discharge.
- The direct cost of a patientʼs hospital stay was also assessed for association with CCI and ECI scores
説明変数:
- 入院時の年齢(<65 vs ≧65 years), 性別, and either CCI/ECI conditionsまたはそのスコア(i.e., the sum of weighted scores assigned to individual comorbidities; score model)
結果:
- 変数を減らせたCCIは元の17よりも10まで減らせたが同等でした.
- 10疾患・病態は以下:MI, CHF, cerebrovascular, pulmonary disease, DM(uncomplicated), hemiplagia/paraplagia, renal disease, any malignancy, liver disease, metastatic solid tumor
まとめ
大規模医療データの利活用を前に、併存疾患や病態をひとまとめにするCharlson Comorbidity Indexなどの指標の開発が進んできています.
こういった指標の組み合わせをうまく使って研究をスムーズに進めることができるとよいと思います.管理者自身も最近、レセプト・健康診断のデータを使った共同研究を行うことになりました.その研究を実施する中で学んだことも共有して行きたいと思います.
この領域に足を踏み入れてまだ日が浅いので、コメントなど気軽にお願いいたします.
次はStataでCharlson Comorbidity Indexをまとめるコマンド”charlson“について解説してみたいと思います.
コメント