アウトカムをレセプト・DPCから拾い上げる

論文紹介

本カテゴリー「論文紹介」では管理者の独断と偏見と気まぐれで選んだ論文を解説します.

論文は図表の貼り付けや結果の細かな紹介はできませんが、最小限の結果(abstractで公開されている範囲)を引用する形で紹介していきます。また、図表もそのまま貼り付けることはせず、オリジナルのイメージ図に替えて掲載致します.

主旨としては管理者自らの疫学・統計学・臨床医学上の個人的解釈とし、Stataのコード紹介なども行っていきます.内容の詳細がご覧になりたい場合にはぜひ本文を正式に入手してください.

なお、内容の是非に踏み込んだコメントも致しますが、本ブログは情報提供だけを目的としたもので、医学的アドバイス(診断、治療、予防)の代わりになるものではありません。また診療目的でのアドバイスやご質問も受け付けておりませんので宜しくお願いいたします.

さて、本日紹介する論文は、2つあります.ともに日本でデータベース研究を行うための礎となる研究です.

  1. Ono Y, Taneda Y, Takeshima T, Iwasaki K, Yasui A. Validity of Claims Diagnosis Codes for Cardiovascular Diseases in Diabetes Patients in Japanese Administrative Database. Clin Epidemiol. 2020 Apr 8;12:367-375. 
  2. Ando T, Ooba N, Mochizuki M, Koide D, Kimura K, Lee SL, Setoguchi S, Kubota K. Positive predictive value of ICD-10 codes for acute myocardial infarction in Japan: a validation study at a single center. BMC Health Serv Res. 2018 Nov 26;18(1):895.

一つ目が、糖尿病患者における心血管イベントをICD10コードからいかにして拾い上げるか、そしてどの程度正確なのか、というもので、日本のReal World Dataという会社がもつ膨大なデータを元に実施された研究です.

もう一つが、ある日本の大学病院でDPCが広まっていく途中段階の時代のデータで、心筋梗塞の入院がどの程度正しく推定できるか、ということの題材になりそうな論文です.

1.Real World Data Co, Ltd(Kyoto, Japan)のデータを使ったバリデーション研究

このペーパーが出された当時の状況ではありますが、「200近い医療機関で診療を受けた1200万人以上のuniquely identifiableな patientsのデータを使用」とあります.

様々なタイプの病院データを利用可能ですが、特筆すべきは、匿名のEMRデータが1985年1月から2018年12月までの分があって、

demographics, physician ordering diagnosis, prescriptions, and laboratory results from both outpatient and in-patient services.

患者レベルの EMR/claims data がユニークに結合され、それぞれの病院で匿名化され、それをこの会社に渡しているということのようです.個人情報保護規定にもちろん則って実施しているとのこと.

これだけでも驚きなのに、さらに、

The EMR diagnosis data are from both in and out-patient setting, and even if physician diagnosis is entered as free text by physicians, RWD company converts free text information into the standard disease coding system.

つまり、RWD社によってEMRの診断はフリーテキストから標準化された診断コードに変換されるんだそうです.ここまでくるともはやね…って感じです.

ド田舎出身の私は、子供の頃、駅の自動券売機には後ろに人がいて機械のボタンを押すとその人が大急ぎで切符を作るんだと思っていましたが、まあそんな感じなんでしょうか.あるいはこれこそAIとかが使われているのか??そこまではここの本文では読み取れませんでした.俄然興味が涌いてきます、RWD.

さて、それでこのデータセットは、EMRに加えてDPCデータが2006年11月から2018年10月の分まで取得しているとのこと.DPCといえば7つの診断カテゴリですが、

  1. 医療資源を最も投入した傷病名:greatest-resource consuming condition
  2. 入院の契機となった傷病名:trigger-for-hospitalization condition
  3. 主傷病名:main condition
  4. その他病名:other condition
  5. 医療資源を2番目に投入した傷病名:second greatest-resource consuming condition
  6. 入院時併存症名:comorbidities at the time of admission
  7. 入院後発症疾患名:conditions occurring during the hospitalization

のいずれかに入るかどうかということでみていますが、このうちの上3つに入るかどうかをPrimary outcomeである心血管疾患(うっ血性心不全、虚血性脳卒中、出血性脳卒中、いずれのタイプの脳卒中、心筋梗塞)、末期腎不全、そして死亡のICD10コードについてみていて、mild to moderate な慢性腎臓病については別の扱いとしてSecondary outcomeとしています.

これを糖尿病患者でどの程度正確に当たっているかE10-14のコードが当たっている人を対象にしているという研究デザインです.

どんなコードを用いているかは本文(Open accessですので閲覧可能)を参照してください.

これらのコードがどの程度役に立つかは陽性的中率(PPV)をみます.以前留学していたPennsylvania大学の疫学・生物統計学の授業では、PPV8割は欲しいところだ、とインストラクターが言っていましたので、そのあたりを基準にして判断するとよいのではないかと思います.

Table 3を見る限り、PPVの数値をみると、MI、心不全、Strokeはそこそこ役立ちそう、と結論できそうにみえます.ESKDはアウトカムとして使うのは微妙かもしれません.

2.大学病院でのバリデーション研究

こちらは小規模ながら実際にカルテをみて確認するという作業が発生しています.

DPCが全国津々浦々に浸透して行く前の段階で研究ですので、DPCのデータが使える時期と使えない時期とで分けて検討されています.

DPCデータだけで考えればI21、I22を心筋梗塞のコードとした場合に93%の陽性的中率を誇るという結果でした.

単一の施設での検討、さらにただ一人の循環器内科医の確認だけをベースにしているので外的妥当性は微妙かも知れませんが...。

しかしこれ以上の研究は今のところでてきていないということであれば、これを引用するより他ないでしょう.

まとめ

これからリアルワールドデータを使った研究が増えていくと思われますが、こうした地道な研究が下地になっていくことは間違いありません.

以前Charlson’s comorbidity scoreをまとめるプログラムについての記事をご紹介しましたが、これもリアルワールドデータを活用した研究に必須です.これからもこういった研究にも役立つような情報を発信していきたいと思います.

コメント

タイトルとURLをコピーしました