本カテゴリー「論文紹介」では管理者の独断と偏見と気まぐれで選んだ論文を解説します.
論文は図表の貼り付けや結果の細かな紹介はできませんが、最小限の結果(abstractで公開されている範囲)を引用する形で紹介していきます。また、図表もそのまま貼り付けることはせず、オリジナルのイメージ図に替えて掲載致します.
主旨としては管理者自らの疫学・統計学・臨床医学上の個人的解釈とし、Stataのコード紹介なども行っていきます.内容の詳細がご覧になりたい場合にはぜひ本文を正式に入手してください.
なお、内容の是非に踏み込んだコメントも致しますが、本ブログは情報提供だけを目的としたもので、医学的アドバイス(診断、治療、予防)の代わりになるものではありません。また診療目的でのアドバイスやご質問も受け付けておりませんので宜しくお願いいたします.
さて、本日紹介する論文は、管理者自らが執筆した、日米比較研究の第一号研究論文を紹介させてください.(Pubmed link), (Enhanced PDFで全文閲覧可能。ただしダウンロード・コピーは不可)
この研究では日米それぞれの、国を代表する慢性腎臓病コホートの横断的なデータを用いて日米のCKD患者における降圧薬の処方パターンと心血管病の既往歴について比較を行いました.
アメリカ人は日本人に比べて、一般集団でもCKD患者集団においても心血管病の発症率、有病割合ともに高いことが知られています.しかし特にCKD集団においては患者個別の情報を使って背景を調整した比較というのがほとんど行われてきませんでした.
なぜ日米で心血管病の頻度が異なるのか?
このシンプルな疑問に答えるためには様々な違いを乗り越えなければなりませんでした.
1.日米CKDコホートの方法論的違いについて
CKD-JAC研究はCRIC研究を模して立ち上げられたのですが、色々な点で異なります.まず、CKD-JACのほうが全体的に腎機能の悪めの人が多い特徴がありました.
そして、CVD既往歴もアメリカの方が多いのですが、コホート研究における情報収集の方法が異なりました.日本では主治医や研究者がカルテをもとにして入力していくのに対し、CRIC研究では対象者に対して聞き取り調査を行い、それに基づいて既往ありとしていたのです.
そこで先々代の日本人研究者が直接カルテを閲覧して日本でのやり方を再現しました。さすがに4000人近くの対象者全員には無理で、全米にまたがってすべてチェックするのも難しかったので、我々がいたPennsylvania大学の病院に通院する患者のみを対象に調査を行いました.
結果としては高い一致率(kappa係数を求めるコマンド”kap“を活用)を示したのですが、やはり自己申告のほうがややover diagnosisぎみでした.
想像してみるとわかるかと思いますが、非医療者の言う「貧血」とか「脳卒中」ってにわかには信じられない、というよりむしろ、内科研修では上級医から「鵜吞みにするな」と注意されるようなことだと思います.
腎機能の推定方法も異なります.国際共同研究ではCKD-EPI式というのを目にすると思うのですが、日本人には日本人の推算式があり、同様にCRIC研究ではCRICの集団にきちんと合わせた推算式がありますので、それらを用いました.やはり実測GFRとのバリデーションがきちんととれているものをそれぞれの集団においてきちんと準備しなければいけないんでしょうね、本当は.メタ解析をはじめとする国際共同研究では参加するすべての地域で最適の式が存在するわけではないので、一応ユニバーサルに使えるとされているこのCKD-EPI式を使うのが次善の策なのだと思います.
2.日米CKD患者の違い(結果)
詳しくは論文の本文をご覧になっていただきたいのですが、やはりCVD既往はCRIC研究で多く、特に心不全や虚血性心疾患で多いという結果です.
降圧薬としては、ARBとカルシウム拮抗薬がCKD-JACでは多く見られる処方であるのに対し、利尿薬とβ遮断薬がCRICでは多いというのが特徴です.
β遮断薬はほかの国際研究でも日本の処方割合が際立って低いことが示されています.日本ではβ遮断薬が控えられる原因として次のことが挙げられると思います.
- 虚血性心疾患をはじめとする心疾患の割合が少ないためにβ遮断薬使わなきゃ!という意識が医療者側に低い可能性
- カリウムが上がるかもしれない、という懸念
- 冠攣縮性狭心症の割合が高く処方を控えられる可能性
いずれにしてもβ遮断薬が控えめなのが日本のCKD診療ということになります.虚血性心疾患があった場合にもこの処方びかえが有意になるのが虚血性心疾患において有意な交互作用がみられることからも見て取ることができます.
3.使った統計解析手法
ここでは使用した統計解析手法とそのポイントをStata的に説明してみます.
1. 多重代入後に予測確率を計算
多変量解析をした後に予測確率を算出してグラフを作りました(Fig 1、4を参照ください).
これだけ書いてもいまいち伝わりにくいのですが、とにかくポイントは、
mi estimateのあとにsavingオプションを
つまり、MI後に確率を予測する(predictもしくはpredictnlで予測値を出す)ときには一旦結果を一時的なデータセットに保存する必要があるということです.具体的には、
mi estimate, saving(tempfile, replace): ~~
という感じで書いてください.
2.modified Poisson regression
次に、確率を算出するために、0/1アウトカムを予測する数学的なモデルとして、modified Poisson regression approachという方法をとりました、というお話をさせていただきます.
まず、0/1アウトカムの確率を出す方法としてよく知られているのがbinomial distributionをlogitで出す、ロジスティック回帰です.ここが基本になります.
その前に「ばいのみある」とか「ろじっと」って何?という人のためにGLM、つまり一般化線形モデル(generalized linear model)をご説明します.
線形モデルというのは、Y = a + bx みたいに一次式で表される関係をベースにxとyの関連を数式化したものですが、これをいろんな関数と組み合わせて拡張させたのが一般化線形モデルになります.
ここでポイントなのは、「分布」と「リンク関数」の二つの要素です.これで決まります.
もう少し詳しく知りたい方には以下の書籍がおすすめです.順番に読んでいけば一般的な高校数学のレベルくらいの知識で十分読みこなせます.文章も素直で読みやすく、丁寧に書かれています.
Stataでは分布をfamily, リンク関数をlinkというオプションで表現します.最も頻用されている一般的なモデルの一つが、二項分布+logit関数の組み合わせ、すなわちロジスティック回帰分析となります.
Stataでglmと調べると出てくるオプションは以下のようになっていますが、あまり見かけないものや、自分自身がよくわかっていないものもあるので、とりあえずよく見るものを太くしておきます.
familyname | description |
gaussian | Gaussian (normal) |
igaussian | inverse Gaussian |
binomial | Bernoulli/binomial |
poisson | Poisson |
nbinomial | negative binomial |
gamma | gamma |
linkname | description |
identity | identity |
log | log |
logit | logit |
probit | probit |
cloglog | clog-log |
power # | power |
opower # | odds power |
nbinomial | negative binomial |
loglog | log-log |
logc | log-complement |
今回の論文では二項分布(binomial)ではモデルが収束しませんでした.そこで統計家の先生に相談して提案されたのが、このmodified Poisson regressionという方法でした.
ポイントとして、Poisson分布 + logリンク関数 + robust error variance となります.
glm outcome exposure cov_list, fam(poisson) link(log) vce(robust)
普段はこんなのは使わないかもしれませんが、もしbinomial + logitでうまくいかなかったときのためにオプションとして取っておくのはありなのかもしれません.
まとめ
それにしてもCRIC研究ではCKD患者というのは、β遮断薬や利尿薬が結構使われている(≒心不全の準備状態)人が多いのが特徴で、そういった人達に生じる心臓の機能・形態的変化というものが気になります.ということで続編の研究はそのあたりのことをテーマにしています.もうじき投稿するので乞うご期待!
コメント