このブログでは、統計解析ソフトStataのプログラミングのTipsや便利コマンドを紹介しています.
Facebook groupでは、ちょっとした疑問や気づいたことなどを共有して貰うフォーラムになっています. ブログと合わせて個人の学習に役立てて貰えれば幸いです.
Cox比例ハザードモデルは、生存時間分析を実施する上で最もオーソドックスな統計手法ですが、これを使うための最低条件として、
「比例ハザード性」
というのがあります.
これはどういうことかというと、カプランマイヤー曲線を思い浮かべていただくとわかりやすいのですが、ある状態Aと状態Bにおいて、無イベント生存率が平行して下がっていくような状況においてのみ使えますよ、ということです.
比例ハザード性からの逸脱を客観的に示す方法としては、Graphicalに示す方法と、統計学的な手法とがあります.
1.統計学的に示す
そんな前提なので区間ごとにHRを出すというこのやり方をとって、1年ごとのHRの推移を図にしていたのでした.
use http://www.biostatepi.org/data/hers, clear
stset pafu, f(pa)
stcox group
estat phtest
/* 比例ハザード性逸脱を確認 */
stcox group diabetes htnmed anydrk
estat phtest, detail
/* すべての説明変数において比例ハザード性逸脱を確認 */
このとき、groupという変数のP値が、0.05未満となっていますので、もしこれを主たる要因として解析しようとするとちょっとこのままでは問題がありそうです.
2.図で確認する
統計学的に示すとき、サンプル数が大きくなるとそれだけでも有意になってしまいます.何でもかんでも機械的に処理してしまうと、大局を見誤ります.そこで、図的に示す方法をご紹介します.具体的には以下の2つがあります.
- log-logプロット
- Schoenfeld残差プロット
ひとつ目のlog-log プロットですが、これは通称であり、正しくは
-ln{-ln(survival)} の曲線を、カテゴリー変数または順序変数それぞれにおいて描き、ln(analysis time)を横軸としたときに平行になっているかを確認するというものです.
use http://www.biostatepi.org/data/hers, clear
stset pafu, f(pa)
stcox group
stphtplot
/* 比例ハザード性逸脱を確認 */
2つの曲線が平行ではないので、比例ハザード性からの逸脱が疑われます.ここで重要なのは、「見た目」です.もう一つの方法は、Schoenfeld残差のプロットになります.
use http://www.biostatepi.org/data/hers, clear
stset pafu, f(pa)
stcox group
estat phtest, plot(group)
/* 比例ハザード性逸脱を確認 */
この方法であれば、多変量解析を行った後に、特定の説明変数に着目して作図することができます.通常はプロットはY=0の直線上に乗りますが、右肩下がりになっています.時間が経過すると残差が変化しているということを示しており、これも比例ハザード性からの逸脱が疑われる所見になります.
3.tvcオプションで確認する
この方法は、おそらく日本語のWeb siteではあまり見かけません.しかしよく行われる方法ですので押さえておくとよいでしょう.この方法は上記のような比例ハザード性からの逸脱が疑われる状況において、時間と曝露因子の交互作用項を入れることによって時間依存的に曝露因子と結果の関係が変化することを示します.
use http://www.biostatepi.org/data/hers, clear
stset pafu, f(pa) id(id)
stcox group, tvc(group) texp(ln(_t))
このように表します.なぜここで時間の自然対数を入れるのか?と疑問に思われた方もいると思いますが、これはフォローアップ時間の分布がどうしても右に細長く尾を引いてしまうためです.
UCLAのサイトでも紹介されています.こちらの動画でも同様に時間の自然対数を入れています.
同じデータセットを使って実際にtvcを走らせてみると、以下のような結果が出力されます.
tvcのところのgroupをみると確かにP<0.05となっていますので、時間依存性であると結論付けることができます.
この方法は一緒に仕事をしているある生物統計の専門家の先生にも教えてもらいました.
4.まとめ
今回は比例ハザード性の仮定を確認する方法について、3つまとめてみました.
論文中でさらっと触れられる程度のことが多いですが、これだけのことが行われている、ということなのです.
コメント
[…] 前者はlog-log plotと呼ばれる方法が良くとられますが、Schoenfeld残差を利用した方法もあります.また同様にSchoenfeld残差を利用した統計学的な方法もあります.これらは前回の記事に掲載しております. […]
[…] このデータセットで、変数の変形が必要かどうか、モデル全体の適合性はどうか、外れ値の影響はどうかについて検証してみたいと思います.(比例ハザード性についてはこちらにまとめています) […]