症例対照研究について

このブログでは、統計解析ソフトStataのプログラミングのTipsや便利コマンドを紹介しています.時々Stataと関係なく疫学や公衆衛生、統計学に関する記事も掲載していきます.

さて、今日のテーマは疫学に関する記事を紹介したいと思います.元ネタはPennsylvania大学の疫学・生物統計学部門の「Introduction to Epidemiology」という講義資料や「ロスマンの疫学」です.

1.症例対照研究とは

症例対照研究とは観察研究の1つの型であり、コホート研究と同様に要因と結果の関係性を推定するための1つの手段です. コホート研究では、研究対象とする母集団を代表する一部を切り出してきて標本とし、アウトカムの発生を特定の要因別に比較する、時間の流れに沿ったデザインでした. 症例対照研究は、同様に研究対象とする母集団の中から、アウトカムを発症した集団と、発症していない集団を切り出してきて、それらの集団同士の背景を比較するというものです.

The sophisticated use and understanding of case-control studies is the most outstanding methodologic development of modern epidemiology.
Because it need not be extremely expensive nor time-consuming to conduct a case-control study, many studies have been conducted by would-bu investigators who lack even a rudimentary appreciation for epidemiologic principles.

Kenneth J. Rothman

とっても素晴らしい方法だけど、正しく使いましょう、ということですね、ざっくり言えば.

コホート研究との決定的な違いは、対象集団の集め方です. コホート研究では“at-risk集団”、つまりまだアウトカムを生じていないが、将来的に生じうる集団を集めてアウトカムが生じる割合、スピードなんかを比較します.これに対して症例対照研究では、アウトカムを生じた人と生じていない(でも将来的には生じうる人)の比較を行います. このとき、コントロールをどう集めるかが鍵である、とRothmanは述べています. コホート研究を実施した場合の研究対象集団に相当する”Source population (原集団)” を出発点に考えるとわかりやすいとしています.

コントロールをいかにして集めるか、という観点で上記を見ていきましょう.

まず、最初のステップであるSource populationを規定するところを間違えるととんでもないコントロールを取ってきてしまいます.

例えば、重症患者の電解質異常を来すリスク要因を探索したい、という場合に、CaseがICU患者に集中しているのにその病院の外来患者をコントロールにする、等とした場合どうでしょうか?想定する原集団がおかしな事になっているかどうかはそれをコホート研究としたときに違和感がないかどうか、という観点で評価すればわかりやすいですね.

コントロールを選択する上で、以下のような原則に則る必要があります.

  • アウトカムを将来的に生じうる人を選ぶ.原集団を代表していること.
  • 曝露因子と独立して集められるべき

コントロールの選択方法によって症例対照研究はいくつかのサブタイプに分けられます.

2.症例対照研究の3つのサブタイプ

前述のように、症例対照研究は以下の3つのサブタイプに分類されます.

サブタイプコントロール選択方法オッズ比の解釈
Cumulative
(古典的CC)
研究期間を通じて
disease-freeな集団
リスク比に近似
(頻度が低いときのみ)
Incidence density sampling
(Nested case-control)
現時点ではat-risk.
将来発症するかは問題ではない
発症率比
(incidence rate ratio)
Case-Cohortすべてのstudy population
将来発症するかは問題ではない
リスク比

1.累積症例対照研究(Cumulative case-control study)

いわゆる古典的な症例対照研究です.閉じた集団を追跡し、観察が満了した時点でアウトカムを起こしたか否かによってCaseとControlをそれぞれ抽出します.

ちなみに、リスク比は、曝露群における発症者の割合( A/(A+B) )と非曝露群における発症者の割合( C/(C+D) )の比をだすものなので、B、Dが不明だと理論的には算出できません.

しかし、希少疾患のときはA/(A+B)はA/Bと近似できるし、C/(C+D)はC/Dと近似できるので、結果的にその日はA/B÷C/D=AD/BCとなり、オッズ比と同じ式になります.この前提はrare disease assumptionといい、リスクが0.1くらいまでが許容範囲とされることが多いようです.

観察期間を通じて曝露と非曝露状態が変化しない前提であり、急性疾患とか、ごく限られた曝露状態(妊娠など)のときに適したデザインといえます.

2.密度症例対照研究

密度に基づいた標本抽出(density-based sampling)に基づいた標本抽出を行うもので、Nested case-control研究と呼ばれています.疫学の授業ではこれが一番いい、とすすめられました.

Caseが発生したタイミングで、その時点ではまだ発症していない人たちからランダムにControlを抽出してくる、という方法です.結果はコホート研究で算出できるincidence rateの比と同じように解釈できるので、完全なコホートとほぼ同等に扱えます.また、rare disease assumptionが不要であること、曝露状態が時間とともに変化してもよいことがこの研究デザインの優れたところです.

サンプリングの仕方は下の図のようになっています.

Caseが生じたとき、そのときat-riskな人達からcontrolがランダムに選択される

どうしてincidence rate ratioとして結果が解釈できるのか、ということなのですが、Controlとして抽出してきた人達は、すでに人-時のうちの”時”の部分はサンプリングしてくるときにCaseと同じになるので純粋に人数比だけで済む、という考え方です.下の図が解説になります.

アウトカムを発症せずに長く集団に留まっている人、というのはコホート研究ではそれなりに意味があり、「contributeした」人となりますが、このincidence density samplingでも同じ事が言えます.すなわち、5年間研究の症例になるリスクをもつ人は1年だけ持つ人に比べてコントロールとして選択される確率が5倍高いはずですよね.

3.症例コホート研究(Case-cohort研究)

最後はCase-cohort研究です.一番始めにこの名称を見たときは、「case-control studyの間違いじゃないの?」などと思ったものです.

この研究デザインは、コホート研究のうちのCaseだけを抜き出してくること、対照群としては原集団全体から標本抽出をする(発症、未発症に関わらず)という点が累積症例対照研究と異なります.

はじめの段階でコントロールを抽出.発症した人達が次々にCaseに登録される.

このデザインの研究のよいところは、Caseの数を損なわずに全体の数を減らせるところにあります.あるバイオマーカーの探索をするのに、5000人のコホート研究があるけど、予算の関係で1000検体しか測定できない、というときにこの研究デザインは使えそうです.

かつて留学していたときに関わっていたコホート研究でもやられています.FGF23と腎代替療法の関連を調べた研究(Mehta R, et al. Serial Fibroblast Growth Factor 23 Measurements and Risk of Requirement for Kidney Replacement Therapy: The CRIC (Chronic Renal Insufficiency Cohort) Study. Am J Kidney Dis. 2020;75(6):908‐918. )ですが、バイオマーカーの測定を繰り返す必要があったために対象集団を絞り込んでいます.

3.まとめ

今回は症例対照研究について、解説しました.古典的な症例対照研究よりもNested case-control研究やCase-cohort研究をうまく使うことを考慮すると低予算で質の高い研究を実施できるかもしれませんので、ぜひRothmanを読み込んでみてください.

さて、Stataと全く関係ないというのは好ましくないので、1つだけ.Incidence density samplingで行うNested case-control研究のデータセットを作るのにsttoccというコマンドがあります.変数のマッチや、対照群との比(Case:control)などを設定することができます.また、1つ注意としてはランダムに選択するプロセスが途中で入るので、seedを設定することを忘れないようにしましょう.

コメント

  1. 角谷寛 より:

    統計はいつまでたっても難しいです
    どうぞよろしくお願いいたします

    • 管理者 より:

      コメントありがとうございます。難しいですよね。できるだけたくさんの方に理解していただけるような記事を書いていこうと思っております。

  2. […] さて、Case-control studyの1つでincidence dense samplingとかriskset samplingとか言われる方法でコホート内でコントロールを時の流れをそろえて抽出してくる”nested case-control”を以前ご紹介しました.それをStataで実装するコマンドがあり、”sttocc“といいますが、その使い方をご紹介します. […]

タイトルとURLをコピーしました