統計

統計

傾向検定について

「傾向検定」とは、標本集団で観察された平均値や割合が、だんだん大きくなる、もしくはだんだん小さくなるというトレンド(傾向)が、母集団でもそうなっているかどうかを検定するものです. 連続変数における平均値やカテゴリー変数の割合(ここでは二値変...
統計

生存時間分析におけるバイアスについて

生存時間分析を行う上で、カプランマイヤー法は一般的によく用いられる方法です. 生存時間分析を用いて研究を行うとき、打ち切りがランダムに発生する という前提条件に基づいていますが、本当にそうなのかはわかりません.今日は、何らかの理由に基づく打...
グラフ

交互作用の表し方

「交互作用」というのは、ある要因と結果の間の関係が、サブグループによって異なるかことを指します. 薬剤Aの効果を見るとき、男女で分けると男性では8割に効いたのに対し、女性には2割しか効果がなかった、といった現象について統計学的に検証すること...
グラフ

競合リスクまとめ②

前回の記事では競合リスク解析の理論について説明しました.いよいよ今回は実践編です.残念ながらStataでは競合リスクを考慮したCumulative incidence法でのグラフを描いて必要な統計的な検討を行うためのコマンドが存在しないため...
プログラミング

競合リスクまとめ①

競合リスクとその解析方法をStataでどのようにして実装するのかを理論編と実践編ということで解説していきます.まず今回は理論編ということで、以下のコンテンツに沿って概説します.1.競合リスクとは複数の別の種類のイベントがあり、最初の1つしか...
統計

事前確率から尤度比を使って事後確率を求める

新型コロナウイルスが国内で様々な混乱を引き起こしていますが、政治も医療もてんやわんやとなっています.PCRの検出感度が高くないこと、8割は元気だけど重症化する人もそれなりにいて広まりやすいくせに診断しにくい、という困ったやつです.PCRが保...
グラフ

Kaplan-Meierのきれいな描き方

今回はカプランマイヤーを綺麗に描くためのポイントを書いてみます.以下のエレメントを順番に加えたときにどんなグラフになるかを見てみましょう.Figure legendの位置を調節し、表記を自分好みにするat-risk tableを追加するP値...
プログラミング

P値を計算する方法 ③ 多重補完後の結果を取り出す

回帰モデルを実施した後に、P値や推定値を取り出すのに、_b, _seなどのようにすることでその値を取り出してプログラムに組み込むことができました.Multipleimputation (MI, 多重補完法)を実施したあとの結果を取り出すとき...
プログラミング

P値を計算する方法 ② 各種検定・回帰モデルにおけるP値計算方法のまとめ

検定や回帰モデルを実施したあとに、P値や推定値を取り出す、という技があると、表記方法をカスタマイズしたり、結果だけを手早くコピーしたりできるので、その後のデータ整理の時間を短縮することができます.特にたくさんのモデルを試した際に、結果だけと...
統計

P値を計算する方法 ① 統計学の基礎知識編

どのソフトで計算するにしても、プログラミングを行って統計量や検定結果を自分の好みの形で出力するためには統計学の基本的な知識はどうしても必要になります.統計学をまじめに勉強すると奥が深いのですが、今日は、「P値の計算式をどうやってプログラムに...