管理者

疫学

比例ハザード性からの逸脱を確認する

このブログでは、統計解析ソフトStataのプログラミングのTipsや便利コマンドを紹介しています. Facebook groupでは、ちょっとした疑問や気づいたことなどを共有して貰うフォーラムになっています. ブログと合わせて個人の学習に役...
疫学

誤分類バイアスについて

今回は疫学に関する内容で、Stataは直接的には関係ありません.しかし最近つくづく思うのは、疫学の知識をもって統計やプログラミングを実践しなければ結局のところ臨床研究として一番重要な部分は抜けてしまう、ということです.Discussionを...
プログラミング

複数のループを重ねる

ループを使って繰り返しのコマンドをひとまとめにするコツを以前の記事でまとめていますが、今回は、ループをいくつも重ねてすっきり洗練されたプログラムを書くコツをまとめてみたいと思います. 1.多変量モデルをいくつも走らせて、メインの曝露因子の結...
プログラミング

Labelの設定②

今回も前回に引き続いて変数ラベルと値ラベルに関してまとめていきます.基本コマンドである.labelについては前回の記事で概要をまとめました。そして今回はその拡張版である.elabelについてまとめていきます. 1.コマンドを入手する 例によ...
プログラミング

Labelの設定①

今日は変数ラベルと値ラベルに関してまとめていきます.基本コマンドである .labelを使いこなすこと、そしてその拡張版である.elabelを必要に応じて使えるようにマスターすることがポイントとなります. 今回は"label"コマンドの使い方...
疫学

症例対照研究について

このブログでは、統計解析ソフトStataのプログラミングのTipsや便利コマンドを紹介しています.時々Stataと関係なく疫学や公衆衛生、統計学に関する記事も掲載していきます. さて、今日のテーマは疫学に関する記事を紹介したいと思います.元...
プログラミング

Baseline tableの自動生成

さて、今日はBaseline characteristicsを要約した表(いわゆる”Table 1”)をあっという間に自動生成してしまう、便利なコマンドである”.table1_mc”をご紹介します. このコマンドを作成したのは、オーストラリ...
グラフ

lowess plotとlincheck

回帰分析をするときに、何となく変数を入れるだけではなく、データの特性をきちんと踏まえてモデルを組むことが大切です. 説明変数同士の関係を散布図や2×2 Tableで記述説明変数と目的変数の関係も同様に記述 その他にも、連続変数や順序変数が説...
グラフ

棒グラフの注意点 -X軸設定と積み上げ棒グラフの作り方-

今日は棒グラフの描き方に関するコツをお示しします. ポイントとしては、 X軸のタイトルの入れ方合わせて100%になるような棒グラフ について説明していきます. いつものautoのデータセットで、燃費と車体の重さの関係について描いてみたいと思...
グラフ

競合リスクまとめ③

プログラムにミスが見つかりましたので訂正いたしました。お知らせくださった先生、ありがとうございます。(2022/7/8) 前回、前々回の記事では競合リスク解析の理論と実践の初歩について説明しました.今回はちょっとした応用編です. 前回の記事...
グラフ

グラフのmarkerとlineを整える

Stataはきれいなグラフを描くことができることが魅力の1つなのですが、その際に役立つ便利なツールを紹介します. 1.symbolpalette: グラフ中のマーカーの形を変更 グラフ中のマーカーの形を選ぶことができます.どんなシンボルにす...
統計

傾向検定について

「傾向検定」とは、標本集団で観察された平均値や割合が、だんだん大きくなる、もしくはだんだん小さくなるというトレンド(傾向)が、母集団でもそうなっているかどうかを検定するものです. 連続変数における平均値やカテゴリー変数の割合(ここでは二値変...
統計

生存時間分析におけるバイアスについて

生存時間分析を行う上で、カプランマイヤー法は一般的によく用いられる方法です. 生存時間分析を用いて研究を行うとき、打ち切りがランダムに発生する という前提条件に基づいていますが、本当にそうなのかはわかりません.今日は、何らかの理由に基づく打...
グラフ

交互作用の表し方

「交互作用」というのは、ある要因と結果の間の関係が、サブグループによって異なるかことを指します. 薬剤Aの効果を見るとき、男女で分けると男性では8割に効いたのに対し、女性には2割しか効果がなかった、といった現象について統計学的に検証すること...
プログラミング

サブグループやIDごとに集計する

一人一行で整えられた形(Wide)にしても、一人複数行の形(Long)にしても データセットにはある程度共通点を持ったグループであるサブグループがあり、 そのサブグループごとに集計値を出したいときがあると思います. それだけでなく、一人複数...
グラフ

競合リスクまとめ②

前回の記事では競合リスク解析の理論について説明しました.いよいよ今回は実践編です. 残念ながらStataでは競合リスクを考慮したCumulative incidence法でのグラフを描いて必要な統計的な検討を行うためのコマンドが存在しないた...
プログラミング

競合リスクまとめ①

競合リスクとその解析方法をStataでどのようにして実装するのかを理論編と実践編ということで解説していきます. まず今回は理論編ということで、以下のコンテンツに沿って概説します. 1.競合リスクとは 複数の別の種類のイベントがあり、最初の1...
統計

事前確率から尤度比を使って事後確率を求める

新型コロナウイルスが国内で様々な混乱を引き起こしていますが、政治も医療もてんやわんやとなっています. PCRの検出感度が高くないこと、8割は元気だけど重症化する人もそれなりにいて広まりやすいくせに診断しにくい、という困ったやつです. PCR...
グラフ

Kaplan-Meierのきれいな描き方

今回はカプランマイヤーを綺麗に描くためのポイントを書いてみます. 以下のエレメントを順番に加えたときにどんなグラフになるかを見てみましょう. Figure legendの位置を調節し、表記を自分好みにするat-risk tableを追加する...
プログラミング

Stataによるデータクリーニング

ひさしぶりの更新となりました。皆様お元気でしょうか?世間はコロナウイルス一色ですが、在宅で仕事する人も増えてきているでしょうか。 さて、今日はデータマネージメントを学ぶためのStata pressの書籍とWebサイトを1つ紹介させてください...
プログラミング

P値を計算する方法 ③ 多重補完後の結果を取り出す

回帰モデルを実施した後に、P値や推定値を取り出すのに、 _b, _se などのようにすることでその値を取り出してプログラムに組み込むことができました. Multiple imputation (MI, 多重補完法)を実施したあとの結果を取り...
プログラミング

P値を計算する方法 ② 各種検定・回帰モデルにおけるP値計算方法のまとめ

検定や回帰モデルを実施したあとに、P値や推定値を取り出す、という技があると、 表記方法をカスタマイズしたり、結果だけを手早くコピーしたりできるので、 その後のデータ整理の時間を短縮することができます. 特にたくさんのモデルを試した際に、結果...
統計

P値を計算する方法 ① 統計学の基礎知識編

どのソフトで計算するにしても、プログラミングを行って統計量や検定結果を自分の好みの形で出力するためには統計学の基本的な知識はどうしても必要になります. 統計学をまじめに勉強すると奥が深いのですが、今日は、 「P値の計算式をどうやってプログラ...
グラフ

twowayグラフと軸の設定

このブログでは、統計解析ソフトStataのプログラミングのTipsや便利コマンドを紹介しています. Facebook groupでは、ちょっとした疑問や気づいたことなどを共有して貰うフォーラムになっています. ブログと合わせて個人の学習に役...
グラフ

コマンド“mylabels”のご紹介

値が正規分布に従わないときに対数変換したものをグラフにしたときにつけるラベルで悩んでいたのですが、 ちょうどよいコマンドを見つけましたのでご紹介します. こんなやつを、対数変換して、 まあこれでもいいのですが、X軸のラベルをかっこよく整えた...
グラフ

カラーパレット2

先日紹介したStataのカラーパレットにさらに強力なバージョンが存在することがわかったのでシェアします. 色のグラデーションをつけたいときにはこちらのほうが便利そうですし、 いろいろと使い勝手がよさそうな印象です。まだ使いこなせているわけで...
プログラミング

ループに関するエトセトラ

このブログでは、統計解析ソフトStataのプログラミングのTipsや便利コマンドを紹介しています. Facebook groupでは、ちょっとした疑問や気づいたことなどを共有して貰うフォーラムになっています. ブログと合わせて個人の学習に役...
グラフ

グラフの中に回帰式を入れる方法

local変数の面目躍如たる瞬間だと思いますが、 回帰式の係数をグラフ中にうまく表示させる方法をシェアします. 簡単です. Stataに内蔵されているデータセット ”auto.dta” を使っていきます.   回帰式の係数を取り出すときに、...
プログラミング

改行の仕方

グラフのコマンドを書いているととてつもなく長くなってしまうことが多々あります. そんなとき、画面上にすっきりと納めたくなります. そこで使えるのが「改行してるけどしてないことにしておく」コマンドです.   command a b c d f...
プログラミング

連続変数からカテゴリー変数を作るコツ

連続変数からカテゴリー変数を作る、という方法はStataではいくつか用意されていますが、実際に使い分けがよくわからない、という声を良く聞きます. 今回は連続変数からカテゴリー変数を作る方法を整理してみたいと思います. 1.連続変数の”区切れ...