プログラミング 縦持ちデータの加工のためのコツ4選 データセットはlong data typeとwide data typeに大別できます(いわゆる縦持ちと横持ちってやつです).たいていの分析はwide data、すなわち一人につき一行で横に連なるデータを使って処理することが多いと思います.... 2020.07.05 プログラミング
その他 CRIC研究とCKD-JAC研究のコラボレーションで学んだこと 新たなカテゴリーとして「論文紹介」と「その他」を追加しました.「論文紹介」では管理者の独断と偏見と気まぐれで選んだ論文を解説します.「その他」カテゴリーはネタに困ったときの切り札(?)ですが、主にアメリカに臨床疫学を学ぶために留学していたと... 2020.06.28 その他
論文紹介 入院中のナトリウム変動と予後(CJASN) ブログレイアウトを変更して少しずつ過去の記事を修正していったせいか、見に来てくださる方の数が増えてきています.ありがたや~.さて、今回新たなカテゴリーとして「論文紹介」と「その他」を追加しました.「論文紹介」では管理者の独断と偏見と気まぐれ... 2020.06.27 論文紹介
グラフ 比例ハザード性からの逸脱への対応 このブログでは、統計解析ソフトStataのプログラミングのTipsや便利コマンドを紹介しています.Facebook groupでは、ちょっとした疑問や気づいたことなどを共有して貰うフォーラムになっています. ブログと合わせて個人の学習に役立... 2020.06.21 グラフ
疫学 比例ハザード性からの逸脱を確認する このブログでは、統計解析ソフトStataのプログラミングのTipsや便利コマンドを紹介しています.Facebook groupでは、ちょっとした疑問や気づいたことなどを共有して貰うフォーラムになっています. ブログと合わせて個人の学習に役立... 2020.06.20 疫学統計
疫学 誤分類バイアスについて 今回は疫学に関する内容で、Stataは直接的には関係ありません.しかし最近つくづく思うのは、疫学の知識をもって統計やプログラミングを実践しなければ結局のところ臨床研究として一番重要な部分は抜けてしまう、ということです.Discussionを... 2020.06.14 疫学
プログラミング 複数のループを重ねる ループを使って繰り返しのコマンドをひとまとめにするコツを以前の記事でまとめていますが、今回は、ループをいくつも重ねてすっきり洗練されたプログラムを書くコツをまとめてみたいと思います.1.多変量モデルをいくつも走らせて、メインの曝露因子の結果... 2020.06.13 プログラミング
プログラミング Labelの設定② 今回も前回に引き続いて変数ラベルと値ラベルに関してまとめていきます.基本コマンドである.labelについては前回の記事で概要をまとめました。そして今回はその拡張版である.elabelについてまとめていきます.1.コマンドを入手する例によって... 2020.06.07 プログラミング
プログラミング Labelの設定① 今日は変数ラベルと値ラベルに関してまとめていきます.基本コマンドである .labelを使いこなすこと、そしてその拡張版である.elabelを必要に応じて使えるようにマスターすることがポイントとなります.今回は"label"コマンドの使い方を... 2020.06.07 プログラミング
疫学 症例対照研究について このブログでは、統計解析ソフトStataのプログラミングのTipsや便利コマンドを紹介しています.時々Stataと関係なく疫学や公衆衛生、統計学に関する記事も掲載していきます.さて、今日のテーマは疫学に関する記事を紹介したいと思います.元ネ... 2020.05.31 疫学
プログラミング Baseline tableの自動生成 さて、今日はBaseline characteristicsを要約した表(いわゆる”Table 1”)をあっという間に自動生成してしまう、便利なコマンドである”.table1_mc”をご紹介します.このコマンドを作成したのは、オーストラリア... 2020.05.30 プログラミング
グラフ lowess plotとlincheck 回帰分析をするときに、何となく変数を入れるだけではなく、データの特性をきちんと踏まえてモデルを組むことが大切です.説明変数同士の関係を散布図や2×2 Tableで記述説明変数と目的変数の関係も同様に記述その他にも、連続変数や順序変数が説明変... 2020.05.24 グラフ
グラフ 棒グラフの注意点 -X軸設定と積み上げ棒グラフの作り方- 今日は棒グラフの描き方に関するコツをお示しします. ポイントとしては、X軸のタイトルの入れ方合わせて100%になるような棒グラフについて説明していきます.いつものautoのデータセットで、燃費と車体の重さの関係について描いてみたいと思います... 2020.05.17 グラフ
グラフ 競合リスクまとめ③ プログラムにミスが見つかりましたので訂正いたしました。お知らせくださった先生、ありがとうございます。(2022/7/8)前回、前々回の記事では競合リスク解析の理論と実践の初歩について説明しました.今回はちょっとした応用編です.前回の記事でも... 2020.05.17 グラフ
グラフ グラフのmarkerとlineを整える Stataはきれいなグラフを描くことができることが魅力の1つなのですが、その際に役立つ便利なツールを紹介します.1.symbolpalette: グラフ中のマーカーの形を変更グラフ中のマーカーの形を選ぶことができます.どんなシンボルにするか... 2020.05.16 グラフ
統計 傾向検定について 「傾向検定」とは、標本集団で観察された平均値や割合が、だんだん大きくなる、もしくはだんだん小さくなるというトレンド(傾向)が、母集団でもそうなっているかどうかを検定するものです. 連続変数における平均値やカテゴリー変数の割合(ここでは二値変... 2020.05.05 統計
統計 生存時間分析におけるバイアスについて 生存時間分析を行う上で、カプランマイヤー法は一般的によく用いられる方法です. 生存時間分析を用いて研究を行うとき、打ち切りがランダムに発生する という前提条件に基づいていますが、本当にそうなのかはわかりません.今日は、何らかの理由に基づく打... 2020.03.22 統計
グラフ 交互作用の表し方 「交互作用」というのは、ある要因と結果の間の関係が、サブグループによって異なるかことを指します. 薬剤Aの効果を見るとき、男女で分けると男性では8割に効いたのに対し、女性には2割しか効果がなかった、といった現象について統計学的に検証すること... 2020.03.20 グラフ統計
プログラミング サブグループやIDごとに集計する 一人一行で整えられた形(Wide)にしても、一人複数行の形(Long)にしても データセットにはある程度共通点を持ったグループであるサブグループがあり、そのサブグループごとに集計値を出したいときがあると思います.それだけでなく、一人複数行の... 2020.03.15 プログラミング
グラフ 競合リスクまとめ② 前回の記事では競合リスク解析の理論について説明しました.いよいよ今回は実践編です.残念ながらStataでは競合リスクを考慮したCumulative incidence法でのグラフを描いて必要な統計的な検討を行うためのコマンドが存在しないため... 2020.03.08 グラフ統計
プログラミング 競合リスクまとめ① 競合リスクとその解析方法をStataでどのようにして実装するのかを理論編と実践編ということで解説していきます.まず今回は理論編ということで、以下のコンテンツに沿って概説します.1.競合リスクとは複数の別の種類のイベントがあり、最初の1つしか... 2020.03.07 プログラミング統計
統計 事前確率から尤度比を使って事後確率を求める 新型コロナウイルスが国内で様々な混乱を引き起こしていますが、政治も医療もてんやわんやとなっています.PCRの検出感度が高くないこと、8割は元気だけど重症化する人もそれなりにいて広まりやすいくせに診断しにくい、という困ったやつです.PCRが保... 2020.03.05 統計
グラフ Kaplan-Meierのきれいな描き方 今回はカプランマイヤーを綺麗に描くためのポイントを書いてみます.以下のエレメントを順番に加えたときにどんなグラフになるかを見てみましょう.Figure legendの位置を調節し、表記を自分好みにするat-risk tableを追加するP値... 2020.03.04 グラフ統計
プログラミング Stataによるデータクリーニング ひさしぶりの更新となりました。皆様お元気でしょうか?世間はコロナウイルス一色ですが、在宅で仕事する人も増えてきているでしょうか。さて、今日はデータマネージメントを学ぶためのStata pressの書籍とWebサイトを1つ紹介させてください.... 2020.02.26 プログラミング
プログラミング P値を計算する方法 ③ 多重補完後の結果を取り出す 回帰モデルを実施した後に、P値や推定値を取り出すのに、_b, _seなどのようにすることでその値を取り出してプログラムに組み込むことができました.Multipleimputation (MI, 多重補完法)を実施したあとの結果を取り出すとき... 2020.01.23 プログラミング統計
プログラミング P値を計算する方法 ② 各種検定・回帰モデルにおけるP値計算方法のまとめ 検定や回帰モデルを実施したあとに、P値や推定値を取り出す、という技があると、表記方法をカスタマイズしたり、結果だけを手早くコピーしたりできるので、その後のデータ整理の時間を短縮することができます.特にたくさんのモデルを試した際に、結果だけと... 2020.01.15 プログラミング統計
統計 P値を計算する方法 ① 統計学の基礎知識編 どのソフトで計算するにしても、プログラミングを行って統計量や検定結果を自分の好みの形で出力するためには統計学の基本的な知識はどうしても必要になります.統計学をまじめに勉強すると奥が深いのですが、今日は、「P値の計算式をどうやってプログラムに... 2020.01.15 統計
グラフ twowayグラフと軸の設定 このブログでは、統計解析ソフトStataのプログラミングのTipsや便利コマンドを紹介しています.Facebook groupでは、ちょっとした疑問や気づいたことなどを共有して貰うフォーラムになっています. ブログと合わせて個人の学習に役立... 2020.01.14 グラフプログラミング
グラフ コマンド“mylabels”のご紹介 値が正規分布に従わないときに対数変換したものをグラフにしたときにつけるラベルで悩んでいたのですが、ちょうどよいコマンドを見つけましたのでご紹介します.こんなやつを、対数変換して、まあこれでもいいのですが、X軸のラベルをかっこよく整えたい!そ... 2020.01.10 グラフ
グラフ カラーパレット2 先日紹介したStataのカラーパレットにさらに強力なバージョンが存在することがわかったのでシェアします.色のグラデーションをつけたいときにはこちらのほうが便利そうですし、いろいろと使い勝手がよさそうな印象です。まだ使いこなせているわけではあ... 2020.01.08 グラフ