基準となるテーブルを参照して平均と標準偏差からSD値を計算する

プログラミング

このブログでは、統計解析ソフトStataのプログラミングのTipsや便利コマンドを紹介しています.

Facebook groupでは、ちょっとした疑問や気づいたことなどを共有して貰うフォーラムになっています. ブログと合わせて個人の学習に役立てて貰えれば幸いです.

ある研究で小児の体格を年齢別の平均値と標準偏差からSD値を計算する、という必要に迫られました.

日本人の小児の体格は、2000年度に行われた調査データに基づいて標準化するのが妥当であるとされているようですので、その出どころのデータを探し出して何とかSD値を計算しました.

日本人小児の体格を評価する際、2000 年度に厚生労働省および文部科学省が発表した身
体測定値データ(以下 2000 年度データ)から算出した基準値を今後も標準値として用いる
ことが妥当であると結論する。この結論が、臨床・教育などの現場や、研究・生活指導な
どの目的によらず、広く用いられることを期待する。

「日本人小児の体格の評価に関する基本的な考え方」 日本小児内分泌学会・日本成長学会合同標準値委員会

日本小児内分泌学会のHPにはそのもととなる表が、

「平均身長・平均体重およびその標準偏差と、横断的成長曲線(身長・体重SD曲線)」という項目の附表1として入手可能です.

PDFで公開されていましたので、それをExcelに直す必要があります.

(下のファイルのようにご自分で作成していただければと思います.)

(こちらのファイルはダウンロードには特に制限は設けていません.)

性別、年齢(年)、年齢(月)という変数があります.これをマージの条件にするというのがミソです.

sex 1=男、0=女としてます.age_y=10, age_m=2 だったら、10歳2か月という意味になります.

迎える側のデータセットにもこれと全く同じものを用意します.

つまり、性別をsex(0=female, 1=male)、年齢は年と月にわけたものを作成します.

そして、

merge m:1 sex age_y age_m using filename

としてあげて、あとは

gen stx_身長 = round((身長-mean_height)/sd_height, .1)

などとやってしまえばいわゆるSD値、Zスコアが求められます.

体重でも同じように求められます.

コメント

タイトルとURLをコピーしました