今回は対応のあるデータを利用した分散分析について実践したいと思います。
「リハビリ前、リハビリ3ヶ月後、リハビリ6ヶ月後の握力の変化」
「投薬効果について、開始前、半年後、1年後の血圧の変化」
など、同一人物群を時間の経過でみていき、効果を判定したいことがありますよね。
データがパラメトリックなデータかノンパラメトリックなデータかによって方法が変わりますが、今回はパラメトリックな方法の3群以上の差の検定についてまとめてみました。
今回もデモデータを使用してわかりやすく実践していきます。
EZRを使っていきますが、EZRの導入については以下のサイトをご確認ください。
データのインポートについては以下のサイトをご確認ください。
簡単に実践できるようにまとめてみました。
スポンサードサーチ
3群以上の差の検定方法の選択
3群以上の差の検定については、検定方法がいろいろありますので、間違えないようにしないといけません。
今回も図のフローチャートを参考に決定していきます。
今回は分散分析の「一元配置分散分析反復測定」を適応した場合になります。
*3群以上の差の検定については以下のサイトにまとめていますので参考にしてください。
「一元配置分散分析反復測定」と「二元配置分散分析反復測定」はみたい要因が1つか2つかによって変わってきます。
分散分析については詳しく以下のサイトに記載していますので、参考にしてください。
今回は対応のあるデータに対しての比較になります。(時系列でみていくデータです)
*データの対応については以下のサイトを参考にしてください。
正規分布と等分散については、実際に確認していきます。
正規分布の確認
一元配置分散分析反復測定は正規分布に従っていて、さらに等分散していることが条件になります。
EZRを使用して正規分布と等分散を確認します。
まずは正規分布を確認していきます。
*正規分布については以下のサイトを参考にしてください。
今回もデモデータを使用して、「握力」を「リハビリ開始前」「3ヶ月後」「6ヶ月後」の3群に分けて差の検定を行います。
「リハビリ開始前」「3ヶ月後」「6ヶ月後」の正規分布を確認しますので、3つの変数が対象になります。
正規性の検定を実際に行います。
まずは「リハビリ開始前」を確認します。
統計解析→連続変数の解析→正規性の検定を選択します。
変数を「リハビリ開始前(M0)」を選択します。
以下のようにグラフが作成されますので、視覚的に確認します。
今回のデータだと、視覚的には正規分布に従っていそうですね。
同時に検定結果も確認します。
サンプル数が26名と少ないため、Shapiro-Wilk検定を確認します。
P=0.10とP≧0.05ですので、正規分布に従うと判断できます。
同様にして「3ヶ月後」「6ヶ月後」を確認しますが、今回は割愛します。
(どちらも正規分布に従っているデモデータになります。)
スポンサードサーチ
等分散の確認
次に、データの分布が等分散かどうかを確認します。
等分散については以下のサイトを確認してください。
今回行う「一元配置分散分析反復測定法」は、検定と同時に等分散の確認もしてくれますので、検定にすすみます。
一元配置分散分析反復測定・多重比較
3群それぞれで正規分布の確認できたので、「一元配置分散分析反復測定」が行えます。
統計解析→連続変数の解析→対応のある2群以上の間の平均値の比較(反復[経時]測定分散分析)を選択します。
変数を複数選択します。
群別する必要がなければ選択しません。(今回は群別していません)
EZRの場合は、分散分析に加えて事後検定である多重比較も同時に行なってくれます。
多重比較の方法は2つ選べますので、行いたい方法を選択します。
基本的には「Bonferroni法」を選択しておけばいいです。(目的によりますが)
多重比較や方法については以下のサイトを参考にしてください。
検索を行うと、まずはグラフが表示されます。
今回のデモデータでは、綺麗にリハビリ開始後から、3ヶ月、6ヶ月と握力が向上していることがわかります。
*時系列の順序は変数名のアルファベットん順になるようです。今回は「M」は共通なので、0→3→6の順に並んでいます。自分の研究で使用する際は時系列に合うように変数名を設定する必要があります(これが無料のEZRの限界ですかね・・・)
実際の解析結果をみていきます。
まずは、今回のデータが等分散しているかどうかを確認する必要があります。
「Mauchly Tests for Sphericity」と書いてある部分を確認します。
P値=0.09となっていることがわかります。
これは「Mauchlyの球面性の検定」というものの結果を表しているようです。
球面性の検定とは・・・
測定時期(被験者内要因間)の差の分散の等質性を意味するものである。
引用:EZRでやさしく学ぶ統計学(P203-204)
とされています。
つまり、ここで等分散の判断ができるのですが、Mauchlyの球面性の検定ではP<0.05の場合に球面性が棄却されますので、今回はP=0.09のため、等分散していると判断できます。
そのため、「一元配置分散分析反復測定」が行えるとなっていきます。
もし球面性が否定されてしまった場合は、Mauchly testの下に記載されているGreenhouse-Geisserあるいは、Huynh-Feldtのいずれかの方式で補正した値を採用するようです。
ややこしいですよね・・・
実は「一元配置分散分析反復測定」のようなパラメトリックな方法を選択できるデータでもノンパラメトリックな方法を選択することもあります。
専門家によって諸説あるようですが、私が勉強した「新谷歩」先生の書籍には以下のように書かれています。
反復測定のある分散分析は、解析がやっかいなので、本書ではノンパラメトリック検定のフリードマン検定を紹介します。
引用:みんなの医療統計 P93
このように専門家によって意見が違うこともあるので統計はややこしいんですよね。
もし、Mauchlyの球面性の検定で等分散が否定されて、Greenhouse-Geisserあるいは、Huynh-Feldtの理解が難しければ、フリードマンの検定を選択することも間違いではないと思います。
少し話がそれましたが、
これでようやく反復測定分散分析の結果を示す部分になります。
以下のように結果が表示されています。
P値は2.2e-16(2.2×10の-16乗)となっていますいので、時間の経過とともに有意な差がある(有意に変化している)と判断できます。
分散分析の特徴として、どことどこの経過に差があるかがわかりませんので、同時に多重比較も行なっています。
多重比較の結果は以下のようになっています。(今回はBonferroni法を選択しています)
ここに、各群間におけるP値が書いてあります。
P<0.05ですので、M0-M3、M3-M6のいずれも有意差ありとの結果になります。
結論として、
「握力はリハビリ開始後から、3ヶ月、6ヶ月とそれぞれ有意に増加した」となります。
スポンサードサーチ
まとめ
- 一元配置分散分析反復測定はパラメトリックな方法で、正規性の確認と等分散の確認が必要です。
- データは対応のあるデータで、要因が1つの場合に選択されます。
- 分散分析では「どことどこの群に差がある」まではわからないので、同時に事後検定である「多重比較」を行います。
- 多重比較には様々な方法があるので、用途によって選択します。
一元配置分散分析と違い、反復測定の場合は等分散の確認方法が違いますので注意が必要です。
正規性や分散が必要とされるのでデータの確認が大変ですが、要件を満たしてしまえば今回記載した方法にそっていけば行えます。
一見複雑そうですが、簡単にまとめましたので参考にしていただけたら幸いです。
****
その他のEZRの使い方/統計手法について以下のサイトにまとめていますので参考にしてください
****
“EZRの使い方:一元配置分散分析反復測定の実践” への1件のフィードバック