今回は3群以上の差の検定のひとつである「一元配置分散分析」について実践してみたいと思います。
「A町、B町、C町での運動耐容能の比較」
「60歳台、70歳台、80歳台での握力の比較」
など、対応がない3群以上の差の検定を行うときに使用するパラメトリックな方法になります。
今回もデモデータを使用してわかりやすく実践していきます。
EZRを使っていきますが、EZRの導入については以下のサイトをご確認ください。
データのインポートについては以下のサイトをご確認ください。
簡単に実践できるようにまとめてみました。
スポンサードサーチ
3群以上の差の検定方法の選択
3群以上の差の検定については、検定方法がいろいろありますので、間違えないようにしないといけません。
今回も図のフローチャートを参考に決定していきます。
今回は分散分析の「一元配置分散分析」を適応した場合になります。
*3群以上の差の検定については以下のサイトにまとめていますので参考にしてください。
「一元配置分散分析」と「二元配置分散分析」はみたい要因が1つか2つかによって変わってきます。
分散分析については詳しく以下のサイトに記載していますので、参考にしてください。
今回は対応のないデータに対しての比較になります。
*データの対応については以下のサイトを参考にしてください。
正規分布と等分散については、実際に確認していきます。
正規分布の確認
一元配置分散分析は正規分布に従っていて、さらに等分散していることが条件になります。
EZRを使用して正規分布と等分散を確認します。
まずは正規分布を確認していきます。
*正規分布については以下のサイトを参考にしてください。
今回もデモデータを使用して、「握力」を「60歳台」「70歳台」「80歳台」の3群に分けて差の検定を行います。
「60歳台」「70歳台」「80歳台」の正規分布を確認しますので、3つの変数が対象になります。
まずは、視覚的に「ヒストグラム」で3群を確認してみます。
グラフと表→ヒストグラムを選択します。
変数を「grip(握力)」にして、群別する変数を「age category」として選択します。
ヒストグラムが作成されますので、3群を視覚的に比較します。
視覚的には正規分布に従っているような感じがしますが、3群以上にもなるとわかりにくいですよね。
次に正規性の検定を実際に行います。
まずは「60台」を確認します。
統計解析→連続変数の解析→正規性の検定を選択します。
このまま変数を「握力」とすると、全ての年代を混ぜたデータの正規性を確認してしまいます。
各年代のそれぞれの正規性を確認したいので、
下記の赤丸の場所に、「60歳台」だけと絞り込みが必要です。
データ入力で、年代を「age.category」、60歳台を60、70歳台を70、80歳台を80と入力していますので、
「age.category==60」として60歳台だけを選択してもらいます。
以下のように、「60歳台」だけのヒストグラムが作成されます。
同時に検定結果も確認します。
サンプル数が26名と少ないため、Shapiro-Wilk検定を確認します。
P=0.41とP≧0.05ですので、正規分布に従うと判断できます。
同様にして「70歳台」「80歳台」を確認しますが、今回は割愛します。
(どちらも正規分布に従っているデモデータになります。)
スポンサードサーチ
等分散の確認
次に、データの分布が等分散かどうかを確認します。
等分散については以下のサイトを確認してください。
統計解析→連続変数の解析→3群以上の等分散の検定(Bartlett検定)を選択します。
目的変数を「grip」、グループを「age.category」と選択すると3群の等分散を検定してくれます。
このような検定結果が表示されます。
P<0.05となると等分散は棄却されます(等分散ではないとされます)。
今回はP=0.73ですので、等分散であると判断できます。
これでデータが正規分布に従っていて、等分散していると確認できますので、「一元配置分散分析」が選択されることになります。
一元配置分散分析・多重比較
3群それぞれで正規分布と等分散を確認できたので、ようやく「一元配置分散分析」が行えます。
統計解析→連続変数の解析→3群以上の間の平均値の比較(一元配置分散分析one-way ANOVA)を選択します。
目的変数を「grip」、比較する群を「age.category」を選択します。
先ほど等分散を確認しましたので、「はい(一元配置分散分析)」を選択します。
EZRの場合は、分散分析に加えて事後検定である多重比較も同時に行なってくれます。
多重比較の方法は4つ選べますので、行いたい方法を選択します。
基本的には「Tukey法」を選択しておけばいいようです。(目的によりますが)
今回は、オーソドックスですが有意差がでにくい(比較的厳密に検定したい場合にオススメ)「Bonferroni」と、有意差がでやすい「Tukey」の両方をみてみます。
(両方とも幅広く使える多重比較の方法です。)
多重比較については以下のサイトを参考にしてください。
選択するとすぐに結果と棒グラフが出力されます。
棒グラフを確認すると・・綺麗に年代によって握力が低下していることがわかります。
実際の検定結果を確認します。
各群の平均と標準偏差が出力され、右側にP値が表示されます。
今回はP値がP<0.05であることから、「3群のどこかに有意差がある」と判明します。
これが分散分析のややこしいところで、ここまでではどことどこに有意に差があるかはわかりません。
そのため、事後検定の「多重比較」が必要になります。
多重比較には様々な方法があり、今回は「Bonferroni法」と、「Tukey法」の両方をみてみます。
以下が「Bonferroni法」の結果です。
P<0.05で有意に差があると判断しますので、「60歳台と80歳台」「70歳台と80歳台」が有意に差があると判明しました。
別な多重比較の方法もみてみます。
以下が「Tukey法」の結果です。
右下の「p adj」の値を確認します。
これもP<0.05で有意に差があると判断しますので、「Bonferroni法」同様に「60歳台と80歳台」「70歳台と80歳台」が有意に差があると判明しました。
今回はどちらも同じ結果でしたが、P値は違いますように、データによっては有意差の有無も変わってきます。
多重比較の方法は厳密度など、目的をもって選択してください。
詳しくは以下のサイトを確認してください。
スポンサードサーチ
まとめ
- 一元配置分散分析はパラメトリックな方法で、正規性の確認と等分散の確認が必要です。
- データは対応のないデータで、要因が1つの場合に選択されます。
- 分散分析では「どことどこの群に差がある」まではわからないので、同時に事後検定である「多重比較」を行います。
- 多重比較には様々な方法があるので(EZRでは4つから選べる)、用途によって選択します。
一元配置分散分析を行うには、正規性や分散が必要とされるのでデータの確認が大変ですが、要件を満たしてしまえば今回記載した方法にそっていけば簡単に行えます。
一見複雑そうですが、簡単にまとめましたので参考にしていただけたら幸いです。
****
その他のEZRの使い方/統計手法について以下のサイトにまとめていますので参考にしてください
****