今回は3群以上の差の検定方法のひとつである「クラスカル・ウォリス検定」について実践してみたいと思います。
「A町、B町、C町での運動耐用能の比較」
「60歳台、70歳台、80歳台での握力の比較」
など、対応がない3群以上の差の検定を行うときに選択します。
パラメトリックなデータの時は「一元配置分散分析」を選択しますが、ノンパラメトリックなデータでも行えるのが「クラスカル・ウォリス検定」になります。
今回もデモデータを使用してわかりやすく実践していきます。
EZRを使っていきますが、EZRの導入については以下のサイトをご確認ください。
データのインポートについては以下のサイトをご確認ください。
簡単に実践できるようにまとめてみました。
スポンサードサーチ
3群以上の差の検定方法の選択
3群以上の差の検定については、検定方法がいろいろありますので、間違えないようにしないといけません。
今回も図のフローチャートを参考に決定していきます。
今回はノンパラメトリックの「クラスカル・ウォリス検定」を適応した場合になります。
*3群以上の差の検定については以下のサイトにまとめていますので参考にしてください。
今回は対応のないデータに対しての比較になります。
*データの対応については以下のサイトを参考にしてください。
今回はノンパラメトリックな方法ですので、幅広いデータに使用できます。
*パラメトリックとノンパラメトリックについては以下のサイトを参考にしてください。
正規分布については、実際に確認していきます。
正規分布の確認
パラメトリックな方法になるか、ノンパラメトリックな方法になるかは正規分布に従っているかどうかで変わります。
EZRを使用して正規分布を確認します。
*正規分布については以下のサイトを参考にしてください。
今回もデモデータを使用して、「握力」を「60歳台」「70歳台」「80歳台」の3群に分けて差の検定を行います。
「60歳台」「70歳台」「80歳台」の正規分布を確認しますので、3つの変数が対象になり、ひとつでも正規分布に従わなかったらノンパラメトリック検定になります。
まずは「60歳台」から正規性の検定を行っていきます。
統計解析→連続変数の解析→正規性の検定を選択します。
このまま変数を「握力」とすると、全ての年代を混ぜたデータの正規性を確認してしまいます。
各年代のそれぞれの正規性を確認したいので、
下記の赤丸の場所に、「60歳台」だけと絞り込みが必要です。
データの入力で、年代を「age.category」、60歳台を60、70歳台を70、80歳台を80と入力していますので、
「age.category==60」として60歳台だけを選択してもらいます。
以下のように、「60歳台」だけのヒストグラムが作成されます。
グラフで視認性に確認しながら、同時に表示される検定結果も確認します。
サンプル数が26名と少ないため、Shapiro-Wilk検定を確認します。
P=0.03であり、p<0.05ですので、正規性が棄却され、正規分布に従わないと判断できます。
同様に「70歳台」「80歳台」と確認するのですが、今回は「60歳台」で正規分布に従わずにノンパラメトリックの方法になりましたので、「70歳台」「80歳台」の確認は割愛します。
(データの把握のために確認したほうがいいですが、検定方法はノンパラメトリックの方法になりますので、今回は割愛しています)
スポンサードサーチ
クラスカル・ウォリス検定、多重比較
3群以上の差の検定であり、対応のないデータのノンパラメトリックの方法ですので、「クラスカル・ウォリス検定」が選択されました。
これからEZRで実践していきます。
統計解析→ノンパラメトリック検定→3群以上の間の比較(Kruskal-Wallis検定)を選択します。
目的変数(比較したい変数)を「grip(握力)」、グループ(群分け)を「age.category(年台)」を選択します。
EZRの場合は、事後検定である多重比較も同時に行ってくれます。
多重比較の方法は4つ選べますので、行いたい方法を選択します。
今回は、オーソドックスですが有意差がでにくい(比較的厳密に検定したい場合にオススメ)「Bonferroni」と、有意差がでやすい「Steel-Dwass」の両方を見てみます。
(Steel-Dwassは、分散分析後の多重比較で選択するTukey法に相当します)
多重比較については、以下のサイトを参考にしてください。
検定を実施すると、箱ひげ図が表示されます。
今回はノンパラメトリックの方法ですので、箱ひげ図が表示されます。
*箱ひげ図に関しては以下を参考にしてください。
参考までに箱ひげ図の見方について以下に示します。
検定結果に戻ります。
箱ひげ図と同時にKruskal-Wallis検定結果が表示されます。
P=0.00004ですので、P<0.05となり、有意差ありと判断できます。
ここまででは「3群間のどこかに有意差がある」までしかわかりません。
次に、多重比較の結果を確認します。(上記で有意差がでなかったら多重比較の結果は確認しません)
まずは、「Bonferroni法」の多重比較の結果を確認します。
この結果から、「60歳台と80歳台」はP<0.05で有意差ありとわかります。
それ以外の「60歳台と70歳台」「70歳台と80歳台」はP≧0.05であり、有意差がないと判断できます。
ちなみに、「Steel-Dwass法」での多重比較の結果も確認してみます。
「Bonferroni法」と表示の仕方と値がちがいますが、結果は一緒です。
この結果から、「60歳台と80歳台」はP<0.05で有意差ありとわかります。
それ以外の「60歳台と70歳台」「70歳台と80歳台」はP≧0.05であり、有意差がないと判断できます。
目的に応じて、多重比較の方法を選択して採用してください。
(今回はデモでしたので、両方表示してみましたが、基本的には1つで問題ありません)
まとめ
- クラスカル・ウォリス検定はノンパラメトリックな方法で、対応のないデータの方法です。
- 分散分析と同様に、「どことどこの群に差がある」まではわからないので、同時に事後検定である「多重比較」を行います。
- 多重比較には様々な方法があるので、用途によって選択します。
クラスカル・ウォリス検定はノンパラメトリックな方法ですので、データ数が少ない場合や、正規分布に従っていない場合にも使用できるので行いやすい検定方法かと思います。
選択するまで一見複雑そうですが、簡単にまとめましたので参考にしていただけたら幸いです。
****
その他のEZRの使い方/統計手法について以下のサイトにまとめていますので参考にしてください
****
“EZRの使い方:クラスカル・ウォリス検定の実践” への1件のフィードバック