3群以上の差の検定方法の1つに、「分散分析」という方法が選択されます。
しかし、分散分析は「分散分析反復測定」「一元配置分散分析」など、さまざまな用語があり混乱してしまいます。
(少なくとも私は混乱しました・・・)
しっかり理解すればそれほど複雑ではないのですが、知らないと用語だけでもイヤになってしまいます。
今回は「分散分析」の種類と違いについて簡単にまとめましたので、参考にしてください。
スポンサードサーチ
3群以上の差の検定
3群以上の差の検定方法は以下のようにフローチャートで選択できます。
左図に示したパラメトリックな方法が「分散分析」になります。
3群以上の差の検定方法については以下のサイトをご確認ください。
分散分析
各群間の平均値に差があるのかを調べる方法です。
パラメトリックな方法であり、データが正規分布に従って、等分散されていることが前提になります。
正規分布については以下のサイトを参考にしてください。
等分散については以下のサイトを参考にしてください。
検定として「各群の平均値は互いに等しい」という帰無仮説を立て、その確率を調べる方法です。
→帰無仮説が棄却されることで、群間に差があることがわかるのですが、どことどこの群間に差があるのかまではわかりません。
スポンサードサーチ
分散分析の種類と用語
分散分析にはいくつかの種類があり、「対応の有無」と「要因の数」などで分けられます。
対応の有無については以下のサイトを参考にしてください。
以下に分散分析で使用される用語を整理します。
要因:影響を及ぼす条件(独立変数)
水準:条件の数を示します。
主効果:要因によって生じる差
例えば、「握力」が「年代」に影響されるとしたら、「有意な主効果を認めた」などと表現されることがあります。
データに影響を及ぼす変数である要因(または因子)は「年代」であり、要因の基準となる内訳である水準は「50歳台、60歳台、70歳台」の3つになります。
→要因が1つの場合を、「一元配置分散分析」といいます。
さらに男女による影響も確認したいとなると、「年代」以外に「性別」という要因が増えることになり、要因が2つになります。
→要因が2つの場合を、「二元配置分散分析」といいます。
2要因までの分散分析は以下のようなパターンになります。
一元配置分散分析(対応なし)
一元配置分散分析反復測定(対応あり)
二元配置分散分析(対応なし)
二元配置分散分析反復測定(対応あり・なし混在)
二元配置分散分析反復測定(対応あり)
もう少し詳しくまとめていきます。
主効果
先ほど記載したように、分散分析で要因によって平均値に差があった場合に「主効果がある」と表現します。
一元配置分散分析の場合は、以下のように単純です。
二元配置分散分析の場合は、要因が2つとなるため、主効果の判断も複雑になってきます。
(例として、「握力」に対して、要因を「年代」と「性別」の2つとして考えてみます)
*図がわかりやすいように、標準偏差を割愛し、数値を線で結んでみました。
このように、要因が増えると要因ごとに主効果の有無を確認する必要がでてきます。
交互作用
要因が2つ以上の場合では、主効果の他に「交互作用」を確認する必要があります。
「交互作用」とは要因同士の組み合わせによる効果のことを示します。
交互作用には相乗効果と相殺効果があります。
下の図に例をあげてみます。
(実臨床ではありえない例かもしれませんが、わかりやすいようにこのようにしました・・)
これらの場合は、単純に要因をひとまとまりにしても効果を説明できません。
→このようなとき「交互作用がある」と表現します。
二元配置以上の分散分析の場合は、交互作用があるのかどうか必ず確かめる必要があります。
交互作用がある場合、さらに詳しくデータを解析することで結果の解釈を深めることができます。
例えば、一方の要因を水準ごとに分け、他方の要因の主効果を検定する方法があります。
上記の例では、男性と女性に分けて、年代によって握力に主効果があるのか一元配置分散分析を行なって確かめるなどです。
→これを「単純主効果の検定」といいます。
まとめ
- 3群以上の差の検定で、パラメトリックな方法には分散分析があります。
- 分散分析は対応の有無や、要因の数によって様々な種類があります。
- 分散分析を解釈する時は、「主効果」や「交互作用」を考える必要があります。
分散分析は二元配置以上になると、解釈が複雑になってきますが、「交互作用」を理解して、「主効果」を考えていくと結果が見通しやすくなります。
複雑になりそうですが、調査したいデータをアルゴリズムに当てはめていくと3群以上の差の検定方法もわかりやすいので、参考にしていただけたら幸いです。
“統計学入門:分散分析の種類〜3群以上の差の検定方法〜” への2件のフィードバック