統計学入門:分散分析の種類〜3郡以上の差の検定方法〜

3郡以上の差の検定方法の1つに、「分散分析」という方法が選択されます。

しかし、分散分析は「分散分析反復測定」「一元配置分散分析」など、さまざまな用語があり混乱してしまいます。

(少なくとも私は混乱しました・・・)

 

しっかり理解すればそれほど複雑ではないのですが、知らないと用語だけでもイヤになってしまいます。

今回は「分散分析」の種類と違いについて簡単にまとめましたので、参考にしてください。

スポンサードサーチ

3郡以上の差の検定

3郡以上の差の検定方法は以下のようにフローチャートで選択できます。

左図に示したパラメトリックな方法「分散分析」になります。

 

3郡以上の差の検定方法については以下のサイトをご確認ください。

統計学入門:3群以上の差の検定〜検定方法の選び方〜

分散分析

分散分析(ANOVA:analysis of variance)

各群間の平均値に差があるのかを調べる方法です。

パラメトリックな方法であり、データが正規分布に従って、等分散されていることが前提になります。

正規分布については以下のサイトを参考にしてください。

EZRの使い方:正規分布とは?正規分布の求め方

 

等分散については以下のサイトを参考にしてください。

統計学入門:データの等分散?非等分散?EZRで検定を実践

 

検定として「各群の平均値は互いに等しい」という帰無仮説を立て、その確率を調べる方法です。

→帰無仮説が棄却されることで、群間に差があることがわかるのですが、どことどこの群間に差があるのかまではわかりません。

スポンサードサーチ

分散分析の種類と用語

分散分析にはいくつかの種類があり、「対応の有無」「要因の数」などで分けられます。

 

対応の有無については以下のサイトを参考にしてください。

対応のあるデータ?対応のないデータ?

 

以下に分散分析で使用される用語を整理します。

要因:影響を及ぼす条件(独立変数)

水準:条件の数を示します。

主効果:要因によって生じる差

 

例えば、「握力」が「年代」に影響されるとしたら、「有意な主効果を認めた」などと表現されることがあります。

データに影響を及ぼす変数である要因(または因子)は「年代」であり、要因の基準となる内訳である水準は「50歳台、60歳台、70歳台」の3つになります。

→要因が1つの場合を、「一元配置分散分析」といいます。

 

さらに男女による影響も確認したいとなると、「年代」以外に「性別」という要因が増えることになり、要因が2つになります。

→要因が2つの場合を、「二元配置分散分析」といいます。

 

2要因までの分散分析は以下のようなパターンになります。

一元配置分散分析(対応なし)

一元配置分散分析反復測定(対応あり)

 

二元配置分散分析(対応なし)

二元配置分散分析反復測定(対応あり・なし混在)

二元配置分散分析反復測定(対応あり)

 

もう少し詳しくまとめていきます。

主効果

先ほど記載したように、分散分析で要因によって平均値に差があった場合に「主効果がある」と表現します。

一元配置分散分析の場合は、以下のように単純です。

一元配置分散分析の例

年代に主効果あり(握力は年代によって差が生じる)

 

二元配置分散分析の場合は、要因が2つとなるため、主効果の判断も複雑になってきます。

(例として、「握力」に対して、要因を「年代」と「性別」の2つとして考えてみます)

*図がわかりやすいように、標準偏差を割愛し、数値を線で結んでみました。

二元配置分散分析の例

①年代・性別ともに主効果あり

 

②年代に主効果あり

 

③性別に主効果あり

このように、要因が増えると要因ごとに主効果の有無を確認する必要がでてきます。

交互作用

要因が2つ以上の場合では、主効果の他に「交互作用」を確認する必要があります。

「交互作用」とは要因同士の組み合わせによる効果のことを示します。

交互作用には相乗効果と相殺効果があります。

 

下の図に例をあげてみます。

(実臨床ではありえない例かもしれませんが、わかりやすいようにこのようにしました・・)

交互作用がある場合:二元配置分散分析

①1要因のみ、水準で変化

 

②各要因の水準ごとに複雑に変化

 

これらの場合は、単純に要因をひとまとまりにしても効果を説明できません。

→このようなとき「交互作用がある」と表現します。

 

二元配置以上の分散分析の場合は、交互作用があるのかどうか必ず確かめる必要があります。

 

交互作用がある場合、さらに詳しくデータを解析することで結果の解釈を深めることができます。

例えば、一方の要因を水準ごとに分け、他方の要因の主効果を検定する方法があります。

上記の例では、男性と女性に分けて、年代によって握力に主効果があるのか一元配置分散分析を行なって確かめるなどです。

→これを「単純主効果の検定」といいます。

 

交互作用がある場合、どこに差があるのかをデータを分けて検討(事後検定)をするとデータの見通しがよくなります。

まとめ

  • 3群以上の差の検定で、パラメトリックな方法には分散分析があります。
  • 分散分析は対応の有無や、要因の数によって様々な種類があります。
  • 分散分析を解釈する時は、「主効果」や「交互作用」を考える必要があります。

 

分散分析は二元配置以上になると、解釈が複雑になってきますが、「交互作用」を理解して、「主効果」を考えていくと結果が見通しやすくなります。

複雑になりそうですが、調査したいデータをアルゴリズムに当てはめていくと3群以上の差の検定方法もわかりやすいので、参考にしていただけたら幸いです。