研究を行うときはデータの解析が必要です。
統計手法を選ぶ時に、データが「等分散」なのか「非等分散」なのかによって検定方法が違ってきます。
「等分散?」
「非等分散?」
慣れないと何をいっているかわからないですよね・・・
(本当にわからない用語ばかりで私は戸惑いました・・・)
今回はデータの「等分散」「非等分散」について簡単にまとめ、さらにEZRを利用して検定で等分散の確認をする方法までご紹介します。
スポンサードサーチ
等分散・非等分散
分散と非等分散を確認する前に、データが正規分布に従っていることが前提になります。
(正規分布に従っていないと、山の形がいびつで等分散でも非等分散でもありません)
正規分布については以下のサイトを参考にしてください。
各群のデータが正規分布に従っていることを確認したら次に移ります。
今度はデータの分散が等分散なのか、非等分散なのかを確認しないといけません。
等分散とは、データの釣鐘型の形状が対象とした2群で近似していることを示します。
非等分散とは、データの釣鐘型の形状が対象とした2群で異なることを示します。
わかりやすいように、イメージ図を表示します。
図をイメージするとわかりやすいと思います。
実際に等分散なのか、非等分散なのか、グラフで視認性で判断する以外に、検定で判断できます。
「F検定(2群)」「Bartlett検定(3群以上)」という統計的検定を用いるとそれぞれの群が等分散しているのかを確認できます。
EZRを使用すれば検定が簡単に行えますので、実践してみます。
等分散の確認:F検定、Bartlett検定の実践
今回使用するデモデータは「握力」です。
*データが2群なのか、3群以上なのかで選択が違ってきますので以下の2つのデモデータを使用します。
①「男性、女性」の2群で分散を確認します。
②「60歳台、70歳台、80歳台」の3群で分散を確認します。
前提としてデータが正規分布に従っていることが条件です。
(今回のデモデータは正規分布に従っていますし、実際に確認済みということにします)
それでは分布が等分散なのか、非等分散なのか、実際に確認していきます。
2群の等分散の確認
2群ですので、①「男性、女性」の2群で分けたデモデータを使用します。
統計解析→連続変数の解析→2群の等分散性の検定(F検定)を選択します。
目的変数に「握力」、グループに「sex」を選択します。
検定結果が以下のように出力されます。
F検定 P値=0.00794となっています。
つまり、今回はP<0.05ですので、非等分散であると判断されました。
ヒストグラムで確認すると以下のグラフになりますね。
3群以上の等分散の確認
3群以上ですので、②「60歳台、70歳台、80歳台」の3群で分けたデモデータで分散を確認します。
握力を「grip」、年代を「age.category」としたデモデータです。
統計解析→連続変数の解析→3群以上の等分散の検定(Bartlett検定)を選択します。
目的変数に「握力」、グループに「年代」を選択します。
簡単に等分散の検定が行われ、以下のような結果が表示されます。
P値=0.7355と表示されていることがわかると思います。
つまり、今回はP=0.73ですので等分散であると判断できます。
視覚的に確認する場合は以下のようにヒストグラムを確認します。
グラフと表→ヒストグラム
変数に「握力」、群別する変数に「年代」を選択します。
選択するとこのようなヒストグラムがでてきます。
視認性の確認の場合、3群以上だとわかりにくいですよね。
ですので、先ほどの検定結果に従うことがいいとおもいます。
スポンサードサーチ
まとめ
- データが正規分布に従っていても、等分散なのか非等分散なのかで検定方法が変わることがあります。
- ヒストグラムで視認性に確認もできますが、正確には検定を使用します。
- 2群の場合はF検定、3群以上の場合はBartlett検定を行います。
- 検定はEZRで簡単に行えます。
検定方法を選択する場合にどうしても必要なことですので、理解しておかないといけません。
EZRを使用すれば簡単に行えますので参考にしてください。