今回は対応のないt検定(独立したサンプルのt検定)を実践していきたいと思います。
「対応のないt検定」は2群間の差の検定方法の1つになります。
データが「正規分布」に従っていて、「対応が無い」場合に選択されます。
統計学の教科書によっては、「対応のないt検定」と記載されていたり、「独立したサンプルのt検定」と記載されていたり、「スチューデントのt検定、ウェルチのt検定」と記載されていたりと、統一されていないことがあり混乱してしまいます。
(私がそうでしたので・・・)
「対応のないt検定」と「独立したサンプルのt検定」は同じ意味で、その中に「スチューデントのt検定、ウェルチのt検定」が含まれています。
今回は簡単に理解して、実践できるように、「対応のないt検定(独立したサンプルのt検定)」をまとめてみました。
今回もデモデータを使用して分かりやすく実践していきます。
EZRを使っていきますが、EZRの導入については以下のサイトをご確認ください。
データのインポートについては、以下のサイトをご確認ください。
今回も検定方法さえわかれば、簡単にできますので参考にしてください。
スポンサードサーチ
2群間の差の検定方法の選択
2群間の差の検定については、検定方法がいろいろありますので間違えないようにしないといけません。
今回も図のフローチャートを参考に決定していきます。
今回は「独立したサンプルのt検定」を適応にした場合になります。
データに対応があるかどうかは、データの収集の時点で把握していると思います。
*2群間の差の検定方法についてや、対応の有無については、以下のサイトを確認ください。
正規分布については、実際に確認していきます。
正規分布の確認
EZRで正規分布を確認します。
今回も正規性の検定方法を示しますが、詳しくは以下のサイトをご確認ください。
今回もデモデータを使用して、「握力」を「男性群」と「女性群」の2群に分けて差の検定を行います。
男性群と女性群の「握力」の正規分布を確認しますので、2つの変数が対象になります。
(どちらかでも正規分布に従っていなかった場合は、ノンパラメトリックの方法になります)
まずは、わかりやすいように「ヒストグラム」で2群を確認してみます。
グラフと表→ヒストグラムを選択します。
変数を「握力」にして、群別する変数を「sex」として選択します。
ヒストグラムが作成されますので、2群を比較するとイメージがつきやすいです。
今回は、sex=1が男性、sex=2が女性となっています。
視覚的にはなんとなく正規分布していそうな感じがします。
次に正規性の検定を行います。
まずはsex=1の男性を確認します。
統計解析→正規性の検定を選択します。
このまま変数を「握力」とすると、全てのデータの正規性を確認してしまいます。
男性、女性、それぞれの正規分布を確認したいので、
赤丸の場所に男性だけですよと絞り込みが必要です。
データ入力で、性別をsex、男性を1、女性を2と入力していますので、
「sex==1」として男性だけを選択してもらいます。
このように男性だけのヒストグラムが作成されます。
同時に検定結果も確認します。
サンプル数が70名と少ないため、Shapiro-Wilk検定を確認します。
P>0.05ですので、正規分布に従っているといえます。
次に同様に「女性群」も確認します。
同様の方法ですので、結果のみ示します。
ヒストグラムと検定結果から、女性群の握力も正規分布に従っていると確認できました。
比較したい2群が正規分布に従っていたため、パラメトリックな検定を行うことになります。
ここで注意が必要なのですが、対応のないt検定(独立したサンプルのt検定)の場合は、正規分布していても、2群の分布が等分散なのか、非等分散なのかによって、統計手法が変わってきます。
(ここもややこしいですよね)
もう一度フローチャートを見てみます。
ここで等分散と非等分散とでてきましたので、このことについて整理します。
スポンサードサーチ
等分散・非等分散:F検定?
2群のデータが正規分布に従っていることは、先ほど確認しました。
今度は分散が等分散なのか、非等分散なのかを確認しないといけません。
等分散とは、データの釣鐘型の形状が対象とした2群で近似していることを示します。
非等分散とは、データの釣鐘型の形状が対象とした2群で異なることを示します。
わかりやすいように、イメージ図を表示します。
図をイメージするとわかりやすいと思います。
実際に等分散なのか、非等分散なのか、グラフで視認性で判断する以外に、検定で判断できます。
「F検定」という統計的検定を用いると2群が等分散しているのかを確認できます。
F検定を行い、
データが等分散している→スチューデントのt検定
データが非等分散している→ウェルチのt検定
と判断します。
次に実践でF検定を行っていきます。
等分散の確認:F検定の実践
デモデータが正規分布に従っていることは、先ほど確認しました。
今度は分布が等分散なのか、非等分散なのか、実際に確認していきます。
統計解析→連続変数の解析→2群の等分散性の検定(F検定)を選択します。
目的変数に「握力」、グループに「sex」を選択します。
検定結果が以下のように出力されます。
F検定 P値=0.00794となっています。
つまり、今回はP<0.05ですので、非等分散であると判断されました。
ヒストグラムで確認すると以下のグラフになりますね。
スポンサードサーチ
対応のない(独立したサンプルの)t検定を実践
ここまでで、正規性の確認、等分散の確認が終わりました。
これでようやく、対応のないt検定にうつります。
今回のデモデータでは、「握力」を男性、女性の2群に分けたデータは、正規分布しているが、非等分散になっているということです。
データが等分散している→スチューデントのt検定
データが非等分散している→ウェルチのt検定
となりますので、今回はウェルチのt検定をすることになります。
実践してみます。
統計解析→連続変数の解析→2群間の平均値の比較(t検定)を選択します。
目的変数を「握力」、比較する群を「sex」と選択します。
今回のデータは非等分散でしたので、赤丸の「いいえ(Welch検定)」を選択します。
*もしデータが等分散していたら、赤丸の「はい(t検定)」を選択し、これがスチューデントのt検定になります。
グラフと検定結果が表示されます。
P値を確認します。
P値=「2.4e-20」とありますが、これは、2.4×10-20のことです。
つまり、P<0.05であるため、2群間は有意差ありと判断できます。
結果をまとめると
男性の握力:33.5kg±7.4 VS 女性の握力:19.7kg±5.0 であり、有意に男性の握力が強いと判断できます。
*今回のデモデータは非等分散であり、ウェルチのt検定になりましたが、
等分散なデータでスチューデントのt検定を選択した場合も結果は同様の解釈になります。
ただ、等分散の検定結果に基づいて検定方法を選択するという手法には異論もあるようで、見解は統一されていないようです。
まとめ
- 対応のないt検定(独立したサンプルのt検定)は2群のデータが対応がなく、正規分布に従っている場合に選択されます。
- 分散の形が等分散なのか、非等分散なのかで、スチューデントのt検定と、ウェルチのt検定に分けられます。
- 等分散の確認にはF検定が用いられます。
今回は2群間の差の検定の1つである、対応のあるt検定についてまとめました。
分散の形によって検定が違うためやや複雑でしたが、順を追って整理すれば簡単に行えます。
参考にしていただけたら幸いです。
**その他のEZRの使い方/統計手法について以下のサイトにまとめていますので参考にしてください**