今回は「2群間を比べる」検定のひとつである「カイ2乗(χ2)検定」「フィッシャー(Fisher)の正確検定(直接確率法)」について実践してみたいと思います。
「カイ2乗(χ2)検定」は聞いたことありますか?
学会発表などでも使いやすい検定ですので、聞いたことがある方も多いと思います。
ノンパラメトリックな方法で、2群とも名義尺度のときに2群間を比べることができる検定です。
条件によっては「カイ2乗(χ2)検定」ではなく、「フィッシャー(Fisher)の正確検定(直接確率法)」を選択することにもなるので、一緒に覚える必要かあります。
今回もデモデータを使用して分かりやすく実践していきます。
EZRを使っていきますが、EZRの導入については以下のサイトをご確認ください。
データのインポートについては以下のサイトをご確認ください。
簡単に実践できるようにまとめてみました。
スポンサードサーチ
2群間の差の検定方法(2群間を比べる)
2群間の差の検定方法には様々な方法あるので検定方法を間違わないようにしないといけません。
差を比べる時に、データが名義尺度の時は「カイ2乗(χ2)検定」か、「フィッシャー(Fisher)の正確検定(直接確率法)」を選択することになります。
例えば、
「杖使用の有無」と「転倒の有無」は関連しているか?
「性別」と「高血圧の有無」は関連しているか?
など、名義尺度で2群間を比べている検定方法になります。
「転倒歴の有無」と「退院先:自宅、施設、転院、特養」など数種類でも比較は可能です。
名義尺度についてわからない場合は、以下のサイトを参考にしてください。
カイ2乗検定とフィッシャーの正確検定の違い
対象となるデータが「有無」であったり、データがわかりやすいので検定をかける機会も多いと思います。
しかし、データの状況によっては「カイ2乗検定」と「フィッシャーの正確検定」を使いわけないといけません。
どちらを選択するかはいろいろな説があるようですが、アメリカの大学でよく使用されている、ハーバード大学のRosner教授の書かれている生物統計のテキストブックで推奨されている方法をいかに示して解説します。
1:全体の症例数が20未満 → フィッシャーの正確検定
2:全体の症例数が40以上 → カイ2乗検定
3:全体の症例数が20以上40未満
& 最小の期待値が5未満 → フィッシャーの正確検定
このように症例数を参考にして決定します。
しかし、3の「期待値」がわかりにくいと思います。
期待値とは
「行データの合計や列データの合計の比率から逆算して期待される値のことを示す」
???と書いてありますが、イマイチわかりにくいですよね。
これは実際にデータ解析したほうが簡単なので、後述します。
スポンサードサーチ
実例
実際にEZRを使用して、「カイ2乗検定」「フィッシャーの正確検定」を行っていきたいと思います。
今回は「性別」と「ステロイド使用の有無」に関連があるか?
とデモデータを使用して検定してみます。
「統計解析」→「名義変数の解析」→「分割表の作成と群間の比率の比較(Fisherの正確検定)」を選択します。
行の選択で「sex」を、列の選択で「ステロイドの使用」をチェックします。
今回の症例数は49名であり、40名以上であるため、赤丸の「カイ2乗検定」を選択します。
*「パーセントの計算」にチェックをいれると、結果に男女比(%)を表示できます。
これだけで「カイ2乗検定」が検定され、
少し上の結果欄に、内訳が表示されます。
「パーセント計算」にチェック(今回は列のパーセント)をいれていましたので、男女比(%)も表示されます。
最後に「カイ2乗検定」の結果が表にされます。(P値)
今回の結果から、P値≧0.05ですので、「有意差なし」と判断できます。
つまり、「ステロイドの使用の有無と男女比には有意差は認められなかった」という結果です。
今回は症例数が49名でしたので、「カイ2乗検定」でしたが、「フィッシャーの正確検定」も簡単に行えます。
以下をもう一度確認します。
1:全体の症例数が20未満 → フィッシャーの正確検定
2:全体の症例数が40以上 → カイ2乗検定
3:全体の症例数が20以上40未満
& 最小の期待値が5未満 → フィッシャーの正確検定
仮に症例数が20未満であった場合は、以下の赤丸のように「フィッシャーの正確検定」を選択します。
3の場合には「期待度」も確認しなければなりません。
赤丸のように、「期待度数の表示」に加えて、「カイ2乗検定」と「フィッシャーの正確検定」の2つを選択して、「期待度」に応じて検定方法を決定します。
結果を確認すると、「期待値」が表示されますので、最小の期待値が5未満の場合は「フィッシャーの正確検定」のP値を確認して有意差の有無を判断します。
以下の結果では、最小の期待値は5.4と、5未満ではありません。
*今回のデモデータは症例数が49名ですので、「カイ2乗検定」を選択すればいいのですが、20〜40例と症例数によって検定方法を悩む場合は、この方法で期待値も確認して判断します。
まとめ
- 2群間の比較で、データが名義尺度の場合は「カイ2乗検定」か「フィッシャーの正確検定」を行います。
- 諸説はありますが、データの個数によって「カイ2乗検定」か「フィッシャーの正確検定」を選択します。
- EZRを使用すれば簡単に実践することができます。
今回は名義尺度を比べる時に選択される「カイ2乗検定」と「フィッシャーの正確検定」を簡単にまとめました。
名義尺度で行える検定ですので、理解すれば簡単に様々な研究に利用できると思います。
参考にしていただけたら幸いです。
“EZRの使い方:カイ2乗(χ2)検定、フィッシャーの正確検定” への1件のフィードバック