EZRの使い方:Wilcoxonの符号付順位和検定 実践例

今回は「Wilcoxonの符号付順位和検定」の実践をしてみたいと思います。

2群間の差の検定の1つで、対応の有るデータで行うノンパラメトリックの方法(正規分布していないなど)になります。

 

2群間の差の検定については、検定方法がいろいろありますので間違えないようにしないといけません。

2群間の差の検定の検定方法については以下のサイトをご確認ください。

統計学入門:2群の差の検定〜検定方法の選び方〜

 

今回もデモデータを使用して分かりやすく実践していきます。

EZRを使っていきますが、EZRの導入については以下のサイトをご確認ください。

EZRの使い方:EZRの導入[Mac編] 

 

データのインポートについては、以下のサイトをご確認ください。

EZRの使い方:医療統計実践編 データのインポート

 

今回も検定方法さえわかれば、簡単にできますので参考にしてください。

スポンサードサーチ

2群間の差の検定方法の決定

2群間の差の検定方法については、図のフローチャートを参考に決定します。

図のように、検定方法を確認します。

 

データに対応があるかどうかは、データの収集の時点で把握していると思います。

*2群間の差の検定方法についてや、対応の有無については、以下のサイトを確認ください。

統計学入門:2群の差の検定〜検定方法の選び方〜

 

正規分布については、実際に確認していきます。

正規分布の確認

EZRで正規分布を確認します。

今回も正規性の検定方法を示しますが、詳しくは以下のサイトをご確認ください。

EZRの使い方:正規分布とは?正規分布の求め方

 

今回はデモデータを使用して、リハビリ介入前後での「6分間歩行距離」の差の検定を行います。

介入前と介入後の「6分間歩行距離」の正規分布を確認しますので、2つの変数が対象になります。

(どちらかでも正規分布に従っていなかった場合は、ノンパラメトリックの方法になります)

 

統計解析→連続変数の解析→正規性の検定を選択します。

リハビリ前の「6分間歩行距離」を選択します。

結果のヒストグラムと検定結果を確認します。

サンプル数が49名と少ないので、Shapiro-Wilk検定を確認します。

P<0.05ですので、正規分布に従わないと言えます。

(ヒストグラムでも左側に流れていて、正規分布とはいえません)

 

リハビリ前後の「6分間歩行距離」ですので2つの正規分布を確認しますが、片方でも正規分布に従っていなかったらノンパラメトリックの方法になります。

(今回はリハビリ前時点で正規分布に従っていませんでしたので、リハビリ後の確認は省略します)

 

対応のあるデータであり、正規分布に従っていないため、「 Wilcoxonの符号付順位和検定」が選択されます。

スポンサードサーチ

EZRで実践:Wilcoxonの符号付順位和検定

データの確認が行えましたので、実際に「 Wilcoxonの符号付順位和検定」を行っていきます。

統計解析→ノンパラメトリック検定→対応のある2群間の比較( Wilcoxonの符号付順位和検定)を選択します。

今回はリハビリ介入前後の比較ですので、

第1の変数を介入前の「6分間歩行距離」、第2の変数に「リハビリ後の6分間歩行距離」を選択します。

このような結果が表示されます。

P値を確認すると、0.0000228であり、P<0.05ですので、「有意差あり」となります。

しかし、有意差がわかっても、どの値で、どちらが距離が長いのかはここではわかりません。

*パラメトリックの方法である「対応のあるt検定」のときは、検定結果に2群間の平均値も出力されます。

「 Wilcoxonの符号付順位和検定」はノンパラメトリックの方法であるため、平均値ではなく、中央値をみることになります。

実際の「中央値」はデータの要約を確認する必要があります。

 

「平均値」と「中央値」の違いについては以下のサイトを参考にしてください。

平均値と中央値の違い〜標準偏差?四分位範囲?〜

データの要約を確認する

検定をかける前に確認していて、その後に「 Wilcoxonの符号付順位和検定」を行ったほうがいいのかもしれません。

今回は「対応のあるt検定」と同じ順番で実践したので、「データの要約」を後にまわしました。

*「対応のあるt検定」については以下のサイトで実践しています。

EZRの使い方:対応のあるt検定 〜実践例〜

 

「データの要約」については以下のサイトで詳しく説明していますので、参考にしてください。

EZRの使い方:医療統計実践編  変数の解析

 

今回も実際にデータの要約をしてみます。

統計解析→連続変数の解析→連続変数の要約を選択します。

今回はリハビリ前の「6分間歩行距離」と、リハビリ後の「6分間歩行距離」の2つの変数の解析が必要ですので、表示されているように「control」を押しながら2つを選択します。

以下のように「平均値」と、「中央値」が表示されます。

今回はノンパラメトリック検定ですので、中央値が必要になります。

このデータの要約から、

リハビリ前:中央値438m(388-531)、サンプル数:49名

リハビリ後:中央値460m(399-531)、サンプル数:49名

ということがわかります。

 

先ほどの「 Wilcoxonの符号付順位和検定」の検定結果では、2群間の差は有意差ありと表示されましたので、

リハビリの前後で「6分間歩行距離」は有意に増大したといえます。

スポンサードサーチ

まとめ

  • 「 Wilcoxonの符号付順位和検定」は2群間の差の検定方法のひとつで、「対応の有るデータ」「ノンパラメトリックなデータ(正規分布していないなど)」で選択されます。
  • ノンパラメトリックな方法なので、「中央値」をみることになります。
  • 「中央値」はデータの要約から簡単に確認できます。

 

今回は「 Wilcoxonの符号付順位和検定」について、実際にデモデータを使用して実践してみました。

検定方法やデータ要約がわかれば簡単に行えますので、参考にしていただけたら幸いです。

**その他のEZRの使い方/統計手法について以下のサイトにまとめていますので参考にしてください**

EZRの使い方まとめ