今回は「感度」「特異度」を利用した、ROC曲線(カーブ)について簡単に紹介していきます。
ROC曲線は聞いたことがあるかもしれません。
検査から診断する「カットオフ値」というものを求めるときに使用するものです。
この説明をする前に、まずは「感度」「特異度」を理解している必要があるので、わからない方は下記のリンクを参考にしてください。
それでは簡単にまとめてみます。
スポンサードサーチ
ROC曲線とは?
「感度」「特異度」の解析では、検査結果が陽性や陰性といったすでに2値になったデータで計算可能です。(わかりやすいですよね)
しかし、多くの場合は、検査結果は「陽性」「陰性」というよりも、マーカー値(○点)のように連続した値をとることが多いと思います。
そんなとき、「○点以上が陽性」といったような基準が必要です。
この基準値のことを「カットオフ値」と呼んでいます。
例えば、例題でも示すMMSEという認知症の検査では、満点が30点で、点数が高いほど認知機能がよいとされています。
25点以下を認知症と診断するのか、22点以下を認知症と診断するのかで、「感度」「特異度」が変化してきます。このようなカット値が変化するなかで、最も診断に優れた値を「カットオフ値」として採用します。
そのために描く必要があるのがROC曲線であるので、これから実践してみます。
ROCとはReceiver Operating Characteristicの略になります。
第二次世界大戦中にドイツ軍がイギリスからやってくる飛行機を検知しようとして開発したレーダーの性能を評価するために開発されたため、このような名前になったそうです。
感度と特異度の関係をプロットしてカーブを描くのですが、感度を上げすぎるとカラスでも検知うしてしまいますし、感度を下げると飛行機がきてしまう可能性が高くなります。
目的にあった最も適した値(イギリス軍を検知しやすい)を「カットオフ値」として採用します。
EZRでROC曲線の作成:カットオフ値の求め方
実際にデータを取り込んでROC曲線を描いてみます。
デモデータの読み込み
今回使用するデモデータは、私が参考にさせていただいている新谷歩先生が無料で公開しているデモデータを使用させていただき、MMSEについてのROC曲線を描いていきます。
新谷先生の統計本はとても参考になるので興味がある方は以下のサイトで紹介しています。
ちなみに、以下のようなエクセルデータになります。
MMSEが連続変数(点数)であり、Dementia(認知症)が有無(1or2)の2値変数で入力されています。
方法
実際にEZRでROC曲線を描いてみます。
「統計解析」→「検査の正確度の評価」→「定量検査の診断への正確度の評価(ROC曲線)」を選択します。
結果に2値変数である「Dementia(認知症の有無)」を選択し、予測に用いる値に「MMSE(連続変数)」を選択します。
今回は点数が低い場合に認知症(陽性)と判断されるため、赤丸の「閾値以下を陽性と判定する」を選択します。
(もちろん、検査によってはここを「閾値以上〜」と選択することもあります。)
「OK」をクリックすると結果(ROC曲線)が表示されます。
結果の解釈
ROC曲線がこのように表示されます。
縦軸はSensitivity(感度)、横軸はSpecificity(特異度)です。
EZRで表示されるROC曲線は横軸が「Specificity」であり、左が1.0、右端が0.0になっています。
一般的な論文で表示されるROC曲線は、「1-Specificity」で、左端が0、右端が1となっています。
なぜEZRではこのように表示されるのかはわかりません。(設定で変えられればいいのですが)
結果の解釈に戻ります。
上の図のように、26.000というのが、感度+特異度が最大になるということで選ばれた最適カット値です。
26.000の横の値(0.910,0.890)は、26以下を陽性とした場合の特異度と感度です。
つまり、この例では、26以下を陽性と判断したときにこの検査の特異度が91%、感度は89%になると解釈できます。
*ちなみに、EZRの出力欄には、以下のように感度と特異度の値が数値で表示されていて、カットオフ値が30点の場合は感度1(100%)、特異度0(0%)、・・・と続いていき、これをプロットしたのがROC曲線です。
このように数値ではわかりにくいので、ROC曲線と表示されている「カットオフ値」を確認することが重要です。
曲線下面積とは?
EZRの出力欄の一番下には「曲線下面積」と記載されています。
これはなんなのでしょうか?
今回の結果は、曲線下面積:0.949ですので、かなり正確性の高い検査であると証明されました。
(MMSEが26点以下で認知症と診断できやすい)
スポンサードサーチ
まとめ
今回はROC曲線について簡単にまとめました。
新しい検査の有用性を研究する際や、基準値を考える際に「カットオフ値」をみるときに使われる方法です。
論文などでもみかけますし、自分で行う機会もあるかと思います。
理解してしまえばシンプルでEZRでも簡単に行えますので、是非利用してみてください。
少しでも参考になれば幸いです。
EZRの使い方は以下のサイトにまとめてあるので興味があれば参考にしてください。
わかりやすいコメントありがとうございます。参考にさせていただきたいと思います。