試験の点数から○○大学に合格(T)か不合格(F)かを予測したいときや,検査値から病気(T)か健康(F)かを判断したいときなどがあります。
要するに,与えられた値から,真(TRUE)か偽(FALSE)かを判断したいわけです。
例として右の表のような場合を考えましょう。
与えられた値をどこで切っても,TとFは完全には分離できません。例えば11で切って,11以上を陽性(positive),
11未満を陰性(negative)とした場合,10個のTのうち5個がpositiveに入りますので,true positive(真陽性)の割合は0.5です。
また,5個のFのうち1個がpositiveに入りますので,false positive(偽陽性)の割合は0.2です。
そこで,(0.2, 0.5) をプロットします。このように,区切る値(閾値,カットオフポイント)をいろいろ変えて,
横軸にfalse positiveの割合,縦軸にtrue positiveの割合をとってプロットしたものが,ROC曲線です。
// 図省略
https://oku.edu.mie-u.ac.jp/~okumura/stat/ROC.html
アウトカムと独立変数の関係が完全に偶然だった場合、ROC曲線は右上から左下への斜点線になります。
一方、感度1.00、特異度1.00の理想的な独立変数の場合、左上方に位置します。
http://www.med.osaka-u.ac.jp/pub/kid/clinicaljournalclub6.html