14. 効果量について

藤宮

多くのマーカー候補から、判別に役立つマーカーを絞るためには、有意差検定が一般的に使われています。

たとえば、t検定を行い、多重比較による補正をどうするかなど考慮してp値を求め、有意なものから優先的にマーカーとして選択するという流れです。しかし、p値では、どれぐらいの精度で判定できるマーカーなのかを知ることはできません。判定性能がどの程度かを知るためには効果量が便利です。

効果量は、2つの分布の重なりの程度を数値化したものです。2群の差の効果量としては、Cohens’ dがあります。群1群2のそれぞれの平均をμ1、μ2、標準偏差をσ1、 σ2、サンプル数をn1、n2とすると、次式で計算できます。

d = (μ1 – μ2)/√{(n1*σ1 + n2*σ2) / (n1 + n2)}

効果量は、t統計量に似ていますが、分母が異なっています。Cohens’dは、分散の重み付き平均を求めるのにサンプル数を使うだけで、効果量d自体はサンプル数nに依存しない数値です。分子は平均値の差で、分母はサンプル数で重みづけた標準偏差を計算しています。

これはデジタル通信の分野で、μ1、μ2が2つの信号レベルを表し、通信路においてそれぞれσ1, σ2のノイズが加わる場合の信号対雑音比の計算方法と同じです。2群判別では、ROC (Receiver Operating Characteristic)カーブからAUC (Area Under the Curve)で、最終的な判定性能が求められますが、この効果量とも関連付けられ、下記のようになります。

効果量AUC
0.50.6382
1.00.7602
1.50.8556
2.00.9214
2.50.9615