連鎖不平衡係数

『Dについて』

【算出法】
           遺伝子座Aのアレル頻度 = PA Pa
           遺伝子座Bのアレル頻度 = PB Pb
           各ハプロタイプ頻度 = PAB PAb PaB Pab

             D = PAB-PAPB   PAB = PAPB+D
             D = PAPb-PAb   PAb = PAPb-D
             D = PaPB-PaB   PaB = PaPB-D
             D = Pab-PaPb   Pab = PaPb+D
             D = PABPab-PAbPaB

(値の範囲 = -0.25 ~ 0.25)


ある遺伝子Aと遺伝子Bの間に関連が無い(連鎖平衡である)場合、アレルAとアレルBは独立であるため、ハプロタイプ頻度はAとBのアレル頻度を掛け合わせたものとなります(積の法則)。
しかしAとBの間に関連がある(連鎖不平衡が存在する)場合、ハプロタイプ頻度は各アレル頻度の積の値からずれます。このズレを連鎖不平衡の尺度として定義しているのが連鎖不平衡係数:Dです。

Dは、D’、r2を導く際に必要となる重要な値です。

 


『D’について』

【算出法】
           Dmin = max (-PAPB, -PaPb) = (-1)×min (PAPB, PaPb)
           Dmax = min (PAPb, PaPB)

             D’ = D / Dmax (D>0の場合)
             D’ = D / Dmin (D<0の場合)

(値の範囲 = -1 ~ 1 (絶対値を取る場合は0~1))


すべてのハプロタイプ頻度とアレル頻度は確率なので、0から1の間の値を取ります。故に連鎖不平衡尺度Dは限られた範囲の値を取る値です。
Dがとりうる範囲を限定されていることより、連鎖不平衡尺度を規格化した値がD’です。D>0の場合にはDの最大値で、D<0の場合にはDの最小値で尺度Dを割ることで算出します。なお、D’の定義は2種類あり、どちらのアレルを規準にするかを考えて正負の符号付きで表示する場合と、絶対値をとって0-1の範囲に収める定義があります。SNPAlyzeでは、前者で計算しておりますが、絶対値をとる|D’|も表示してあります。
D’は主にマーカーと遺伝子座との遺伝的距離に依存することから、尺度として適切な性質を持つとも言われます。D’= 1の場合には2つの遺伝子が組換えを起こしておらず、完全に連鎖不平衡にある状態を指します。
しかしD’= 1の場合の問題点として、以下のような場合の時、

ハプロタイプ数
    遺伝子座1
    c d
遺伝子座2 a 50 0
b 49 1


アレルdの遺伝子多型は偶然サンプルに入ってきたとみなせるので、この結果を連鎖不平衡と考えるのは不自然です。
しかしながら、この場合はD’=1となってしまいます。片方あるいは両方の遺伝子多型頻度が極めて低い場合には、高い値が算出される場合があるので、D’を使うときは注意が必要となります。このようにD’はサンプルサイズに依存する性質を持ちます。
また、ある1遺伝子について考えるとすると、D’はその遺伝子の中で組換えが起こったかどうかの判断に用いることが出来ます。しかし原因変異を追及しようとすると、組換えが起こっていないとほとんどのSNPでD’の値は高くなってしまいます。そのため、遺伝子内のどのSNPに原因があるかを推定する場合にはr2などの、他の尺度も考慮する必要があります。

D’は組み換えの歴史を現す尺度です。

 


『r2について』

【算出法】
             r2 = D2 / (PAPBPaPb) ( r22と表される場合もあり)
(値の範囲 = 0 ~ 1)


r2はD’よりもシビアな値をとるため、1遺伝子内でも連鎖不平衡にあるSNPの組合せを検出しやすい尺度です。そのためD’を補完する性質を持ちます。
また、r2はD’に比べてサンプル数が少ない場合の値上昇率は低いです。r2が1/3以上の値を取るならば、十分に強い連鎖不平衡があるとみなすことが出来るとのことです。
r2は各遺伝子座の2つの対立遺伝子を成分とする2×2表を対象としたχ2検定を行い、χ2/n とした値です。よってこの値を用いて連鎖不平衡を評価すると、χ2検定を用いた場合と似た結果になります。

r2は変異の成り立ちを表す尺度です。