ハプロタイプ推定
一般的にタイピングデータはジェノタイプの形で表されていますが、各々の遺伝子(遺伝マーカ)がどちらの染色体上にあるかが不明な不完全データです。 片方の染色体上に存在する遺伝子(遺伝マーカ)の組み合わせのことをハプロタイプと呼び、ハプロタイプが判明すると完全なデータとなります。
例えば、ある2つの座位があり、それぞれのアレルがA/a, B/bであった場合、考えられうるハプロタイプは以下のようになります。
B/B | B/b | b/b | |
---|---|---|---|
A/A | ![]() | ![]() | ![]() |
A/a | ![]() | ![]() | |
a/a | ![]() | ![]() | ![]() |
この図に示されているように、考えられる組み合わせ9通りのうち、8通りまではハプロタイプが一意に決定出来ます。 しかし唯一、ヘテロ同士の組み合わせの場合には、以下の2通りの可能性が考えられます。
![]() ![]() | ![]() ![]() |
現在の技術では、このヘテロ同士の組み合わせがどちらになるのかを実験的に決定することは困難です。 ここで示されている例は2座位のみのケースですが、座位数が増えるに従ってヘテロ同士の相を決定出来ない組み合わせの数は 指数的に増加していきます。
そのため、この部分だけは計算によってハプロタイプの相を推定するしか方法がありません。このような場合に用いられるのがハプロタイプ推定アルゴリズムです。