本製品の主な機能をご紹介します。
|
ジェノタイピングデータのインポート |
SNPデータが保存されている次のフォーマットのファイルを読み込んで解析できます。
対応ファイル
- Excelファイル(xls/xlsx形式) (Excelがインストールされている必要があります)
- タブ区切りテキストファイル
- カンマ区切りテキストファイル(csv形式)
- SNPAlyze Data ファイル(slyz形式)
- Biotage社 PSQ96エキスポートファイル
- ABI社 PRISM7900エキスポートファイル
ケースコントロール研究を行う場合にはジェノタイピングデータが入力されている列に加えて、疾患、対照といった集団を区別するための情報が入力されている列が必要です。
連鎖不平衡解析、および相の場合は集団を区別するための情報の入力は必要ありません。ただし集団を区別する情報を入力することで集団毎にそれらの解析を行うことが可能になります。 |

また、Ver.4.1以前は1枚しか開けなかったデータシートが、Ver.5.0以降では複数枚開けるようになりました。

|
多型マーカの絞り込み機能 |
ハーディーワインベルグ平衡(HWE)、マイナーアレル頻度、多型マーカタイプに応じて、解析の対象となる多型マーカを自動的に選択する機能を搭載しました。 |

解析に用いる多型マーカに対して上記の3通りの方法でフィルターをかけることが可能です。また、フィルターをかける対象を登録した集団(Subject)にすることも可能です。例えば、症例集団は遺伝的に偏りがあってHWEを満たさないが、対照集団はHWEを満たさなくてはならない場合に、対照集団にのみ、HWEでフィルターをかけることができます。
|
ケースコントロール研究 |
カイ二乗検定およびAICを用いて個々のSNPと疾患との関連を評価します。特にAICはカイ二乗検定のように有意性の判断に曖昧さが無く、より厳密な評価が可能です。またオッズ比の算出も可能です。
ジェノタイピングデータの集計方法の設定
タイピングによって得られた多型情報をユーザーが評価しやすい形に集計して解析を行うことが可能です。
集計方法は「Automatically」、「User customize」の2通りがあり、Automaticallyの場合は、(1)Genotype、(2)Allele(Multiplicative model)、(3)Dominant、(4)Recessive の4通りの集計方法で分割表を定義し統計値を算出します。User customizeの場合にはSubject 、多型マーカデータからそれぞれ必要なものを選択して分割表を作成します。 |
・・・・・・・・・・・・・・・・・・・・・・・・・
|
カイ二乗検定の利用
「ジェノタイピングデータの集計方法の設定」で作成された分割表に対してカイ二乗検定、Fisherの正確確率検定を行います。また2×2分割表の場合にはオッズ比も出力します。
・・・・・・・・・・・・・・・・・・・・・・・・・
|
AICの利用
「ジェノタイピングデータの集計方法の設定」で作成された分割表に対して独立モデル(AIC(IM))と従属モデル(AIC(DM))を想定し、両モデルのAIC値から分割表の独立、従属の判定を行います。
AICはその値が最小となるモデルが最も良いと判断されますので
AIC(IM) > AIC(DM) ⇒ SNPと疾患とは従属と判定
AIC(IM) < AIC(DM) ⇒ SNPと疾患とは独立と判定 |
|
となります。
・・・・・・・・・・・・・・・・・・・・・・・・・
|
FDR法の利用
FDR法を利用した多重検定の補正が可能です。
FDR法は有意と判断された仮説のうち、本来帰無仮説に属するものの割合をコントロールする方法です。ケースコントロール研究の結果得られる複数のp-valueから多重検定における有意性指標であるq-valueを計算します。(帰無仮説の個数比を推定する方法としてBHまたはBootstrap法のどちらかを選択可) |
・・・・・・・・・・・・・・・・・・・・・・・・・
|
詳細結果の出力
解析条件、解析結果の詳細な情報をテキストファイル形式で出力します。 |
|
連鎖不平衡解析 |
任意の2座位のハプロタイプ頻度とアレル頻度との"ずれ"から連鎖不平衡係数を計算します。出力可能な連鎖不平衡係数はD、D’、D'(絶対値)、r2 です。以上に加えてカイ二乗値、AIC値の出力が可能です。連鎖不平衡をグラフィカルに表示することも可能です。
ハプロタイプ頻度および連鎖不平衡係数、統計値の表示
・・・・・・・・・・・・・・・・・・・・・・・・・
連鎖不平衡のグラフィカルな表示
複数のSNPs間の連鎖不平衡係数、統計値を一目で参照可能です。強い連鎖不平衡が存在する領域を容易に特定できます。SNPAlyzeでは以下の3つの形式を利用可能です。
- 異なる2集団の解析結果の比較表示 ・・・図1
- 異なる2つの連鎖不平衡係数、統計値を用いた解析結果の比較表示 ・・・図2
- 異なる2集団の解析結果を重ね合わせて表示(BMP形式のみ) ・・・図3
異なる2つの集団間および、連鎖不平衡係数間での解析結果を比較表示する場合は、以下のグリッド形式も利用可能です。各セルには連鎖不平衡係数または統計値が表示され、設定した閾値に応じてセルの色分けが可能です。 |
|
ハプロタイプ推定 |
ハプロタイプ頻度の推定、tagSNPの同定
集団内のハプロタイプ候補とその頻度を算出します。またEMアルゴリズムによって最尤と判断された各検体のディプロタイプ形も出力可能です。 |
・・・・・・・・・・・・・・・・・・・・・・・・・
|
ディプロタイプ形の分布の推定
EMアルゴリズムを利用してハプロタイプ頻度を推定する過程で計算されるハプロタイプの組み合わせ(ディプロタイプ形)の分布を表示します。 |
・・・・・・・・・・・・・・・・・・・・・・・・・
|
ハプロタイプ推定の詳細結果の出力
tagSNPの組み合わせが複数考えられる場合、それらすべての組み合わせを出力します。同ウィンドウにはハプロタイプ推定のパラメータの設定やハプロタイプ頻度および各検体のディプロタイプ形も出力されます。 |
|
ハーディ・ワインベルグ平衡の検定 |
あるSNPサイトについて実際に観測されたアレル数とハーディ・ワインベルグ平衡にあると仮定した場合のアレル数とのずれをカイ二乗検定により評価します。また、カイ二乗検定が適さない場合を考慮して、Exact test及び、Exact test(Monte Carlo法)の2通りの検定方法を追加しました。 |
・・・・・・・・・・・・・・・・・・・・・・・・・
|
詳細結果の出力
解析条件、解析結果の詳細な情報をテキストファイル形式で出力します。 |
・・・・・・・・・・・・・・・・・・・・・・・・・
|
FDR法の利用
FDR法を利用した多重検定の補正が可能です。
FDR法は有意と判断された仮説のうち、本来帰無仮説に属するものの割合をコントロールする方法です。ケースコントロール研究の結果得られる複数のp-valueから多重検定における有意性指標であるq-valueを計算します。(帰無仮説の個数比を推定する方法としてBHまたはBootstrap法のどちらかを選択可)
|
コクラン・アーミテージ・トレンド検定(トレンド検定) |
トレンド検定
ケースコントロール研究と同様、疾患の有無によって患者群と対照群を設定し、遺伝子データとの関連性について検討を行います。
ケースコントロール研究では遺伝形式(Recessive, Dominant, Genotype)に着目し、各遺伝型と疾患の有無について検討しました。トレンド検定では任意のアレルに着目し、群間で同アレル数(=各遺伝型に相当)の比に線形傾向がみられるか検討を行います。
・・・・・・・・・・・・・・・・・・・・・・・・・
分割表の定義
疾患の有無と各遺伝型について集計した2×3分割表を利用します。
・・・・・・・・・・・・・・・・・・・・・・・・・
トレンド検定結果
検定の結果、[Statistics]および[Detail information]の2つのウィンドウが作成されます。
[Statistics]画面出力例

・・・・・・・・・・・・・・・・・・・・・・・・・
FDR法の利用
FDR法を利用した多重検定の補正が可能です。
FDR法は有意と判断された仮説のうち、本来帰無仮説に属するものの割合をコントロールする方法です。ケースコントロール研究の結果得られる複数のp-valueから多重検定における有意性指標であるq-valueを計算します。(帰無仮説の個数比を推定する方法としてBHまたはBootstrap法のどちらかを選択可)
|
Bootstrap法の利用 |
データのリサンプリングよって推定量の偏りや信頼区間を出力し、各種統計値の信頼性を評価します。(ケースコントロール研究、連鎖不平衡解析、ハプロタイプ推定について)
|
ハプロタイプを用いたケースコントロール研究 |
複数の集団について任意の座位から推定されるハプロタイプ頻度の差の検定を行います。検定結果の有意性は、Permutation testを用いて評価します。 |
 |
Permutation testより得られる統計値の度数分布および度数分布のグラフを出力します。 |
|
ハプロタイプブロック解析 |
Gabrielの方法(※1)、Four Gamete法(※2)を用いて遺伝的に強く連鎖している部分(組み換えが起こっていないと判断された部分)をハプロタイプブロックとして同定します。 |
 |
下図のように、各ブロックについて、(1)ハプロタイプ候補とその頻度、(2)tagSNP、(3)ハプロタイプ同士の出現頻度、(4)ブロック間の連鎖不平衡係数(D’値)、(5)カイ二乗検定の結果 を出力します。 |
 |
さらに構築されたブロックを視覚的に表示することも可能です。 |
|
HealthSketchとの連携 |
HealthSketch(ヘルスケッチ)は、臨床および生活習慣データを統合し、統計処理や疾患予測モデルの構築支援を行うソフトウェアです。HealthSketchとの連携により以下が可能になります。
※HealthSketchとの連携機能をご利用いただくには、別途HealthSketchをご購入いただく必要があります。
ファイルを介したデータの受け渡し |
 |
- 多型情報と臨床情報を組み合わせた解析
SNPAlyzeのハプロタイプ推定より得られる「最尤と判断された各検体のディプロタイプ形」を HealthSketchに渡します。HealthSketchでは同ディプロタイプ形の情報を用いたロジスティッ ク回帰分析(オッズ比などの推定)などが可能です。
- 臨床情報を利用したクラスタリングによる分類結果の利用
HealthSketchのクラスタリング解析を利用することで、臨床情報を考慮したデータの 分類が可能になります。同じような臨床情報を持つデータを集められるため、より効率のよい多 型解析が可能になります。
*ファイルを介したデータの受け渡し機能をご利用いただくにはSNPAlyze Ver.5.0.2以降、HealthSketch Ver.1.1以降が必要です。
・・・・・・・・・・・・・・・・・・・・・・・・・
ロジスティック回帰分析
単一のSNPについてロジスティック回帰分析を実行します。Genotypeモデル, Dominantモデル, Recessiveモデルを考慮したオッズ比、オッズ比の95%信頼区間および検定統計量を出力します。
*ロジスティック回帰分析の機能をご利用いただくにはSNPAlyze Ver.7.0以降、HealthSketch Ver.2.5以降が必要です。
|
データと結果の一括保存&読み込み機能 ~ SNPAlyze Dataファイルの利用 |
SNPAlyze Dataファイルは、ジェノタイピングデータと解析結果が一括保存されたファイルです。同ファイル形式で保存されたファイルを読み込むとジェノタイピングデータと同データに対して行った解析結果が表示されます。そのまま続きの解析を実行したり、同ファイルを他のSNPAlyzeユーザに配布して結果を共有したりできます。
※SNPAlyze Dataファイルにはジェノタイピングデータが含まれます。配布には十分ご注意ください。 |
 |
|
主成分分析 |
- 主成分分析結果のEigenvalueをもとに第一主成分を横軸、第二主成分を縦軸として散布図で表示します。
異端な検体の確認が可能です。

|
|
マンハッタンプロット |
- NGSデータを対象としたケースコントロール研究のp値をマンハッタンプロットで出力します。
下部のシートにはマンハッタンプロット上で選択したSNPの統計値を表示します。
- Genotypeモデル、Alleleモデル、Recessiveモデル、Dominantモデルについてp値、カイ二乗値、自由度、効果量を算出します。

|
※1 参考文献
Stacey B. Gabriel, Stephen F. Schaffner, Huy Nguyen, Jamie M. Moore, Jessica Roy, Brendan Blumenstiel, John Higgins, Matthew DeFelice, Amy Lochner, Maura Faggart, Shau Neen Liu-Cordero, Charles Rotimi, Adebowale Adeyemo, Richard Cooper, Ryk Ward, Eric S, Lander, Mark J. Daly, David Altshuler,
The Structure of Haplotype Blocks in the Human Genome. Science. 2002 Jun 21;296(5576):2225-9.
※2 参考文献
Ning Wang, Joshua M. Akey, Kun Zhang, Ranajit Chakraborty, and Li Jin. Distribution of Recombination Crossovers and the Origin of Haplotype Blocks: Interplay of Population History, Recombination, and Mutation Am J Hum Genet. 2002 Nov ;71 (5):1227-34. |