主な特長

本製品の主な特長をご紹介します。

Excelと同様の操作性

SNPAlyzeのデータシートではExcelと同様の感覚でデータを編集できます。また、Excel等から直接データをコピーアンドペーストすることも可能です。編集したデータはタブ区切りテキストファイルとして保存可能です。



データのインポートが簡単

画面に従って操作することで簡単にタブ区切りテキストファイル(txt形式)、カンマ区切りテキストファイル(csv形式)、Excelファイル(xls/xlsx形式)およびSNPAlyze Dataファイル(slyz形式)をインポートできます。また、Biotage社 PSQ96ABI社 PRISM7900のエキスポートファイルもインポート可能です。



世界最高速のハプロタイプ推定 ※1

SNPAlyzeのハプロタイプ推定機能は世界最高速です。

同ハプロタイプ推定機能を
Arlequinと比較したところ、
約1000倍高速という結果が得られています。※2



複数の座位のハプロタイプ推定

Ver.3.1以前では一度に推定可能な座位が30に制限されていましたが、これを40座位まで推定可能にしました。(ただし、Standard版は、30座位、Pro版は、40座位となります。)

検体数にも依存しますが、40座位のハプロタイプを数秒で推定可能です。

(40座位以上でカスタマイズのご希望の場合は、『価格・購入方法』をご覧ください。)



カイ二乗値、P値のほかにAICに対応

SNPAlyzeではカイ二乗値、P値の算出に加えてAICを算出することが可能です。カイ二乗検定では有意水準の設定が恣意的であり判定基準が「曖昧」だと考えられます。

AICはカイ二乗検定のように有意性の判断に曖昧さが無く、より厳密に解析を行うことが可能です。SNPAlyzeでは次の解析にAICを用いています。


連鎖不平衡のグラフィカルな表示

複数のSNPs間の連鎖不平衡を一目で参照可能です。強い連鎖不平衡が存在する領域を容易に特定できます。SNPAlyzeでは以下の3つの形式を利用可能です。

従来の連鎖不平衡値(D、D’、r2)のほかにAIC(LD)も対応

連鎖不平衡の尺度としてはD、D’、r2などが知られています。SNPAlyzeでは既存の尺度に加えてAICを用いて連鎖不平衡を評価することが可能です。※3 

ある2つのSNPs座位が連鎖不平衡にあると考えるモデル(AIC(IM))と連鎖平衡にあると考えるモデル(AIC(DM))を想定し、その差を用いて連鎖不平衡を評価します。

(AIC(LD)= AIC(IM)- IC(DM))



ディプロタイプ形の分布推定

EMアルゴリズムを利用してディプロタイプ形の分布を推定することが可能です。各ディプロタイプ形を構成するハプロタイプの組み合わせおよびデータ中で同ディプロタイプ形を取る検体数を表示します。



Permutation testの利用

複数の集団(ケース群、コントロール群等)から求められる各ハプロタイプ頻度の差の検定を行います。検定において、極端に小さなハプロタイプの頻度を含む場合、カイ二乗検定などでは大きな誤差を生じてしまいます。

Permutation法では乱数を使用しながら近似的に正確確率を求めるため、広いデータ範囲で適切なP値を求めることができる手法として注目されています。※4



大量のデータを処理可能

Pro版のみ最大で10,000検体の解析が可能です。Standard版では対応できない大量のデータも解析可能です。(解析可能なデータ数はメモリに依存します。




マイクロサテライトへの対応

マイクロサテライトはSNPと比較するとゲノム上の出現頻度は低いものの、多型性に富み、得られる情報量は多いです。SNPとマイクロサテライトを組み合わせることにより効率よく解析を行うことが可能になります。




tagSNP同定機能

ハプロタイプ推定時にtagSNP(htSNP)の同定が可能になりました。ハプロタイプブロックを代表する多型マーカであるtagSNPを用いることにより、より効率的なジェノタイピングを行うことが可能です。

複数の座位のハプロタイプを推定した場合など、tagSNPの組み合わせが複数存在する場合は、全ての組み合わせを出力します。




複数のデータシートを読み込み可能

Ver.5.0では、複数のデータシートを同時に読み込むことが可能となりました。異なるデータシート間での解析結果の比較や、解析結果の履歴をダイレクトに参照することが可能です。




ハプロタイプブロック解析

一般的に用いられるGabriel※5の方法、Four Gamete法※6を用いてハプロタイプブロックを構築します。構築されたブロックを選択することにより、そのままハプロタイプを用いたケースコンロール研究を実行することが可能です。




多型マーカーの絞り込み機能

ハーディーワインベルグ平衡(HWE)、マイナーアレル頻度、多型マーカタイプに応じて、解析の対象となる多型マーカを自動的に選択する機能を搭載しています。



HealthSketchとの連携 ※7

HealthSketch(ヘルスケッチ)は、臨床および生活習慣データを統合し、統計処理や疾患予測モデルの構築支援を行うソフトウェアです。HealthSketchとの連携により以下が可能になります。


データと結果をまとめて管理

SNPAlyze Dataファイル形式を利用すると、ジェノタイピングデータと同データの解析結果を一括して保存したり、読み込んだりできるのでデータや結果を個別に管理する煩わしさから解放されます。

同ファイル形式で保存したファイルを開いて解析を再開したり、他のSNPAlyzeユーザに配布してデータや結果を共有したりできます。

※SNPAlyze Dataファイルにはジェノタイピングデータが含まれます。配布には十分ご注意ください。




FDR法の利用

FDR法を利用した多重検定の補正が可能になりました。

FDR法は有意と判断された仮説のうち、本来帰無仮説に属するものの割合をコントロールする方法です。ケースコントロール研究の結果得られる複数のp-valueから多重検定における有意性指標であるq-valueを計算します。(帰無仮説の個数比を推定する方法としてBHまたはBootstrap法のどちらかを選択可)



コクラン・アーミテージ・トレンド検定

単一のSNPについてコクラン・アーミテージ・トレンド検定(トレンド検定)を実行します。

ケースコントロール研究と同様、疾患の有無によって患者群と対照群を設定し、遺伝子データとの関連性について検討を行います。 ケースコントロール研究では遺伝形式(Recessive, Dominant, Genotype)に着目し、各遺伝型と疾患の有無について検討しました。トレンド検定では任意のアレルに着目し、群間で同アレル数(=各遺伝型に相当)の比に線形傾向がみられるか検討を行います。



VCFファイルのインポートNEW!!
  • VCFファイルのインポート

    VCFファイルを入力ファイルとして扱えるようになりました(VCFバージョン4.1、4.2に対応)。
    インポート可能な検体数はStandard版、Pro版で異なります。 詳細については『Pro版とStandard版との機能比較について』をご覧ください。



効果量NEW!!
  • 効果量は、効果の大きさを表す統計的な指標を示し、2群間の差の程度を表す効果量や変数間の関係の大きさを表す効果量があります。
    この絶対値が大きくなればなるほど効果は大きいことを表します。例えば、変数間の関係の大きさを表す効果量としてphi(Φ)やCramer’s V(V)があります。

  • 2変数間の関係の強さを調べるためにはカイ二乗検定を利用します。
    SNPAlyzeでは、Genotypeモデル・Alleleモデル・Recessiveモデル・Dominantモデルごとに分割表を作成し、効果量を算出しています。
    効果量はカイ二乗値(χ^2)とケース群とコントロール群の総数(N)、分割表の少ない方の行または列の数(k)を用いて次式で表すことができます。

                                                      effect_size_equation3




その他、関連情報


※1 2004年9月現在(自社調べ)

※2 SNPデータに限定

※3
 Shimo-Onoda K, Tanaka T, Furushima K, Nakajima T, Toh S, Harata S, Yone K, Komiya S, Adachi H, Nakamura E, Fujimiya H, Inoue I. Akaike’s information criterion for a measure of linkage disequilibrium. J Hum Genet 2002; 47(12): 649-55.

※4 Fallin D, Cohen A, Essioux L, Chumakov I, Blumenfeld M, Cohen D, Schork NJ. Genetic analysis of case/ control data using estimated haplotype frequencies: application to APOE locus variation and alzheimer’s disease. Genome Res. 2001 Jan; 11: 143-151.

Good, P. Permutation Tests. A Practical Guide to Resampling Methods for Test-ing Hypothesis. Second Edition. New York: Springer-Verlag, 2000.


※5 Stacey B. Gabriel, Stephen F. Schaffner, Huy Nguyen, Jamie M. Moore, Jessica Roy, Brendan Blumenstiel, John Higgins, Matthew DeFelice, Amy Lochner, Maura Faggart, Shau Neen Liu-Cordero, Charles Rotimi, Adebowale Adeyemo, Richard Cooper, Ryk Ward, Eric S, Lander, Mark J. Daly, David Altshuler, The Structure of Haplotype Blocks in the Human Genome. Science. 2002 Jun 21;296(5576):2225-9.

※6
 Ning Wang, Joshua M. Akey, Kun Zhang, Ranajit Chakraborty, and Li Jin. Distribution of Recombination Crossovers and the Origin of Haplotype Blocks: Interplay of Population History, Recombination, and Mutation Am J Hum Genet. 2002 Nov ;71 (5):1227-34.

※7 連携機能をご利用いただくにはSNPAlyze Ver.5.0.2 以降、HealthSketch Ver.1.1 以降が必要です。

※8
 ロジスティック回帰分析の機能をご利用いただくにはSNPAlyze Ver.7.0以降、HealthSketch Ver.2.5 以降が必要です。