22.Stacksを使用したRAD-seq解析
三原
『はじめに』
RAD-seq(Restriction Site Associated DNA Sequence)は、次世代シークエンサーを利用した解析のひとつで、ゲノム上にある制限酵素認識サイトの近接領域をシークエンスすることで、ゲノムの0.1~10%の領域を効率的に解析することができます。領域を絞ってシークエンスしているので、多サンプルでの解析もコストを抑えることができ、品種・系統・集団間での遺伝的変異の同定、系統解析、集団構造解析、連鎖解析など様々な場面で利用されています。
今回はRAD-seqのデータ解析プログラムであるStacks(ver. 1.37)を使用したde novo解析の例をご紹介します。
また実行環境として、Stacksがすぐにご利用いただける弊社Virtual Machine (VM) を使用した例をご紹介します。VMについては【Windows上で動作するNGSデータ解析環境】(https://www.dynacom.co.jp/product_service/development/win_ngs.html)を参照ください。
*ファイルパスやユーザー名などはVM環境でのものになりますので、環境が異なる場合は適宜修正ください。ご参考:Stacksのインストール方法。
stacksのバージョンアップに伴い、現在(2020.6.24)はリンク先のデータが利用できません
1.データのダウンロード&解凍
Stacksのサンプルデータ:http://catchenlab.life.illinois.edu/stacks/tut_gar.php
$ wget –N http://catchenlab.life.illinois.edu/stacks/tutorial/stacks_samples.tar.gz $ tar -zxvf stacks_samples.tar.gz |
stacks_samplesというフォルダができ、中には両親2個体分と、94個体分のF1のfastaファイルが含まれます。
2.MySQLデータベースの作成
MySQLにstacks用のデータベースを作成します。
*mysqlのユーザー名をstacksとしています。
|
3.de novo(リファレンス配列無し)での解析を実行
両親2個体分と、F1の10個体分のデータを利用して解析を行いました。
一括して処理を行うスクリプトとして、リファレンス配列無しの場合はdenovo_map.pl、リファレンス配列有りの場合はref_map.plが利用できます。
|
4.結果をブラウザで確認する
VM上のFirefoxを起動し、URLに”localhost/stacks”と入力すればアクセス可能です。

ブラウザ上でデータの絞り込みや、データのダウンロードが可能です。

弊社では、Stacksを実行後の連鎖地図作成なども承っております。ご興味のある方はお問い合わせください。
参考文献:
J. Catchen, P. Hohenlohe, S. Bassham, A. Amores, and W. Cresko. Stacks: an analysis tool set for population genomics. Molecular Ecology. 2013.
J. Catchen, A. Amores, P. Hohenlohe, W. Cresko, and J. Postlethwait. Stacks: building and genotyping loci de novo from short-read sequences. G3:
Genes, Genomes, Genetics, 1:171-182, 2011.