三原
はじめに
RAD-seq(Restriction Site Associated DNA Sequence)は、次世代シークエンサーを利用した解析のひとつで、ゲノム上にある制限酵素認識サイトの近接領域をシークエンスすることで、ゲノムの0.1~10%の領域を効率的に解析することができます。領域を絞ってシークエンスしているので、多サンプルでの解析もコストを抑えることができ、品種・系統・集団間での遺伝的変異の同定、系統解析、集団構造解析、連鎖解析など様々な場面で利用されています。
今回はRAD-seqのデータ解析プログラムであるStacks(ver. 1.37)を使用したde novo解析の例をご紹介します。また、実行環境として、Stacksがすぐにご利用いただける弊社Virtual Machine (VM) を使用した例をご紹介します。VMについては【Windows上で動作するNGSデータ解析環境】を参照ください。
ファイルパスやユーザー名などはVM環境でのものになりますので、環境が異なる場合は適宜修正ください。
ご参考:Stacksのインストール方法
stacksのバージョンアップに伴い、現在(2020.6.24)はリンク先のデータが利用できません
1.データのダウンロード&解凍
Stacksのサンプルデータ:http://catchenlab.life.illinois.edu/stacks/tut_gar.php
$ wget –N http://catchenlab.life.illinois.edu/stacks/tutorial/stacks_samples.tar.gz
$ tar -zxvf stacks_samples.tar.gz
stacks_samplesというフォルダができ、中には両親2個体分と、94個体分のF1のfastaファイルが含まれます。
2.MySQLデータベースの作成
MySQLにstacks用のデータベースを作成します。
*mysqlのユーザー名をstacksとしています。
$ mysql -u stacks -p -e “CREATE DATABASE test_radtags”
$ mysql -u stacks -p test_radtags < /opt/bio/local/stacks/share/stacks/sql/stacks.sql
3.de novo(リファレンス配列無し)での解析を実行
両親2個体分と、F1の10個体分のデータを利用して解析を行いました。一括して処理を行うスクリプトとして、リファレンス配列無しの場合はdenovo_map.pl、リファレンス配列有りの場合はref_map.plが利用できます。
$ mkdir out
$ denovo_map.pl -m 3 -M 2 -n 3 -T 15 -B test_radtags -b 1 -t -a 2016-06-16 \
-D “Test RAD-seq Samples” -o ./out \
-p ./stacks_samples/female.fa \
-p ./stacks_samples/male.fa \
-r ./stacks_samples/progeny_01.fa \
-r ./stacks_samples/progeny_02.fa \
-r ./stacks_samples/progeny_03.fa \
-r ./stacks_samples/progeny_04.fa \
-r ./stacks_samples/progeny_05.fa \
-r ./stacks_samples/progeny_06.fa \
-r ./stacks_samples/progeny_07.fa \
-r ./stacks_samples/progeny_08.fa \
-r ./stacks_samples/progeny_09.fa \
-r ./stacks_samples/progeny_10.fa
4.結果をブラウザで確認する
VM上のFirefoxを起動し、URLに”localhost/stacks”と入力すればアクセス可能です。
ブラウザ上でデータの絞り込みや、データのダウンロードが可能です。
弊社では、Stacksを実行後の連鎖地図作成なども承っております。ご興味のある方はお問い合わせください。
参考文献
- J. Catchen, P. Hohenlohe, S. Bassham, A. Amores, and W. Cresko. Stacks: an analysis tool set for population genomics. Molecular Ecology. 2013.
- J. Catchen, A. Amores, P. Hohenlohe, W. Cresko, and J. Postlethwait. Stacks: building and genotyping loci de novo from short-read sequences. G3: Genes, Genomes, Genetics, 1:171-182, 2011.