22.Stacksを使用したRAD-seq解析

三原

『はじめに』

RAD-seq(Restriction Site Associated DNA Sequence)は、次世代シークエンサーを利用した解析のひとつで、ゲノム上にある制限酵素認識サイトの近接領域をシークエンスすることで、ゲノムの0.1~10%の領域を効率的に解析することができます。領域を絞ってシークエンスしているので、多サンプルでの解析もコストを抑えることができ、品種・系統・集団間での遺伝的変異の同定、系統解析、集団構造解析、連鎖解析など様々な場面で利用されています。
今回はRAD-seqのデータ解析プログラムであるStacks(ver. 1.37)を使用したde novo解析の例をご紹介します。
また実行環境として、Stacksがすぐにご利用いただける弊社Virtual Machine (VM) を使用した例をご紹介します。VMについては【Windows上で動作するNGSデータ解析環境】(https://www.dynacom.co.jp/product_service/development/win_ngs.html)を参照ください。
*ファイルパスやユーザー名などはVM環境でのものになりますので、環境が異なる場合は適宜修正ください。ご参考:Stacksのインストール方法。

1.データのダウンロード&解凍

Stacksのサンプルデータ:http://catchenlab.life.illinois.edu/stacks/tut_gar.php
$ wget –N http://catchenlab.life.illinois.edu/stacks/tutorial/stacks_samples.tar.gz
$ tar -zxvf stacks_samples.tar.gz

stacks_samplesというフォルダができ、中には両親2個体分と、94個体分のF1のfastaファイルが含まれます。

2.MySQLデータベースの作成

MySQLにstacks用のデータベースを作成します。
*mysqlのユーザー名をstacksとしています。
$ mysql -u stacks -p -e “CREATE DATABASE test_radtags”
$ mysql -u stacks -p test_radtags < /opt/bio/local/stacks/share/stacks/sql/stacks.sql


3.de novo(リファレンス配列無し)での解析を実行

両親2個体分と、F1の10個体分のデータを利用して解析を行いました。
一括して処理を行うスクリプトとして、リファレンス配列無しの場合はdenovo_map.pl、リファレンス配列有りの場合はref_map.plが利用できます。
$ mkdir out
$ denovo_map.pl -m 3 -M 2 -n 3 -T 15 -B test_radtags -b 1 -t -a 2016-06-16 \
-D “Test RAD-seq Samples” -o ./out \
-p ./stacks_samples/female.fa \
-p ./stacks_samples/male.fa \
-r ./stacks_samples/progeny_01.fa \
-r ./stacks_samples/progeny_02.fa \
-r ./stacks_samples/progeny_03.fa \
-r ./stacks_samples/progeny_04.fa \
-r ./stacks_samples/progeny_05.fa \
-r ./stacks_samples/progeny_06.fa \
-r ./stacks_samples/progeny_07.fa \
-r ./stacks_samples/progeny_08.fa \
-r ./stacks_samples/progeny_09.fa \
-r ./stacks_samples/progeny_10.fa


4.結果をブラウザで確認する

  VM上のFirefoxを起動し、URLに”localhost/stacks”と入力すればアクセス可能です。


ブラウザ上でデータの絞り込みや、データのダウンロードが可能です。 

弊社では、Stacksを実行後の連鎖地図作成なども承っております。ご興味のある方はお問い合わせください。

参考文献:
J. Catchen, P. Hohenlohe, S. Bassham, A. Amores, and W. Cresko. Stacks: an analysis tool set for population genomics. Molecular Ecology. 2013.
J. Catchen, A. Amores, P. Hohenlohe, W. Cresko, and J. Postlethwait. Stacks: building and genotyping loci de novo from short-read sequences. G3:
Genes, Genomes, Genetics, 1:171-182, 2011.