22.Stacksを使用したRAD-seq解析

三原

はじめに

RAD-seq(Restriction Site Associated DNA Sequence)は、次世代シークエンサーを利用した解析のひとつで、ゲノム上にある制限酵素認識サイトの近接領域をシークエンスすることで、ゲノムの0.1~10%の領域を効率的に解析することができます。領域を絞ってシークエンスしているので、多サンプルでの解析もコストを抑えることができ、品種・系統・集団間での遺伝的変異の同定、系統解析、集団構造解析、連鎖解析など様々な場面で利用されています。

今回はRAD-seqのデータ解析プログラムであるStacks(ver. 1.37)を使用したde novo解析の例をご紹介します。また、実行環境として、Stacksがすぐにご利用いただける弊社Virtual Machine (VM) を使用した例をご紹介します。VMについては【Windows上で動作するNGSデータ解析環境】を参照ください。

ファイルパスやユーザー名などはVM環境でのものになりますので、環境が異なる場合は適宜修正ください。
ご参考:Stacksのインストール方法
stacksのバージョンアップに伴い、現在(2020.6.24)はリンク先のデータが利用できません

1.データのダウンロード&解凍

Stacksのサンプルデータ:http://catchenlab.life.illinois.edu/stacks/tut_gar.php

$ wget –N http://catchenlab.life.illinois.edu/stacks/tutorial/stacks_samples.tar.gz
$ tar -zxvf stacks_samples.tar.gz

stacks_samplesというフォルダができ、中には両親2個体分と、94個体分のF1のfastaファイルが含まれます。

2.MySQLデータベースの作成

MySQLにstacks用のデータベースを作成します。
*mysqlのユーザー名をstacksとしています。

$ mysql -u stacks -p -e “CREATE DATABASE test_radtags”
$ mysql -u stacks -p test_radtags < /opt/bio/local/stacks/share/stacks/sql/stacks.sql

3.de novo(リファレンス配列無し)での解析を実行

両親2個体分と、F1の10個体分のデータを利用して解析を行いました。一括して処理を行うスクリプトとして、リファレンス配列無しの場合はdenovo_map.pl、リファレンス配列有りの場合はref_map.plが利用できます。

$ mkdir out
$ denovo_map.pl -m 3 -M 2 -n 3 -T 15 -B test_radtags -b 1 -t -a 2016-06-16 \
-D “Test RAD-seq Samples” -o ./out \
-p ./stacks_samples/female.fa \
-p ./stacks_samples/male.fa \
-r ./stacks_samples/progeny_01.fa \
-r ./stacks_samples/progeny_02.fa \
-r ./stacks_samples/progeny_03.fa \
-r ./stacks_samples/progeny_04.fa \
-r ./stacks_samples/progeny_05.fa \
-r ./stacks_samples/progeny_06.fa \
-r ./stacks_samples/progeny_07.fa \
-r ./stacks_samples/progeny_08.fa \
-r ./stacks_samples/progeny_09.fa \
-r ./stacks_samples/progeny_10.fa

4.結果をブラウザで確認する

VM上のFirefoxを起動し、URLに”localhost/stacks”と入力すればアクセス可能です。

ブラウザ上でデータの絞り込みや、データのダウンロードが可能です。

弊社では、Stacksを実行後の連鎖地図作成なども承っております。ご興味のある方はお問い合わせください。

参考文献