跨物种靶基因富集技术实验方案

黄俊满; 袁昊; 李晨虹

Home

Request a Protocol

About

A brief version of this protocol appeared in:

Protocol for Cross-species Target-gene Enrichment

黄俊满

袁昊

李晨虹

DOI: 10.21769/BioProtoc.1010606

Published: May 11, 2021

PDF

Original Version
Updated Version

How to cite

Favorites

Q&A

Cited by

引用格式：黄俊满, 袁昊, 李晨虹. (2021). 跨物种靶基因富集技术实验方案. Bio-101: e1010606. DOI: <a href="https://doi.org/10.21769/BioProtoc.1010606">10.21769/BioProtoc.1010606</a>. <a href="/downpdf.aspx?wzid=1010606&action=21&lang=1"> <img src='https://en-cdn.bio-protocol.org/bio101/images/RISLogo_cn.png' class='videopic margin-top margin-bottom' style='width:auto;height:auto;box-shadow:none;cursor: pointer !important;' /> </a> <div class='clear'></div>How to cite: Huang, J. M., Yuan, H. and Li, C. H. (2021). Protocol for Cross-species Target-gene Enrichment. Bio-101: e1010606. DOI: <a href="https://doi.org/10.21769/BioProtoc.1010606">10.21769/BioProtoc.1010606</a>. <a href="/downpdf.aspx?wzid=1010606&action=21&lang=0"> <img src='https://en-cdn.bio-protocol.org/bio101/images/RISLogo.png' class='videopic margin-top margin-bottom' style='width:auto;height:auto;box-shadow:none;cursor: pointer !important;' /> </a>

摘要：本实验方案介绍了一种跨物种靶基因富集的方法，可以获得与探针相似度低至60-70%的目标基因序列。该方法能用于获得成千上万个单拷贝核基因编码序列，用于系统发育基因组学 (phylogenomics) 分析；也可以用于其它非模式生物功能基因的富集。实验方案包括三个实验方法和相关数据分析方法。1."MagNA磁珠清洗法纯化DNA产物"描述了通过自配MagNA清洗磁珠和缓冲液，可以几乎无成本地纯化DNA，用于靶基因文库构建和富集的各个步骤，也可用于一般的DNA纯化需求；2."文库构建"介绍了如何构建用于靶基因富集的Illumina文库；3."靶基因富集"是关于跨物种靶基因富集实验过程的详细步骤。另外，本方案还介绍了以单拷贝外显子为目标基因富集数据的组装和分析方法。本方案尽量选用实验室自配溶液和降低成本的设计，并尽可能地详尽描述实验步骤，旨在为相关科研工作者开展系统发育基因组学研究或其它方向的研究提供一种可操作、高效、低成本的解决方案。

关键词: 目标基因捕获, 外显子, 文库构建, 高通量测序, 数据组装, 系统发育基因组学

研究背景

        传统分子系统学研究往往采用一个或几个基因标记，通过设计PCR引物，扩增目标基因，然后克隆、测序。这种方法耗时费力，一次只能获得一个样本一个或几个基因的序列。随着测序技术的提高和测序成本的不断下降，越来越多的动物系统学和进化研究开始使用基因组水平的数据。但是目前采用全基因组测序的方法成本太高，特别是当研究涉及物种较多或者每个物种有多个样品的情况下。因此，越来越多的研究者通过使用简化基因组或靶基因富集等方法，获得基因组的部分同源序列用于系统学研究。
        简化基因组依靠限制性内切酶位点来选择同源序列，此方法用于遗传距离较远的物种往往不能保证序列的同源性，还可能会导致大量数据的缺失。而通过锚定超保守序列的基因富集方法，如ultraconserved elements (UCEs) 或anchored hybrid enrichment (AHE) 等方法获得的大部分序列是超保守的序列和非编码的侧翼序列。超保守序列提供的系统发育信息不足，而侧翼非编码序列与编码序列相比无论是在序列比对和适用分子进化模型等方面都还不成熟，不太适合用于系统学分析。另外，无论是UCEs还是AHE可用的标记数量有限。本方案介绍一种跨物种靶基因富集技术，通过改变杂交条件，降低杂交和清洗温度等步骤获得相似度低至60-70%的目标基因序列。因此，该方法比UCEs或AHE更具优势，可以用于富集不同物种的编码基因，能更好地用于系统发育基因组学的研究；也可以用于获得非模式物种的目标基因序列，用于基因功能进化的研究。
        本实验方案结合自主开发用于系统发育基因组学研究的分子标记，已成功应用于桑科植物 (Yao et al., 2013)、蚂蚁 (Stroeher et al., 2013)、绦虫 (Huan et al., 2016)、线虫、纤毛虫，鱼类 (Song et al., 2017，Yin et al., 2019)、爬行类和哺乳类等生物类群中。本实验方案尽量采用自配溶液和降低成本的设计，可以一次性获得一百多个样品的几千个基因序列。每个样品建库、富集和测序的总成本可以控制在300-400元。

材料与试剂

一、"MagNA磁珠清洗法纯化DNA"试剂清单

5% Sera-Mag Magnetic Speed-beads (Fishersci，catalog number: 09-981-123，4 °C储存)
PEG-8000 (生工，catalog number: A600433-0500，常温储存)
5 M NaCl (生工，catalog number: A100241，常温存储，自配至对应浓度)
1 M Tris-Cl (pH = 8.0) (生工，catalog number: B548127-0500，常温储存)
0.5 M EDTA (pH = 8.0) (Invitrogen，catalog number: 15575-020，常温存储)

二、"靶基因富集文库构建"试剂清单

Buffer Tango (10x) (Thermo, catalog number: BY5，-20 °C储存)
dNTPs (10 mM each) (Invitrogen，catalog number: 18427088，-20 °C储存)
ATP (100 mM) (Thermo，catalog number: R0441，-20 °C储存)
T4 polynucleotide kinase (10 U/μl) (Thermo，catalog number: EK0031，-20 °C储存)
T4 DNA polymerase (5 U/μl) (Thermo，catalog number: EP0061，-20 °C储存)
T4 DNA ligase (5 U/μl) (Invitrogen，catalog number: 15224041，-20 °C储存)
T4 DNA ligase buffer (10x) (T4 DNA ligase试剂盒配套)
PEG-4000 (50%) (T4 DNA ligase试剂盒配套)
Bsm polymerase, large fragment (8 U/μl) (Thermo，catalog number: EP0691，-20 °C储存)
Bsm buffer (10x) (Bsm polymerase, large fragment (8U/μl) 试剂盒配套)
KAPA HiFi Hotstart Ready Mix (2x) (KAPABIOSYSTEMS，catalog number: KK2602，-20 °C储存)

三、"靶基因富集"试剂清单

UltraPure™ SSPE, 20x (Invitrogen，catalog number: 15591043，常温储存)
UltraPure™ 0.5M EDTA, pH 8.0 (Invitrogen，catalog number: 15575020，常温储存)
Denhardt's Solution (50x) (Invitrogen，catalog number: 750018，-5 °C ~-30 °C储存)
10% SDS溶液 (生工，catalog number: B548118-0100，常温储存)
SUPERase•In™ RNase Inhibitor (20 U/μl) (Invitrogen，catalog number: AM2696，-20 °C储存)
DEPC 处理水 (生工，catalog number: B501005-0500，常温储存)
RNA baits (Arbor Bioscience，-20 °C储存)
注：RNA baits是一段带有生物素标记、与目标基因互补配对的RNA序列。通过杂交反应与目标基因结合，其特有的生物素能与链霉亲和素磁珠特异结合，根据此特性清洗去除非目标序列以达到富集效果。RNA baits可以根据目标基因进行设计，例如通过比较模式生物基因组寻找单拷贝核基因编码序列，设计RNA baits (Li et al., 2012)。
Human Cot-1 DNA (Invitrogen，catalog number: 15279011，-20 °C储存)
BO1 (封阻片段1，序列见"溶液配制")
BO3 (封阻片段3，序列见"溶液配制")
Dynabeads™ MyOne™ Streptavidin C1 (Invitrogen，catalog number: 65002，2-8 °C储存)
Binding Buffer (成分见"溶液配制")
Tween-20 (Amresco，catalog number: 0777-1L，常温储存)
Wash Buffer2 (成分见"溶液配制")
Wash Buffer1 (成分见"溶液配制")
1x TE buffer (生工，catalog number: B548106，常温储存)
KAPA HiFi Hotstart Ready Mix (2x) (KAPABIOSYSTEMS，catalog number: KK2602，-20 °C储存)
20x SSC 缓冲液 (生工，catalog number: B548109-0200，常温储存)
1 M Tris-HCl 溶液，pH 7.5，无菌 (生工，catalog number: B548124-0500，常温储存)
HPLC超纯水 (TEDIA，catalog number: WS2211-001，常温储存)

四、其他耗材

0.2 ml 薄壁PCR管 (Axygen，catalog number: PCR-02-L-C)
各种型号的带滤芯枪头 (10 μl，100 μl，200 μl，1000 μl，Axygen)
0.2 ml 96孔PCR板盒 (淘宝)
自制磁板 (超强磁条 (淘宝) 嵌套于0.2 ml 96孔PCR板盒)

仪器设备

PCR仪 (Eppendorf AG，22331 Hamburg)
杂交仪 (UVP HB-1000 Hybridizer)
0.1-2.5 μl, 0.5-10 μl, 2-20 μl, 10-100 μl, 20-200 μl, 100-1000 μl移液枪 (Eppendorf系列)
漩涡混匀仪 (上海沪析实业有限公司，Vortex-2)
微型掌上离心机 (上海沪析实业有限公司，HL-6KS)
Nanodrop 3300超微量荧光分光光度计 (Thermo)
破碎仪 (Covaris M220)
高压蒸汽灭菌锅 (上海博讯实业有限公司)
服务器 (Linux系统，32 G以上的内存，500 G的存储)
电泳仪 (BIO-RAD，PowerPac-Basic)

分析软件

Perl v5.18 or higher (https://www.perl.org/get.html)
trim_galore v0.4.1 or higher (https://github.com/FelixKrueger/TrimGalore)
cutadapt v1.2.1 or higher (https://github.com/marcelm/cutadapt)
USEARCH 10.0.240 or higher (http://www.drive5.com/usearch/download.html)
SGA v0.10.15 or higher (https://github.com/jts/sga)
Exonerate v2.2.0 or higher (https://www.ebi.ac.uk/about/vertebrate-genomics/software/exonerate)
Assexon (https://github.com/yhadevol/Assexon)
Mafft v7.294b or higher (https://mafft.cbrc.jp/alignment/software/)
RAxML (https://github.com/stamatak/standard-RAxML)
ASTRAL (https://github.com/smirarab/ASTRAL)
Figtree (http://tree.bio.ed.ac.uk/software/figtree/)

实验步骤

本实验方案包括三个部分：1.MagNA磁珠清洗法纯化DNA产物；2.文库构建；3.靶基因富集。

一、MagNA磁珠清洗法纯化DNA产物

将30 μl的MagNA磁珠加入到0.2 ml PCR空管，将PCR管放在磁板上静置片刻，待磁珠吸附到管壁后，去除上清液 (可丢弃吸附上的磁性不强磁珠)。
以1:0.9的比例添加DNA样品与MagNA缓冲液 (见溶液配制)，随后涡旋振荡PCR管片刻，使其充分混匀。
注：1:0.9的比例是根据经验值而定，可最大化减少试剂的使用量、减少短片段的丢失，建议读者在配制MagNA缓冲液后，做浓度梯度预实验来确定最优的比例。
常温下将PCR管置于96孔板上5 min (使磁珠吸附DNA)，用微型离心机离心5 s。
将PCR管转移至磁板上5 min，直到磁珠吸附到管壁上。随后去除上清液，注意不要吸到磁珠。
继续将PCR管置于磁板上，添加186 μl的70%乙醇，用于清洗残留的MagNA缓冲液。静置1 min，随后去除上清液。
注：不要吹打溶液，无需混匀磁珠。
重复步骤5一次。
将PCR管盖敞开，室温静置5 min，使残留的乙醇彻底挥发。
添加20 μl DEPC处理水或1x TE缓冲液，将PCR管从磁板转移到96孔板上，用移液枪缓慢吹打溶液3-5次，使其充分混匀，室温静置1 min (释放DNA)，随后离心5 s。
将PCR管放回磁板上，静置1 min，随后将上清液转移至新管中。
注：在下面建库和富集过程中，往往不需洗脱DNA，而是保留有DNA的磁珠，此时省略第8-9步。

二、文库构建

DNA片段化
1.1
取0.3-1 μg DNA样品 (DNA片段大于100 bp)，用Covaris M220破碎仪将DNA破碎成100-500 bp片段 (破碎仪可参考如下设置：Average Incident Power: 15 Watt, Peak Incident Power: 75 Watt, Duty Factor: 20%, Cycles/Burst: 200, Duration: 360 s；片段化DNA样品所需体积270 μl)。
1.2
分别取1 μl片段化产物和1 μl初始DNA，使用1%琼脂糖凝胶电泳进行检测。
1.3
取130 μl片段化DNA，正对照 (用于做正对照的样品可以是一般PCR产物，如300 bp左右的PCR产物) 和负对照 (30 μl超纯水) 作对比实验，用MagNA磁珠清洗法将片段化DNA吸附到磁珠上，随后去除上清液。

图1. 破碎后的DNA示意图 图上分别为DNA样品和片段化DNA。

平末端修复

2.1

在冰盒上配制"平末端修复"反应溶液。将20 μl的反应溶液加入每个样品 (上一步保留的磁珠)，并轻轻吹打3-5次混匀。

成分	体积 (μl)	终浓度(20 μl体系)
Buffer Tango (10x)	2	1x
dNTPs (10 mM each)	0.2	100 μM each
ATP (100 mM) T4 polynucleotide kinase (10 U/μl) T4 DNA polymerase (5 U/μl) DEPC处理水	0.2 1 0.4 16.2	1 mM 0.5 U/μl 0.1 U/μl
总体积	20

注：建议在冰盒上进行操作

2.2

设置"平末端修复"程序如下：

步骤	循环阶段	温度	时间	循环数
1	平末端	25 °C	15 min	1
2	DNA 5‘端磷酸化修饰	12 °C	5 min	1

注：反应完成后，将PCR管离心5 s以免管盖内壁附着液滴，可以减少污染。

2.3

利用MagNA磁珠清洗法进行纯化 (无需添加新的磁珠)，最后去除上清，保留磁珠。(仅做到磁珠清洗法的第7步)
注：反应完成后需立即纯化，纯化产物可以4 °C过夜保存。

连接测序接头

3.1

在冰盒上配制"连接测序接头"反应溶液：

成分	体积 (μl)	终浓度(40 μl体系)
T4 DNA ligase buffer (10x)	4	1x
PEG-4000 (50%)	4	5%
Adapter mix P5 (50 μM each) Adapter mix P7 (50 μM each) T4 DNA ligase (5 U/μl) DEPC处理水	1 1 1 29	1.25 μM each 1.25 μM each 0.125 U/μl
总体积	40

3.2

将40 μl反应溶液加入上一步样品 (上一步保留的磁珠)中，轻轻吹打3-5次混匀。

3.3

设置"连接测序接头"程序如下：

步骤	循环阶段	温度	时间	循环数
1	连接测序接头	22 °C	30 min	1

注：反应完成后，将PCR管离心5 s。

3.4

利用MagNA磁珠清洗法进行纯化 (无需添加新的磁珠)，最后去除上清，保留干燥的磁珠。(仅做到磁珠清洗法的第7步)
注：纯化产物可以4 °C过夜保存

缺刻补齐
4.1
在冰盒上配制"缺刻补齐"反应溶液：

成分体积(μl) 终浓度(40 μl体系)
Bsm buffer (10x) 4 1x
dNTPs (10 mM each)
Bsm polymerase, large fragment (8 U/μl)
DEPC处理水 1
1.5
33.5 250 μM each
0.3 U/μl
总体积 40

4.2
将40 μl反应溶液加入到上一步的样品 (上一步保留的磁珠) 中，轻轻吹打3-5次混匀。
4.3
设置"缺刻补齐"程序如下：

步骤循环阶段温度时间循环数
1 补齐缺刻 37 °C 20 min 1
注：反应完成后，将PCR管离心5 s。

4.4
利用MagNA磁珠清洗法进行纯化 (无需添加新的磁珠)，去除上清，将35 μl的1x TE缓冲液加入到每个样品中，保留磁珠在PCR管中，在管盖上标注"样品名+lib"。此时靶基因待富集文库已构建完成，可放于-20 °C环境下短期储存一个月。

预杂交PCR扩增在冰盒上配制"预杂交PCR扩增"反应溶液：

成分	体积 (μl)	终浓度(25 μl体系)
KAPA HiFi taq Ready Mix (2x)	12.5	1x
Primer IS7 (10 μM) Primer IS8 (10 μM)	0.75 0.75	0.3 μM 0.3 μM
总体积	14

5.2

将14 μl上述反应液加入到0.2ml PCR空管中，再分别加入11 μl第四步获得的样品 "lib"文库 (切记磁珠与溶液混匀后再吸取)。将样品与试剂吹打3-5次，充分混匀。设置"预杂交PCR"程序如下：

步骤	循环阶段	温度	时间	循环数
1	预变性	98 °C	45 s	1
2	变性	98 °C	15 s	12-18 (具体循环数根据所添加样品的量而定)
	退火	60 °C	30 s
	延伸	72 °C	45 s
3	延伸	72 °C	1 min	1
4	降温	4 °C	5 min	1
5	保存	12 °C	∞	1

5.3

利用MagNA磁珠清洗法进行纯化 (需要添加新的MagNA磁珠！)，然后将25 μl的1x TE缓冲液加入到每个样品管里，将上清液转移至新的0.2 ml PCR空管中，在管盖上标注"样品名+PreH"，可放于-20 °C环境下短期储存一个月。

5.4

分别取1 μl "PreH"产物、1 μl 正对照原液 (300 bp)，使用1%的琼脂糖凝胶电泳进行检测。若文库构建成功，则正对照的"PreH"产物长度比正对照原液稍长，且负对照的"PreH"产物中无条带。

图2. 靶基因待富集文库构建结果电泳图 "J1"-"C15"共14个实验样品，"300 bp-lib"为正对照，"-"为负对照，"300 bp"为建库前的正对照DNA原液。Marker-D的片段大小从下至上分别为100 bp, 250 bp, 500 bp, 750 bp, 1 k, 2 k。

三、靶基因富集

杂交

1.1

设置"靶基因富集"程序：

步骤	循环阶段	温度	时间	循环数
1	变性解链	95 °C	5 min	1
2	预退火杂交	65 °C	5 min	1
3	退火杂交	65 °C	240 min	1
4	退火杂交	60 °C	240 min	1
5	退火杂交	55 °C	240 min	1
6	退火杂交	50 °C	240 min	1
	保存	50 °C	∞

注：共计16 h左右。 (通过降低退火温度、设定退火梯度温度，可杂交结合相似度低至60-70%的序列)

1.2

在室温下配制Hyb Baits Mix溶液 (杂交反应体系与RNA酶抑制剂)，反应体系如下：

成分	体积 (μl)
HYB 20x SSPE	7
HYB 0.5 M EDTA (pH = 8.0)	0.3
HYB 50x Denhardt’s	3
HYB 10% SDS	0.3
SUPERase•In (20U/μl)	1
RNA Baits (MYselect)	0.2
DEPC处理水	4.8
总体积	16.6

注：各试剂添加完后，用移液枪轻轻地吹打混匀，随后用微型离心机离心5 s，将溶液集中到底部。

1.3

在室温下配制Lib Mix溶液 (封阻简单重复序列与接头测序序列)，Lib Mix反应体系如下：

成分	体积(μl)
Block Human Cot1 (1 μg/μl)	2.5
BO1.P5.F (200 μM)	0.5
BO3.P7.part1.R (200 μM)	0.5
总体积	3.5

各试剂添加完后，用移液枪轻轻地吹打混匀，随后离心5 s，将溶液集中到底部。
取0.2 ml薄壁PCR空管，在管盖上标注样品名。将3 μl的Lib Mix溶液加入到每个PCR管中，然后再分别加入11 μl样品"PreH"产物 (含有至少100 ng DNA)，用移液枪轻轻地吹打混匀，随后用微型离心机离心5 s，将溶液集中到底部。

1.4

将混有Lib Mix和样品文库的PCR管放至PCR仪上，并启动反应程序。此时进入程序第一步，对DNA文库进行95 °C高温变性解链处理。

1.5

当程序到达第二步 (65 °C)，将含有Hyb Baits Mixs的管子载入PCR仪，预热Hyb Baits Mix 5 min，期间混有Lib Mix和样品文库的PCR管始终置于PCR仪上。

1.6

5 min后，PCR仪上的管子不取出，继续维持65 °C，将16 μl的Hyb Baits Mix转移到混有Lib Mix和样品的PCR管中，用移液枪轻轻吹打混匀3-5次。盖紧PCR管。

1.7

维持反应体系在恒温体系下，直至程序结束。
注：程序结束后，样品仍可在PCR仪上50 °C条件下放置数小时。

Dynabeads链霉亲和素磁珠吸附与清洗
2.1
加nx 10 μl Dynabeads链霉亲和素磁珠到0.2 ml PCR新管中，每个PCR管中添加的磁珠不得超过100 μl，方便后续步骤清洗。
2.2
将PCR管静置于磁板上片刻，待磁珠吸附到管壁之后，去除上清液。
2.3
加100 μl的Binding缓冲液于PCR管中清洗磁珠。用移液枪轻轻吹打混匀。继续将PCR管静置于磁板上2 min，待磁珠吸附到管壁之后，去除上清液 (包含尚未被吸附到管壁上的少许磁珠)。
2.4
重复步骤2.3两次。
2.5
将nx 20 μl Binding缓冲液、1 μl 10%的Tween加入到步骤2.4的PCR管 (此时仅有磁珠)，轻轻吹打混匀，将磁珠再次悬浮。
2.6
先将180 μl的Binding缓冲液加入到新的0.2 ml PCR空管中，再加入20 μl步骤2.5的磁珠悬浮液。
2.7
将步骤2.6配制好的200 μl磁珠溶液放置在PCR仪50 °C加热5 min。
2.8
将"靶基因富集"步骤1.7中的杂交产物加入到磁珠悬浮液中，用移液枪轻轻吹打混匀。随后将PCR管放入杂交仪中，50 °C反应30 min。同时在PCR仪上预热3x nx 190 μl Wash Buffer 2溶液 (提前配制Wash buffer 1，以Wash buffer 1为原料配制Wash buffer 2)，保持50 °C 10 min。
2.9
待步骤2.8杂交结束后，用微型离心机离心5 s，将PCR管转移至磁板上 (磁板提前在杂交仪中预热)，并在杂交仪中静置片刻 (不超过2 min)，待磁珠吸附到管壁后，去除上清液。
2.10
将带有磁珠的PCR管放回PCR仪上 (程序维持在50 °C)。添加186 μl 50 °C的Wash Buffer 2到PCR管中，轻轻地将磁珠吹打混匀。继续在50 °C PCR仪上反应10 min。待10 min反应结束后，将PCR管静置于磁板上片刻 (不超过2 min)，待磁珠吸附到管壁后，去除上清液。
2.11
重复步骤2.10两次。
2.12
在室温下将100 μl的1x TE缓冲液加入到PCR管中 (用以清洗残留的Wash Buffer 2)。将PCR管静置于磁板上1 min，待磁珠吸附到管壁后，去除上清液。
2.13
将35 μl的1x TE缓冲液加入PCR管中，在管盖上标注"样品名+1^stcap"，将其放置在-20 °C短期保存 (溶液中依然保留有磁珠)。
注：清洗步骤时，减少PCR管暴露在室温的时间，尽量保持反应溶液在50 °C。步骤2.9应尽量移除干净上清液。

第一次杂交PCR (为第二次杂交作准备)

3.1

在冰盒上配制PCR扩增反应溶液：

成分	体积 (μl)	终浓度(25 μl体系)
KAPA HiFi HotStart Ready Mix (2x)	12.5	1x
P5引物IS7 (10 μM)	0.75	0.3 μM
P7引物IS8 (10 μM)	0.75	0.3 μM
总体积	14

将14 μl上述所配制的PCR扩增反应溶液加入到新的0.2 ml PCR空管中，随后添加11 μl第一次杂交1^stcap产物 (确保磁珠与溶液混匀后再吸取)，在管盖上标注样品名。用移液枪轻轻吹打3-5下。用以下PCR反应程序进行扩增：

步骤	循环阶段	温度	时间	循环数
1	预变性	98 °C	45 s	1
2	变性	98 °C	15 s	12-14 (具体循环数根据所添加样品的量而定)
	退火	60 °C	30 s
	延伸	72 °C	45 s
3	延伸	72 °C	1 min	1
4	降温	4 °C	5 min	1
5	保存	12 °C	∞	1

3.2

用MagNA磁珠法清洗PCR扩增产物 (需要添加新的MagNA磁珠！)。清洗结束后，用25 μl的1x TE缓冲液进行洗脱，将上清液转移至新的200 μl PCR空管中，在管盖上标注"样品名+preH2"

3.3

取1 μl的PCR产物稀释10倍后，用Nanodrop3300分光光度计进行浓度的测定，产物稀释后浓度约在1 ng/μl左右。

用步骤3的PCR产物再做一遍杂交富集，即二次杂交 (重复步骤1和2)。第二次杂交并清洗后的产物命名为"样品名+2ndcap"。

Indexing PCR

5.1

在冰盒上配制PCR扩增反应溶液如下：

成分	体积 (μl)	终浓度(25 μl体系)
KAPA HiFi HotStart Ready Mix (2x)	12.5	1x
P5引物IS4 (10 μM)	0.5	0.2 μM
总体积	13

将13 μl上述所配制的PCR扩增反应溶液加入新的0.2 ml PCR空管，添加0.5 μl P7 index扩增引物 (见溶液配制)，随后添加11.5 μl的第二次杂交2^ndcap产物 (确保磁珠与溶液混匀后再吸取)。吹打混匀并离心5 s。用以下PCR程序进行扩增：

步骤	循环阶段	温度	时间	循环数
1	预变性	98 °C	45 s	1
2	变性	98 °C	15 s	12-16 (具体循环数根据所添加样品的量而定)
	退火	60 °C	30 s
	延伸	72 °C	45 s
3	延伸	72 °C	1 min	1
4	降温	4 °C	5 min	1
5s	保存	12 °C	∞	1

5.2

用MagNA磁珠法清洗PCR扩增产物 (需要添加新的MagNA磁珠！)。清洗结束后，用25 μl的1x TE缓冲液进行洗脱，将上清液转移至新的200 μl PCR空管中，在管盖上标注"样品名+Ind"

5.3

分别取1 μl PCR产物，使用1%的琼脂糖凝胶电泳进行检测。

混样及送测
6.1
取1 μl PCR产物稀释10倍，用Nanodrop3300超微量荧光分光光度计进行浓度测定。确保样品稀释后浓度均在0.1-0.9 ng/μl范围之内。
6.2
将所有样品等摩尔量混合。
6.3
再次用Nanodrop 3300超微量荧光分光光度计对混合后产物进行浓度测定。终产物应有20 μl体积，且浓度应在2-50 nM (0.5-13 ng/μl) 之间。当满足上述条件后，即可送测。以Illumina Hiseq PE150测序平台为例。

数据分析

利用 (Yuan et al., 2019) 发表的外显子富集数据组装流程进行富集数据的组装(Assexon，https://github.com/yhadevol/Assexon)。
此富集数据组装流程共分为3步：数据预处理，数据组装，数据后期处理。
一、数据预处理

批量解压二代测序得到的原始数据
$ perl gunzip_Files.pl \
--gzip raw_reads \
--gunzipped gunzipped_raw_reads
去除接头及低质量的序列
$ perl trim_adaptor.pl \
--raw_reads gunzipped_raw_reads \
--trimmed trimmed
矫正编码基因的阅读框，并翻译成氨基酸序列
$ perl predict_frames.pl \
--baits reference.fas \
--cds reference.onehitCDSmarkers.column1.txt \
--ref_prot reference.pep.fas
或者手动矫正编码基因阅读框

二、数据组装

检查软件是否已装齐
$ perl assemble.pl –check_depends
序列组装
$ perl assemble.pl \
--trimmed trimmed \
--queryp reference.aa.fas \
--queryn reference.dna.fas \
--db reference.genome.fas \
--dbtype nucleo \
--ref_name reference_name \
--outdir assemble_result

三、数据后期处理

添加已知基因组物种的直系同源序列，并与组装的数据合并
$ perl get_orthologues.pl \
--query reference.dna.fas \
--querydb reference.genome.fas \
--subdb "species1.genome.fas|species2.genome.fas" \
--subname "species1 species2" \
--outdir orthologs
$ perl merge_loci.pl \
--indir "assemble_result/nf orthologs/nf" \
--outdir merged_nf \
--min_seq 3
删除不需要的样品序列信息
$ perl pick_taxa.pl \
--indir merged_nf \
--outdir merged_nf_deselected \
--deselected_taxa "species2"
序列比对
$ perl mafft_aln.pl \
--dna_unaligned merged_nf \
--dna_aligned merged_nf_aligned
过滤比对质量差的序列
$ perl filter.pl \
--indir merged_nf_aligned \
--filtered merged_nf_filtered \
--ref_taxa "reference_name
统计序列信息
$ perl statistics.pl \
--coding_aligned merged_nf_filtered

四、基因串联构建系统树

串联基因
$ perl concat_loci.pl \
--indir merged_nf_filtered \
--outfile concat
基于最大似然法构建基因树
$ raxmlHPC \
-m GTRGAMMA \
-p 12345 \
-q dna12_3.partition.txt \
-s concat.phy \
-n genetree

五、基于多物种溯祖模型的物种树构建

为每个基因构建一个基因树
$ perl construct_tree.pl \
--indir merged_nf_filtered
利用Linux的"cat"命令将步骤1生成的基因树合并到一个文件里
$ cat ./merged_nf_filtered/* > catree.fas
利用ASTRAL构建物种树
$ java -jar astral.jar -I catree.fas -o species.tre

六、寻找SNP位点

生成一致序列 (若参考序列已有基因组，则可省略此步，直接用基因组数据)
$ perl consensus.pl \
--indir merged_nf_filtered \
--outfile consensus.fas
利用GATK软件寻找SNP位点
$ gatk.sh consensus_reference num_of_thread sample1 sample2 sample3 …
将vcf文件转格式，用于BEAST, STRUCTURE等分析
$ perl vcftosnps.pl \
--vcf species.vcf

图3. 数据分析流程图

溶液配方

一、MagNA磁珠法清洗DNA溶液配方

100 ml的MagNA beads

成分	体积	终浓度
5% Sera-Mag Magnetic Speed-beads (FisherSci, catalog number: 09-981-123，4 °C储存)	2 ml	0.1%
PEG8000 (生工，catalog number: A600433-0500，常温储存)	18 g	18%
5 M NaCl (生工，catalog number: A100241，常温存储，自配至对应浓度)	50 ml	2.5 M
1 M Tris-Cl, pH 8.0 (生工, catalog number: B548127-0500)	1 ml	10 mM
0.5 M EDTA, pH 8.0 (Invitrogen, catalog number: 15575-038)	200 μl	1 mM
加超纯水补齐至100 ml

100 ml的MagNA缓冲液

成分	体积	终浓度
PEG8000 (生工，catalog number: A600433-0500，常温储存)	18 g	18%
5 M NaCl (生工，catalog number: A100241，常温存储，自配至对应浓度)	50 ml	2.5 M
1 M Tris-Cl, pH 8.0 (生工, catalog number: B548127-0500)	1 ml	10 mM
0.5 M EDTA, pH 8.0 (Invitrogen, catalog number: 15575-038)	200 μl	1 mM
加超纯水补齐至100 ml

二、文库构建溶液配方

Adapter Mix
配制下述试剂需在不同PCR管中进行
1.1
寡核苷酸杂交缓冲液 (10x)：

成分体积(μl) 终浓度(10 ml体系)
NaCl (5 M) 1 ml 500 mM
Tris-Cl, pH 8.0 (1 M) 100 μl 10 mM
EDTA, pH 8.0 (0.5 M) 20 μl 1 mM
H₂O 8.88 ml

1.2
Adapter mix P5 (100 μM)：

成分体积(μl) 终浓度(100 μl体系)
IS1_adapter_P5.F (500 μM) 20 100 μM
IS3_adapter_P5+P7.R (500 μM) 20 100 μM
寡核苷酸杂交缓冲液 (10x) 10 1x
H₂O 50

1.3
Adapter mix P7 (100 μM):

成分体积(μl) 终浓度(100 μl体系)
IS2_adapter_P7.F (500 μM) 20 100 μM
IS3_adapter_P5+P7.R (500 μM) 20 100 μM
寡核苷酸杂交缓冲液 (10x) 10 1x
H₂O 50

1.4
将步骤1.2，1.3的溶液分别振荡混匀，利用下述程序进行退火反应，形成局部互补的双链接头序列

步骤循环阶段温度时间循环数
1 变性解链 95 °C 10 s 1
2 退火从95 °C梯度降温至12 °C，降温速率为0.1 °C/s 1

三、靶基因富集溶液配方

Binding Buffer

成分	体积(总体积200 ml)
5 M NaCl (生工，catalog number: A100241，常温存储，自配至对应浓度)	40 ml
1 M Tris-HCL (pH = 7.5) (生工, catalog number: B548124-0500)	2 ml
0.5 M EDTA (pH = 8) (Invitrogen, catalog number: 15575-038)	0.4 ml
H₂O (TEDIA, catalog number: WS2211-001)	157.6 ml

Wash Buffer1

成分	体积(总体积50 ml)
20x SSC (生工, catalog number: B548109-0200)	2.5 ml
10% SDS (生工, catalog number: B548118-0100)	500 μl
0.5 M EDTA (Invitrogen, catalog number: 15575-038)	100 μl
H₂O (TEDIA, catalog number: WS2211-001)	46.9 ml

Wash Buffer2

成分体积(总体积50 ml)
Wash Buffer 1 5 ml
10% SDS (生工, catalog number: B548118-0100) 0.5 ml
H₂O (TEDIA, catalog number: WS2211-001) 44.5 ml

序列信息

接头与引物

Name	Sequences
IS1_adapter.P5	acacTCTTTCCCTACACGACGCTCTTCCgatct
IS2_adapter.P7	gtgaCTGGAGTTCAGACGTGTGCTCTTCCgatct
IS3_adapter.P5+P7	agatCGGAagagc
IS4_indPCR.P5	AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTT
IS7_short_amp.P5	ACACTCTTTCCCTACACGAC
IS8_short_amp.P7	GTGACTGGAGTTCAGACGTGT
Index_primer_8nt_XXX	CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGT

注：*代表的是PTO键 (硫代修饰键)

BLOCK

类型序列
BO1.P5.F AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-Pho
BO3.P7.part1.F AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC-Pho

P7 Index Primer 8nt信息

ID	P7 Index name	P7 primer seq
1	index_8nt_1	CAAGCAGAAGACGGCATACGAGATcgttggttGTGACTGGAGTTCAGACGTGT
2	index_8nt_2	CAAGCAGAAGACGGCATACGAGATttctggttGTGACTGGAGTTCAGACGTGT
3	index_8nt_3	CAAGCAGAAGACGGCATACGAGATgcatggttGTGACTGGAGTTCAGACGTGT
4	index_8nt_4	CAAGCAGAAGACGGCATACGAGATgttcggttGTGACTGGAGTTCAGACGTGT
5	index_8nt_5	CAAGCAGAAGACGGCATACGAGATtggcggttGTGACTGGAGTTCAGACGTGT
6	index_8nt_6	CAAGCAGAAGACGGCATACGAGATaaccggttGTGACTGGAGTTCAGACGTGT
7	index_8nt_7	CAAGCAGAAGACGGCATACGAGATtctaggttGTGACTGGAGTTCAGACGTGT
8	index_8nt_8	CAAGCAGAAGACGGCATACGAGATctgaggttGTGACTGGAGTTCAGACGTGT
9	index_8nt_9	CAAGCAGAAGACGGCATACGAGATggcaggttGTGACTGGAGTTCAGACGTGT
10	index_8nt_10	CAAGCAGAAGACGGCATACGAGATacttcgttGTGACTGGAGTTCAGACGTGT
11	index_8nt_11	CAAGCAGAAGACGGCATACGAGATtagtcgttGTGACTGGAGTTCAGACGTGT
12	index_8nt_12	CAAGCAGAAGACGGCATACGAGATctatcgttGTGACTGGAGTTCAGACGTGT
13	index_8nt_13	CAAGCAGAAGACGGCATACGAGATgatgcgttGTGACTGGAGTTCAGACGTGT
14	index_8nt_16	CAAGCAGAAGACGGCATACGAGATgcgccgttGTGACTGGAGTTCAGACGTGT
15	index_8nt_68	CAAGCAGAAGACGGCATACGAGATcggttggtGTGACTGGAGTTCAGACGTGT
16	index_8nt_89	CAAGCAGAAGACGGCATACGAGATaagttcgtGTGACTGGAGTTCAGACGTGT
17	index_8nt_128	CAAGCAGAAGACGGCATACGAGATccggttctGTGACTGGAGTTCAGACGTGT
18	index_8nt_129	CAAGCAGAAGACGGCATACGAGATgtcgttctGTGACTGGAGTTCAGACGTGT
19	index_8nt_179	CAAGCAGAAGACGGCATACGAGATtcagtactGTGACTGGAGTTCAGACGTGT
20	index_8nt_184	CAAGCAGAAGACGGCATACGAGATgttcaactGTGACTGGAGTTCAGACGTGT
21	index_8nt_200	CAAGCAGAAGACGGCATACGAGATatacctatGTGACTGGAGTTCAGACGTGT
22	index_8nt_208	CAAGCAGAAGACGGCATACGAGATtgcttgatGTGACTGGAGTTCAGACGTGT
23	index_8nt_220	CAAGCAGAAGACGGCATACGAGATgcagtcatGTGACTGGAGTTCAGACGTGT
24	index_8nt_229	CAAGCAGAAGACGGCATACGAGATtcgataatGTGACTGGAGTTCAGACGTGT
25	index_8nt_233	CAAGCAGAAGACGGCATACGAGATtaatcaatGTGACTGGAGTTCAGACGTGT
26	index_8nt_236	CAAGCAGAAGACGGCATACGAGATagaggttgGTGACTGGAGTTCAGACGTGT
27	index_8nt_237	CAAGCAGAAGACGGCATACGAGATcctcgttgGTGACTGGAGTTCAGACGTGT
28	index_8nt_254	CAAGCAGAAGACGGCATACGAGATctcaattgGTGACTGGAGTTCAGACGTGT
29	index_8nt_256	CAAGCAGAAGACGGCATACGAGATaaggtctgGTGACTGGAGTTCAGACGTGT
30	index_8nt_288	CAAGCAGAAGACGGCATACGAGATctggttggGTGACTGGAGTTCAGACGTGT
31	index_8nt_298	CAAGCAGAAGACGGCATACGAGATccagctggGTGACTGGAGTTCAGACGTGT
32	index_8nt_301	CAAGCAGAAGACGGCATACGAGATgactatggGTGACTGGAGTTCAGACGTGT
33	index_8nt_302	CAAGCAGAAGACGGCATACGAGATctatatggGTGACTGGAGTTCAGACGTGT
34	index_8nt_303	CAAGCAGAAGACGGCATACGAGATtaagatggGTGACTGGAGTTCAGACGTGT
35	index_8nt_309	CAAGCAGAAGACGGCATACGAGATaggatcggGTGACTGGAGTTCAGACGTGT
36	index_8nt_316	CAAGCAGAAGACGGCATACGAGATgtcgccggGTGACTGGAGTTCAGACGTGT
37	index_8nt_327	CAAGCAGAAGACGGCATACGAGATcgtcgaggGTGACTGGAGTTCAGACGTGT
38	index_8nt_332	CAAGCAGAAGACGGCATACGAGATttggcaggGTGACTGGAGTTCAGACGTGT
39	index_8nt_335	CAAGCAGAAGACGGCATACGAGATattcaaggGTGACTGGAGTTCAGACGTGT
40	index_8nt_337	CAAGCAGAAGACGGCATACGAGATaatattcgGTGACTGGAGTTCAGACGTGT
41	index_8nt_340	CAAGCAGAAGACGGCATACGAGATaggcgtcgGTGACTGGAGTTCAGACGTGT
42	index_8nt_347	CAAGCAGAAGACGGCATACGAGATtccgatcgGTGACTGGAGTTCAGACGTGT
43	index_8nt_362	CAAGCAGAAGACGGCATACGAGATgagtcgcgGTGACTGGAGTTCAGACGTGT
44	index_8nt_389	CAAGCAGAAGACGGCATACGAGATccgcaacgGTGACTGGAGTTCAGACGTGT
45	index_8nt_398	CAAGCAGAAGACGGCATACGAGATatgaatagGTGACTGGAGTTCAGACGTGT
46	index_8nt_407	CAAGCAGAAGACGGCATACGAGATacctcgagGTGACTGGAGTTCAGACGTGT
47	index_8nt_420	CAAGCAGAAGACGGCATACGAGATatgctcagGTGACTGGAGTTCAGACGTGT
48	index_8nt_427	CAAGCAGAAGACGGCATACGAGATttatccagGTGACTGGAGTTCAGACGTGT
49	index_8nt_432	CAAGCAGAAGACGGCATACGAGATtaacgaagGTGACTGGAGTTCAGACGTGT
50	index_8nt_434	CAAGCAGAAGACGGCATACGAGATgactcaagGTGACTGGAGTTCAGACGTGT
51	index_8nt_438	CAAGCAGAAGACGGCATACGAGATaacggttcGTGACTGGAGTTCAGACGTGT
52	index_8nt_439	CAAGCAGAAGACGGCATACGAGATcagcgttcGTGACTGGAGTTCAGACGTGT
53	index_8nt_440	CAAGCAGAAGACGGCATACGAGATatacgttcGTGACTGGAGTTCAGACGTGT
54	index_8nt_455	CAAGCAGAAGACGGCATACGAGATcgtacgtcGTGACTGGAGTTCAGACGTGT
55	index_8nt_475	CAAGCAGAAGACGGCATACGAGATttatcatcGTGACTGGAGTTCAGACGTGT
56	index_8nt_476	CAAGCAGAAGACGGCATACGAGATgaggcatcGTGACTGGAGTTCAGACGTGT
57	index_8nt_497	CAAGCAGAAGACGGCATACGAGATaacctggcGTGACTGGAGTTCAGACGTGT
58	index_8nt_502	CAAGCAGAAGACGGCATACGAGATagttaggcGTGACTGGAGTTCAGACGTGT
59	index_8nt_509	CAAGCAGAAGACGGCATACGAGATcgtatcgcGTGACTGGAGTTCAGACGTGT
60	index_8nt_517	CAAGCAGAAGACGGCATACGAGATgctaacgcGTGACTGGAGTTCAGACGTGT
61	index_8nt_522	CAAGCAGAAGACGGCATACGAGATagcagagcGTGACTGGAGTTCAGACGTGT
62	index_8nt_524	CAAGCAGAAGACGGCATACGAGATtgaccagcGTGACTGGAGTTCAGACGTGT
63	index_8nt_526	CAAGCAGAAGACGGCATACGAGATggagaagcGTGACTGGAGTTCAGACGTGT
64	index_8nt_530	CAAGCAGAAGACGGCATACGAGATccaattccGTGACTGGAGTTCAGACGTGT
65	index_8nt_549	CAAGCAGAAGACGGCATACGAGATttcaagccGTGACTGGAGTTCAGACGTGT
66	index_8nt_551	CAAGCAGAAGACGGCATACGAGATttggtaccGTGACTGGAGTTCAGACGTGT
67	index_8nt_553	CAAGCAGAAGACGGCATACGAGATattctaccGTGACTGGAGTTCAGACGTGT
68	index_8nt_554	CAAGCAGAAGACGGCATACGAGATcaactaccGTGACTGGAGTTCAGACGTGT
69	index_8nt_559	CAAGCAGAAGACGGCATACGAGATcgccgaccGTGACTGGAGTTCAGACGTGT
70	index_8nt_560	CAAGCAGAAGACGGCATACGAGATgactaaccGTGACTGGAGTTCAGACGTGT
71	index_8nt_561	CAAGCAGAAGACGGCATACGAGATgctgaaccGTGACTGGAGTTCAGACGTGT
72	index_8nt_582	CAAGCAGAAGACGGCATACGAGATgccaagacGTGACTGGAGTTCAGACGTGT
73	index_8nt_583	CAAGCAGAAGACGGCATACGAGATaacttaacGTGACTGGAGTTCAGACGTGT
74	index_8nt_585	CAAGCAGAAGACGGCATACGAGATtattgaacGTGACTGGAGTTCAGACGTGT
75	index_8nt_589	CAAGCAGAAGACGGCATACGAGATgttgcaacGTGACTGGAGTTCAGACGTGT
76	index_8nt_604	CAAGCAGAAGACGGCATACGAGATggctgctaGTGACTGGAGTTCAGACGTGT
77	index_8nt_610	CAAGCAGAAGACGGCATACGAGATcctaactaGTGACTGGAGTTCAGACGTGT
78	index_8nt_620	CAAGCAGAAGACGGCATACGAGATagcattgaGTGACTGGAGTTCAGACGTGT
79	index_8nt_625	CAAGCAGAAGACGGCATACGAGATactactgaGTGACTGGAGTTCAGACGTGT
80	index_8nt_627	CAAGCAGAAGACGGCATACGAGATcttcatgaGTGACTGGAGTTCAGACGTGT
81	index_8nt_647	CAAGCAGAAGACGGCATACGAGATtcgaacgaGTGACTGGAGTTCAGACGTGT
82	index_8nt_650	CAAGCAGAAGACGGCATACGAGATcgaatagaGTGACTGGAGTTCAGACGTGT
83	index_8nt_678	CAAGCAGAAGACGGCATACGAGATtgcgtccaGTGACTGGAGTTCAGACGTGT
84	index_8nt_679	CAAGCAGAAGACGGCATACGAGATgtactccaGTGACTGGAGTTCAGACGTGT
85	index_8nt_682	CAAGCAGAAGACGGCATACGAGATcgtcgccaGTGACTGGAGTTCAGACGTGT
86	index_8nt_683	CAAGCAGAAGACGGCATACGAGATtaacgccaGTGACTGGAGTTCAGACGTGT
87	index_8nt_684	CAAGCAGAAGACGGCATACGAGATaattaccaGTGACTGGAGTTCAGACGTGT
88	index_8nt_685	CAAGCAGAAGACGGCATACGAGATtcataccaGTGACTGGAGTTCAGACGTGT
89	index_8nt_686	CAAGCAGAAGACGGCATACGAGATcaggaccaGTGACTGGAGTTCAGACGTGT
90	index_8nt_687	CAAGCAGAAGACGGCATACGAGATgtcaaccaGTGACTGGAGTTCAGACGTGT
91	index_8nt_691	CAAGCAGAAGACGGCATACGAGATagaagtaaGTGACTGGAGTTCAGACGTGT
92	index_8nt_693	CAAGCAGAAGACGGCATACGAGATcatcctaaGTGACTGGAGTTCAGACGTGT
93	index_8nt_695	CAAGCAGAAGACGGCATACGAGATgacgataaGTGACTGGAGTTCAGACGTGT
94	index_8nt_700	CAAGCAGAAGACGGCATACGAGATtcatcgaaGTGACTGGAGTTCAGACGTGT
95	index_8nt_702	CAAGCAGAAGACGGCATACGAGATccgacgaaGTGACTGGAGTTCAGACGTGT
96	index_8nt_706	CAAGCAGAAGACGGCATACGAGATtggatcaaGTGACTGGAGTTCAGACGTGT
97	index_8nt_708	CAAGCAGAAGACGGCATACGAGATgcgcgcaaGTGACTGGAGTTCAGACGTGT
98	index_8nt_709	CAAGCAGAAGACGGCATACGAGATagctccaaGTGACTGGAGTTCAGACGTGT
99	index_8nt_710	CAAGCAGAAGACGGCATACGAGATtctgccaaGTGACTGGAGTTCAGACGTGT
100	index_8nt_711	CAAGCAGAAGACGGCATACGAGATggagccaaGTGACTGGAGTTCAGACGTGT

注：为了确保测序样品的Index碱基组成平衡，减少因index碱基不平衡而造成的测序错误。当样品数量小于30 h，推荐使用下列任一index编号组合：

3.1

10个样品
Set I: 27, 100, 208, 236, 336, 526, 527, 533, 685, 702
Set II: 1, 2, 68, 432, 436, 442, 554, 647, 687, 693
Set III: 10, 138, 254, 423, 435, 440, 527, 551, 639, 679

3.2

15个样品
Set I: 1, 10, 89, 138, 254, 423, 435, 440, 527, 549, 551, 625, 639, 679, 711
Set II: 1, 10, 93, 233, 236, 285, 325, 517, 530, 533, 571, 654, 679, 687, 696
Set III: 2, 7, 9, 11, 288, 420, 435, 524, 526, 530, 559, 676, 684, 693, 695

3.3

20个样品
Set I: 1, 2, 4, 124, 130, 255, 347, 420, 434, 435, 441, 522, 526, 527, 547, 647, 668, 686, 691, 693
Set II: 2, 3, 12, 93, 138, 237, 255, 309, 388, 419, 527, 533, 549, 558, 589, 625, 639, 695, 706, 711
Set III: 1, 2, 7, 9, 11, 288, 335, 420, 431, 435, 524, 526, 530, 547, 559, 647, 676, 684, 693, 695

3.4

25个样品
Set I: 3, 7, 10, 13, 26, 200, 229, 235, 288, 325, 339, 381, 432, 487, 517, 522, 527, 530, 546, 609, 686,687, 688, 703, 709
Set II: 1, 9, 20, 100, 129, 229, 332, 336, 383, 407, 421, 435, 440, 443, 513, 526, 527, 533, 546, 603,628, 676, 684, 700, 706
Set III: 1, 8, 10, 11, 16, 129, 219, 254, 332, 334, 337, 362, 400, 517, 522, 526, 527, 565, 567, 654, 679,683, 685, 691, 710

3.5

30个样品
Set I: 1, 7, 10, 16, 50, 100, 129, 130, 255, 336, 339, 383, 388, 419, 431, 513, 517, 526, 527, 533, 547,588, 617, 633, 639, 650, 688, 693, 695, 707
Set II: 2, 3, 4, 7, 27, 89, 134, 229, 255, 303, 313, 332, 388, 435, 436, 527, 530, 533, 546, 571, 582,587, 604, 609, 620, 638, 672, 686, 693, 707
Set III: 1, 2, 4, 13, 27, 208, 219, 229, 237, 332, 340, 389, 407, 431, 435, 438, 482, 515, 526, 527, 530,554, 567, 603, 633, 647, 678, 686, 687, 693
注：当样品数量超过30 h，可选取任一Index。

致谢

实验方案中文库构建和跨物种靶基因富集步骤根据作者2013年发表的方法修改 (Li et al., 2013)，数据分析参考作者2019年发表的方法 (Yuan et al., 2019)。

竞争性利益声明

作者声明没有利益冲突

参考文献

Meyer, M. and Kircher, M. (2010). Illumina sequencing library preparation for highly multiplexed target capture and sequencing. Cold Spring Harb Protoc prot5448.
Li, C., Riethoven, J. J. M. and Naylor G. J. P. (2012). EvolMarkers: a database for mining exon and intron markers for evolution, ecology and conservation studies. Mol Ecol Resour 12(5): 967-971.
Li, C., Hofreiter, M., Straube, N., Corrigan, S. and Naylor, G. J. P. (2013). Capturing protein-coding genes across highly divergent species. BioTechniques 54: 321-326.
Yao, X., Li, C. and Dick, C. W. (2013). Exon-primed intron-crossing (EPIC) markers for evolutionary studies of Ficus and other taxa in the fig family (Moraceae). Appl Plant Sci 1(10): 1-4.
Stroeher, P. R., Li, C. and Pie, M. R. (2013). Exon-primed intron-crossing (EPIC) markers as a tool for ant phylogeography. Rev Bras Entomol 57(4): 427-430.
Yuan, H., Jiang, J., Jimenez, F. A., Hoberg, E. P., Cook, J. A., Galbreath , K. E. and Li, C. H. (2016). Target gene enrichment in the cyclophyllidean cestodes, the most diverse group of tapeworms. Mol Ecol Resour 16(5): 1095-1106.
Song, S., Zhao, J. and Li, C. (2017). Species delimitation and phylogenetic reconstruction of the sinipercids (Perciformes: Sinipercidae) based on target enrichment of thousands of nuclear coding sequences. Mol Phylogenet Evol 111: 44-55.
Yin, G., Pan, Y., Sarker, A., Baki, M. A., Kim, J. K., Wu, H. and Li, C. (2019). Molecular systematics of Pampus (Perciformes: Stromateidae) based on thousands of nuclear loci using target-gene enrichment. Mol Phylogenet Evol 140: 106595.
Yuan, H., Atta, C., Tornabene, L. and Li, C. (2019). Assexon: assembling exon using gene capture data. Evol Bioinform 15: 1-13.

Please login or register for free to view full text

引用格式：黄俊满, 袁昊, 李晨虹. (2021). 跨物种靶基因富集技术实验方案. Bio-101: e1010606. DOI: 10.21769/BioProtoc.1010606.

How to cite: Huang, J. M., Yuan, H. and Li, C. H. (2021). Protocol for Cross-species Target-gene Enrichment. Bio-101: e1010606. DOI: 10.21769/BioProtoc.1010606.

Q&A

If you have any questions/comments about this protocol, you are highly recommended to post here. We will invite the authors of this protocol as well as some of its users to address your questions/comments. To make it easier for them to help you, you are encouraged to post your data including images for the troubleshooting.

Find out more

We use cookies to improve your user experience on this site. By using our website, you agree to the storage of cookies on your computer.

Protocols 

Request a Protocol

Submit 

About

A brief version of this protocol appeared in:

Similar Protocols

Reproducibility Feedback

Navigate this Article

Protocol for Cross-species Target-gene Enrichment

黄俊满

袁昊

李晨虹

成分	体积(μl)	终浓度(10 ml体系)
NaCl (5 M)	1 ml	500 mM
Tris-Cl, pH 8.0 (1 M)	100 μl	10 mM
EDTA, pH 8.0 (0.5 M)	20 μl	1 mM
H₂O	8.88 ml

成分	体积(μl)	终浓度(100 μl体系)
IS1_adapter_P5.F (500 μM)	20	100 μM
IS3_adapter_P5+P7.R (500 μM)	20	100 μM
寡核苷酸杂交缓冲液 (10x)	10	1x
H₂O	50

成分	体积(总体积50 ml)
Wash Buffer 1	5 ml
10% SDS (生工, catalog number: B548118-0100)	0.5 ml
H₂O (TEDIA, catalog number: WS2211-001)	44.5 ml

类型	序列
BO1.P5.F	AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-Pho
BO3.P7.part1.F	AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC-Pho