Navigate this Article


 

Collection, Preparation, Preservation, Identification and Molecular Phylogenetics of Calyptratae (Diptera: Schizophora)   

How to cite Favorites Q&A Share your feedback Cited by

摘要:有瓣蝇类Calyptratae隶属于昆虫纲Insecta四大超适应辐射类群之一的双翅目Diptera,包括虱蝇总科、蝇总科、狂蝇总科。该类群多为腐食性、植食性、寄生性等,因而在媒介、法医、畜牧等领域具有不可取代的重要作用;同时,有瓣蝇类在物种多样性、地理分布、生物学习性等方面均充分体现了双翅目昆虫的适应性,是探究双翅目昆虫成功适应辐射历史的关键类群。本文总结了野外采集有瓣蝇类的常用方法,概述了有瓣蝇类针插、浸制标本的制作与保存方法,针对我国有瓣蝇类的鉴定编制了分科检索表,并在近年来作者的研究基础上综述了利用线粒体基因组、转录组等数据开展有瓣蝇类分子系统学研究的分析方法。

关键词: 双翅目, 野外采集, 鉴定, 线粒体基因组, 转录组

研究背景

有瓣蝇类Calyptratae 隶属于昆虫纲Insecta四大超适应辐射类群之一的双翅目Diptera (范滋德,1992;薛万琦和赵建铭,1996;Pape et al., 2011)。目前已知23,000 余种 (Pape et al., 2011),约占双翅目物种多样性的20%,是有缝组Schizophora (双翅目:短角亚目) 中物种多样性最为丰富的类群之一 (Pape et al., 2011);其分布地遍及南极大陆以外的世界各地 (Kutty et al., 2010);且生物学习性极为多样,以幼虫阶段尤为显著,不仅涵盖了捕食性、植食性、腐生性、寄生性、盗猎寄生性等昆虫纲全部常见的生物学习性类型,还包含专性寄生于哺乳动物皮下、颅腔或消化道的昆虫纲中唯一的哺乳动物专性内寄生类群——狂蝇科Oestridae (Zumpt, 1965; Kutty et al., 2010),是媒介、法医、畜牧等领域的热点研究类群。该类群在物种数量、地理分布及生物学习性多样性等方面充分展现了双翅目昆虫的适应性,是探究双翅目系统发育 (phylogeny) 关系及成功适应辐射历史的关键类群。

材料与试剂

  1. 胶水
  2. 冻存管
  3. 标本盒
  4. 乙酸乙酯
  5. 乙二醇乙醚
  6. 甘油
  7. RNAlater
  8. 液氮
  9. 乙醇
  10. 无菌水
  11. PCR缓冲液
  12. dNTP
  13. DNA聚合酶

仪器设备

  1. 捕虫网、马来氏网、黄盘
  2. 昆虫针
  3. 水浴锅
  4. 体视显微镜
  5. 镊子
  6. 小型细软毛刷
  7. 剪刀
  8. 低温冷冻冰柜
  9. PCR仪

软件

  1. BioEdit version v7.0.9.0 (Hall, 1999)
  2. SeqMan (DNAStar, Steve hearDown, 1998-2001 version, DNASTAR Inc., USA)
  3. BLAST (Altschul et al., 1990)
  4. MITOS (Bernt et al., 2013)
  5. DNAMAN (version 8, Lynnon Corp., Canada)
  6. FastQC (Andrews, 2010)
  7. Trimmomatic (Bolger et al., 2014)
  8. idba-ud (Peng et al., 2012)
  9. MAFFT (Katoh and Standley, 2013)
  10. SequenceMatrix (Vaidya et al., 2011)
  11. PartitionFinder2 (Lanfear et al., 2017)
  12. MrBayes 3.2.1 (Ronquist and Huelsenbeck, 2003)
  13. IQ-TREE (Nguyen et al., 2015)
  14. Trinity (Grabherr et al., 2011)
  15. Geneious (Biomatters, Auckland, New Zealand)
  16. Orthograph version 0.6.1 (Petersen et al., 2017)
  17. OrthoFinder version 1.1.10 (Emms and Kelly, 2015)
  18. FASconCAT-G (Kück and Longo, 2014)
  19. MARE version 0.1.2-rc (Misof et al., 2013)
  20. IQ-TREE (Nguyen et al., 2015)
  21. ModelFinder (Kalyaanamoorthy et al., 2017)

实验步骤

  1. 有瓣蝇类野外采集方法
    1.1
    网捕法 (Sweep netting)
    网捕法能够在绝大部分生境类型中有效采集双翅目昆虫。捕虫网 (图1) 是最基本的采集工具,由一个坚固的金属圈、合金或木质的杆和一个带细孔的网袋组成,不同的采集人可根据需要对捕虫网进行多样化的设计。此外,还需要使用毒瓶来处死采获的昆虫。毒瓶一般用500 ml的塑料广口瓶制作,制作方法如下:取一块与瓶底同样大小的海绵,放入广口瓶底,或铺一层约1 cm厚的脱脂棉,然后加入10-20 ml乙酸乙酯。
            网捕法用途广泛,可用于捕捉单独个体、飞行中的群体或在矮枝、灌木丛、杂草中飞行的蝇类。用捕虫网捕捉飞翔的昆虫,昆虫扫入网兜后,迅速挥网使昆虫落入网底,用手捏住网口,将有虫的网底部装入毒瓶中,进行根据虫体大小进行1-5分钟左右的熏杀后取出。体型较大的个体可直接取出放入单个管中,体型较小的个体可用吸虫管吸出。野外采集过程中也可将撕成条状卫生纸放入矿泉水瓶,制作成简易的采集瓶,暂时保存采集到的标本,防止标本过快干燥;同时,卫生纸还可以将个体隔开,防止标本之间互相挤压而导致的破损。


    图1. 捕虫网和毒瓶

    1.2
    马来氏网 (马氏网) 诱捕法 (Malaise trapping)
    马来氏网诱集装置 (图2) 被认为是过去几十年中双翅目和其他飞行昆虫采集方法最大的进步。1937年,瑞典昆虫学家René Malaise开发出第一个马来氏诱捕器,之后经过了多次其他设计,修改和改进,但是马来氏诱捕器的原理基本保持不变。
            马氏网本质上是基于昆虫向光飞行习性的飞行拦截陷阱,其形状类似于一个帐篷,有开放的两侧供昆虫飞入,还有一个高大的屏障板,可引导拦截到的昆虫向上飞至装有杀虫剂的圆柱体中 (通常是一上一下两个收集瓶,两瓶口相对,上方瓶侧面有开口通向马氏网,下方瓶中装有无水乙醇)。选择合适的地点来布设马氏网对于最大限度地增加通过陷阱开口的昆虫数量至关重要,这必须通过评估该地区的自然特征来确定,如地形、植被类型、风向和水源地等各项因素。马氏网通常布设在两棵树之间,两树间的距离不应太近也应太远,还需要选择合适的树杈或树枝以支撑网体。除此之外,还需要确保收集瓶在阳光的直射下。选择好合适的位置后,主要支撑绳可以绑在平石或周围的重木块上,以将整个网中轴吊起来,这一步完成后,使用其他绳索保持陷阱展开,并绑在周围的树枝、植被或石头上 (根据生境决定)。


    图2. 布设完成的马来氏网

    1.3
    盘诱捕法 (Pan trapping)
    使用各种颜色的盘陷阱是采集昆虫常用方法之一,盘陷阱对大部分双翅目,尤其是潮湿地区的食腐性类群非常有效。最常用的为黄盘诱集法,用黄盘 (碗) 盛肥皂液或洗衣粉液,被黄盘吸引来的昆虫落入其中后死亡,达到诱捕效果。
  2. 有瓣蝇类标本制作与保存
    2.1
    针插标本制作与保存
    主要设备及工具:水浴锅 (用于还软昆虫尾器);体视显微镜;胶水;各种规格的冻存管;镊子;小型细软毛刷;剪刀;昆虫针等。
    1)
    整姿
    大部分保存为干标本的昆虫都用于分类鉴定,昆虫在处死后接触空气会变得干硬发脆,只有在适当放松的状态下才能安全固定,因此,最好的方式就是在昆虫死后不久立即固定,制成针插标本。最常用的昆虫针有0至5号几种不同型号,从0号至5号依次变粗,针插时需依据虫体大小选择粗细合适的昆虫针,在有瓣蝇类中1、2、3号针较常用,不建议使用比1号针更细的昆虫针直接固定,因为针太细容易弯曲,且无法将标签固定到位,容易松动。
            针插时先将标本轻轻捏在食指和拇指的指尖上部,然后将昆虫针垂直插入胸部中心稍偏右侧的位置(如果标本右侧状态优于左侧,则插入偏左侧的位置,以保证有一侧完整)。在针插标本时,可能会出现足部脱落的情况,此时应将分离的足部应保存于冻存管,或粘在对应位置的针下方。针插入标本后,从下方将标本轻轻调整至适当高度(通常为昆虫针整体的上三分之一处),在标本上方留出足够的空间以在不接触标本的情况可以直接拿起针头观察标本,又要保持标本下方有足够的空间来针插所有的信息标签 (图3)。固定完成后,用镊子轻拉足部到自然舒展的姿势,之后将标本针插在标本盒中妥善保存。
            如需将酒精浸制标本改制成针插标本,先将酒精保存的标本倒入一个分拣盘中,用精细镊子小心夹住翅基部抬起,放在干纸巾上以吸去多余的酒精,之后用镊子将标本放入装有乙二醇乙醚 (C4H10O2) 的小管中,放置24 h,使用移液管将乙二醇乙醚吸出,直到小瓶内几乎干燥,再用移液管将乙酸乙酯倒入管中直到没过标本,再次放置24 h,之后将标本取出放置在干纸巾上直到完全干燥,干燥后可直接制成干制标本。
    2)
    标签
    附有适当和准确信息的标签对于所有标本和样品至关重要,标签上的信息反映标本的来源和历史,没有数据标签的标本对科学研究毫无价值。标本及其相关标签为一个整体,应附在标本上的基本信息有:国家、地区、省、国家公园/保护区的名称、精确地名、GPS坐标、采集日期、采集人姓名、采集方法、生境类型等。标签应尽可能小,同时满足标签上的信息便于查看,最后按照标签的大小依次针插于标本下。
    3)
    外生殖器解剖
    对于许多外部形态极其相似的有瓣蝇类来说,只有通过雄性或雌性外生殖器特征才能较为准确的进行鉴定,即需要将标本腹部的全部或部分切除,溶解部分组织使骨化结构可见,以观察可用于鉴定的特征。
            在体视显微镜下用镊子小心将腹部与标本分离,将腹部放置在含有5%或10%的氢氧化钾溶液、乳酸或氢氧化钠溶液中,放在水浴锅中加热,直到标本的骨化结构完全显现出来,再用镊子小心将尾器取出,转移至少量冰醋酸中 (可中和氢氧化钠的腐蚀作用),之后在体视显微镜下解剖出关键结构。所有解剖部分都应保留下来,并放入装有甘油的小管中,固定于相应标本下方 (图3)。
            对于许多外部形态极其相似的有瓣蝇类来说,只有通过雄性或雌性外生殖器特征才能较为准确的进行鉴定,即需要将标本腹部的全部或部分切除,溶解部分组织使骨化结构可见,以观察可用于鉴定的特征。
            在体视显微镜下用镊子小心将腹部与标本分离,将腹部放置在含有5%或10%的氢氧化钾溶液、乳酸或氢氧化钠溶液中,放在水浴锅中加热,直到标本的骨化结构完全显现出来,再用镊子小心将尾器取出,转移至少量冰醋酸中 (可中和氢氧化钠的腐蚀作用),之后在体视显微镜下解剖出关键结构。所有解剖部分都应保留下来,并放入装有甘油的小管中,固定于相应标本下方 (图3)。


    图3. 解剖了外生殖器的有瓣蝇类标本

    2.2
    浸制标本保存方法
  3. 有瓣蝇类鉴定
    有瓣蝇类成虫主要形态学特征如下:
    1)
    具额囊缝;
    2)
    通常具有发达的下腋瓣;
    3)
    具髭;
    4)
    触角第二节 (梗节) 背外方具纵贯全长的纵缝;
    5)
    具内倾下眶鬃 (额鬃);
    6)
    侧额与头顶的侧顶片不存在明显界限,着生在侧额下部的鬃距眼前缘远;
    7)
    前腹部气门通常开口于背板,第一、二背板常愈合为第1 + 2合背板;
    8)
    翅后胛明显;
    9)
    中胸盾沟明显且完整,仅极少数中断;
    10)
    常具肩后鬃与翅内鬃;
    11)
    Sc脉完整地达于C脉;
    12)
    M1脉末段直或向翅前缘弯曲;
    13)
    雄性额常较雌性狭;
    14)
    外口孔有喙齿。

    中国有瓣蝇类分科检索表
    1. 身体背腹扁平;各足基节相互远离;爪强,弯曲,通常具齿;成虫外寄生于鸟类或哺乳动物.........2
      身体不是明显的背腹扁平;各足基节相互靠近;爪不强烈弯曲,不具齿;成虫非体外寄生虫.........4
    2. 头部向后折叠于中胸背板的凹槽内;各足第一分跗节长,至少与剩余跗节等长;外寄生于蝙蝠.........蛛蝇科Nycteribiidae
      头部不向后折叠;各足第一分跗节短,与第二分跗节近乎等长.........3
    3. 复眼小或无,眼高不超过头高的1/2;外寄生于蝙蝠 ......... 蝠蝇科Streblidae
      复眼大,眼高至少为头高的3/4;外寄生于鸟类和除蝙蝠外的哺乳动物.........虱蝇科Hippoboscidae
    4. 下侧片在后气门的前下方常有呈曲尺形或弧形排列的 (凹面朝前) 的成行的鬃 (狂蝇科 Oestridae下侧片具成簇的长毛或毛状鬃) ;翅侧片具鬃或毛;M1脉常向前作角形弯曲,弯曲处有时有1赘脉,或则M1脉和R4+5脉接合成1柄状脉,极少呈缓缓的弧形弯曲,或则M1脉直,不达翅缘即中断.........5
      下侧片通常无鬃,至多具短细毛;如后气门前下方有鬃,则决不排列成行,且翅侧片无鬃或毛,M1脉常直或终末于翅后缘.........9
    5. 口器窝大小正常,附近的髭与鬃均发达;喙部发育良好.........6
      口器窝小,喙缺失或极小.........狂蝇科Oestridae
    6. 后小盾片退化、不明显或不很发达.........7
      后小盾片发达,凸出在小盾片和中胸后背片之间;多数种类体被长而多的鬃 .........寄蝇科Tachinidae
    7. 胸部侧面观可见外方的一个肩后鬃的位置比沟前鬃低,二者的连结线略与背侧片的背缘并行 (若非如此,则末胸部具淡色绵毛或具下述几点特征的综合);体色多数呈青、绿、黄 等色且具金属光泽,较少为底色黑而粉被显著的灰色种.........丽蝇科Calliphoridae
      胸部侧面观可见外方的一个肩后鬃的位置比沟前鬃高,或在同一水平线上,二者的连结线与背侧片的背缘相交.........8
    8. 体躯底色黑,一般具明显的灰白色粉被;胸部背面常具三条黑色纵条,腹部背面具棋盘格状粉被斑.........麻蝇科Sarcophagidae
      后小盾片在远离小盾片的一侧轻微凸出;后气门前、后厣都呈羽状,或则后厣不发达,上述两种情况都不能把整个气门掩蔽起来.........邻寄蝇科 Rhinophoridae
    9. 雄性额窄,雌性额宽;下腋瓣发达.........10
      雌雄两性额均宽;下腋瓣不发达,呈线状;体常具浓密的黄毛.........粪蝇科Scathophagidae
    10. 成虫CuA+CuP脉不达于翅缘,小盾片下面不具纤毛.........11
      成虫CuA+CuP脉达于翅缘,小盾片下面具纤毛.........花蝇科Anthomyiidae
    11. CuA+CuP脉很短,而A1脉较长且其端部显然弯到CuA+CuP脉的外方 (或A1脉的延 伸线位于CuA+CuP脉末端于翅缘之间);腹部通常较扁,常为卵形、长扁形,亦有部分类群雄性腹部向后去变宽呈刮匙状,少数种类长筒状.........厕蝇科Fanniidae
      CuA+CuP脉大多超过该翅脉延伸距之半,而A1脉端部未弯到CuA+CuP脉的外方;腹部通常为卵圆形.........蝇科Muscidae

  4. 有瓣蝇类分子系统学研究
    系统发育关系的构建是重现生物类群演化历史、阐明不同生物类群间协同演化的基石。在测序技术普及以前 (约为1990年前),形态学特征是唯一的系统发育信息来源,因此早期的系统发育研究采用形态学特征构建矩阵,基于最大简约法原则构建系统发育关系,这一时期为支序系统学时代 (Kjer et al., 2016b)。1975年桑格测序(Sanger Sequencing) 技术的诞生使得获取DNA序列成为可能 (Sanger and Coulson, 1975),分子系统学研究的序幕也由此揭开。这一时期的分子系统学主要采用数个基因甚至单个基因建树 (Kjer et al., 2016a and b),相比于支序系统学时代,DNA序列获取的便捷性、分子数据本身的进化稳定性及其蕴含的巨大系统发育信息量 (于黎和张亚平,2006),使得昆虫系统发育研究乃至生命之树的重建都得到了极大推动。但由于桑格测序技术测序速度的局限,这一时期获得的数据量依然很小,系统发育信息也十分有限,导致许多有争议的系统发育问题未能得到妥善解决(Kjer et al., 2016b)。近年来,高通量测序技术的出现使得线粒体基因组、转录组、基因组等分子大数据被成功应用于昆虫和其他类群的系统发育关系构建 (Wiegmann et al., 2011; Cameron, 2014; Zhang et al., 2016),分子系统学研究正式进入了系统发育基因组学Phylogenomics研究时代。国际千种昆虫转录组演化(1K Insect Transcriptome Evolution, 1KITE) 项目组于2014年发表的Science封面文章 (Misof et al., 2014) 也将昆虫分子系统学研究推向了新的高潮。系统发育基因组解决了历史遗留的部分问题 (如捻翅目Strepsiptera的系统地位),大大提高了系统发育树的稳健性和置信度,但其仍有自身的局限性:大量系统发育信息中隐藏的进化噪音导致的系统误差仍然存在,同时,对系统发育基因组学数据的分析需要巨大的计算力才能实现 (于黎和张亚平,2006;Kjer et al., 2016b)。
    4.1
    多基因片段及线粒体基因组
    线粒体基因组是昆虫分子系统学研究领域应用十分普遍的另一分子标记并受到广泛关注 (Cameron, 2014)。许多学者从多方面对使用线粒体基因组构建昆虫不同类群系统发育关系的方法论进行了探讨 [如Cameron (2014)、Zhang et al. (2016)],但对于有瓣蝇类乃至双翅目,利用线粒体基因组构建的系统发育关系常存在冲突,其在系统发育关系重建研究中的作用也长期存有争议 (Cameron, 2014)。得益于通用引物的设计,线粒体基因组一直被广泛应用于系统发育重建研究,如Zhang et al. (2016)、Yan et al. (2019),即使在高通量测序技术极大发展的今天,由于线粒体基因组比核基因进化速率快,其还是被认为是有效的分子标记而广泛应用于快速进化类群的系统发育关系研究。
    1)
    数据获取
    利用Sanger测序获取多基因片段及线粒体基因组:通过聚合酶链式反应(Polymerase Chain Reaction,PCR) 利用引物对目标类群的线粒体基因组进行分段扩增。一般的PCR反应体系为25 μl,包括1 μl DNA模板 (10 μM),17.2 μl无菌水,2.5 μl 10x PCR缓冲液 (Es Taq PCR Buffer),2 μl dNTP (2.5 mM),DNA聚合酶0.3 μl (1.5个活性单位),双向引物 (10 μM) 各1 μl。PCR反应在热循环仪中进行,反应条件为95 °C, 10 min (酶激活),95 °C 1 min (变性),适宜温度退火0.5 min (退火),再72 °C延伸时间延伸,变性、退火、延伸共进行35个循环,最终72 °C 10 min (终延伸)。所得PCR产物通过琼脂糖凝胶电泳检测,将有目的条带的产物进行Sanger测序。所得测序结果利用BioEdit version v7.0.9.0 (Hall, 1999) 和SeqMan (DNAStar,Steve hearDown,1998-2001 version,DNASTAR Inc.,USA) 进行拼接组装。最后,对于线粒体基因组,结合BLAST (Altschul et al., 1990)、MITOS (Bernt et al., 2013)、DNAMAN (version 8,Lynnon Corp.,Canada) 对组装后的线粒体基因组序列进行基因注释。
            利用高通量测序获取线粒体基因组方法:将混合的DNA样品建库后利用Illumina Hiseq 2500测序仪等高通量测序平台进行双端测序。所得数据先以FastQC (Andrews, 2010) 和Trimmomatic (Bolger et al., 2014) 进行质量评估和低质量数据过滤以获得Clean Data。Trimmomatic被设置为去除掉序列两端质量不高于30的位点以及长度短于36 bp的序列,以 Illumina 发布的接头序列为参考去除接头,直到利用FastQC对过滤后的数据进行检测时,“每位点序列质量”均超过30,“过表达序列”和“接头”中均不包含接头序列。获得有效数据后,参考Crampton-Platt et al. (2015) 使用idba-ud工具(Peng et al., 2012) 进行基因组组装,再用基于相应COI序列为诱饵 (Bait),利用BLAST (Altschul et al., 1990) 从组装结果中“钓取”目标线粒体基因组序列。其后,结合BLAST、MITOS (Bernt et al., 2013)、DNAMAN (version 8,Lynnon Corp.,Canada) 对线粒体基因组序列进行注释。
    2)
    数据分析
    使用MAFFT在线比对工具分别比对13个蛋白编码基因、2个rRNA基因进行比对。比对完成后,用SequenceMatrix (Vaidya et al., 2011) 将各基因串联生成建树矩阵。分区 (Partition) 策略及最适碱基替代模型的选择采用PartitionFinder2进行。采用贝叶斯推断 (Bayesian Inference,BI) 和最大似然法 (Maximum Likelihood,ML) 进行系统发育关系构建。贝叶斯推断一般采用MrBayes 3.2.1 (Ronquist and Huelsenbeck, 2003),建树过程分2个独立运行,每个运行包括4条运行链 (1条冷链,3条热链),运行100万代或当离散频率 (Split Frequencies) 标准差低于0.01;每1000代取样一次,前25%作为burn-in弃去。最大似然法采用RaxML或IQ-TREE进行。
    4.2
    系统发育基因组
    系统发育基因组学 (Phylogenomics) 最早由Eisen (1999) 提出并被应用于基因功能预测,其后被广泛应用于系统发育关系研究。近年来飞速发展的测序技术将系统发育关系研究带进了系统发育基因组时代,利用转录组等系统发育基因组数据开展各种类群、不同阶元系统发育关系的研究大量涌现 [如 (Jarvis et al., 2014; Misof et al., 2014; Zhang et al., 2014; Faircloth et al., 2015; Young et al., 2016; Branstetter et al., 2017; Peters et al., 2017)]。目前开展系统发育基因组研究的常见思路是利用高通量测序获取系统发育基因组数据,对组装后的数据进行单拷贝同源基因分配(Orthology Assignment),对每个同源基因分别比对,串联成超级矩阵后建树(Concatenation Based Phylogeny Construction),或分别构建基因树再构建物种树 (Coalescent Based Phylogeny Construction) (Delsuc et al., 2005)。
            现代分子生物学技术的发展使得可用于系统发育关系重建的数据极大增长,有力推动了生命之树 (Tree of Life,TOL) 的研究进展 (Kjer et al., 2016a)。尤其是随着高通量测序技术的发展,系统发育基因组被用于不同类群、分类阶元的生命之树重建研究,如哺乳类 (Sims et al., 2009)、鸟类 (Zhang et al., 2014)、节肢类 (Meusemann et al., 2010),昆虫纲Insecta目以下阶元 (Kutty et al., 2018) 等。系统发育基因组因具有大量系统发育信号,被普遍认为是解决生命演化历史“疑难”类群的有力手段 (Dunn et al., 2008; Yeates et al., 2016)。目前常用的系统发育基因组数据包括基因组、转录组、AHE (Anchored Hybrid Enrichment)、UCE (Ultra-Conserved Element) 数据,主要研究流程如图4所示。


    图4. 采用的研究及数据分析流程  (闫利平,2019;改自1KITE项目)

    1)
    数据获取
    对来源于DNA的数据 (基因组、AHE、UCE数据),取组织样品提取DNA后,直接利用高通量测序平台进行基因组测序 (基因组数据),或先利用探针富集目标序列后再进行高通量测序 (AHE、UCE数据)。
    2)
    数据分析
    所得原始测序数据分别用FastQC (Andrews, 2010) 和Trimmomatic (Bolger et al., 2014) 进行质量评估和低质量数据过滤。设置Trimmomatic参数为:去除掉序列两端质量不高于30 (即测序错误率高于10-3,或准确率低于99.9%) 的位点,以 Illumina 发布的接头序列为参考去除接头序列,最终保留序列长度不低于36 bp的序列,直到最终利用FastQC对过滤后的数据进行检测时,“每位点序列质量”均超过30,“过表达序列”和“接头”中均不包含接头序列。
            通过上述流程获得Clean Data后,利用Trinity (Grabherr et al., 2011)或其他转录组组装软件进行转录组数据从头组装。组装后将测序序列 (Reads) 回溯 (Mapping) 至转录本,并过滤掉平均覆盖度不超过10的转录本序列。过滤后的转录本序列再用Geneious version 7.1.5 (Biomatters,Auckland,New Zealand) 以UniVec Core为参考去除质粒序列,其后输出序列长度超过200 bp的转录本,进行后续分析。
            单拷贝同源基因的分配采用Orthograph version 0.6.1 (Petersen et al., 2017)。Orthograph是可以在参考序列和目标序列间做双向搜索的工具,最终仅输出在双向搜索中匹配度最高的结果。选取已完备测序和注释的参考物种基因组,使用OrthoFinder version 1.1.10 (Emms and Kelly, 2015) 识别出其共享的单拷贝同源基因,并构建单拷贝同源基因数据库,作为Orthograph进行单拷贝同源基因分配的参考数据库。成功进行单拷贝同源基因分配后,使用Orthograph自带的perl脚本(summarize_orthograph_results.pl) 在核苷酸 (nucleotide,NT) 和氨基酸(amino acid,AA) 层面分别汇总各基因序列。利用MAFFT version 7.310 (Katoh and Standley, 2013),采用L-INS-i算法,对汇总后的氨基酸序列进行比对,得到多序列比对序列 (Multiple Sequence Alignments,MSA)。所得的MSA按照 (Petersen et al., 2017) 中的流程先后进行异常序列筛查、优化、排除后,以比对后的氨基酸序列为模板,利用PAL2NAL (Suyama et al., 2006) 进行核苷酸序列比对。通过在默认设置条件下运行Aliscore (version 2.2) (Misof and Misof, 2009; Kück et al., 2010; Meusemann et al., 2010),本研究识别并移除比对后各氨基酸序列中的歧义位点,随后移除核苷酸序列中相应的位点。
            氨基酸和核苷酸序列起始和末端的空位分别以X和N补齐;再利用FASconCAT-G (Kück and Longo, 2014) 将全部氨基酸的MSA串联(Concatenate) 成为超级矩阵;为提高整体系统发育信息,用MARE version 0.1.2-rc (Misof et al., 2013) 对该矩阵进行“压缩”,得到氨基酸 (AA) 矩阵,再通过FASconCAT-G获得各矩阵组相应的核苷酸矩阵。可分别利用Alistat analysis (version 1.6) (https://github.com/thomaskf/AliStat)和 symtest (version 2.0.47) 评估了各矩阵的数据完整性 (Completeness) 和异质性(Heterogeneity) 情况。
    利用IQ-TREE (Nguyen et al., 2015) 对全部6个建树矩阵分别进行系统发育构建。先以IQ-TREE自带的ModelFinder (Kalyaanamoorthy et al., 2017) 按照Akaike's Information Corrected Criterion (AICc) 标准对各数据分区 (Partition) 进行最佳系统发育模型筛选,基于筛选出的模型搜索最优树 (BEST_TREE),再采用标准自举检验 (Standard Bootstrap) 进行100次重建树以评估节点支持率。

致谢

感谢审稿人和编辑对本文提出的修改建议。本研究由国家自然科学基金面上项目(31872964,31572305) 和博士后创新人才支持计划 (BX20190042) 资助。

参考文献

  1. 中国常见蝇类检索表(第二版). 科学出版社. 北京. 1-853.
  2. 薛万,赵建铭. (1996). 中国蝇类(上册). 辽宁科学技术出版社. 沈阳. 1-1365.
  3. 闫利平. (2019). 有瓣蝇类系统发育关系重建—侧重狂蝇总科演化历史研究. 博士学位论文. 北京林业大学.
  4. 于黎,张亚平. (2006). 系统发育基因组学—重建生命之树的一条迷人途径. 遗传 28: 1445-1450.
  5. Altschul, S. F., Gish, W., Miller, W., Myers, E. W. and Lipman, D. J. (1990). Basic local alignment search tool. J Mol Biol 215: 403-410.
  6. Andrews, S. (2010). FastQC: A quality control tool for high throughput sequence data. Babraham Bioinformatics
  7. Bernt, M., Donath, A., Jühling, F., Externbrink, F., Florentz, C., Fritzsch, G., Pütz, J., Middendorf, M. and Stadler, P. F. (2013). MITOS: Improved de novo metazoan mitochondrial genome annotation. Mol Phylogenet Evol 69: 313-319.
  8. Bolger, A., Lohse, M. and Usadel, B. (2014). Trimmomatic: A flexible read trimming tool for Illumina NGS data. Bioinformatics 30: 2114-2120.
  9. Branstetter, M. G., Danforth, B. N., Pitts, J. P., Faircloth, B. C., Ward, P. S., Buffington, M. L., Gates, M. W., Kula, R. R. and Brady, S. G. (2017). Phylogenomic insights into the evolution of stinging wasps and the origins of ants and bees. Curr Biol 27: 1019-1025.
  10. Cameron, S. L. (2014). Insect mitochondrial genomics: implications for evolution and phylogeny. Annu Rev Entomol 59: 95-117.
  11. Crampton-Platt, A., Timmermans, M. J. T. N., Gimmel, M. L., Kutty, S. N., Cockerill, T. D., Khen, C. V. and Vogler, A. P. (2015). Soup to tree: The phylogeny of beetles inferred by mitochondrial metagenomics of a bornean rainforest sample. Mol Biol Evol 32: 2302-2316.
  12. Delsuc, F., Brinkmann, H. and Philippe, H. (2005). Phylogenomics and the reconstruction of the tree of life. Nat Rev Genet 6: 361-375.
  13. Dunn, C. W., Hejnol, A., Matus, D. Q., Pang, K., Browne, W. E., Smith, S. A., Seaver, E., Rouse, G. W., Obst, M., Edgecombe, G. D., Sørensen, M. V., Haddock, S. H., Schmidt-Rhaesa, A., Okusu, A., Kristensen, R. M., Wheeler, W. C., Martindale, M. Q. and Giribet, G. (2008). Broad phylogenomic sampling improves resolution of the animal tree of life. Nature 452: 745-749.
  14. Eisen, J. A. (1999). Phylogenomics: Improving functional predictions for uncharacterized genes by evolutionary analysis. Genome Res 8: 163-167.
  15. Emms, D. M. and Kelly, S. (2015). OrthoFinder: solving fundamental biases in whole genome comparisons dramatically improves orthogroup inference accuracy. Genome Biol 16: 157.
  16. Faircloth, B. C., Branstetter, M. G., White, N. D. and Brady, S. G. (2015). Target enrichment of ultraconserved elements from arthropods provides a genomic perspective on relationships among hymenoptera. Mol Ecol Resour 15: 489-501.
  17. Grabherr, M. G., Haas, B. J., Yassour, M., Levin, J. Z., Thompson, D. A., Amit, I., Adiconis, X., Fan, L., Raychowdhury, R., Zeng, Q., Chen, Z., Mauceli, E., Hacohen, N., Gnirke, A., Rhind, N., di Palma, F., Birren, B. W., Nusbaum, C., Lindblad-Toh, K., Friedman, N. and Regev, A. (2011). Full-length transcriptome assembly from RNA-Seq data without a reference genome. Nat Biotech 29: 644-652.
  18. Hall, T. A. (1999). BioEdit: a user-friendly biological sequence alignment editor and analysis program for Windows 95/98/NT. Nucleic Acids Symposium Series 41: 95-98.
  19. Jarvis, E. D., Mirarab, S., Aberer, A. J., Li, B., Houde, P., Li, C., Ho, S. Y. W., Faircloth, B. C., Nabholz, B., Howard, J. T., Suh, A., Weber, C. C., da Fonseca, R. R., Li, J., Zhang, F., Li, H., Zhou, L., Narula, N., Liu, L., Ganapathy, G., Boussau, B., Bayzid, M. S., Zavidovych, V., Subramanian, S., Gabaldón, T., Capella-Gutiérrez, S., Huerta-Cepas, J., Rekepalli, B., Munch, K., Schierup, M., Lindow, B., Warren, W. C., Ray, D., Green, R. E., Bruford, M. W., Zhan, X., Dixon, A., Li, S., Li, N., Huang, Y., Derryberry, E. P., Bertelsen, M. F., Sheldon, F. H., Brumfield, R. T., Mello, C. V., Lovell, P. V., Wirthlin, M., Schneider, M. P., Prosdocimi, F., Samaniego, J. A., Vargas Velazquez, A. M., Alfaro-Núñez, A., Campos, P. F., Petersen, B., Sicheritz-Ponten, T., Pas, A., Bailey, T., Scofield, P., Bunce, M., Lambert, D. M., Zhou, Q., Perelman, P., Driskell, A. C., Shapiro, B., Xiong, Z., Zeng, Y., Liu, S., Li, Z., Liu, B., Wu, K., Xiao, J., Yinqi, X., Zheng, Q., Zhang, Y., Yang, H., Wang, J., Smeds, L., Rheindt, F. E., Braun, M., Fjeldsa, J., Orlando, L., Barker, F. K., Jønsson, K. A., Johnson, W., Koepfli, K. P., O'Brien, S., Haussler, D., Ryder, O. A., Rahbek, C., Willerslev, E., Graves, G. R., Glenn, T. C., McCormack, J., Burt, D., Ellegren, H., Alström, P., Edwards, S. V., Stamatakis, A., Mindell, D. P., Cracraft, J., Braun, E. L., Warnow, T., Jun, W., Gilbert, M. T. and Zhang, G. (2014). Whole-genome analyses resolve early branches in the tree of life of modern birds. Science 346(6215): 1320-1331.
  20. Kalyaanamoorthy, S., Minh, B. Q., Wong, T. K. F., Von Haeseler, A. and Jermiin, L. S. (2017). ModelFinder: Fast model selection for accurate phylogenetic estimates. Nat Methods 14: 587-589.
  21. Katoh, K. and Standley, D. M. (2013). MAFFT multiple sequence alignment software version 7: Improvements in performance and usability. Mol Biol Evol 30: 772-780.
  22. Kjer, K., Borowiec, M., Frandsen, P. B., Ware, J. and Wiegmann, B. M. (2016a) Advances using molecular data in insect systematics. Curr Opin Insect Sci 18: 40-47.
  23. Kjer, K. M., Simon, C., Yavorskaya, M. and Beutel, R. G. (2016b). Progress, pitfalls and parallel universes: a history of insect phylogenetics. J R Soc Interface 13(121): 20160363.
  24. Kück, P. and Longo, G. C. (2014). FASconCAT-G: Extensive functions for multiple sequence alignment preparations concerning phylogenetic studies. Front Zool 11: 81.
  25. Kück, P., Meusemann, K., Dambach, J., Thormann, B., von Reumont, B. M., Wägele, J. W. and Misof, B. (2010). Parametric and non-parametric masking of randomness in sequence alignments can be improved and leads to better resolved trees. Front Zool 7: 10.
  26. Kutty, S. N., Pape, T., Wiegmann, B. M. and Meier, R. (2010). Molecular phylogeny of the Calyptratae (Diptera: Cyclorrhapha) with an emphasis on the superfamily Oestroidea and the position of Mystacinobiidae and McAlpine’s fly. Syst Entomol 35: 614-635.
  27. Kutty, S. N., Wong, W. H., Meusemann, K., Meier, R. and Cranston, P. S. (2018). A phylogenomic analysis of Culicomorpha (Diptera) resolves the relationships among the eight constituent families. Syst Entomol 43: 434-446.
  28. Lanfear, R., Frandsen, P. B., Wright A. M., Senfeld, T. and Calcott, B. (2017). PartitionFinder 2: new methods for selecting partitioned models of evolution for molecular and morphological phylogenetic analyses. Mol Biol Evol 34(3): 772-773.
  29. Meusemann, K., Von Reumont, B. M., Simon, S., Roeding, F., Strauss, S., Kück, P., Ebersberger, I., Walzl, M., Pass, G., Breuers, S., Achter, V., von Haeseler, A., Burmester, T., Hadrys, H., Wägele, J. W. and Misof, B. (2010). A phylogenomic approach to resolve the arthropod tree of life. Mol Biol Evol 27: 2451-2464.
  30. Misof, B. and Misof, K. (2009). A monte carlo approach successfully identifies randomness in multiple sequence alignments: a more objective means of data exclusion. Syst Biol 58: 21-34.
  31. Misof, B., Meyer, B., von Reumont, B. M., Kück, P., Misof, K. and Meusemann, K. (2013). Selecting informative subsets of sparse supermatrices increases the chance to find correct trees. BMC Bioinformatics 14: 348.
  32. Misof, B., Liu, S., Meusemann, K., Peters, R. S., Donath, A., Mayer, C., Frandsen, P. B., Ware, J., Flouri, T., Beutel, R. G., Niehuis, O., Petersen, M., Izquierdo-Carrasco, F., Wappler, T., Rust, J., Aberer, A. J., Aspöck, U., Aspöck, H., Bartel, D., Blanke, A., Berger, S., Böhm, A., Buckley, T. R., Calcott, B., Chen, J., Friedrich, F., Fukui, M., Fujita, M., Greve, C., Grobe, P., Gu, S., Huang, Y., Jermiin, L. S., Kawahara, A. Y., Krogmann, L., Kubiak, M., Lanfear, R., Letsch, H., Li, Y., Li, Z., Li, J., Lu, H., Machida, R., Mashimo, Y., Kapli, P., McKenna, D. D., Meng, G., Nakagaki, Y., Navarrete-Heredia, J. L., Ott, M., Ou, Y., Pass, G., Podsiadlowski, L., Pohl, H., von Reumont, B. M., Schütte, K., Sekiya, K., Shimizu, S., Slipinski, A., Stamatakis, A., Song, W., Su, X., Szucsich, N.U., Tan, M., Tan, X., Tang, M., Tang, J., Timelthaler, G., Tomizuka, S., Trautwein, M., Tong, X., Uchifune, T., Walzl, M. G., Wiegmann, B. M., Wilbrandt, J., Wipfler, B., Wong, T. K., Wu, Q., Wu, G., Xie, Y., Yang, S., Yang, Q., Yeates, D. K., Yoshizawa, K., Zhang, Q., Zhang, R., Zhang, W., Zhang, Y., Zhao, J., Zhou, C., Zhou, L., Ziesmann, T., Zou, S., Li, Y., Xu, X., Zhang, Y., Yang, H., Wang, J., Wang, J., Kjer, K. M. and Zhou, X. (2014) Phylogenomics resolves the timing and pattern of insect evolution. Science 346: 763-767.
  33. Nguyen, L. T., Schmidt, H. A., Von Haeseler, A. and Minh, B. Q. (2015). IQ-TREE: A fast and effective stochastic algorithm for estimating maximum-likelihood phylogenies. Mol Biol Evol 32: 268-274.
  34. Pape, T., Blagoderov, V. and Mostovski, M. B. (2011). Order Diptera Linnaeus, 1758. In: Zhang, Z. Q. (Ed.). In: Animal biodiversity: an outline of higher-level classification and survey of taxonomic richness. Zootaxa, 222-229.
  35. Peng, Y., Leung, H. C. M., Yiu, S. M. and Chin, F. Y. L. (2012). IDBA-UD: A de novo assembler for single-cell and metagenomic sequencing data with highly uneven depth. Bioinformatics 28(11): 1420-1428.
  36. Peters, R. S., Krogmann, L., Mayer, C., Donath, A., Gunkel, S., Meusemann, K., Kozlov, A., Podsiadlowski, L., Petersen, M., Lanfear, R., Diez, P. A., Heraty, J., Kjer, K. M., Klopfstein, S., Meier, R., Polidori, C., Schmitt, T., Liu, S., Zhou, X., Wappler, T., Rust, J., Misof, B. and Niehuis, O. (2017). Evolutionary history of the Hymenoptera. Curr Biol 27: 1013-1018.
  37. Petersen, M., Meusemann, K., Donath, A., Dowling, D., Liu, S., Peters, R. S., Podsiadlowski, L., Vasilikopoulos, A., Zhou, X., Misof, B. and Niehuis, O. (2017). Orthograph: a versatile tool for mapping coding nucleotide sequences to clusters of orthologous genes. BMC Bioinformatics 18: 111.
  38. Ronquist, F. and Huelsenbeck, J. P. (2003). MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics 19: 1572-1574.
  39. Sanger, F. and Coulson, A. R. (1975). A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase. J Mol Biol 94: 441-448.
  40. Sims, G. E., Jun, S. R., Wu, G. A. and Kim, S. H. (2009). Whole-genome phylogeny of mammals: Evolutionary information in genic and nongenic regions. Proc Natl Acad Sci U S A 106: 17077-17082.
  41. Suyama, M., Torrents, D. and Bork, P. (2006). PAL2NAL: Robust conversion of protein sequence alignments into the corresponding codon alignments. Nucleic Acids Res 34: W609-W612.
  42. Vaidya, G., Lohman, D.J. and Meier, R. (2011). SequenceMatrix: Concatenation software for the fast assembly of multi-gene datasets with character set and codon information. Cladistics 27: 171-180.
  43. Wiegmann, B. M., Trautwein, M., Winkler, I. S., Barr, N. B., Kim, J. W., Lambkin, C., Bertone, M. A., Cassel, B. K., Bayless, K. M., Heimberg, A. M., Wheeler, B. M., Peterson, K. J., Pape, T., Sinclair, B. J., Skevington, J. H., Blagoderov, V., Caravas, J., Kutty, S. N., Schmidt-Ott, U., Kampmeier, G. E., Thompson, F. C., Grimaldi, D. A., Beckenbach, A. T., Courtney, G. W., Friedrich, M., Meier, R. and Yeates, D. K. (2011). Episodic radiations in the fly tree of life. Proc Natl Acad Sci U S A 108: 5690-5695.
  44. Yan, L., Pape, T., Elgar, M. A., Gao, Y. and Zhang, D. (2019). Evolutionary history of stomach bot flies in the light of mitogenomics. Syst Entomol 44: 797-809.
  45. Yeates, D. K., Meusemann, K., Trautwein, M., Wiegmann, B. and Zwick, A. (2016). Power, resolution and bias: Recent advances in insect phylogeny driven by the genomic revolution. Curr Opin Insect Sci 3: 16-23.
  46. Young, A. D., Lemmon, A. R., Skevington, J. H., Mengual, X., Ståhls, G., Reemer, M., Jordaens, K., Kelso, S., Lemmon, E. M., Hauser, M., De Meyer, M, Misof, B and Wiegmann, B. M. (2016). Anchored enrichment dataset for true flies (order Diptera) reveals insights into the phylogeny of flower flies (family Syrphidae). BMC Evol Biol 16: 143.
  47. Zhang, D., Yan, L., Zhang, M., Chu, H., Cao, J., Li, K., Hu, D. and Pape, T. (2016). Phylogenetic inference of calyptrates, with the first mitogenomes for Gasterophilinae (Diptera: Oestridae) and Paramacronychiinae (Diptera: Sarcophagidae). Int J Biol Sci 12: 489-504.
  48. Zhang, G., Li, C., Li, Q., Li, B., Larkin, D.M., Lee, C., Storz, J. F., Antunes, A., Greenwold, M. J., Meredith, R. W., Ödeen, A., Cui, J., Zhou, Q., Xu, L., Pan, H., Wang, Z., Jin, L., Zhang, P., Hu, H., Yang, W., Hu, J., Xiao, J., Yang, Z., Liu, Y., Xie, Q., Yu, H., Lian, J., Wen, P., Zhang, F., Li, H., Zeng, Y., Xiong, Z., Liu, S., Zhou, L., Huang, Z., An, N., Wang, J., Zheng, Q., Xiong, Y., Wang, G., Wang, B., Wang, J., Fan, Y., da Fonseca, R. R., Alfaro-Núñez, A., Schubert, M., Orlando, L., Mourier, T., Howard, J. T., Ganapathy, G., Pfenning, A., Whitney, O., Rivas, M. V., Hara, E., Smith, J., Farré, M., Narayan, J., Slavov, G., Romanov, M. N., Borges, R., Machado, J. P., Khan, I., Springer, M. S., Gatesy, J., Hoffmann, F. G., Opazo, J. C., Håstad, O., Sawyer, R. H., Kim, H., Kim, K. W., Kim, H. J., Cho, S., Li, N., Huang, Y., Bruford, M. W., Zhan, X., Dixon, A., Bertelsen, M. F., Derryberry, E., Warren, W., Wilson, R. K., Li, S., Ray, D. A., Green, R. E., O'Brien, S. J., Griffin, D., Johnson, W. E., Haussler, D., Ryder, O. A., Willerslev, E., Graves, G. R., Alström, P., Fjeldså, J., Mindell, D. P., Edwards, S. V., Braun, E. L., Rahbek, C., Burt, D. W., Houde, P., Zhang, Y., Yang, H., Wang, J., Avian Genome Consortium, Jarvis, E. D., Gilbert, M. T. and Wang, J. (2014). Comparative genomics reveals insights into avian genome evolution and adaptation. Science 346: 1311-1320.
  49. Zumpt, F. (1965). Myiasis in man and animals in the old world. Butterworths. London.
Please login or register for free to view full text
Copyright: © 2021 The Authors; exclusive licensee Bio-protocol LLC.
引用格式:张东, 闫利平, 李心钰, 孙浩然, 徐雯恬. (2021). 有瓣蝇类野外采集与标本制作、保存、鉴定方法 及分子系统学研究. Bio-101: e1010671. DOI: 10.21769/BioProtoc.1010671.
How to cite: Zhang, D., Yan, L. P., Li, X. Y., Sun, H. Y. and Xu, W. T. (2021). Collection, Preparation, Preservation, Identification and Molecular Phylogenetics of Calyptratae (Diptera: Schizophora). Bio-101: e1010671. DOI: 10.21769/BioProtoc.1010671.
Q&A
By submitting a question/comment you agree to abide by our Terms of Service. If you find something abusive or that does not comply with our terms please contact us at eb@bio-protocol.org.

If you have any questions/comments about this protocol, you are highly recommended to post here. We will invite the authors of this protocol as well as some of its users to address your questions/comments. To make it easier for them to help you, you are encouraged to post your data including images for the troubleshooting.

If you have any questions/comments about this protocol, you are highly recommended to post here. We will invite the authors of this protocol as well as some of its users to address your questions/comments. To make it easier for them to help you, you are encouraged to post your data including images for the troubleshooting.

We use cookies on this site to enhance your user experience. By using our website, you are agreeing to allow the storage of cookies on your computer.