摘要:Small RNA是生物体内一类重要的功能分子,包括miRNA、siRNA和piRNA。它的主要功能是诱导基因沉默,调控细胞生长、发育、基因转录和翻译等生物学过程。基于新一代高通量测序技术的small RNA测序,可一次性获得数百万条small RNA序列,能够快速地鉴定某种组织在特定状态下的所有已知small RNA,并发现新的small RNA,为small RNA功能研究提供有力工具。本实验教程以miRNA为例,详述了small RNA测序数据的分析流程。
关键词: miRNA-seq, 测序定量, 差异表达, 靶标预测
仪器设备
-
服务器 (型号:I620-G20;操作系统:centos7;CPU:Xeon(R) CPU E5-2620 v4 @ 2.10GHz,8核,32G内存)
注:学习者最好是有mac或者linux系统,需要8G+的内存,500G的存储,如果是Windows,则需要安装git,notepad++,虚拟机 (安装linux系统) 等,建议初学者使用mac。
-
普通个人电脑 (需要已经安装好R,能调用个人终端)
软件
-
FASTX-Toolkit (v0.014)
-
FastQC (v0.11.8)
-
mulitiQC(v1.6)
-
miRDeep2(v2.0.0) (Anders和Huber,2010)
-
DESeq(v1.34.0) (Friedlander等,2012)
-
R(v3.5.1)
实验步骤
注:
-
miRNA-seq数据获得
本实验方案以2017年发表在Oncotarget杂志上的文章:“Systematic analysis reveals tumor-enhancing and -suppressing microRNAs in Drosophila epithelial tumors.” (Shu等,2017) 中miRNA-seq的部分数据作为测试数据。
-
去掉adapter
在终端输入命令:$ fastx_clipper -a adapter -c –i输入文件名.fastq -z –o; 输出文件名.fastq.gz,操作如下图所示:
-
通过FastQC对数据进行质量评估
$ fastqc所在目录/fastqc -t 4输入文件
注:若想指定输出目录,可以增加参数“-o路径”设置。
操作如下图所示:
在输出文件夹中每个输入文件都有两个输出结果,一个结果集合压缩包 (.zip文件)和一个网页结果 (.html文件)。一般通过查看网页结果即可知道基本的测序质量。
结果如图1:
图1. fastqc质控结果. A. 表示每个碱基的测序质量,在绿色区域表示测序质量很高;B. 展示了测序测到的长度分布,主要分布在21~23 nt,这与miRNA的大小符合。
当具有多个样品时,查看多个fastqc的结果时可以使用multiQC软件,将所有的结果综合到一起查看,输入命令:
$ multiqc目标文件夹
查看方式与结果与fastqc是一致的,在此就不进行赘述。
-
对测序文件进行比对
目前比对miRNA的程序很多,比如miRDeep2、miRExpress、miRNAkey以及sRNAbench等,同时还有一些在线的分析软件。我们采用综合指标比较好的miRDeep2进行比对 (Bisgin等,2018)。
-
miRNA表达矩阵以及差异表达分析
miRNA可以使用DESeq (DESeq2),edgeR以及limma等R包进行差异表达分析。由于示例数据是没有重复的数据,所以我们采用DESeq对数据进行分析 (DESeq2不支持没有重复组的分析,建议读者使用具有重复的实验数据)。将R的工作环境设置到含有输出的miRNAs_expression的文件夹中,运行如下脚本 (图3):
图3. DESEq分析R脚本
运行脚本后我们可以获得miRNA差异基因表格以及差异最显著的前30个miRNA的热图 (如图4)。
图4. miRNA差异基因热图
-
下游分析
目前进行miRNA测序数据分析,大多是要和mRNA测序数据关联来看。这里就涉及到了miRNA寻找对应的targets问题。目前寻找miRNA靶点的方法主要分为计算机预测和实验的方法。计算机预测靶点,可以参考该网站的介绍https://www.plob.org/article/1157.html。
而实验方法,目前在果蝇方面,我们实验室首次实现了一种可以检测个体水平上的miRNA靶标的实验Ago1-RIP-seq,通过这种方法我们可以探究已知以及潜在的miRNA靶标,为miRNA的后续分析提供了非常坚实的实验指导。目前我们正在开发Ago1-RIP-seq的数据库,很快可以上线,为广大的科研人员提供服务。
参考文献
-
Anders, S. and Huber, W. (2010). Differential expression analysis for sequence count data. Genome Biol 11(10): R106.
-
Bisgin, H., Gong, B., Wang, Y. and Tong, W. (2018). Evaluation of bioinformatics approaches for next-generation sequencing analysis of microRNAs with a toxicogenomics study design. Front Genet 9: 22.
-
Friedlander, M. R., Mackowiak, S. D., Li, N., Chen, W. and Rajewsky, N. (2012). miRDeep2 accurately identifies known and hundreds of novel microRNA genes in seven animal clades. Nucleic Acids Res 40(1): 37-52.
-
Shu, Z., Huang, Y. C., Palmer, W. H., Tamori, Y., Xie, G., Wang, H., Liu, N. and Deng, W. M. (2017). Systematic analysis reveals tumor-enhancing and -suppressing microRNAs in Drosophila epithelial tumors. Oncotarget 8(65): 108825-108839.
Please login or register for free to view full text
Login | Register
Copyright: © 2019 The Authors; exclusive licensee Bio-protocol LLC.