摘要:代谢组学是研究生物体受外部刺激后所产生的所有代谢物变化的科学,能够全面揭示生物体受到扰动后机体代谢网络的变化。现有的代谢组学方法在数据库数据方面,数据来源众多,数据质量参差不齐,鉴定结果准确度和数据处理速度上受各实验室仪器状态和数据采集方法影响很大,通量有进一步提升的空间。本实验采用高分辨质谱对600余种内源性代谢物标准品逐一进行色谱和质谱数据采集,手动确认和标注信息后,录入数据库并导入Compound discover等数据处理软件进行快速、高通量的代谢组学数据处理。化合物鉴定标准方面,在进行质量偏差和二级质谱 (MS2) 碎片信息匹配的基础上,加入色谱保留时间作为高维度确证指标,降低了化合物鉴定的假阳性率。该数据库的建立和应用提高了代谢组学方法化合物鉴定的准确度,缩短了数据分析流程,可用于药物靶点发现、药理病理研究、疾病诊断等。
关键词: 高分辨质谱, 数据库, 代谢组学, 高通量
材料与试剂
-
1.5 ml 离心管 (Axygen, catalog number: MCT-150-C)
-
Mass Spectrometry Metabolite Library内源性代谢物标准品库 (IROA Technologies, MSMLS)
-
甲醇 (Thermo Fisher, catalog number: A452-4)
-
乙腈 (Thermo Fisher, catalog number: A998-4)
-
异丙醇 (Thermo Fisher, catalog number: A451-4)
-
甲酸 (Thermo Fisher, catalog number: A117-50,质谱级,纯度>99.5%)
-
乙酸铵 (Thermo Fisher, catalog number: AM9070G,质谱级,纯度>99%)
-
去离子水 (制备自Milli Q Advantage A10超纯水机,电阻率为18.2MΩ·cm)
仪器设备
-
Q Exactive Plus Orbitrap高分辨液质联用仪,配有U3000超高效液相色谱及自动进样器 (Thermo Fisher, catalog number: 16029108)
-
Vortex-2 Genie 涡旋混合器 (Scientific Industries)
-
5810R低温离心机 (Eppendorf)
-
WD-9415C型超声波清洗器 (北京市六一仪器厂)
-
ACQUITY UPLC HSS T3色谱柱,2.1 × 100 mm,1.8 μm (Waters)
-
BEH Amide 色谱柱,2.1 × 100 mm,1.7 μm (Waters)
-
mzVault 2.2软件 (Thermo Fisher)
-
Compound discover 3.2软件 (Thermo Fisher)
实验步骤
-
样品制备
采用IROA Technologies公司的Mass Spectrometry Metabolite
Library内源性代谢物标准品库进行高分辨质谱数据库建立,该高覆盖度代谢物标准品库包括了大多数内源性代谢物及中间体,覆盖关键代谢通路,包括了有机酸,氨基酸,生物胺,聚胺类,核苷酸,辅酶,维生素,单糖,二糖,脂肪酸,脂质,类固醇,激素等,共634种,纯度均> 95%,储存形式为7个96孔板 (包括38个空白孔),每孔中包括5 μg化合物标准品,其中1-5号板为亲水性高极性代谢物,6号板为中等极性代谢物,7号板为脂溶性低极性代谢物,根据不同化合物的溶解性设计样品制备方案如下,化合物具体信息整理如附表1所示。
-
质谱数据采集
针对不同极性和性质的化合物,分为反相液相色谱 (Reversed-phase liquid chromatography, RPLC) 和亲水作用色谱 (Hydrophilic interaction liquid chromatography, HILIC) 两种色谱体系进行质谱数据采集,并记录保留时间。
-
高通量内源性代谢物数据库信息录入
采用Mzvault 2.2和Xcalibur Qual Browser软件进行原始数据处理及数据库信息录入。具体步骤如下,同时附有视频演示。
-
代谢组学及实际样品数据分析比对工作流程
将建立的内源性代谢物质谱数据库导入Compound discover 3.2软件中,采用293T细胞内容物作为实际样品,比较该数据库和软件中现有数据库"Bamba lab 598 polar metabolites"、"Fiehn HILIC POS 1701 & NEG 1341"、mzcloud离线镜像版以及mzcloud在线版在细胞代谢组学工作流程的特征峰鉴定数量、准确度和数据处理所需时间等方面的差异。具体工作流程如下:
结果与分析
本实验共选择5种数据库进行代谢组学数据分析,考察数据库通量及搜索准确度,结果如表5所示。从鉴定数量结果来看,mzcloud数据库因质谱信息条目多,鉴定到的化合物数量最多,但经过手动指认和标注后,部分结果因采集仪器不同、没有保留时间比对等原因被认定为假阳性结果或重复结果。而采用自建数据库则很大程度上的降低了假阳性率,并且手动标注后的化合物鉴定结果数也与mzcloud等数据库保持相同水平。
表5. 五种内源性代谢物质谱数据库细胞内容物代谢组学鉴定结果对比
|
Bamba
|
Fiehn
|
mzcloud
离线版
|
mzcloud
在线版
|
自建数据库
|
鉴定结果数
|
57
|
139
|
237
|
249
|
175
|
手动标注后结果数
|
35
|
85
|
148
|
142
|
149
|
假阳性鉴定率 (%)
|
38.60
|
38.85
|
37.55
|
42.97
|
14.86
|
自建数据库的高通量优势如图8所示,比较采用compound discover加载不同数据库处理代谢组学数据的时长,自建数据库在化合物搜库鉴定总时长上具有更显著的优势,相比高通量的mzcloud的离线或在线工作流程,分析时间缩短了50%以上。结合QE Plus质谱实现正负离子信息同时采集和扫描,同一个样品仅需一次进样,LCMS分析总时间27 min,即可对代谢组学样品进行快速数据采集及数据处理,缩短的现有方法所需时间,进一步突显了高通量质谱数控采集及分析的特点。
图8. Compound discover加载不同数据库进行数据处理所需时长对比
致谢
感谢清华大学药学院尹航老师的讨论、建议和大力支持。感谢"清华大学实验室管理处双一流实验室建设专项"对本实验提供的支持。
参考文献
-
Gray, N., Lawler, N., Yang, R., Morillon, A. C., Gay, M. C. L., Bong, S. H., Holmes, E., Nicholson, J. K. and Whiley, L. (2020). A simultaneous exploratory and quantitative amino acid and biogenic amine metabolic profling platform for rapid disease phenotyping via UPLC-QToF-MS. Talanta 223: 121872.
-
Tsugawa, H., Cajka, T., Kind, T., Ma, Y., Higgins, B., Ikeda, K., Kanazawa, M., VanderGheynst, J., Fiehn, O. and Arita, M. (2015). MS-DIAL: data-independent MS/MS deconvolution for comprehensive metabolome analysis. Nat Methods 12(6): 523-526.
-
Tsugawa, H., Kind, T., Nakabayashi, R., Yukihira, D., Tanaka, W., Cajka, T., Saito, K., Fiehn, O. and Arita, M. (2016). Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Anal Chem 88(16): 7946.
Please login or register for free to view full text
Login | Register
Copyright: © 2021 The Authors; exclusive licensee Bio-protocol LLC.
引用格式:唐煜, 韦芳, 付玮彬, 商世瑛. (2021). 高通量质谱数据库建立及应用——以内源性代谢组学研究为例. // 高通量筛选实验手册.
Bio-101: e1010847. DOI:
10.21769/BioProtoc.1010847.
How to cite: Tang, Y., Wei, F., Fu, W. B. and Shang, S. Y. (2021). Establishment of a High Throughput MS Database and Its Application in Endogenous Metabolite Metabolomics Profiling. // High-throughput Screening Protocol eBook.
Bio-101: e1010847. DOI:
10.21769/BioProtoc.1010847.