首页 理论教育 代谢组学的研究方法

代谢组学的研究方法

时间:2022-04-06 理论教育 版权反馈
【摘要】:代谢组学研究在整个样品处理和分析过程中,应尽可能保留和体现样品中代谢物的信息,生物样品的收集、灭活、储存、处理、仪器分析和数据处理等环节的标准化问题已越来越引起研究者的重视。此外,1 H-NMR对含氢化合物均有响应,能完成样品中大多数化合物的检测,满足代谢组学中的对尽可能多的化合物进行检测的目标。基于NMR技术的代谢组学方法已广泛地应用于药物毒性、基因功能以及疾病的临床诊断中。

代谢组学研究一般包括代谢组数据的采集、数据预处理、多变量数据分析、标记物识别和途径分析等步骤。生物样品(如尿液、血液、组织、细胞和培养液等)采集后进行生物反应灭活、预处理。运用磁共振、质谱或色谱等检测其中代谢物的种类、含量、状态及其变化,得到代谢谱或代谢指纹,而后使用多变量数据分析方法对获得的多维复杂数据进行降维和信息挖掘,并研究相关代谢物变化涉及的代谢途径和变化规律,以阐述生物体对相应刺激的响应机制、发现生物标记物。

1.样品采集与制备 样品的采集与制备是代谢组学研究的初始步骤也是最重要的步骤之一,代谢组学研究要求严格的实验设计和合适的分析精度。首先需要采集足够数量的样本,从而可有效减少源于生物样品个体差异对分析结果的影响,得到有统计学意义的分析数据。实验设计中对样品收集的时间、部位、种类、样本群体等应给予充分考虑。在研究人类样本时,还需考虑饮食、性别、年龄和地域等诸多因素的影响。此外,分析过程要有严格的质量控制,需要考查如样本的重复性、分析精度、空白等。代谢产物的变化对分析结果有较大的影响,在处理生物样本时要特别注意避免由于残留酶活性或氧化还原过程降解代谢产物、产生新的代谢产物。代谢组学研究在整个样品处理和分析过程中,应尽可能保留和体现样品中代谢物的信息,生物样品的收集、灭活、储存、处理、仪器分析和数据处理等环节的标准化问题已越来越引起研究者的重视。

2.数据采集 完成样本的采集和预处理后,样品中的代谢产物需通过合适的方法进行测定。代谢组学分析方法要求具有高灵敏度、高通量和无偏向性的特点,与原有的各种组学技术只分析特定类型的化合物不同,代谢组学所分析的对象的大小、数量、官能团、挥发性、带电性、电迁移率、极性以及其他物理化学参数差异很大。由于代谢产物和生物体系的复杂性,至今为止,尚无一种能满足上述所有要求的代谢组学分析技术,现有的分析技术都有各自的优势和适用范围。最好采用联用技术和多种方法综合分析。色谱(color spectrum)、质谱(mass spectra,MS)、磁共振(nuclear magnetic resonance,NMR)、毛细管电泳、红外光谱、电化学检测等分离分析手段及其组合都出现在代谢组学的研究中。其中色谱-质谱联用方法兼备色谱的高分离度、高通量及质谱的普适性、高灵敏度和特异性,NMR特别是1 H-NMR以其对含氢代谢产物的普适性而成为最主要的分析工具。

(1)NMR:NMR是当前代谢组学研究中的主要技术,NMR的优势在于能够对样品实现无创性、无偏向的检测,具有良好的客观性和重现性,样品不需要繁琐处理,具有较高的通量和较低的单位样品检测成本。此外,1 H-NMR对含氢化合物均有响应,能完成样品中大多数化合物的检测,满足代谢组学中的对尽可能多的化合物进行检测的目标。NMR虽然可对复杂样品如尿液、血液等进行非破坏性分析,与质谱法相比,它的缺点是检测灵敏度相对较低(采用现有成熟的超低温探头技术,其检测灵敏度在纳克级水平)、动态范围有限,很难同时测定生物体系中共存的浓度相差较大的代谢产物;同时,购置仪器所需的投资也较大。为了提高NMR技术的灵敏度,研究者们采用了增加场强、使用低温探头和微探头的方法。针对分辨率的问题,使用了多维磁共振技术和液相色谱-磁共振联用(liquid chromatography-nuclear magnetic resonance,LC-NMR)。Daykin采用色谱技术,利用LCNMR联用对心血管疾病患者血中的脂蛋白代谢产物进行了检测。基于NMR技术的代谢组学方法已广泛地应用于药物毒性、基因功能以及疾病的临床诊断中。

(2)质谱:MS具有较高的灵敏度和专属性,可以实现对多个化合物的同时快速分析与鉴定。随着质谱及其联用技术的发展,越来越多的研究者将色谱-质谱联用技术用于代谢组学的研究。气相色谱(gas chromatogram,GC)-质谱联用(GC-MS)方法的主要优点包括较高的分辨率和检测灵敏度,并且有可供参考、比较的标准谱图库,可以用于代谢产物定性。但是GC不能直接得到体系中难挥发的大多数代谢组分的信息,对于挥发性较低的代谢产物需要衍生化处理,预处理过程繁琐。GC-MS常用于植物和微生物代谢指纹分析。液相色谱-质谱(LC-MS)联用避免了GCMS中繁杂的样品前处理,由于其较高的灵敏度和较宽的动态范围,已被越来越多地用于代谢组学研究,它非常适合于生物样本中复杂代谢产物的检测和潜在标记物的鉴定。新的分析技术如超高效液相色谱/高分辨飞行时间质谱技术、毛细管液相色谱-质谱联用技术、傅里叶变换离子回旋共振技术等也被用于代谢组学研究以提高代谢产物的检测灵敏度和通量。

3.数据处理方法 由分析仪器导出的元数据(metadata),不能直接用于模式识别分析,还需对数据进行预处理,将元数据转变为适合于多变量分析(主要是模式识别)的数据形式。主要的数据预处理包括滤噪、重叠峰解析(deconvolution)、峰对齐、峰匹配、标准化和归一化等。由于代谢组学得到的是大量的、多维的信息,为了充分挖掘所获得数据中的潜在信息,对数据的分析需要应用一系列的化学计量学方法。数据分析过程中应用的主要手段为模式识别技术,包括非监督学习方法和监督学习方法。非监督学习方法用于从原始谱图信息或预处理后的信息中对样本进行归类,并采用相应的可视化技术直观地表达出来,不需要有关样品分类的任何背景信息。主要有主成分分析(principal components analysis,PCA)、非线性映射、簇类分析等。有监督学习方法用于建立类别间的数学模型,使各类样品间达到最大的分离,并利用建立的多参数模型对未知的样本进行预测。在这类方法中,由于建立模型时有可供学习利用的训练样本,所以称为监督学习。PCA和偏最小二乘法-判别分析(PLS-discriminant a-nalysis,PLS-DA)是代谢组学研究中最常用的模式识别方法,这两种方法通常以得分图(score plot)获得对样品分类的信息,载荷图(loading plot)获得对分类有贡献变量及其贡献大小,从而用于发现可作为生物标记物的变量。此外,在数据处理和分析的各阶段,对数据的质量控制和模型的有效性验证也需引起足够的重视。

4.代谢组学数据库 代谢组学分析离不开各种代谢途径和生物化学数据库。与基因组学和蛋白组学已有较完善的数据库供搜索使用相比,目前代谢组学研究尚无类似的功能完备数据库。一些生化数据库可供未知代谢物的结构鉴定或用于已知代谢物的生物功能解释,如连接图数据库(connections MapDB)、京都基因与基因组百科全书(KEGG)、MET-L IN,HumanCyc,Eco-Cyc和metacyc,BRENDA,L IGAND,MetaCyc,UMBBD,W IT2,EMP项目,I-R IS,AraCyc,PathDB,生物化学途径(Ex-PASy)、互联网主要代谢途径(main metabolic pathways on internet,MMP)、Duke博士植物化学和民族植物学数据库、Arizona大学天然产物数据库等。目前的代谢组学数据库主要用于各种生物样本中代谢物的结构鉴定。理想的代谢组学数据库还应包括各种生物体的代谢物组信息以及包含代谢物的定量数据,如人类代谢组数据库(the human metabolite database,http://www.hmdb.ca)包含了人类体液中超过1400种以上的代谢产物。数据库中每种代谢产物都有其相应的化学、临床、分子生物学和生化数据。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈