首页 > 科研进展 > 正文

我组提出大规模非靶向代谢组学数据的特征检测和匹配新方法

作者:杨军时间:2025-05-07点击数:

近日我组在大规模非靶向代谢组学数据处理方法研究方面取得新进展,开发了一种面向大规模样品研究的液相色谱-高分辨质谱(LC-HRMS)代谢组学数据处理新工具MetCohort,提升了数据处理的准确性和效率。

大规模样本的代谢组学研究在流行病学和临床医学研究领域的应用越来越广泛,对于阐明生命体代谢、遗传-环境等的复杂相互作用有着重要意义。从复杂的代谢组学数据中准确获得化合物的质谱特征(feature)和定量信息对于下游统计分析和生物知识的挖掘至关重要,尽管已经有许多基于LC-HRMS的代谢组学数据处理工具被开发,但仍然缺乏较好的针对大规模LC-HRMS的数据处理方法。  

                                      

     

本研究提出了一种大规模样本的特征检测和匹配新方法MetCohort,从非靶向LC-HRMS原始数据中自动获取准确的峰表,降低特征检测的假阳性和假阴性,并提升大规模样本特征定量的准确性,从而用于后续的化合物鉴定和统计分析。MetCohort首先进行基于局部锚点匹配和离群点去除的原始数据保留时间校正,之后,通过构建所有样本的色谱信号区域构成二维感兴趣区域(ROI)矩阵,从而将峰检测问题转化为二维图像处理任务。通过改进的基于动态规划的边缘检测方法,化合物特征峰可以被准确识别和积分,从而提升大规模样本中峰检测的灵敏度、特异性和定量准确性。

相关研究成果以“MetCohort: Precise Feature Detection and Correspondence for Untargeted Metabolomics in Large-Scale Cohort Studies”为题,发表在《Analytical Chemistry》上。该工作的第一作者是我组博士研究生杨军,通讯作者为许国旺研究员和刘心昱研究员。上述工作得到国家重点研发计划、国家自然科学基金等项目的资助。(文/ 杨军)


文章链接:https://pubs.acs.org/doi/10.1021/acs.analchem.4c04906 


Laboratory of High Resolution Separation/Analysis and Metabonomics   Dalian Institute of Chemical Physics, Chinese Academy of Sciences. All Rights Reserved.
中国科学院大连化学物理研究所  生物分子高分辨分离分析及代谢组学研究组(1808组)
地址: 大连市中山路457号, 邮编: 116023 电话: 0411-84379531; 传真: 0411-84379559     Email: g1808@dicp.ac.cn