近日,我组发展了一种基于分子结构关联网络的代谢组学规模化注释新方法,把非靶向代谢组数据的规模化注释又往前推进了一步。
液相色谱-高分辨串联质谱作为非靶向代谢组学研究的主流技术可获得成千上万的代谢特征,但传统搜库方法受谱图库收录规模的限制,仅可注释其中2%~20%的谱图,无法满足代谢组学研究的需要,亟待发展代谢组规模化鉴定的新方法。
基于分子结构-谱图相关性,研究团队研发了一种不依赖谱学数据库的代谢组规模化注释新方法SGMNS。利用生物体系代谢物间存在的紧密联系以及代谢物结构数据库,构建代谢物结构关联网络GCMN。通过结构类似物的迭代计算,进行高效网络注释传播,实现代谢组大规模的结构注释。结构关联网络可利用的化学空间更大,具有更为独特的网络拓扑特性。方法评价证实其具备更优异的网络注释传播性、重复性和可靠性。仅采用10个已知代谢物做初始种子即可成功注释出生物样本混样中的2041个代谢物。该方法为缺乏参考质谱数据及代谢反应的代谢物规模化注释提供了解决方案。
近年来,我组在非靶向代谢组学规模化注释方面发展了系列方法。如采用代谢反应网络进行可靠候选分子式筛选,提出直接进样-超高分辨质谱的血清代谢组表征新方法,实现代谢组的深度表征(Analytical Chemistry,2023)。发展代谢物的LC-MS2数据库实现从原始数据出发对代谢物的规模化注释(Analytical Chemistry, 2022)。构建in silico苷元库和糖基/酰基-糖基碎裂模式库,发展了糖苷类化合物规模化定性新方法,准确性和特异性均得到提高(Analytical Chemistry,2022)。开发了基于修饰基团的代谢物定性新策略,并可进行新型修饰代谢物的结构注释(Analytical Chemistry,2021)。上述系列方法为代谢组的规模化鉴定提供了有用工具。
相关研究以“A Structure-Guided Molecular Network Strategy for Global Untargeted Metabolomics Data Annotation”为题,发表在《分析化学》(Analytical Chemistry)上。该工作的第一作者是我组博士研究生王鑫欣和大连理工大学联合培养博士研究生李超。上述工作得到了国家重点研发计划、国家自然科学基金、大连化物所创新基金和中国科学院洁净能源创新研究院-榆林学院联合基金等项目的资助。(文/图王鑫欣、郑福建、郑思佳、孙晓珊、路鑫)
文章链接:https://doi.org/10.1021/acs.analchem.3c00849