近日,我组在小分子串联质谱(MS/MS)预测方面取得新进展,提出一种基于母离子-子离子对图包(PPGB)的MS/MS预测方法PPGB-MS2,保证了高分辨率质谱预测时,MS/MS预测的准确性。
在基于液相色谱-质谱(LC-MS)的代谢组学的化合物鉴定中,高质量的MS/MS数据是关键支撑,最直接的获取方式是通过标准品进行实验测量,但成本高,且很多标准品难以获取,因此很多化合物缺乏实验MS/MS数据,导致代谢组学数据鉴定的覆盖度不足。MS/MS预测被视为补充缺失MS/MS数据的有效途径之一,但在准确性、是否可实现高分辨率MS/MS预测等方面仍存在提升空间。
本研究提出了一种用于小分子的MS/MS预测新方法PPGB-MS2,将MS/MS预测任务转化为碎片离子强度预测任务。该方法引入PPGB表示碎片,使母离子、子离子结构以及碎裂信息得到统一表征,在输入机器学习模型前最大限度保留化学结构信息。基于PPGB表示,利用图神经网络(GNN)实现MS/MS碎片离子强度预测,进而实现MS/MS预测。使用NIST串联质谱数据库中由安捷伦QTOF 6530采集的[M+H]+和[M-H]-数据,对该系统进行全面训练与严格评估,结果显示,在测试集中平均余弦相似度为0.71,高于经典的 MS/MS 预测方法。同时,凭借其对碎片和结构间对应关系的高效管理,成功实现高分辨率的MS/MS预测。
相关研究成果以“Predicting Tandem Mass Spectra of Small Molecules Using Graph Embedding of Precursor-Product Ion Pair Graph“为题,发表在《Analytical Chemistry》上。该工作的第一作者是我组毕业博士研究生郑福建,通讯作者为许国旺研究员。上述工作得到国家重点研发计划、国家自然科学基金等项目的资助。
文章链接:https://doi.org/10.1021/acs.analchem.4c04375 (文/图 郑福建)