在心血管疾病预防中,一个经久存在的难题是:很多疾病在发病前已在体内埋伏多年,但要在早期精确断定一小我将来是否会同时面对多种心血管疾病风险,并不轻易。
(图1. 研究设计与分析流程。a. 研究人群;b. 模型开辟流程;c. 模型机能评估。)
以往的风险评估重要依附年纪、血压、血脂等惯例临床指标,或多基因遗传风险评分。然而心血管疾病往往是一个经久演变、可能同时出现多种终局的过程,单一指标或针对单一疾病的猜测方法,很难周全反应真实风险。
跟着大年夜范围人群队列和高通量分子检测技巧的成长,研究者发明血液中的蛋白质和代谢物可以或许更直接地反应身材当前的心理状况以及疾病过程。这些分子旌旗灯号不仅受到遗传身分影响,也会随情况和生活方法变更,为经久风险评估供给了新的信息来源。
在此背景下,由喷鼻港大年夜学数据科学研究院及药理与药剂学系副传授张清鹏领衔的研究团队,基于 UK Biobank 大年夜范围前瞻性人群数据,开展了一项多组学信息与人工智能相结合的研究。
研究团队不再局限于“一病一模型”的思路,而是将蛋白组和代谢组信息纳入同一框架,同时评估多种心血管疾病的经久风险。相干成果以《AI-based multiomics profiling reveals complementary omics contributions to personalized prediction of cardiovascular disease 》为题揭橥于 Nature Communications,为心血管风险研究供给了一种更整体、也更切近真实人群的研究路径。

论文地址:https://www.nature.com/articles/s41467-026-68956-6
用血液多组学信息,体系评估多种心血管疾病风险
这项研究的核心发明是:在传统临床指标的基本上,引入血液多组学信息,可以明显晋升对心血管疾病经久风险的猜测才能,并且这种晋升在多种心血管疾病中都表示得稳定一致。
研究基于 UK Biobank 的经久随访数据,采取分阶段的方法构建和验证模型。研究团队提出了 CardiOmicScore 框架,分别应用血液中的 2,920 种蛋白质和 168 种代谢物,练习了两类人工智能模型,并由此生成了两种疾病特异性风险评分:基于蛋白组的 ProScore 和基于代谢组的 MetScore。
与传统只针对单一疾病构建的风险评分不合,这两种评分是在同一模型中同时纳入多种心血管疾病进行练习,体系性地捕获了多种心血管疾病之间的共性生物学特点及其各自的分子差别,最终会为每一种疾病分别生成对应的风险评分。在随后纳入约 2.4 万名基线时未患心血管疾病的验证人群中,研究者体系评估了这些风险评分的猜测后果。

成果显示,即使不依附任何传统临床指标,ProScore和MetScore本身就已经具备较强的风险辨认才能,可以或许在疾病产生前十年以上发出预警旌旗灯号。个中,基于蛋白组的ProScore猜测后果最为稳定,其区分高风险与低风险人群的才能(C-index在0.69-0.82之间)明显优于多基因风险评分(C-index在0.52-0.60之间),在部分心血管终局中接近常用的临床风险模型。基于代谢组的MetScore表示(C-index在0.64-0.74之间)略弱于ProScore,但整体仍优于多基因风险评分。雷峰网
在真实人群中,这些多组学评分也能清楚区分不合风险程度,辨认出更轻易产生心血管事宜的个别。无论是蛋白组照样代谢组评分,高风险人群在随访时代产生心血管疾病的概率始终明显高于低风险人群,并且这种差别在六种心血管疾病中均一致存在。

(图2. MetScore 与 ProScore 对心血管疾病风险的区分才能。a. 按MetScore分层的生计概率;b. 按ProScore分层的生计概率;c. MetScore和ProScore与心血管疾病风险的接洽关系强度。)
进一步分析发明,多组学信息在现有临床评估基本上能供给额外价值。无论模型中已包含若干临床信息,只要参加蛋白组或代谢组评分,猜测后果都邑明显晋升,个中蛋白组评分带来的改良最为凸起,代谢组次之,而多基因风险评分的晋升相对有限。这注解,多组学旌旗灯号反应的是传统临床检查难以直接捕获的分子层面风险。

(图3. 多组学信息对心血管疾病的猜测机能。a. 模型的判别才能;b. 参加多组学信息后基线临床模型猜测机能的变更。)
从实际应用角度看,参加多组学信息后的模型猜测成果稳定靠得住,猜测风险与真实事宜产生率高度一致,不会体系性高估或低估风险。在多种模仿的临床决定计划场景中,这类模型显示出更高的潜在收益,有望在削减不须要干涉的同时,更早、更精确地辨认真正的高风险人群。
(图4. 心血管疾病猜测模型的校准才能和净收益曲线。a. 校准曲线;b. 净收益曲线。)
为了懂得模型“为什么如许猜测”,研究者经由过程 SHAP 办法进一步分析了模型最依附的分子特点。成果显示,一些临床上早已熟知的指标仍然是核心猜测因子,例如与心脏负荷相干的 NT-proBNP 和 NPPB 蛋白,以及反应肾功能和养分状况的肌酐和白蛋白。
在此基本上,模型还辨认出了一批具有潜在价值的新型生物标记物。在蛋白组中,GDF15、MMP12、FASLG 和NEFL 显示出较强的猜测才能;在代谢组中,谷氨酰胺、脂肪酸、糖蛋白乙酰基(GlycA)以及多种脂质相干分子同样具有重要感化。
这些分子在不合心血管疾病中的表示并不完全雷同,为深刻懂得心血管疾病的复杂分子机制,以及摸索新的干涉靶点供给了线索。这些分子的感化模式,与心肌应激、炎症反响和代谢混乱等已知病理过程高度一致,解释模型确切抓住了心血管疾病的关键生物学旌旗灯号。


(图6. 代谢物和蛋白质在心血管疾病风险猜测中的相对供献。a. 代谢物的猜测供献;b. 蛋白质的猜测供献。)
基于大年夜范围人群数据的研究设计与模型验证
这项研究依托 UK Biobank 大年夜范围前瞻性队列开展。研究采取了“先开辟、再验证”的严谨设计:起首应用只包含单一组学信息的大年夜范围人群数据练习模型,个中包含约 22 万名具有代谢组数据的介入者和约 1.9 万名具有蛋白组数据的介入者;随后,再在一组同时具备遗传、代谢和蛋白信息、且基线时没有心血管疾病的 2.4 万名个别中进行自力验证。这些人群的中位随访时光约为 15 年,使研究可以或许充分不雅察心血管疾病的经久产生过程。雷峰网("大众,"号:雷峰网)
研究重点存眷了六种常见且临床包袱较重的心血管疾病。所有疾病终局均经由过程病院住院记录和逝世亡挂号信息进行确认,确保了成果剖断的靠得住性和一致性。随访时光从基线评估开端,一向持续到疾病产生、逝世亡、掉访或随访停止。
在数据层面,研究整合了三类关键信息。遗传风险经由过程既往全基因组接洽关系研究中已验证的遗传变异构建,用来反应个别的先天易感性;代谢组数据来自血液样本,涵盖脂质、脂蛋白、氨基酸以及炎症相干代谢物,可以或许反应机体当前的代谢状况;蛋白组数据则一次性检测了近 3,000 种轮回蛋白,覆盖炎症、免疫、代谢调控和心血管构造重塑等多种关键生物过程。
(图5. 心血管疾病风险猜测中具有代表性的关键代谢物和蛋白质。a. 关键代谢物;b. 关键蛋白质。)
在验证阶段,研究采取了严格的自力测试策略,确保模型在新的人群中依然有效。模型机能不仅经由过程常用的猜测精确度指标进行评估,还结合了校准分析和决定计划曲线分析,体系考验其在真实临床应用处景中的靠得住性和潜在价值。
此外,研究还对模型进行了深刻解释,分析哪些具体的蛋白和代谢物在风险猜测中起到了关键感化。这一步使得模型的猜测成果可以或许与已知和潜在的生物学机制相对应,而不是逗留在“黑箱猜测”的层面。
一个可持续扩大的心血管风险评估模型框架
从研究意义上看,这项工作为心血管疾病风险猜测供给了一种新的整体框架。研究清楚注解,仅依附传统临床指标或遗传信息,很难周全反应一小我将来的经久心血管风险;而血液中的蛋白质和代谢物,可以或许更直接地反应身材当前的心理状况和疾病进展过程。将这些信息体系性地整合起来,可以更精确地猜测将来心血管事宜的产生。
在临床应用层面,研究提出了一种更高效的风险评估方法:经由过程一次血液检测,同时评估多种心血管疾病的经久风险。这种办法打破了传统“一病一模型”的做法,更切近真实临床中多种心血管风险往往同时存在的情况,也为将来开展更精准、更高效的风险筛查供给了可能。
在此基本上,研究团队开辟了一套名为 CardiOmicScore 的人工智能模型框架,分别针对蛋白组(ProNet)和代谢组(MetNet)信息构建风险猜测模型。该框架的一个重要特点是,它既能进修多种心血管疾病之间的共通生物学特点,也能同时捕获每一种疾病特有的分子旌旗灯号。模型最终输出的是持续的风险评分,而不是简单的“有病或没病”,是以更合实用于经久风险评估。
在精准医学的背景下,研究进一步凸显了蛋白组和代谢组信息的独特优势。与相对固定的遗传风险不合,这些分子可以或许反应情况、生活方法和健康状况的综合影响,是以更合实用于动态风险评估和早期干涉,为心血管疾病的一级预防供给了新的科学根据。

此外,经由过程对模型的解释性分析,研究不仅验证了传统的 NT-proBNP 等既往已知的心血管相干生物标记物,还经由过程AI揭示了一批潜在的新分子线索。这些成果有助于加深对心血管疾病分子机制的懂得,并为将来生物标记物开辟、药物靶点发明以及治疗策略优化供给偏向。
从更长远的角度来看,这项研究展示了一种具有优胜扩大性的医学人工智能研究范式。跟着将来进一步整合影像、心电图等多模态数据,这类模型有潜力成长为更周全的心血管风险评估对象,为临床决定计划供给加倍个别化和前瞻性的支撑。
重要作者
论文的作者包含:喷鼻港大年夜学罗颜、崔梦瑶、张清鹏,天津医科大年夜学第二病院刘彤、张楠,南京大年夜学羊剑楠,喷鼻港中文大年夜学蔡锦辉传授和利物浦大年夜学 Gregory Y. H. Lip,张清鹏与刘彤为合营通信作者。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。

发表评论 取消回复