人体是一个极其复杂的系统,由数十万亿个细胞组成,这些细胞类型多样,功能复杂,并且会随着时间发生变化。蛋白质组学是研究人体蛋白质组的科学,对于理解人类生物学至关重要。然而,人体蛋白质组的复杂性无法仅通过基因组信息来预测,且现有技术也无法系统性地测量其复杂性。近年来,蛋白质组学技术和计算科学的进步为研究人体提供了新的机会。单细胞和空间蛋白质组学技术可以提供更精细的蛋白质组信息,而深度学习和人工智能技术可以帮助我们更好地分析和解释这些数据。
2024年12月11日,Nature发表了一篇由国家蛋白质科学中心贺福初院士和苏黎世联邦理工学院Ruedi Aebersold教授联合近百名国际科学家发表的题为“π-HuB: the proteomic navigator of the human body”的观点文献。本文介绍了π-HuB项目,旨在通过生成和利用多模态蛋白质组数据来增强对人类生物学的理解,并推动精准医疗和智医的发展的“大科学”项目。
π-HuB项目是一个雄心勃勃的国际合作项目,其目标是通过生成和利用多模态蛋白质组数据来增强对人类生物学的理解,并推动精准医疗和智医的发展。包括揭示人体细胞、组织和器官的构建原理以及生物过程的分子/细胞机制,通过蛋白质组数据预测疾病风险和诊断疾病,发现新的药物靶点以推动新药研发,利用蛋白质组数据指导个性化治疗方案的选择和优化,以及开发π-HuB导航器,利用人工智能技术为个人提供个性化的健康管理方案,从而推动基于蛋白质组学的实践智慧医学新时代的到来。
具体目标
π-HuB 项目旨在通过三大目标来揭示人体蛋白质组的奥秘,并推动精准医疗的发展。
1. 发现人体原理
数字化解剖空间:利用单细胞和空间蛋白质组学等技术,将人体分解成一系列数字蛋白质组解剖空间,包括:
● 组织/器官的细胞组成
● 单个细胞类型的蛋白质组成
● 细胞内的蛋白质组中心分子网络
揭示构建原理:通过整合多模态数据融合/整合技术,特别是深度学习和基础模型的快速发展,将高分辨率、基于解剖的蛋白质组数据转化为解码细胞/组织/器官的分子/细胞构建原理的绝佳机会,并揭示生物过程的关键分子/细胞机制,即从蛋白质网络到表型的因果关系。
2. 开发 Meta Homo Sapiens 模型
生命周期轨迹:深入研究个体一生中人类蛋白质组的动态变化,探索人类蛋白质组如何适应影响健康结果的各种因素。
状态空间:将整个人体状态空间转换为多个子空间,并通过各种维度进一步分解,例如:
● 追踪主要产前和产后阶段的蛋白质组中心轨迹
● 绘制复杂疾病发展和进展过程中复杂蛋白质组的纵向动态变化
● 确定非遗传因素(例如共生微生物组、生活方式和环境)对人体蛋白质组的影响
数字化模型:将状态上下文蛋白质组数据与其他人类组学数据整合,并投射到一个名为 Meta Homo Sapiens 的数字化模型中。该模型将使用三维解剖层次结构记录每个级别器官、组织、体液和细胞的数字特征,并包含时间序列帧,每个帧包含在单位时间内测量和增强的蛋白质组数据,以代表人体在特定时间戳的状态。
3. 构建 π-HuB 导航器
虚拟状态空间仪器:将生理表型与蛋白质组导向的时空生化/生物物理信息相结合,创建一个虚拟状态空间仪器。
真实模型:将原型 Meta Homo Sapiens 模型从初始身体条件转移到不同的次级状态,以获得真实模型。
状态空间:通过模拟每个模型的身体动力学来创建一个涵盖人体所有关键状态的状态空间,并解决基于非侵入性蛋白质组快照和纵向蛋白质组测量的结果预测问题。
因果推断:使用因果推断来识别导致相邻关键状态之间转换的潜在触发因素。
拓扑导航图:将每个状态空间视为拓扑导航图,其中每个节点是定义相应生物标志物的关键状态,两个节点之间的边记录了从一种状态转换为另一种状态的触发因素。
应用:
● 追踪健康轨迹
● 定义疾病风险评估和早期诊断的重要因素
● 推动新的治疗干预措施和智能医疗方法的发展
通过这三大目标,π-HuB 项目将有望揭示人体蛋白质组的奥秘,并推动精准医疗的发展,最终实现“智医”的愿景。
图1 π-HuB 项目的总体目标(图源:He, et al., Nature, 2024)
关键支柱
π-HuB 项目将依靠六大支柱来支撑其目标,并确保其成功实施。
1. 人体生物样本
来源多样化:
● 解剖样本:从健康捐赠者的尸体解剖中获得的器官、组织和活体样本。
● 双胞胎队列:用于计算人群中观察到的变异的遗传成分,并有助于控制复杂疾病病因学研究中混杂因素的影响。
● 基于人群的队列:来自世界不同地区具有不同生活方式和环境的个体的高质量生物样本的横断面收集。
● 纵向队列研究:应用非侵入性或侵入性较小的技术,以相对较高的采样频率对健康个体或具有健康或治疗意义或结果的定义暴露的患者的样本进行采样。
标准化的注释:所有样本都需要进行良好的、一致的注释,包括临床和人口统计学信息,例如问卷调查、物理测量、生化测试、医学影像数据、与疾病易感性相关的遗传变异记录以及可穿戴设备记录等。
元数据标准:使用通用的元数据标准进行注释,以确保数据可访问性、互操作性和基于人工智能的数据整合。
2. 测量技术创新
单细胞蛋白质组学 (SCP):通过加速和基准测试基于质谱的技术如nanoPOTS、SCoPE-MS和scPiMS,以及开发完全集成/自动化的纳克级样品制备和单分子蛋白质测序技术,以提升分析通量。
空间蛋白质组学:利用深度视觉蛋白质组学技术或其衍生技术进行分析,并开发基于人工智能的组织成像导航技术,实现高通量和像素格式采样,同时整合多模态数据。
血浆蛋白质组分析:应用基于质谱或亲和力的技术进行血浆蛋白质组分析,以同时分析数千个蛋白质在数千个血浆样本中的高通量。
功能蛋白质组学:开发和应用稳健的技术,以生成指示蛋白质组功能状态的多维蛋白质组数据,例如翻译后修饰、结构状态、定位和相互作用。
3. 计算技术创新
数据整合与分析:开发数据驱动的建模方法,例如自动机器学习 (autoML),以近似许多虚拟和现实世界系统。
可解释人工智能 (XAI):开发 XAI 方法,以提供蛋白质组分析结果的清晰和可理解的解释,并验证人工智能驱动的假设。
大型语言模型 (LLM):建立先进的 LLM,以理解并生成蛋白质组学领域的特定语言,并分析大量生物医学文本。
因果推理:使用因果推理方法来识别导致相邻关键状态之间转换的潜在触发因素。
4. 大科学基础设施
国家设施/中心:建立国家设施/中心,用于收集和处理多层蛋白质组数据,并具备高吞吐量和高性能计算能力。
国际合作:与世界各地的现有基础设施合作,例如荷兰蛋白质组学中心和澳大利亚的 ProCan。
5. 开放资源
数据共享:将 π-HuB 产生的(非敏感)原始数据通过实施可查找、可访问、可互操作和可重用 (FAIR) 数据原则的数据门户网站直接提供给国际科学界。
生物信息学基础设施:开发将蛋白质组学图谱整合到 UniProt 中的生物信息学基础设施,以便向整个生命科学界提供信息。
计算框架:开发一个基于 π-HuB 分子和空间数据的网络版 Meta Homo Sapiens 计算框架,以便临床医生和患者可以免费查询医疗干预策略。
6. 国际研究团队
多学科合作:由研究人员、软件工程师、临床医生、病理学家、项目经理、管理人员、财务人员、律师、商业实体等组成的国际研究团队。
决策机构:由执行委员会和顾问委员会领导,并遵循明确的治理和问责制指南。
能力建设和文化交流:通过奖学金/研究员计划促进国际研究人员之间的思想交流和研究成果交流,并吸引更多年轻科学家参与该项目。
通过这六大支柱,π-HuB 项目将有望实现其目标,并推动蛋白质组学在医学领域的应用,最终实现精准医疗的愿景。
图2 π-HuB 项目的关键支柱(图源:He, et al., Nature, 2024)
挑战
π-HuB 项目也面临着一些挑战。
1. 伦理:建立一个共同的、灵活的、普遍接受的框架,以应对伦理和监管方面的挑战。
2. 大数据:建立一个专门为 π-HuB 项目设计的、适合目的的数据中心。
3. 数据生成和整合:确保来自不同团队的数据具有可比性和可整合性。
4. 建模:构建一个复杂的计算机驱动的人体蛋白质组 Meta Homo Sapiens 模型。
预期成果
π-HuB 项目旨在通过 30 年的努力,取得一系列突破性的成果,推动精准医疗和智医的发展。以下是 π-HuB 项目启动和开发阶段(2024-2033年)的预期取得的成果。
1. 组织构建原理
细胞类型解析的蛋白质组图谱:建立包含所有主要器官和组织的细胞类型解析的蛋白质组图谱,揭示不同细胞类型的蛋白质表达、亚细胞定位、翻译后修饰和相互作用。
新分子/细胞机制:发现新的分子/细胞机制,解释不同细胞类型和组织功能的多样性。
2. 蛋白质组导向的生活方式指南
人类蛋白质组特征资源:建立一个包含人类蛋白质组特征资源的数据集,包括与不同生活方式相关的蛋白质组特征。
蛋白质健康评分:开发一个基于神经网络或大型语言模型的蛋白质健康评分系统,为个人提供个性化的健康指导。
3. 蛋白质组导向的精准医疗
人类蛋白质组特征资源:建立一个包含人类蛋白质组特征资源的数据集,包括与主要疾病相关的蛋白质组特征。
新的生物标志物和治疗靶点:发现新的蛋白质组生物标志物和治疗靶点,用于疾病的早期诊断和精准治疗。
4. π-HuB 导航器
虚拟状态空间仪器:开发一个虚拟状态空间仪器,用于追踪人体健康轨迹、预测疾病风险和制定精准治疗方案。
智医:实现“智医”的愿景,通过人工智能技术为个人提供个性化的健康管理方案。
π-HuB 项目预期取得的成果将极大地推动精准医疗和智医的发展,为人类健康事业做出重大贡献。
拜谱小结
π-HuB 项目是一个激动人心的项目,它有可能彻底改变我们对人体的理解,并推动精准医疗的发展。通过国际合作和科技创新,π-HuB 项目有望在未来几十年内取得重大突破,为疾病预防和诊断、药物发现和精准医疗做出贡献。
拜谱生物作为一家国内领先的多组学服务公司,率先引进赛默飞最新一代质谱仪Astral,并且专家团队总结多年DIA蛋白组项目经验,结合Astral质谱仪高稳定性、高灵敏度、高通量、高深度的特性对样品制备、分离技术、算法软件、实验设计全流程进行多维迭代更新,助力公司的DIA蛋白组产品全线升级,推出了DIA-Ultra深度蛋白质组学检测产品,达到万级蛋白深度检测(最高可超越12k),在此基础上也开展了磷酸化、乳酸化、完整糖肽、半胱氨酸修饰以及空间蛋白组等特色技术,欢迎大家咨询!
参考文献:
He F, Aebersold R, Baker MS, Bian X, Bo X, Chan DW, Chang C, Chen L, Chen X, Chen YJ, Cheng H, Collins BC, Corrales F, Cox J, E W, Van Eyk JE, Fan J, Faridi P, Figeys D, Gao GF, Gao W, Gao ZH, Goda K, Goh WWB, Gu D, Guo C, Guo T, He Y, Heck AJR, Hermjakob H, Hunter T, Iyer NG, Jiang Y, Jimenez CR, Joshi L, Kelleher NL, Li M, Li Y, Lin Q, Liu CH, Liu F, Liu GH, Liu Y, Liu Z, Low TY, Lu B, Mann M, Meng A, Moritz RL, Nice E, Ning G, Omenn GS, Overall CM, Palmisano G, Peng Y, Pineau C, Poon TCW, Purcell AW, Qiao J, Reddel RR, Robinson PJ, Roncada P, Sander C, Sha J, Song E, Srivastava S, Sun A, Sze SK, Tang C, Tang L, Tian R, Vizcaíno JA, Wang C, Wang C, Wang X, Wang X, Wang Y, Weiss T, Wilhelm M, Winkler R, Wollscheid B, Wong L, Xie L, Xie W, Xu T, Xu T, Yan L, Yang J, Yang X, Yates J, Yun T, Zhai Q, Zhang B, Zhang H, Zhang L, Zhang L, Zhang P, Zhang Y, Zheng YZ, Zhong Q, Zhu Y; π-HuB Consortium. π-HuB: the proteomic navigator of the human body. Nature. 2024 Dec;636(8042):322-331. doi: 10.1038/s41586-024-08280-5