人类表型组微观与整体的复杂关联及其机制解密

Human Phenome: Unravelling the Mystery of Complex Cross- Phenotype Associations and its Underlying Mechanisms

问题年度:2024 问题类型:前沿科学问题 学科领域:生命健康 学科细分归类:遗传学,基础医学

推荐机构:中国认知科学学会

表型组学 遗传学 医学 基因-表型-环境关联

问题描述

基因和环境相互作用决定人体的各种特征,这些人体特征即表型(Phenotype)。人类表型组(Human Phenome)是从胚胎发育到出生、成长、衰老乃至死亡过程中,人的形态特征、功能、行为、分子组成规律等所有生物、物理和化学特征的集合。表型包括微观表型和宏观表型。微观表型包括转录本、蛋白质、代谢物、细胞亚群、微生物等等;宏观表型包括影像学表征、体貌特征、疾病病征、健康状态、环境适应能力等。现代生命科学和生物医学的核心问题就是揭示宏观表型的微观机制。以破解微观表型与整体之间的复杂关联为目标,通过大规模表型全景精密测量与数据系统解析,破解基因-表型-环境、宏观-微观表型之间以及宏观表型项目之间的关联与调控机制,将达到对生物系统的全面理解,最终帮助实现对疾病与健康的精准干预。

问题背景

表型组学研究的重要性已成为学界共识,利用和破解宏观-微观表型之间的复杂关联与互作机制一直是生命科学前沿探索的方向。

2003年,Nelson Freimer和Chiara Sabatti在Nature Genetics上撰文倡议发起“人类表型组计划(The Human Phenome Project, HPP)”,倡议集合更强大、标准化及多样性的人类表型数据库,集成一系列科学学科,同时带动诸如美国国立卫生研究院(NIH)和英国维康基金会(Wellcome Trust)等公共机构、非营利机构以及生物制药与其他行业之间的合作。2005年Science杂志创刊125周年之际,公布了当代125个最具挑战性的科学问题,其中“遗传变异与健康关联” “人的基因为何如此之少” “什么基因改变造成了人类的独特性”等遗传与发育问题位居前列,这些问题的核心和瓶颈在于缺乏技术手段和数据分析方法破解宏观-微观表型之间的复杂关联与互作机制。2010年英国New Scientist杂志盘点可能改变科学的50个想法,其中表型组(phenome)位列第13位,该文认为表型组是现阶段的科学研究重点之一,将带来巨大突破。2013年,Nature杂志评述认为表型组对疾病相关表型信息进行系统梳理,可对医疗健康大数据起到“点石成金”的作用,前景非常光明。2016年,美国国家科学基金会(NSF)在Science杂志发表文章为NSF未来几十年的发展描绘蓝图,提出六大科研前沿和三大机制改革建议,“理解生命的规律:预测表型”位列第三。2018年,Nature杂志技术展望,“连接基因型和表型(Linking genotype and phenotype)”被列为2018年度可改变生命科学研究的技术领域之一。2019年Science杂志以“从基因型到表型”为题出版特刊,对基因型与表型的关系进行了分析与总结。2020年Nature Review Genetics杂志以“遗传学和基因组学的未来之路”为题刊登述评,美国科学院院士、国家医学科学院院士、印度国立科学院院士Aravinda Chakravarti将“解码多因素表型”列为未来方向之一。2021年美国国立卫生研究院(NIH)主任在Francis S. Collins教授在Cell杂志上发表聚焦未来十年精准医学的七个关键性发展领域的前沿评论,其中包含“表型组学与环境”和“队列研究”,涉及整合多队列的临床表型、环境暴露和生活习惯等不同维度表型相关数据。

最新进展(截止问题发布年度)

自2003年被首次提出以来,人类表型组作为具有前瞻性、先导性和探索性的领域逐步得到国际学界的关注与重视。尤其是2015年,中国科学家在香山科学会议上首次提出发起“人类表型组国际大科学计划”的倡议之后,该领域逐渐获得国际大量顶尖学者的高度认可,被视为对生命科学未来发展具有重大影响和引领作用的关键方向。2021年,“人类表型组学研究”被中国工程院等单位编制的《全球工程前沿》评为医药卫生领域“十大前沿热点”。

我国高度重视并率先对人类表型组领域进行了战略性科研布局。2016年4月,国际人类表型组即被国务院文件列入“需布局的重大科学基础工程”。2016年至2022年,科技部、国家自然科学基金委和上海市立项多个人类表型组相关重大科技项目。2021年,上海建设全球科创中心“十四五”规划,明确将“加快筹备国际人类表型组等新一批大科学计划”。

同时,以金力等院士领衔的中国科学家团队,已在人类表型组基础研究领域取得一系列原创性突破,达成三项“全球第一”:建成了全球首个跨尺度多维度人类表型精密测量平台并建立全套SOP体系;完成了全球首个每人测量2.4万个表型的健康人群表型精密测量千人核心队列;绘制完成全球首版人类表型组导航图,发现150余万个表型间强关联。我国科学家在标准化体系建设中也取得了成绩:已发布国际标准ISO22690,研制的“中华家系1号”多组学标准物质已被欧洲转化医学研究先进基础设施等多家国际单位应用。被誉为“系统生物学之父”的拉斯克奖获得者、美国四院院士胡德(Leroy Hood)据此评价认为,中国“在表型组学基础研究领域已处于领先地位”。

由于进化历程和生活环境不同,人群表型存在着巨大差异。由于测量成本较高、采样要求不同、标准尚未统一等原因,目前多个有代表性的人类表型数据库/数据集缺乏系统性,数据库间比对困难,因此统一技术标准和共享数据资源将是本问题未来面临的重要挑战。

当前生命科学领域,针对不同来源样本,从不同维度视角,以各自标准,积累了海量的数据。然而,跨尺度表型组解析技术面临数据产出和解读方式各不相同,数据采集灵敏度、分辨率、时间颗粒度、数量级等存在极大差异,也是目前跨尺度表型组关联分析的障碍。

此外,表型组学研究还需要多学科协同。现阶段生命科学研究的组织形式,由传统的单一维度/单因子研究,向现代大规模跨尺度多维度集成式研究进行了革命性的演进,多学科汇聚,跨尺度解析成为生命科学研究的最新范式。包括生物学、医学、计算科学、工程学等多领域学者共同参与技术研发、算法开发、人工智能研究等,构建跨尺度表型组知识图谱,共同揭示现代生命科学和生物医学的核心问题,即揭示微观表型与整体之间的复杂关联。

重要意义

当前生命科学研究正从单一因子的还原式研究向深入理解复杂体系和现象的系统研究发展,与此同时,大数据驱动的研究范式与科学智能赋能(AI for Science)的研究范式结合,正带动医药健康领域变革,本问题是结合健康科学大数据与AI赋能的最佳实践,将带动我国生命健康基础科研与应用的跨域式发展。通过本问题的研究,可以实现表型组数据与基因组信息相结合,开展从表型到基因与环境的“归因”分析,厘清疾病发生发展机理,整量级发现人群关键生物学标志物,为疾病预防与干预提供关键线索与指引。与此同时,本问题需要多学科协同,包括生物学、医学、人类学、计算科学、工程学、语言学等多领域学科交叉合作,使得多学科间协同攻关,将引领多学科交叉融合。

此外,本问题的表型组学研究是大科学项目,需要广泛的国际科研合作,建立国际化科研合作平台。目前,由中国科学家率先发起的国际人类表型组计划已建立了国际科研合作平台雏形——国际人类表型组研究协作组,随着表型组学研究的进一步深入,将进一步增进国际学术交流、促进国际化人才培养、推动构建开放创新生态,稳固和扩大我国在表型组学研究领域的先发优势。以点带面,进一步带动相关学科、产业、人才的国际交流合作,打造以表型组为代表的生命科学前沿科研资源配置的中心,有助于巩固我国在表型组学领域的国际引领地位,加强我国在表型组学领域的国际交流推动作用,并担当全球科技治理规则的制定者的关键角色。