跳到主要内容
溢价试验:

索取年度报价

英国生物银行蛋白质组学项目绘制了人类基因-蛋白质联系的大规模地图

溢价

英国生物银行制药蛋白质组学项目(UKB-PPP)的研究人员分析了54000多人的血浆蛋白质组,将蛋白质水平数据与来自同一受试者的基因组信息整合在一起。

该努力,详细在BioRxiv预印该报告于本月发表,生成了迄今为止最广泛的数据集之一,将蛋白质表达与其基因影响联系起来,为药物开发和更广泛意义上的生命科学的研究人员提供了丰富的信息。

斯坦福大学病理学助理教授乔纳森·朗说:“在如此庞大的个体集合中,能够真正拥有一个大规模的资源,展示出基因结构的样子……这真是太棒了。”

Long并不是UKB-PPP的成员,他使用血浆蛋白质组学和其他方法来研究能量代谢,主要关注血液中的代谢激素。他说,该项目产生的数据将为他的实验室的研究提供“非常肥沃的土壤”。

UKB-PPP努力的主要目标之一是识别蛋白质数量性状位点(pQTLs)——遗传变异和血浆蛋白质水平之间的联系。近年来,随着Olink和SomaLogic基于亲和的平台的发展,这种工作已经变得可行,它们能够测量数万个人血浆样本中的数千种蛋白质,将蛋白质组学研究的深度和吞吐量提高到可以与大规模基因组数据集进行有意义的集成的水平。

pqtl通常有两种特征独联体这意味着pQTL位于编码该蛋白质的基因附近反式这意味着它位于更远的地方。一个独联体pQTL在许多情况下反映了对编码该基因的蛋白质的影响,而反式pqtl可能反映其他现象,如与目标蛋白相互作用或与目标蛋白处于信号通路中的其他蛋白质的变化。希望pqtl可以帮助研究人员绘制遗传变异和蛋白质表达变化之间的联系,并最终确定疾病。

UKB-PPP团队使用Olink的Explore 1536平台分析了54306个个体的血浆蛋白质组,测量了每个个体1463个独特的蛋白质。利用这些数据进行pQTL映射,他们确定了10248个pQTL,其中1163个独联体一共9085个反式

研究人员指出,他们观察到的数量独联体当pqtl达到大约5000个参与者的样本量时,pqtl大约在测量的蛋白质数量上停滞,但是pqtl的数量反式pqtl继续增长,即使研究涉及54000名受试者,也没有显示出停滞的迹象。此外,他们说,随着样本量的增加,他们观察到更多的“与多种蛋白质相关的基因组区域……表明随着研究规模的增加,多效性基因座的可检测性更强。”

剑桥大学临床医学院MRC流行病学部门的生物信息学家Maik Pietzner说,这表明UKB-PPP数据集可以对影响蛋白质表达的不那么直接的机制提供更深入的了解。

“之前的研究已经非常有力地看到[独联体但这篇论文真正的贡献是,我们能够看到更多的编码在基因组的其他地方,”他说。“我认为,与之前的pQTL研究相比,这可能是这项研究的最大贡献。”

皮茨纳没有参与英国独立党和ppp的努力,他是《独立党与ppp》的第一作者一篇论文去年在自然通讯他和他的同事使用SomaLogic的SomaScan平台测量了10,708名受试者的4,775种独特蛋白质,并使用Olink的平台测量了485名受试者的1,069种蛋白质。他们鉴定出547个pqtl,其中108个是Olink特有的,91个是SomaLogic特有的。

Biogen的翻译遗传学副主任兼负责人、预印本的资深作者Christopher Whelan说,他预计该数据集将被证明对药物靶点发现、生物标志物发现和对疾病生物学的基本研究有用。

Biogen的科学/医学副总监、该研究的第一作者Benjamin Sun指出,预印本中提供的数据“只是冰山一角,真的”,并补充说,现在更广泛的科学界可以提出具体的问题和额外的分析模式。

“它的范围远远超出了我们一份预印本所能呈现的范围,”他说。

尽管预印本确实研究了一些与疾病相关的pqtl,包括与COVID-19和心血管疾病有关的基因-蛋白质关系,但Whelan说,鉴于UKB-PPP努力的前竞争性质,研究人员将把此类关系的更深入探索留给外部研究人员和参与的制药公司。

他指出,“举例来说,在百健方面,我们当然在研究与中枢神经系统有关的疾病。”

斯坦福大学的Long说,UKB-PPP数据集为他的实验室特别感兴趣的分子研究提供了一个起点。

他说:“我们有单一的、高优先级的血浆蛋白,我们真的很想了解它们。”“所以,现在,如果我们查找我们感兴趣的东西,我们不仅得到了那个位点的基因签名,而且还得到了所有这些反式决定分子水平的基因座。这为我们对该途径的调控进行基础科学调查提供了非常肥沃的土壤。”

惠兰说:“遗传学捕捉健康和疾病的蓝图,而蛋白质组学捕捉这一蓝图的最终产物,所以在许多方面,它们是同一枚硬币的两面。”“蛋白质组学在很多方面都是一项技术,我认为我们需要帮助释放基因组vwin德赢ac米兰合作学的全部潜力。”

蛋白质组学直到最近才达到了使这种群体规模的蛋白质组学研究成为可能的规模和吞吐量,而且,事实上,现有的技术只能查询血浆蛋白质组的一小部分。Olink目前的Explore平台测量了大约3000种蛋白质,而SomaLogic的SomaScan目前的版本测量了大约7000种蛋白质。与此同时,高通量的质谱工作流程通常在500个蛋白质左右达到峰值,但研究表明,Seer的Proteograph平台可以将这一数字提高到1500到2000个。鉴于人类大约有2万个编码蛋白质的基因,现有的分析方法只捕获了蛋白质组的一小部分。

同样重要的是,许多蛋白质以多种形式存在,表现出诸如氨基酸变异、截断或翻译后修饰等变化。每一种所谓的蛋白质形态在细胞中可能有不同的功能,这意味着,理想情况下,研究人员不仅可以知道他们在观察什么蛋白质,还可以知道具体的蛋白质形态。

在pQTL研究中,不同蛋白形态的存在可能会导致通过两个不同平台映射的pQTL显示出不同的效果,这取决于所使用的平台。例如,在自然通讯在这项研究中,Pietzner和他的同事观察到,基因PILRA的一个错义变体与Olink平台测量的PILRA蛋白表达呈负相关,而相同的遗传信号与SomaScan平台测量的同一蛋白的两种蛋白形式呈正相关,而与SomaScan测量的PILRA标准版本完全不相关。作者认为,这种差异源于两个平台的试剂与不同的PILRA蛋白形式结合的差异。

自然通讯惠兰说:“研究表明,结合蛋白质组学平台有巨大的好处。”他补充说,他和他的同事打算在英国生物银行样本集的一部分中进行多平台研究。他们计划使用Olink Explore平台、SomaLogic的SomaScan平台和三种不同的质谱分析装置来分析1250个样本。

这项工作将帮助研究人员评估通过使用多种平台可以捕获多少人类蛋白质组,并评估更新的基于质量谱的工作流程的性能。

惠兰说,关于质谱仪,他和他的同事们特别感兴趣的是该技术识别特定蛋白质形态和翻译后修饰的能力,“这对神经疾病非常重要,特别是我们在百健非常感兴趣的。”vwin德赢ac米兰合作

Pietzner说,他也希望看到该领域扩展到英国生物银行项目中分析的主要欧洲人口以外(以及类似的领域)Decode Genetics的大规模努力)融入其他种族。不过,他指出,尽管其他国家也有类似的生物银行,但很少有国家能提供英国生物银行的规模和获取便利。

他说:“这就是为什么这个资源对社区来说如此富有成效和重要的原因。”

UKB-PPP下一阶段的工作将使用Olink的Explore 3072试验,这将使总蛋白质测量增加到2926种蛋白质。研究人员还计划分析最初采样后大约10年收集的4500个样本,这将使他们能够收集纵向数据,并评估蛋白质是如何随着时间推移而变化的,因为衰老、疾病和其他因素。

惠兰表示,他预计该项目这一阶段的数据将在2023年年底公布。

扫描

按需基因疗法有望治疗癫痫

《科学》杂志上的一篇新论文描述了使用一种基于基因疗法的方法来降低神经元兴奋性,这抑制了小鼠模型的癫痫发作。

食肉动物肠道微生物群揭示了人类活动的影响

PLOS One的一项分析研究了生活在受人类影响地区和未受影响地区的野生美洲貂的肠道微生物群的差异。

用基因表达判断患者败血症风险的计算方法

《科学转化医学》的研究人员描述了一种急性感染患者分层的方法。

表观遗传衰老与极早产儿神经发育结果相关

JAMA Network Open的一项研究发现,早产儿的表观遗传衰老可以预测神经发育结果。
Baidu
map