谷歌DeepMind重大突破:蛋白质结构准确预测或加速药物研发
记者 | 田思奇
总部位于伦敦的实验室DeepMind研发的人工智能系统已经分别在围棋(AlphaGo)、国际象棋(AlphaZero)和星际争霸(AlphaStar)等一系列竞技领域战胜最顶尖的人类选手。现在,该实验室又在生物学领域取得突破,基本解决困扰研究人员半个世纪的一大难题。
11月30日(周一),一项和蛋白质预测相关的国际竞赛宣布,在最新人工智能程序AlphaFold的帮助下,DeepMind已经可以准确预测蛋白质如何折叠成3D形状,其预测结果和更加费时费力的实验室结果基本相当。这将帮助研究人员更高效地梳理导致某些疾病的机制,进而设计相关药物。
作为人体最重要的化合物之一,人类对蛋白质结构与功能的探索由来已久。1972年,美国科学家克里斯蒂安·安芬森(Christian Anfinsen)凭借可以根据蛋白质的氨基酸序列来确定蛋白质形状的研究成果收获诺贝尔化学奖。
从那时起,研究人员通过X射线、核磁共振和冷冻电镜技术破译了部分蛋白质结构,但这一过程需要几个月甚至几年的时间。虽然计算机技术的发展极大地推动了对蛋白质结构的预测,但到目前为止,生命体中已知的约2亿种氨基酸序列中,只有约17万种蛋白质结构得以确定。
1994年,美国马里兰大学的约翰·穆尔特和同事发起CASP竞赛(即“蛋白质结构预测技术批判性评估社区实验”),旨在比较计算机预测的蛋白质结构和实验室的结果,准确度将以0-100的分数呈现,得分在90分以上就可认为与实验室结果一致。
俗称为“蛋白质奥林匹克”的CASP竞赛每两年举行一次,来自全球的团队需要预测大约100种蛋白质的结构。比赛发起当年,小而简单的蛋白质结构已经可以获得准确的预测结果,但对于复杂的蛋白质结构,预测结果只有20分的水平。到2016年,最具挑战的蛋白质结构预测结果得分已经上升至40分。
直到2018年,谷歌母公司Alphabet旗下的DeepMind携AlphaFold首次参赛,随即在最具挑战的蛋白质结构上斩获60分,大幅领先所有对手。
但AlphaFold的研发负责人约翰·杰弗姆(John Jumper)表示,这些预测仍然过于粗糙,不具有任何生物学意义。
两年来,AlphaFold继续利用公共蛋白质数据库中的已知蛋白质形状信息进行“学习”,并改进了算法。今年它再次参赛,其得分中值一举达到92.5分,在最具挑战的蛋白质上也获得87分。
CASP竞赛组织者甚至担心DeepMind可能会作弊,因此评委之一,德国普朗克发展生物学研究所科学家安德烈·卢帕斯(Andrei Lupas)把一种古生菌的膜蛋白纳入挑战。他的研究团队在过去10年里都未能通过X射线获得该蛋白质的结构。
但AlphaFold没有遇到任何麻烦,它交出了一份由三部分组成的蛋白质图像,并帮助卢帕斯团队理解了X射线的数据,在半小时内获得与AlphaFold的预测相吻合的实验室结果。“这几乎是完美的,”卢帕斯说。“他们不可能在这件事上作弊,我不知道他们是怎么做到的。”
马里兰大学的约翰·穆尔特也表示,研究出一种蛋白质的形状需要昂贵的设备,而且通常需要数年时间。“这是一个有50年历史的难题,我从来没想过会在有生之年看到这样的场面。”
在实际应用方面,DeepMind表示已经开始与几个科学团体合作,在初始阶段专注于疟疾、昏睡病和利什曼病这些热带寄生虫相关疾病,它们与许多未知蛋白质结构有关。
新闻推荐
新华社北京11月30日电国家统计局服务业调查中心、中国物流与采购联合会30日发布数据,11月份,中国制造业采购经理指数(PMI)为5...