众力资讯网

颜宁回应混不下去回国了言论 科普下AlphaFold,到底能不能替代科研人员和冷

颜宁回应混不下去回国了言论 科普下AlphaFold,到底能不能替代科研人员和冷冻电镜的活?

我对AlphaGo很熟悉,很多人看下棋也大致知道是在干啥。AlphaFold就专业多了,绝大部分人不知道怎么回事。AlphaFold是DeepMind开发的,根据蛋白质氨基酸序列预测其三维结构,得了2024年诺贝尔奖,是AI4S(AI for Science)的标志性成果。这是一般性理解,还是不知道干啥。

就以颜宁刚发的这个《科学》文章《Structural N- and O-glycans revealed by high-resolution cryo-EM analysis of tubular mastigonemes》为例。这是一篇糖质(glycan)结构生物学文章,讲的就是“结构”,和AlphaFold预测的“三维结构”,研究的一个东西。

糖质与蛋白质、核酸、脂类并列为四大基本生物大分子,但结构解析长期进展不佳。聚糖分子很复杂,分支多、异构体、修饰多样,传统手段搞不出高分辨率结构。糖质被学界称为细胞中的"暗物质" 。

颜宁研究的“管状纤绒毛”(tubular mastigoneme)是金藻鞭毛表面的毛发状附属结构,参与机械感觉和细胞运动。颜宁团队用“冷冻电镜+糖蛋白质组学+AI建模”的三大招组合,取得了结构突破。

冷冻电镜的作用是,首次将天然糖质复合物推进至2Å的近原子分辨率,直接可视化单糖环、共价修饰甚至水分子。糖蛋白质组学的作用是,整合靶向质谱与结构生物学研究,实现糖链组成与蛋白质骨架的精准对应,发现新型糖基化基序。颜宁实验室自研的AI模型EModelG的作用是,推动糖质结构解析从"依赖间接片段信息推断"向高精度直接建模转变,为大规模糖质结构研究提供方法学支撑。

AlphaFold能不能如某些人幻想的,“一步到位”把这些活全干了?显然是不能的。要不然这文章也发不了《科学》

AlphaFold的输入要求很严格,是以FASTA格式提交的氨基酸序列,输出蛋白质主链和侧链的三维坐标预测。它本质上是一个蛋白质结构预测器。中间细节不管,输入和输出很清楚。输入是给定的序列,输出是三维坐标。

在输入层面,AlphaFold只接受"蛋白质的氨基酸序列","糖"的不收。颜宁团队解析的对象包含两类AlphaFold完全无法处理的东西,纯糖纤维(TLP-0)糖蛋白复合物,这两东西不含任何蛋白质。AlphaFold的输入界面根本没有"糖链序列"这个选项,它连门都进不了 。

功能上,AlphaFold预测"蛋白折叠",不预测"糖质组装"。颜宁团队需要自己开发AI模型去预测。

在实证层面上,即使AI模型给出了预测,也需要冷冻电镜给出原子级的数据、确认预测成功。

看看这些,就知道拿一个AlphaFold,不可能替代科研人员和冷冻电镜,只能在某些蛋白质序列任务上,加快提升效率。还有其它一些AI模型也在起这样的作用,AI也不能包打天下,要冷冻电镜。