京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 884|回复: 0

登顶Nature 正刊!百度生物计算用AI首次实现mRNA领域重大进展 ...

[复制链接]

1598

主题

709

回帖

6633

积分

论坛元老

积分
6633
发表于 2023-5-5 09:27:14 | 显示全部楼层 |阅读模式 来自 江苏南通
原标题:登顶Nature 正刊!百度生物计算用AI首次实现mRNA领域重大进展
, o2 h: D( n8 _# U# J                          1985年11月21日的《自然》封面,是一张来自中国的“地图”。这张地图是清代总兵陈伦炯所编撰《海国闻见录》中的插图,是中国人开始认知与探索世界的见证,而选用这张封面,是为了配合当期的特别文章《科技在中国》。
& I0 {- c; [# t# [2 d) \$ g5 k% i 那时候,中国正处在改革开放的浪潮中,中国科技登陆国际视野还显得惊奇与稚嫩。
& a/ I3 _# A  Y' K6 w; j  a: f 一转眼,38年过去,伴随着中国科技的飞速发展,越来越多的中国科研工作者、科研机构以第一作者的身份,登上被称作科学金字塔尖的《自然》。
( K7 v8 q' [% x 5月2日,《自然》杂志正刊发表了百度在生物计算领域的突破性研究成果,并以“加速预览”(Accelerated Article Preview)形式最快发表。
' ]/ h% O1 n; w- B: _& { + c9 o, T9 L: E0 Z# A" S
在这篇题目为《Algorithm for Optimized mRNA Design Improves Stability and Immunogenicity》的文章中,提出了mRNA序列优化算法LinearDesign。其不仅开创了AI与生物、医疗等领域融合突破的诸多可能性,也为中国科技走向世界画上了新的一笔。
4 F* G$ u5 R5 E 在这篇论文里,我们可以读到远超其成果本身的内容,比如AI的诸多可能性、一家科技企业的科学担当,以及中国科技走向世界的远大胸怀。$ c% {6 ]8 l+ j2 z
“出人意料”的生物计算
8 H' W" H7 H" p  _. }8 h; Y 相信大家都知道,《自然》只收录那些在基础科学领域具有突破性与重大意义的研究。; D( {7 X# M: v6 j  V7 [
或许可以说,百度在生物计算领域的探索,生动讲述了什么叫“永远不要低估AI的可能性”。
$ q) r% O& R( t; J 这件事要从新冠疫苗讲起,虽然疫情的阴霾已经悄悄过去,但这场疫情让全球看到了疫苗,尤其是mRNA疫苗在公共卫生事业的重要性。
8 C5 S! H! a" t/ Q2 U9 y 所谓mRNA是一种天然分子,其可以产生靶标蛋白或免疫原,从而激活人体的特定免疫反应,以对抗各种病原体。并且其具有mRNA不带病毒成分、没有感染风险、研发周期短等重要优势,是人类对抗新冠疫情的杀手锏。; o' a! ^1 m2 c% z: A
但如此重要的领域,在疫苗和药物研发中依旧有一些问题,比如如何才能高效设计出稳定、成药性更好的mRNA序列?- t9 X" Q7 G' L9 A
为了解决这个问题,百度基于在AI领域的积累“出人意料”地将AI技术与疫苗研发结合,研发出了登录《自然》杂志的LinearDesign算法。! O* K7 B$ a1 I! w9 ^7 R4 L
这一算法运用自然语言处理中网格解析(Lattice Parsing)技术,对mRNA疫苗序列进行优化,从而提升疫苗的稳定性和有效性。
# [% l+ v; L0 a  @
' Q8 Q: g2 J9 T1 @+ `2 O% m (美国心脏病学家和基因组学家埃里克·托普(Eric J. Topol)在推特上分享百度LinearDesign算法), r* t5 k9 L$ [3 h* B- ], J) O3 o4 H
这里划个重点,LinearDesign算法可以说是用语言学领域的知识去攻克了生物医疗上的难题。两个领域虽然不能说毫不相关,基本也是相隔万里,但是百度对AI技术的探索,却让二者完成了千里姻缘一线牵,LinearDesign算法由此诞生。
( q* U) ~* O/ {8 C( W1 X! g 2020年5月,面对汹涌而来的疫情,百度研究院推出了全球首个mRNA疫苗基因序列设计算法LinearDesign,并宣布向全球疫苗研发机构及研究中心免费开放。LinearDesign能在16分钟完成新冠病毒的mRNA疫苗序列设计,极大加速新冠疫苗的研发效率。7 J5 o0 _* \/ e& t  r
以新冠病毒的Spike蛋白为例,若采用传统方法寻找一条稳定的mRNA序列,需要查看10632个mRNA序列,堪称天文数字,但用LinearDesign算法,却可以在11分钟之内找到最稳定的候选序列。
6 m+ d# R: p$ v  G# ?! f6 S, a + Z' y% h! W9 b0 K$ x
2020年12月,百度凭借LinearFold和LinearDesign算法在新冠抗疫中的杰出贡献,荣获国际顶尖人工智能峰会The AI Summit举办的 AIconics奖项的首届“AI For Good(人工智能向善)”奖。
* E3 M7 }) \8 `9 A 在应用价值之外,LinearDesign算法还展示了AI作为一种底层科学探索工具,在生物与医学领域的全新可能性。这种跨越学科的突破力,是《自然》杂志乃至全球科学界更为珍视的。
+ y* o; W% O; {+ w 打开AI的深度与广度  x* F8 d' i, O( w' r0 ~
为什么百度能把LinearDesign算法这种AI+生物计算研究做大做强?这可能是我们必须读懂的另一个关键信息。
" N, m" N( ~8 Q 其原因无他,千锤百炼而已。从2012年AI方兴未艾,到今天AI火爆全球,这期间百度对AI技术的坚持和探索是始终如一的。这种坚持,渗透到了AI技术的各方各面,包括基础设施研究、算法迭代,以及AI的跨学科融合。其中非常多的领域充满未知与挑战,也不符合传统意义上企业对短期利益的追求。但构建坚实的基础设施,探索前瞻性技术布局,却是一家企业赢得未来的关键。
! ~( c" H# |' q0 ^! k9 R" t+ r
/ f+ R: X+ A/ G9 L AI+生物计算,作为AI技术的延展性方向,更能体现出百度“淡化短期利益,着眼长期发展”的技术布局思路。生物计算可以解决蛋白质分析、新药研发等关键问题,其价值巨大,以新药研发为例,这个领域具有一种“3个10”特征,即10年、10亿美元、10万人才能研发出一种有效的新药,而如果用AI作为药物研发引擎,将可以极大程度改变新药研发的范式,带来难以估量的价值。
1 |" X# u2 ~* q1 U! o8 P 这条路价值虽大,但充满挑战,在短期内都难以实现商业回报,但百度依旧愿意依托AI技术与基础设施的优势,提前布局这条未来之路。早在2018年,百度就正式启动了计算生物方向的研究。几年过去,百度在这一领域已经构建了基础设施、算法、生态合围而成的立体创新版图,比如刚刚提到的LinearDesign算法、可以极大加快RNA结构预测速度的 LinearFold 算法,一系列创新开始勾勒出百度在生物计算算法层的差异化优势,而基于飞桨生态打造的生物计算平台-螺旋桨PaddleHelix,则开启了AI+生物计算底层开发工具的构建,为产学各界探索生物计算奠定了基础。面向产业生态,百度为产业提供了面向化合物分子、蛋白分子、基因组学信息等领域预训练大模型,将自身的技术优势积极投身到产学研协作当中。就像在AI基础设施层面,百度强调技术、生态与基础设施的并行,在生物计算领域,同样的战略落地方式也推动了百度自身与生物计算行业的积极发展。$ I; f9 S0 g0 r/ [, N4 _
企业进行跨学科探索与底层技术创新,强调长线程和重积累,只有构建出完整的技术序列、技术体系,才能在此基础上一鸣惊人。无论是在AI+生物计算领域,还是更为基础的AI技术上,长期主义,始终是百度的王牌。( y/ g  Q0 _% l2 Q* C) ]  r8 R
这样的以重积累换取高效率的逻辑,展现在百度技术创新的方方面面。比如文心一言发布后的1个月内,完成了4次技术迭代,相较最初版本推理效率提升了10倍。这种技术迭代与产业化应用的效率从何而已?其中,飞桨支撑了文心一言从开发训练到推理部署的全流程,并且通过联合优化的方式,大幅提升了大模型的训练与推理。从中就可以看出,底层技术与工具链的长期积累,为新技术的高效率升级奠定了基础。, x( G. k1 m* k  ]9 k" F, ^1 a
百度是如此打开AI技术的深度,中国科技也是如此打开走向世界的广度。/ t( ]4 W% j, Q& d0 A: h1 w7 B' \
大国科技走向世界5 G1 P& G3 n5 \* Z# W
1985年11月,《自然》杂志探讨了中国当时在高能物理、空间探索、地震预测等领域的科研水平,向世界展示了一个具有蓬勃科研创新活力的中国。9 P7 z2 x+ z! p, r. x# \: M
2008年7月,《自然》借着北京奥运的机会发布了中国特刊,向世界介绍了“中国目前论文发表数量比除了美国以外的其他国家都要多”,确定了中国科研实力的地位与价值。: D8 y* P5 s0 p0 @' \/ P$ I7 b# z
几十年来,《自然》里的“中国元素”,可谓与中国科技发展完美同频,比如在1997年时《自然》发表的原创科研论文中只有0.4%涉及中国作者,2017年已增至约15%。这个数字的变化,恰好佐证了中国科技走向全球的变迁。" Z' P$ q( v# k4 d% R- {& i# ~
在这个过程中,一个角色是不可或缺的,那就是科技企业在整体科研环境中扮演的角色。自信息革命以来,我们可以在欧美发达国家的科技版图中,看到很多重大创新都是由企业来完成。以AI+生物计算为例,DeepMind打造的AlphaFold2广受关注。而谷歌母公司Alphabet,已经在持续推动这一算法在医疗健康、新药研发等领域落地,打造了ChatGPT的OpenAI,也在AI疾病诊疗、AI蛋白质结构预测等领域进行着探索。, O3 k+ v- a" F  @) |$ V

7 q3 C4 K; q% t 从世界范围内的趋势来看,AI+生物计算这一重要领域,主要创新阵地应该在科技企业,并且需要以科技企业为核心,形成产学研互动的良性生态。而百度在生物计算领域的布局与进取态势,则在中国科技版图中补完了这一环节。9 d7 R7 W/ K7 q/ v/ T
中国科技走向全球,走向科技自立自强,离不开企业科研能力的不断升级。从这个角度看,百度生物计算以第一完成单位身份在《自然》发表论文,可以看作一个新阶段的信号。1985年,是世界看到中国科技;2008年,中国综合科研能力跻身世界前列;今天,中国的科学家、学术机构、科技企业,都能作为第一作者登上《自然》,证明中国已经具备了多元化,立体化的科技能力。7 n4 F+ ]% Z0 b6 m% |- b
中国科技的创新性和独特性,已经从学术界延伸到产业界,更具有世界眼光,更具有大国担当。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-3-17 11:58 , Processed in 0.041154 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表