|
|
中新经纬 2 月 23 日电 前 Google 高级资深研究员吴军有一部著名的小说《浪潮之巅》,其中写道," 总有一些公司很幸运地、有意识或无意识地站在技术革命的浪尖之上,在长达十年甚至几十年的时间里,他们代表着科技的浪潮,直到下一波浪潮的来临。"; }0 a; D! a7 m: A4 p8 f- K* O
这样的公司,站在了浪潮之巅。# t6 E- K: H8 u1 H, ~3 @- @, J
当眼下这波由国外 ChatGPT 引发的科技浪潮向中国席卷而来,人们也在 " 众里 " 寻找,谁能做出中国的大语言模型?谁会站在新的浪潮之巅?蓦然回首处发现,百度具备这样的综合实力。
; f7 y& }' M& t9 l, U# g百度也积极地对市场关切给予了回应。2 月 7 日,百度确认生成式 AI 产品命名为文心一言 ( ERNIE Bot ) ,并将在 3 月份推出。很快,22 日,百度在 Q4 及全年财报发布当日宣布,计划将多项主流业务与文心一言整合。
3 G1 l5 ], L4 i6 N" v' H7 n' s' q摘明珠的人
. N4 t7 t! u% G5 `( ?, I百度文心一言站在浪潮之巅,也在蓦然回首处,对这句话的理解,要从两方面。
+ n. P+ x5 d1 q7 j* B作为 AIGC ( 人工智能生成内容 ) 最成功的应用,ChatGPT 本身是一款自然语言处理 ( NLP ) 大模型。而 NLP 被称为 " 人工智能皇冠上的明珠 ",谁能实现自然语言处理技术的突破,谁就能在 AI 领域一骑绝尘。
5 V+ h: c" C. t百度已经摘到了这颗明珠,站在了浪潮之巅。
+ n/ k2 T1 u! f" l而之所以身处蓦然回首处,则是因为百度这个 NLP 领域已经默默深耕了许多年。
9 F0 e4 V/ X0 p早在 2000 年百度诞生之时,准确说从百度处理用户的第一次搜索开始,NLP 技术就成为搜索技术的重要组成部分,并伴随着百度的快速发展,同步甚至更快地发展壮大。6 j P0 S: N) [) n$ J
2010 年初,百度对 NLP 的工作进行了重新梳理与规划,百度自然语言处理部正式成立,并不断在语音、图片等技术上布局,敲定了在知识图谱技术上长期投入的战略。
( B; e9 V, r. q2019 年 3 月,百度提出知识增强的语义理解框架 ERNIE,在深度学习的基础上融入知识,同时具备持续学习能力,曾一举登顶全球权威数据集 GLUE 榜单,首次突破 90 分大关,刷新榜单历史。0 j4 I4 W1 a2 v. l4 F0 N1 ]
也就是从 2019 年开始,业界进入开放域对话大模型的研究,这个技术让生成式对话有了质的提升。
& D5 C1 f1 A( C( H- L; `" b8 c) s2021 年 9 月,百度发布了 PLATO-XL,这是全球首个百亿参数的对话大模型,一举超过 Facebook Blender、谷歌 Meena 和微软 DialoGPT,成为全球首个百亿参数中英文对话预训练生成模型,再次刷新了开放域对话效果,打开了对话模型的想象空间。
3 Q& s! [& y' _3 c! e3 c7 |当市场惊讶于百度能以如此快的速度向用户推出文心一言时,知情者才知道百度这种底气来自于强大的 NLP 技术实力。
n$ c9 g% P0 O7 |. i你无我有,你有我强6 P: d, y3 N4 V& J
除了强大的 NLP 技术实力加持,百度快速推出中国大语言模型文心一言,其他工作绝不是从零开始。
: ^4 E6 j0 p/ y6 P& M; H, S当人类进入人工智能时代后,IT 技术的技术栈就发生了根本性的变化。过去基本分为三层:芯片层、操作系统层和应用层。现在可以分为四层:芯片层、框架层、模型层和应用层。
# l8 F3 m* |5 Y5 I) |5 n而对于百度而言,其在芯片、框架、模型、应用四层技术栈均有布局,又得益于这四层技术栈,大语言模型相关技术,百度在中国乃至全球范围均具有综合优势。
4 u; e1 v& M( j1 F( Y具体的,在芯片层面,百度自研 AI 芯片 " 昆仑 " 已在多场景实际部署几万片,在百度搜索业务中也已形成较强工程化实践,这让文心一言底层算力有所保证。
0 K/ `9 {* k9 b) u- r5 \在框架层,飞桨深度学习平台下接芯片上承应用,提供了从便捷开发、高效训练到满足多端多平台推理部署的全栈能力,大幅提升了 AI 深度学习模型的研发效率。; W# ]6 A) f+ K$ a) e( I4 M/ \. ^
在模型层,百度的文心大模型和 Open AI 的 GPT 模型类似,并在 2019 年就已经推出,迄今已经迭代了多次,从单一的自然语言理解延申到多模态,包括视觉、文档、文图、语音等多模态多功能,且已在行业得到普遍应用。因此文心一言所基于的 ERNIE 系列模型也已经具备较强泛化能力和性能,足够为用户提供相应的服务。& I& P2 L" ]' ~* |9 E5 |3 w' x- C0 _
在应用层面,百度深度学习技术与场景融合创新,应用场景日渐丰富,人工智能技术与实体经济也加速融合。此外,还催生了一批新业态新模式,有望深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。) W8 R7 E5 H3 x: e' `
其实不难发现,当科技浪潮席卷而来,百度之所以能站在浪潮之巅,很重要一个原因来自于超前布局,早期的投资奠定了百度在人工智能浪潮中的有利地位,也让百度在市场竞争中掌握先机和主动权,成为中国人工智能市场长期增长的最佳代表。最新财报显示,2022 年百度核心研发费用达到 214.16 亿元,占百度核心收入比例达 22.4%。+ h, P5 E$ ]3 F) F" u1 [
& g$ z4 K, v# ^ D! t$ r
% q# Y9 b7 h% I
2 `! r% g; r) R
看得最远的地方
" J! x9 z% E( Q8 Z虽然这股科技浪潮由 ChatGPT 而起,但必须理性认识到,ChatGPT 并不是革命性的技术。直接点说,ChatGPT 并未实现底层模型的显著突破,它基于人类反馈进行强化训练,给人带来了一种更加智能的感觉。; p8 s o- e9 T# V# V
而百度实际上正在思考更远方的问题,即如何把技术做成人人需要的产品,让人们从中受益。
: Q8 ?" g! P! ]4 @/ o4 A9 U百度创始人李彦宏曾说:"ChatGPT 是 AI 技术发展到一定阶段后的新机会。怎么把这么酷的技术,变成人人需要的产品,让每天有几亿人从中受益?怎么赋能千行百业,让他们的生产效率大幅度地提升?这一步才是最难的,也是最伟大、最能够产生影响力的。"3 ?5 J! ^. |2 |* W/ P
这也就预示了,实际上也是可期待的,百度文心一言,要走比 ChatGPT 更远的路。
( \/ n: P" i% v- v. { y在发给百度全员的财报信中,李彦宏还重点介绍了将在三月份推出的生成式 AI 产品文心一言 ( ERNIE Bot ) ,宣布计划将多项主流业务与文心一言整合,包括搜索、智能云、Apollo 自动驾驶、小度智能设备等。
0 m) ] ^: Y4 f$ `* ~5 D以搜索业务为例,文心一言推出后,将与目前以 " 知一 "" 千流 " 为代表的搜索引擎相互协作,共同为用户提供服务。可预见的是,与传统的搜索引擎相比,接入文心一言后的百度搜索,可以提供更加智能化的答案,免去用户从上到下依次点击链接进行确认的步骤。而这一变化也有望为百度,甚至为整个互联网行业带来收入形式的革新,并拥有极大的想象空间。
! i- Z: x, |2 z* d# b) j6 w此外,百度将开放文心一言大模型,支持更多企业构建自己的模型和应用,赋能交通、能源、制造等实体经济领域,实现生产效率的大幅提升。0 w) U- A8 o+ e7 [) }
在不久的未来,因为文心一言,AI 市场将迎爆发式需求增长。# Z1 S3 N2 N3 m
此外,还有一个容易忽视的细节是,文心一言所基于的文心大模型,是地地道道的本土化的 AI 模型,具备对中文、甚至中国文化的更深理解,这意味着文心一言会更适合中文和中国市场。4 ~+ g- I8 @4 V6 e5 C( [* t
而且,随着 ERNIE Bot 的公众开放,有望建立起立真实的用户调用和模型迭代之间的飞轮,模型将越来越聪明,给用户带来更加聪明的体验。 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|