|
|
编辑部 发自 凹非寺; x* Y4 |5 B1 I6 S0 Q
量子位 | 公众号 QbitAI6 t+ i9 g: }! W! q/ x( \
GPT-4发布一天之后,压力全部给到百度这边。2 c! R. I( A5 {- v0 j
就在刚刚,百度交卷。/ J" r0 ]$ `9 y5 v. C+ g
文心一言,百度全新一代知识增强大语言模型,正式在百度总部“挥手点江山”会议室里发布。
1 S d& f7 T3 E" V" d+ v+ a1 K9 ]7 P0 y 在一片静寂的氛围里,李彦宏小步登场,语气里带着点紧张:$ p0 t* R+ g9 T4 |3 K7 x
大家的期望值,是我们对标ChatGPT,对标GPT-4,这个门槛有点高(笑)。4 X& j( @: w: w/ `3 _
十月怀胎,我们就带大家来看看这个AI大模型文心一言长什么样。9 }& h3 B1 Q% @) ^
( J: S* x) R4 P* ?
此前,有人狂转meme图把百度比作GPT-4旁边的垃圾箱。% W3 K g+ E! h& h0 B- F- @; k
/ ~- q$ _. U& _& M4 L+ M3 B 也有人鼓吹百度是全村的希望。
* b0 C" C- \3 ^7 z 而在发布会进行的同时,百度港股市值大幅下跌,相关话题还冲上了微博热搜。2 f) P+ ^ U7 l: {( b) p; P2 g
; M- n8 ?& k8 O' a1 V' ~/ e
但直播弹幕中也有网友点赞:
8 i1 p. t2 ?" Z7 j$ ` / h/ }6 R* i7 s- r- s C. P- Y: I
那么这个中国版ChatGPT到底实力如何?
2 ~ a* ~+ x. n& J, C* ^ 咱们就用百度发布会演示的预录制Demo,对比一下崭新出炉的GPT-4,先凭实力说话。
J; T& L& H/ I% Z 文心一言 vs GPT-4
. E3 q5 q1 E& S: @1 i 和GPT-4一样,文心一言是一个多模态大模型。
2 M L# e: i0 ~- ?" Y% O$ ?! s 李彦宏开场就展示了文心一言具备的5种能力,包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。2 D) m2 K' d6 _5 b, s1 e
文心一言甚至还现场秀了一口接地气的四川话,现场网友发出一片笑声。 e) N" ?1 _ J* X7 m; {! B
其他能力如何?我们具体展开来看。
9 P5 \. D7 J( C, W 文学创作
7 h" `) a( N3 d! O3 v& F$ v) ? 在文学创作上,李彦宏一开场就搬出了《三体》作者刘慈欣坐镇。& T1 b+ x! M% n/ A {0 w
先让文心一言介绍一下大刘,“毕竟我也是刘慈欣老乡嘛”:" E' \+ U7 _' Y& u! [8 p9 ~4 b/ c
% y; Q3 g! P8 I1 A& y 看起来没什么问题。同样的问题问问GPT-4呢?
, ?0 i( n4 g/ H. o
( Q+ @: {& p+ g+ _8 [2 X5 M1 g' Z 嗯???直接把刘慈欣的老家挪到了湖北省洪湖市。湖北人狂喜(doge)
. E# A" r/ }4 g; q# h 随后,李彦宏又展示了从哲学的角度对这段文章进行续写的demo:3 c$ y* q# Z: A9 g
7 n3 s, k, f. b' S U# Z4 J6 D 看起来中规中矩,比较理性。老样子,我们也来与GPT-4进行一波对比:8 U$ P; l t0 d9 s5 L' `: c
y& l- O) A3 S! | z
这波你是想看GPT-4续写的《三体》,还是文心一言的?; R5 Y# v- G, K0 y2 T! ?
再来看看《三体》电视剧中扮演史强和汪淼的老搭档,于和伟和张鲁一,有什么共同点?
" b0 z5 [7 k- q9 R
/ Z z# t; v! J* x7 A6 a. e* ? 也没什么问题。- o, o0 m8 c$ _& l& \/ R5 e
就是看起来展示的速度有点快,比李彦宏的语速还要快上那么一点点(手动狗头)。
( K) u) s) p; s1 G
5 V. i. `- S8 @7 {4 q 商业文案创作
* C9 L8 B; ?4 P% o6 P 接下来,李彦宏又展示了一下文心一言在商业文案创作上的能力。
9 T' k M" ?8 R9 h/ H' m Q, } 比如给新公司起个名字。# S+ J" H/ w- s( C
" F2 u4 ^6 {5 ]+ Z7 m# v 并且这个名字它还不是瞎起的:- z7 K% E0 m% |" T
4 a) J8 u5 O } 再来看看GPT-4起名的效果?# D2 q8 F# Z8 z8 J: G
6 N& M2 L/ P% m' }9 k
看起来,GPT-4对中文的掌控能力相比之下还是少了一点精髓。
# G( t, D: F' s, a! d- F/ J' f* s 至于写个公司成立的新闻稿?对文心一言来说似乎也不成问题:
}. U; w$ |2 l) G7 c4 v
% g" J& b- ^: J# B 数理逻辑推算1 g; B c& i3 ?1 m; h
数学能力,是考验生成式大模型的一大难题。ChatGPT刚上线时,也翻了不少车。: L7 ^% H9 U) H! T2 f
不过在现场,文心一言处理的数学问题不算复杂,是小学数学竞赛常见的鸡兔同笼问题。9 B$ j4 c+ B* @2 Y
6 p! o2 Z8 F0 n# f% I6 d
彩蛋是,李彦宏现场展示的第一题,引得文心一言说出了《狂飙》里高启盛的经典台词:这题出得不对。
0 ?0 Q4 Z: s+ Q, Q/ Y5 F* t# ? I
. o# u1 ~! }' F8 t: \7 N 修改一下题目,OK,再扔给文心一言试试:
, h) j s+ ~% j# Q/ C' O4 Y; { t
6 V! m. T; U- L( T 看起来,答案还算是有理有据,一步步逻辑推理出来的那种。
) ?: i+ ]2 r: N3 x4 V 李彦宏表示,这些题“不敢说百分之一百能做对,但至少体现了文心一言的思考历程”。
5 `: V4 S& R7 h/ C. v% q3 J 中文理解8 Z' `$ G$ H! q J
接下来,李彦宏着重展示了一下文心一言对中文的理解能力,并特意强调:
6 f' e# w9 M \8 m; g1 w, E1 Z7 E 文心一言对中国文化的了解,理应超出任何一个预训练大模型。6 [2 \4 {- `# k! q
一上来就是一个成语,“洛阳纸贵。到底有多贵?”
0 x* e9 P* {6 r2 U7 A* \5 u# y , W6 ~( J3 r* Z+ U$ X8 D
这是文心一言的效果展示:+ }3 ^8 q3 j; m- Y/ J' Y1 L1 L" i
8 ]# p: E/ D( g! N 还解释了一下这个成语背后的经济学原理:
2 o3 W. y9 _) V4 s9 l $ S) T7 h+ R9 j
那么,将这个问题抛给GPT-4呢?首先问问它,知不知道洛阳纸贵是什么意思:
' b& y9 c5 W2 d1 `' s7 _
$ c c$ f8 D" x$ i: G9 |* Q 接下来,再问问他对应的经济学理论是什么:
- r; [# t( Y. s. v) k
5 r/ P0 V% ]; V 这波看起来,GPT-4的中文理解似乎也不输文心一言啊。' \6 k" w6 Y+ a8 b b9 i/ ^
那么,再来看看二者写藏头诗的能力?
$ z$ Q% X; u& R3 ~ I 首先是文心一言的效果展示:
# y0 \- E9 H8 X9 Z L! r2 h
9 i. B8 I6 B8 K: | 接下来,我们再看看GPT-4怎么说:' V& D, ~- A1 e T. Q, t7 j, ^
) W9 V5 j& `/ }7 l 诶,看起来反而是GPT-4没有真正理解“藏头诗”的含义。& s9 A3 t) z4 m+ l+ W+ y
这波文化理解上,属实是文心一言“小胜一筹”了。# n: z# X6 P+ C
不过在英文上,李彦宏也承认,虽然文心一言也能处理,但能力是显著不如中文的。, w) |, @% o9 U, d5 [7 S6 K9 }
这也和百度目前能用到的训练数据有关。& D) b; }9 d9 o2 K& a
多模态生成
( \/ p i/ r6 i9 T8 v6 i 最后,李彦宏还简单展示了一下文心一言多模态生成的能力。7 V* V5 n) F) _* E' y+ I2 X1 Z& V
首先来看看,为即将到来的2023世界智能交通大会创作海报——
' r$ m+ |0 T4 x
+ J8 {" q6 l$ T0 t( l 而除了前文展示过的文字转四川话能力,文心一言还能文字转视频。7 A! M, c% v' k9 F( L6 d
李彦宏一句指令“将以上内容生成视频”,很快啊,不到几秒钟,文心一言就把字幕和视频做好了:2 \; M# Q* K: t* j
- r6 o; _( X6 U5 q1 D
有些遗憾的是,在ChatGPT被频频称赞的编程方面,文心一言并没有现场展示相关能力。* ?3 W9 g. I0 D7 I/ r, V
但王海峰透露,文心一言的训练数据中同样包括代码。6 r" E& h. S [6 |6 O3 f/ ]
文心一言如何“跑通”?
& \6 p0 o8 D9 `9 V$ u 正如ChatGPT脱胎于OpenAI的GPT系列,百度这次推出的文心一言(ERNIE Bot),背后也正是基于文心大模型技术打造。
; `! ^0 q) J: r5 ^ 据王海峰介绍,文心一言主要脱胎于两大模型:
) B- Z+ u8 W4 D4 |; P5 K8 N1 D1 d 百度ERNIE系列知识增强千亿大模型,以及百度大规模开放域对话模型PLATO。
7 H; J7 a- Y6 \ 在此基础上,主要采用了六项核心技术。
4 C6 q3 F% E% ~7 A 其中三个是广为人知的大模型技术,包括有监督精调、人类反馈强化学习(RLHF)和提示构建。
+ X' g: q) @' `! J" a F6 X9 f p.s. 人类反馈强化学习也是ChatGPT的关键技术。1 n# Q, M1 A$ Q
另外三个,则是“百度比较有特色”的技术,包括知识增强、检索增强和对话增强技术。- j6 V+ m! `+ y" k$ J: o
0 g" f$ F- c7 _5 L6 U) V
首先来看与ChatGPT类似的技术:有监督精调、RLHF和提示构建。
6 ?5 X9 }" W: |2 | 有监督精调,尤其指中文方面的数据精调。百度基于对中国语言文化和中国应用场景的理解,筛选了特定的数据来训练模型。' B! C: C% m% a0 U; k$ {
* y/ b# h. \, T! M& G5 J5 x6 t9 ?
至于人类反馈的强化学习(RLHF)和提示构建,操作上也与ChatGPT大差不差。9 n9 h" W9 {( J j' V. ?
% I5 o' c! x$ ?, x: l 随后是百度提出的、用于进一步改善模型效果的技术。
% S1 H, ^2 @. u' j W- x 知识增强,包括知识内化和知识外用两个部分。其中,知识内化即将知识“渗透”进模型参数中;知识外用指的是模型可以直接使用外部的知识。$ }/ @+ d- t6 v8 Z
+ a9 j. x) d3 D6 p
检索增强,则与百度搜索引擎积累的检索技术有关。1 ~ L, l4 O) Y7 i0 b7 S9 H, n
百度将把检索技术和生成技术结合起来,先对内容进行检索后,将比较有用的部分用于生成,再整合输出结果:3 }& C# h/ F' I. g# e3 c' X
" U9 W* U* V" s& j9 A 最后是对话增强部分,包括之前百度积累的记忆机制、上下文理解和对话规划等技术:0 t, Q; H# g$ U& p
( C3 t6 l- N1 n; i7 E: w3 k
概括来看,文心一言表现出的能力,被李彦宏称为“智能涌现”:
: g* q, G0 J4 q4 w; i3 ~ 当参数达到千亿量级,训练语料达到足够多的情况下,这种现象就会发生。
& A# R5 [" B3 u T9 J, o 目前,百度拥有的AI技术可以分为四个部分,芯片(昆仑芯)、框架(飞桨)、模型(文心)和应用。
4 }: p+ Y5 @( h# [3 V1 I3 O, v 之所以软硬件都要布局,百度称,是为了降低成本:
: i% d+ B Q8 ]& S6 r/ z5 d3 d- } 生成式AI需求的算力非常高,费用相当昂贵。
6 |; B! b3 F) o( D 因此,如果在四层架构之间相互进行协同优化,就能让它的效率比别人更高,从而显著降低成本。& {0 ^/ H3 J+ Y' \/ G+ B. p5 ^( k
李彦宏认为,这也正是百度的优势所在:, N* W3 {0 E: A$ {4 W; b
四层都有领先产品的公司,绝无仅有。
' E7 k$ Z* T/ O7 N. a3 o% T+ I( e6 s 2 @! o! Z* F4 p. Y
这次文心大模型背后的硬件算力,也是通过百度智能云提供服务。2 O `$ U# [9 |4 v
目前,文心一言已经接入百度搜索,目的在于提升搜索资源效率。
$ }9 e) ^- @" X9 c$ e 同时,包括小度和自动驾驶Apollo等产品,以及爱奇艺等公司也已经接入百度的文心一言模型。7 S) y# s2 n! W( ?
8 j4 _( C# {* n
网友:看来还不用提前退休
' t: P2 Y# m, Q" L' o# x 截至发稿,百度港股股价在一波明显下跌之后,有所回弹。
+ U$ D5 q2 G" }9 f5 F5 _3 o
5 s5 u n5 @, o5 c: R; b 发布会结束,网友反应最多的是“提前录制有点败好感”:
9 h/ r4 S# M, ~# \+ J 7 ]. x5 ]& P' ~* q3 D- U" {
: h E2 Y* `, D/ I# Z& z 对于这一点,李彦宏的解释是,给出的问题都比较长,为了节约现场时间,所以才用了提前录制的形式。
& d2 h2 s, u9 ]4 S) Q- s, e 还有不少网友对文心一言展示出的能力不太满意。有人调侃,看完之后感觉“提前退休的日子看起来还可以缓一缓”:
2 U1 d$ p8 a2 ~5 V9 ~' H
$ v! v+ D8 a1 U/ ?% d 离GPT-4还差了20个老胡。
8 M& V6 l' m; T7 i7 a. T * e( }4 ~+ \- ]9 C( {
还有网友感觉,文心一言的发布会像极了毕业答辩的自己(doge):, S' [! }: f( x$ V4 o
1 x0 k7 N6 T/ d6 Y7 e) [3 N! n8 W
不过也有网友表示,希望能给国产产品一点时间一点耐心。
$ s3 r Z: O1 a0 l! z9 s* @. O $ ? P% G$ s) Y" T+ g. U* M- \' _
发布会末尾,王海峰宣布,文心一言将从今天开始对外进行测试,包括个人用户和企业用户。
- o4 v8 V( O) L: L: F 是骡子是马,相信接下来,会得到更多验证。. W$ E$ c5 W' z( u* A+ l: R
One More Thing6 ~* @* J& E6 k# T k2 ]
对了,有网友表示,已经拿到了文心一言的内测资格:* d; p- ^+ g! Z7 O. _- r, I: W5 N
你好,感谢您体验文心一言,体验地址:
$ k* D- x. u* a https://yiyan.baidu.com/welcome,希望您在体验当中给予更多意见,文心一言邀请码:KFCVME50RMB,2023年3月16日24:00前有效。
& C7 P% n& ^1 H0 k& X2 e+ w4 y+ ` 嗯,万物疯狂星期四(手动狗头)。 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|