|
|
编辑部 发自 凹非寺$ ?: {. z9 W5 }$ Z. o
量子位 | 公众号 QbitAI
1 s' i, [$ b# ~- H$ H+ R8 O GPT-4发布一天之后,压力全部给到百度这边。
5 l9 a& v9 S1 V( z+ `# ?1 G 就在刚刚,百度交卷。; E/ G4 U) N( K, F0 N; N) \
文心一言,百度全新一代知识增强大语言模型,正式在百度总部“挥手点江山”会议室里发布。
" G. @* r- G1 g# \3 i( i: c6 N( v 在一片静寂的氛围里,李彦宏小步登场,语气里带着点紧张:9 H% x1 l. W% ?0 N
大家的期望值,是我们对标ChatGPT,对标GPT-4,这个门槛有点高(笑)。
T* `% ]+ i) m4 _ 十月怀胎,我们就带大家来看看这个AI大模型文心一言长什么样。
6 g: W- F& A6 U" ^' `
0 E9 q; z/ f1 j J3 P" `( z 此前,有人狂转meme图把百度比作GPT-4旁边的垃圾箱。4 J1 ?' C- Z9 n: r% G" Z; X5 S: }4 {
3 V. O3 Y3 a- ^8 L. V
也有人鼓吹百度是全村的希望。3 n9 S/ O9 E9 E% f
而在发布会进行的同时,百度港股市值大幅下跌,相关话题还冲上了微博热搜。9 d3 ]1 @- B3 V
) a% ^' h" c7 q& Y6 ^
但直播弹幕中也有网友点赞:& d8 q8 v9 [1 t( S! \9 ?
) O4 Z1 T }2 [
那么这个中国版ChatGPT到底实力如何?* r. l+ Z9 _/ t; c, V
咱们就用百度发布会演示的预录制Demo,对比一下崭新出炉的GPT-4,先凭实力说话。, s2 [6 O% A1 N/ K# \8 k
文心一言 vs GPT-4" e1 G" Z9 [4 Z2 M4 Y* o
和GPT-4一样,文心一言是一个多模态大模型。
# C$ o" ^3 I/ e1 `9 } 李彦宏开场就展示了文心一言具备的5种能力,包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。+ C2 v( `# l7 G( z" W3 D6 L1 }
文心一言甚至还现场秀了一口接地气的四川话,现场网友发出一片笑声。( r7 a/ k1 d; s5 f2 Z K0 H* e" c3 H
其他能力如何?我们具体展开来看。
$ V. d+ X8 P9 m! S _6 K Q/ k% S. M 文学创作/ K- Y' Y( T" N! }8 b
在文学创作上,李彦宏一开场就搬出了《三体》作者刘慈欣坐镇。" h% v: C. S. q z% V
先让文心一言介绍一下大刘,“毕竟我也是刘慈欣老乡嘛”:% D' Y) K. J% D
" w! g0 `1 e6 ` }: R9 n! X& ?. H 看起来没什么问题。同样的问题问问GPT-4呢?
9 d1 [4 G* D! @7 t; U4 l. E
: |" L/ X% I$ A$ x& ] 嗯???直接把刘慈欣的老家挪到了湖北省洪湖市。湖北人狂喜(doge)' a4 W: R" t5 a% n& P
随后,李彦宏又展示了从哲学的角度对这段文章进行续写的demo:9 B# _4 ^, A( O
- _) d* U7 h4 `
看起来中规中矩,比较理性。老样子,我们也来与GPT-4进行一波对比:# e: g1 ]0 z3 y( S$ h- r
3 U+ B' {. W: A8 k1 l" I
这波你是想看GPT-4续写的《三体》,还是文心一言的?+ H6 u5 C4 [6 f
再来看看《三体》电视剧中扮演史强和汪淼的老搭档,于和伟和张鲁一,有什么共同点?* Z1 A/ a% G$ z( y0 K
* v) g) A4 B" g+ b
也没什么问题。
& W4 Y" q2 P E# ^+ H; V: f 就是看起来展示的速度有点快,比李彦宏的语速还要快上那么一点点(手动狗头)。
5 N: l, W) n2 J C
0 P9 z2 a, V+ g% k# { 商业文案创作, D; z% e2 o7 |) u
接下来,李彦宏又展示了一下文心一言在商业文案创作上的能力。
0 s1 ^2 E8 M5 M8 {: M: } 比如给新公司起个名字。
f N) u% m3 K3 ^2 d( u& z / x" t; y7 T, J+ ~" x+ ~8 V
并且这个名字它还不是瞎起的:
" ]* a: p9 m7 [* n- Q
- x0 P) v) e" X2 y% i( P1 g 再来看看GPT-4起名的效果?
+ `: m- b r- S' b8 J h4 i( z 9 y' b/ q7 t$ g8 F5 _
看起来,GPT-4对中文的掌控能力相比之下还是少了一点精髓。' W% y, G2 o$ ?0 g6 {7 G7 b" `
至于写个公司成立的新闻稿?对文心一言来说似乎也不成问题:
, T: s4 J; h; q9 a b0 X+ E7 P4 v / Q9 \' b3 ?* t" a3 Z+ c
数理逻辑推算$ u# q- D6 L/ \ d# X
数学能力,是考验生成式大模型的一大难题。ChatGPT刚上线时,也翻了不少车。
# s7 ?. t) n* }- p& j' l 不过在现场,文心一言处理的数学问题不算复杂,是小学数学竞赛常见的鸡兔同笼问题。 _+ T: k9 d6 o" y- U
. w6 k5 z$ ?- J7 q/ ]4 \
彩蛋是,李彦宏现场展示的第一题,引得文心一言说出了《狂飙》里高启盛的经典台词:这题出得不对。! q" X; }' X1 T5 y% E
c7 A( k& F/ T, r' p
修改一下题目,OK,再扔给文心一言试试:
/ p8 s7 l5 L8 d% \ / ]5 x; z. N# C9 n
看起来,答案还算是有理有据,一步步逻辑推理出来的那种。
. w" @6 T6 G/ d- a7 A 李彦宏表示,这些题“不敢说百分之一百能做对,但至少体现了文心一言的思考历程”。3 P1 W7 R0 }3 j5 t$ ]& M) t; b
中文理解# D. x6 q( _6 M. A, H
接下来,李彦宏着重展示了一下文心一言对中文的理解能力,并特意强调:
+ L8 y3 C5 v' H u5 [ 文心一言对中国文化的了解,理应超出任何一个预训练大模型。
% G- J3 `9 H5 X/ q$ ~+ |4 I. U 一上来就是一个成语,“洛阳纸贵。到底有多贵?”3 x4 t2 A, W; e/ B; Y W `
. t3 \4 @9 Y( D 这是文心一言的效果展示:9 J5 a" S2 q4 K# e( v: M( X
8 p! d: `. X0 F& T* N, v 还解释了一下这个成语背后的经济学原理:
3 q; C+ m! ?; n$ x; k0 q
?3 F6 ~1 S% }* j. V- y 那么,将这个问题抛给GPT-4呢?首先问问它,知不知道洛阳纸贵是什么意思:
3 |4 I& U2 I6 u' x- Q* f
. ?+ M, y" |6 Y \ 接下来,再问问他对应的经济学理论是什么:
* P: |# Q, L( V0 W5 t. \1 l2 Y
( u: w; m* S7 J0 p' O2 {9 z 这波看起来,GPT-4的中文理解似乎也不输文心一言啊。 E4 K+ R: Z* j4 q' `
那么,再来看看二者写藏头诗的能力?
" m# d) K2 U7 }" M, L' @ 首先是文心一言的效果展示:/ i# j0 P0 }8 r
4 u$ F, c, {. ]6 I- M5 C3 N
接下来,我们再看看GPT-4怎么说:8 B# P2 g- p- H$ s! P
0 n5 U4 T: [: `* A 诶,看起来反而是GPT-4没有真正理解“藏头诗”的含义。
/ K0 J6 N3 @' p) \' X8 C 这波文化理解上,属实是文心一言“小胜一筹”了。2 }: N5 X( \* n) b; J. f
不过在英文上,李彦宏也承认,虽然文心一言也能处理,但能力是显著不如中文的。# [4 f; Q+ ~' N/ y- A
这也和百度目前能用到的训练数据有关。3 E& H2 o% z4 p
多模态生成
$ J7 y6 j$ C' I* p 最后,李彦宏还简单展示了一下文心一言多模态生成的能力。% c6 t' Y7 d! n# G
首先来看看,为即将到来的2023世界智能交通大会创作海报——
9 S7 C1 x ]) k. o r
0 M# I2 U+ U4 S0 L+ u4 r7 p 而除了前文展示过的文字转四川话能力,文心一言还能文字转视频。# P. b6 s$ _3 p6 _
李彦宏一句指令“将以上内容生成视频”,很快啊,不到几秒钟,文心一言就把字幕和视频做好了:8 U& N t' l/ F/ ^! m
: Z! d5 S* [+ N
有些遗憾的是,在ChatGPT被频频称赞的编程方面,文心一言并没有现场展示相关能力。
- T, r0 X8 C) i) X) e 但王海峰透露,文心一言的训练数据中同样包括代码。9 g& p R, m1 Z+ Q. \: |" @$ r Q
文心一言如何“跑通”?
], {5 v, b6 |3 L1 x* D 正如ChatGPT脱胎于OpenAI的GPT系列,百度这次推出的文心一言(ERNIE Bot),背后也正是基于文心大模型技术打造。9 w# A( o! W/ \
据王海峰介绍,文心一言主要脱胎于两大模型:" j0 `9 z' ?' S; C6 Q0 }
百度ERNIE系列知识增强千亿大模型,以及百度大规模开放域对话模型PLATO。3 H( \1 i6 _1 |: i& g0 G2 Z/ v6 Y
在此基础上,主要采用了六项核心技术。( D+ {* E0 D* n; R
其中三个是广为人知的大模型技术,包括有监督精调、人类反馈强化学习(RLHF)和提示构建。
+ t7 f1 Z G9 g7 | p.s. 人类反馈强化学习也是ChatGPT的关键技术。
, v6 r% ]' N' f2 I7 h1 ~# f* T 另外三个,则是“百度比较有特色”的技术,包括知识增强、检索增强和对话增强技术。
4 U0 Y$ M. s/ y/ N8 X
, y: O/ y% a; p4 @$ q( t$ T 首先来看与ChatGPT类似的技术:有监督精调、RLHF和提示构建。0 X( D1 h( k2 \
有监督精调,尤其指中文方面的数据精调。百度基于对中国语言文化和中国应用场景的理解,筛选了特定的数据来训练模型。3 y. P% y G3 @% w( c
+ u2 b3 r4 a" w- X3 h5 F4 Z 至于人类反馈的强化学习(RLHF)和提示构建,操作上也与ChatGPT大差不差。
/ F3 j/ _* A: C8 \
2 {& A* q. V1 F6 `4 v' [; b' X 随后是百度提出的、用于进一步改善模型效果的技术。
, k; R; ?; A6 M* g3 ~ 知识增强,包括知识内化和知识外用两个部分。其中,知识内化即将知识“渗透”进模型参数中;知识外用指的是模型可以直接使用外部的知识。5 b" y" ]: B" q% d1 h1 }
) O9 J* @0 R% k# {* N
检索增强,则与百度搜索引擎积累的检索技术有关。5 H( `: Q0 |2 Z7 h8 h% x
百度将把检索技术和生成技术结合起来,先对内容进行检索后,将比较有用的部分用于生成,再整合输出结果:* }8 x" |* b8 V! B& |7 z
. b I. S! o# ^: ~3 K8 U/ L$ V
最后是对话增强部分,包括之前百度积累的记忆机制、上下文理解和对话规划等技术:
7 X) s7 c+ `% N4 Q" q9 Y F# _" L $ h! V, r2 E! _, i `' p8 z
概括来看,文心一言表现出的能力,被李彦宏称为“智能涌现”:
) [7 e+ R) r9 ]8 |- i 当参数达到千亿量级,训练语料达到足够多的情况下,这种现象就会发生。. H6 i1 c1 g" u' m+ m. T
目前,百度拥有的AI技术可以分为四个部分,芯片(昆仑芯)、框架(飞桨)、模型(文心)和应用。) q) j4 I V* l6 ]7 e( g
之所以软硬件都要布局,百度称,是为了降低成本:9 N b6 S5 X( a& M
生成式AI需求的算力非常高,费用相当昂贵。
2 g/ d; b, ?" P7 ]' c. {! q. a2 v8 e 因此,如果在四层架构之间相互进行协同优化,就能让它的效率比别人更高,从而显著降低成本。
- K! J, d8 A; m$ B5 o1 ~- y s7 Q 李彦宏认为,这也正是百度的优势所在:
) L' C s% v3 q+ q, G, r ]" l2 y# [0 d 四层都有领先产品的公司,绝无仅有。
, G- u4 @, Y e5 H6 W* } # k- [$ w' R7 ?/ z, M
这次文心大模型背后的硬件算力,也是通过百度智能云提供服务。
' u l9 N; p6 A' V9 w1 k 目前,文心一言已经接入百度搜索,目的在于提升搜索资源效率。# y" e# u3 G7 C
同时,包括小度和自动驾驶Apollo等产品,以及爱奇艺等公司也已经接入百度的文心一言模型。
0 k+ ]7 o" Z: ?- a u k x& h5 g1 w3 _8 B1 |- R0 t! c- }
网友:看来还不用提前退休" t1 S" W. v# A. }4 c5 P" s
截至发稿,百度港股股价在一波明显下跌之后,有所回弹。
o s- z" d% q/ S* R. S1 U1 [ 1 v! h9 ~8 q- L7 j# |
发布会结束,网友反应最多的是“提前录制有点败好感”:& ]. C$ s; s. @+ Q& e& E
3 a# N; F3 @& [- d: z
- ^* N6 @# y7 p; z. q8 o( y
对于这一点,李彦宏的解释是,给出的问题都比较长,为了节约现场时间,所以才用了提前录制的形式。1 x9 ^2 Z' w6 W3 K* t/ ]: b6 m/ d3 M& b
还有不少网友对文心一言展示出的能力不太满意。有人调侃,看完之后感觉“提前退休的日子看起来还可以缓一缓”:
( x% X6 c: [! \5 G0 E3 Q
/ M& x3 r, K# j$ [2 Z 离GPT-4还差了20个老胡。
8 C# T. b/ I3 r, Q3 L9 F, E% _2 M: E $ Y2 Z9 {; y7 H! T c& S
还有网友感觉,文心一言的发布会像极了毕业答辩的自己(doge):
: `! ^4 G5 q+ ~; @. c. g
0 f6 l2 R# u4 c3 z( w q c 不过也有网友表示,希望能给国产产品一点时间一点耐心。
N0 Y9 k4 S5 b+ [+ |: b
% M7 t1 y( G- D 发布会末尾,王海峰宣布,文心一言将从今天开始对外进行测试,包括个人用户和企业用户。
7 ?- N- U, q5 A7 \5 w 是骡子是马,相信接下来,会得到更多验证。1 a- o# h- d' o+ S) T/ H* L
One More Thing* V4 d3 a/ S" E2 W, {3 ?* A* j
对了,有网友表示,已经拿到了文心一言的内测资格:
3 m9 y. i- r* o: L. P) Q, k9 a 你好,感谢您体验文心一言,体验地址:
- _+ U0 J8 K- Q+ v% U8 c4 t9 D7 S4 o https://yiyan.baidu.com/welcome,希望您在体验当中给予更多意见,文心一言邀请码:KFCVME50RMB,2023年3月16日24:00前有效。
2 w9 O" N" {9 }% d. k, Q% {8 w 嗯,万物疯狂星期四(手动狗头)。 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|