|
|
编辑部 发自 凹非寺
9 J! C% g# v H3 g) W/ L 量子位 | 公众号 QbitAI
0 F* X, ~3 a, N! h( r( j GPT-4发布一天之后,压力全部给到百度这边。
# J- I8 U# m4 m$ |+ U; O0 D 就在刚刚,百度交卷。; r$ O' y# D. ?
文心一言,百度全新一代知识增强大语言模型,正式在百度总部“挥手点江山”会议室里发布。6 \6 e' G) P* `) V) U
在一片静寂的氛围里,李彦宏小步登场,语气里带着点紧张:
' s g$ i0 R& G4 D" K2 q 大家的期望值,是我们对标ChatGPT,对标GPT-4,这个门槛有点高(笑)。9 h& G6 _% p- J; Z, f- P
十月怀胎,我们就带大家来看看这个AI大模型文心一言长什么样。0 k. R$ C C% W# B9 M
& L9 w5 Q/ k% M6 J5 O 此前,有人狂转meme图把百度比作GPT-4旁边的垃圾箱。
8 I6 c7 X t+ v: G* E 1 q- L5 m& d& f" G3 d
也有人鼓吹百度是全村的希望。
8 \6 h: ~1 i0 B( v7 j. m& J 而在发布会进行的同时,百度港股市值大幅下跌,相关话题还冲上了微博热搜。7 F) l2 U( a' W( H1 x; [# f
7 |$ z* ?9 i+ d- d; J# b( d9 t
但直播弹幕中也有网友点赞:
5 g& A9 p" G1 @* w) J( m3 a0 c6 W
2 h/ K; A. o9 c! f( l! Z# W& F 那么这个中国版ChatGPT到底实力如何?
Z! u) h4 ~6 J. O' X! b7 U- ~) b. l& Y 咱们就用百度发布会演示的预录制Demo,对比一下崭新出炉的GPT-4,先凭实力说话。/ T' } d* H6 F4 G) G" d6 t
文心一言 vs GPT-4
; g9 ~8 C3 o/ v" e, n, P9 K) K 和GPT-4一样,文心一言是一个多模态大模型。
& }. {! H6 Z- s; d, B/ A 李彦宏开场就展示了文心一言具备的5种能力,包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。7 i( c: j- U% @/ i
文心一言甚至还现场秀了一口接地气的四川话,现场网友发出一片笑声。/ b' w2 l) K# i- ?2 ]; Z& \
其他能力如何?我们具体展开来看。
9 @/ e B* K, W 文学创作
* f$ l0 L/ u6 M4 i 在文学创作上,李彦宏一开场就搬出了《三体》作者刘慈欣坐镇。
; s) A" T2 G4 H8 r+ i" _( {5 r. u. L 先让文心一言介绍一下大刘,“毕竟我也是刘慈欣老乡嘛”:# [, W$ V3 a$ D- v
0 V& J' y3 B3 z9 w
看起来没什么问题。同样的问题问问GPT-4呢?
: D; _' Y3 l- }# Q* \
, ^' V4 Q! m& ~! P5 M/ X 嗯???直接把刘慈欣的老家挪到了湖北省洪湖市。湖北人狂喜(doge)
& F5 j% F& e! {+ \/ v T1 h 随后,李彦宏又展示了从哲学的角度对这段文章进行续写的demo:
3 _- l1 `0 @3 g o2 k! p; ~& C' P . a7 k) f& X! ~* I- ~( {! e
看起来中规中矩,比较理性。老样子,我们也来与GPT-4进行一波对比:
4 v4 V% |" x" H K
4 V/ @+ t. e3 R- a& K* u0 C# y 这波你是想看GPT-4续写的《三体》,还是文心一言的?
9 K& u- J! u$ S! h, a 再来看看《三体》电视剧中扮演史强和汪淼的老搭档,于和伟和张鲁一,有什么共同点?
5 V# d0 w5 w* k: k , v5 q, j0 A1 f I
也没什么问题。
2 ^1 c/ O0 b/ l' V; i' _ 就是看起来展示的速度有点快,比李彦宏的语速还要快上那么一点点(手动狗头)。" N# Z! y/ ]; d) j. k2 f
# d, l3 B; I, | 商业文案创作
& i$ k# b0 S" w7 p 接下来,李彦宏又展示了一下文心一言在商业文案创作上的能力。8 ~6 u; I( u3 G: _2 g
比如给新公司起个名字。% u) f+ `# r- A: {' ~2 W
4 C9 S8 }! {* h 并且这个名字它还不是瞎起的:8 M/ n4 P, O7 O2 S4 D, y/ K
7 e# M7 Y0 Y* Y& G- f6 }1 _
再来看看GPT-4起名的效果?: ]4 y& C/ R' _! ~4 x9 e
/ x% e* R8 N0 H. l, Z" q 看起来,GPT-4对中文的掌控能力相比之下还是少了一点精髓。) C: I, V) a B
至于写个公司成立的新闻稿?对文心一言来说似乎也不成问题:
7 l( |7 O5 e% k6 h/ [6 r7 o
; I( E9 s6 h3 o- ` 数理逻辑推算
' D# F1 n& @' u5 i" z 数学能力,是考验生成式大模型的一大难题。ChatGPT刚上线时,也翻了不少车。' {+ ]$ @1 q, r" t& ]
不过在现场,文心一言处理的数学问题不算复杂,是小学数学竞赛常见的鸡兔同笼问题。% ?0 e% ?2 H; V( b8 O
7 x/ n$ }4 p, f2 ? 彩蛋是,李彦宏现场展示的第一题,引得文心一言说出了《狂飙》里高启盛的经典台词:这题出得不对。
: Y8 _) @0 ^' l- t, U6 d! K 9 k# `& \$ Z& [2 v$ ~5 Y; U
修改一下题目,OK,再扔给文心一言试试: [ B$ Y0 ~* k! Q+ Z6 y
) V5 Q0 _6 L' X# S6 i, l9 G 看起来,答案还算是有理有据,一步步逻辑推理出来的那种。
' ]1 b0 }5 u- U ~2 {- ? 李彦宏表示,这些题“不敢说百分之一百能做对,但至少体现了文心一言的思考历程”。
, t# x$ T8 E+ B2 w* ?$ Z Y% y) e 中文理解/ J5 y( M' [& Y6 r. G0 Z2 N
接下来,李彦宏着重展示了一下文心一言对中文的理解能力,并特意强调:3 h6 {0 R! H: K; \ n. l2 f
文心一言对中国文化的了解,理应超出任何一个预训练大模型。( v+ {. g# A8 z+ E3 ?: S- U% G
一上来就是一个成语,“洛阳纸贵。到底有多贵?”
: H' x7 x& m% ?% \% q
% j! a' H1 {5 B 这是文心一言的效果展示:) l# N# D! s2 ?$ ]: R0 b; J: ]
8 m- {! \7 \4 w( V9 H' ^/ P 还解释了一下这个成语背后的经济学原理:
, n/ r$ {1 _. u, g$ h1 n$ Z1 x! `
7 E3 e; c; I! f9 [0 k 那么,将这个问题抛给GPT-4呢?首先问问它,知不知道洛阳纸贵是什么意思:" r! s7 F. {5 I. a7 r
- o- u; y9 v6 {7 s+ c9 B
接下来,再问问他对应的经济学理论是什么:
" P4 K7 r" Z2 h. H. C) f
# b/ e( a( q, y8 H 这波看起来,GPT-4的中文理解似乎也不输文心一言啊。7 L, g0 l* a5 x5 e# G* g
那么,再来看看二者写藏头诗的能力?
7 N3 f% D4 }" P1 ?5 D: j" Q 首先是文心一言的效果展示:; k" C6 t: D w G1 e+ J
! a* h! H( I) @6 V 接下来,我们再看看GPT-4怎么说:
: T5 O" P: K; o8 ^. m
$ O, @+ H9 B* `8 k/ ^ 诶,看起来反而是GPT-4没有真正理解“藏头诗”的含义。
2 c9 n: L; a: ^ 这波文化理解上,属实是文心一言“小胜一筹”了。
* `( Z, h6 C9 _2 {$ O& s' c 不过在英文上,李彦宏也承认,虽然文心一言也能处理,但能力是显著不如中文的。
6 K( Y2 g: ]/ F 这也和百度目前能用到的训练数据有关。/ Z; e4 J- x8 }$ s* J
多模态生成8 M& s- b6 R* d8 O
最后,李彦宏还简单展示了一下文心一言多模态生成的能力。
$ o9 v3 D- Z) {, B 首先来看看,为即将到来的2023世界智能交通大会创作海报——
1 v1 H6 z- m5 Y, X6 A 4 Y5 h8 B- z9 t4 i6 r' M
而除了前文展示过的文字转四川话能力,文心一言还能文字转视频。: `$ J7 c2 z$ G f0 E- \, O
李彦宏一句指令“将以上内容生成视频”,很快啊,不到几秒钟,文心一言就把字幕和视频做好了:
" D3 W3 p0 ~: z
! p4 H. f, T( R8 ^& u% D8 Y5 C& e1 u 有些遗憾的是,在ChatGPT被频频称赞的编程方面,文心一言并没有现场展示相关能力。
0 r$ q3 ^1 b# k7 J4 B1 Q 但王海峰透露,文心一言的训练数据中同样包括代码。5 s) Y$ ~2 h% B/ e4 l9 h( U( }9 a& D+ W
文心一言如何“跑通”?8 E- u( m7 Z' z
正如ChatGPT脱胎于OpenAI的GPT系列,百度这次推出的文心一言(ERNIE Bot),背后也正是基于文心大模型技术打造。
$ o6 {1 M# g9 m( s0 |' G 据王海峰介绍,文心一言主要脱胎于两大模型:
3 }1 R9 a8 u0 B! a+ ] 百度ERNIE系列知识增强千亿大模型,以及百度大规模开放域对话模型PLATO。
9 I% c5 A$ A! M9 _ } 在此基础上,主要采用了六项核心技术。
- I7 s! C8 W$ D9 b 其中三个是广为人知的大模型技术,包括有监督精调、人类反馈强化学习(RLHF)和提示构建。
1 {: F: r4 }1 V& K# k$ O4 D: V+ [ p.s. 人类反馈强化学习也是ChatGPT的关键技术。2 M$ I ^& c) Y% k
另外三个,则是“百度比较有特色”的技术,包括知识增强、检索增强和对话增强技术。
: k0 K. m* G+ o% S+ I# l7 U
( G% K+ E) i4 \! {4 F! } 首先来看与ChatGPT类似的技术:有监督精调、RLHF和提示构建。
4 P7 @ U& V5 {4 \3 }: Y 有监督精调,尤其指中文方面的数据精调。百度基于对中国语言文化和中国应用场景的理解,筛选了特定的数据来训练模型。9 r+ c" b0 D2 p5 ?) q2 g
: x0 H( u% k1 l3 R h 至于人类反馈的强化学习(RLHF)和提示构建,操作上也与ChatGPT大差不差。
/ u. G8 g# A- Y1 z3 F) o( I
6 T* L3 x" `/ e) S k( g3 T 随后是百度提出的、用于进一步改善模型效果的技术。8 p6 J% b( Y/ ?4 I4 I, N1 X
知识增强,包括知识内化和知识外用两个部分。其中,知识内化即将知识“渗透”进模型参数中;知识外用指的是模型可以直接使用外部的知识。
5 x: K$ B3 B3 ? m3 ?* ~
+ Q4 J* _9 [" ]8 ^* H) ?: m 检索增强,则与百度搜索引擎积累的检索技术有关。
9 l% l! p2 ^ V @7 e& c' a5 C! W. }8 r 百度将把检索技术和生成技术结合起来,先对内容进行检索后,将比较有用的部分用于生成,再整合输出结果:
2 L5 B( g0 F+ C0 t" u; z% j
+ I4 \5 g* u$ s. ~" r7 N 最后是对话增强部分,包括之前百度积累的记忆机制、上下文理解和对话规划等技术:* ` A K1 z& Q6 _$ m! g8 c& h2 g0 c
+ e" f% z. e5 t5 \8 h9 P
概括来看,文心一言表现出的能力,被李彦宏称为“智能涌现”:
% F! p2 k: R9 x$ { 当参数达到千亿量级,训练语料达到足够多的情况下,这种现象就会发生。
1 \3 Y E2 N2 T" q/ w3 V6 ^ 目前,百度拥有的AI技术可以分为四个部分,芯片(昆仑芯)、框架(飞桨)、模型(文心)和应用。
( [; x, d9 H" x2 K 之所以软硬件都要布局,百度称,是为了降低成本:/ O4 t* H9 X9 R0 f
生成式AI需求的算力非常高,费用相当昂贵。
8 |1 _) f6 r) X0 W& G5 F 因此,如果在四层架构之间相互进行协同优化,就能让它的效率比别人更高,从而显著降低成本。
2 Z; [: h9 @* ?) o 李彦宏认为,这也正是百度的优势所在:( b# W: T7 p: z) Z9 L3 S& [
四层都有领先产品的公司,绝无仅有。/ G `6 o6 l0 J4 a
$ u* |' p G, E- F 这次文心大模型背后的硬件算力,也是通过百度智能云提供服务。9 Q2 i' A) l; }. `" J8 `6 A
目前,文心一言已经接入百度搜索,目的在于提升搜索资源效率。. N2 d5 j3 M. I7 k) m' W5 u: f
同时,包括小度和自动驾驶Apollo等产品,以及爱奇艺等公司也已经接入百度的文心一言模型。
" n4 i' ^4 z. q; B5 _* D7 n5 r8 X D K : ]7 k H3 W6 ?* K. r* Z
网友:看来还不用提前退休7 _! f" m/ w* c; i0 D: l
截至发稿,百度港股股价在一波明显下跌之后,有所回弹。3 e v; Y3 N9 \8 P! q
% |, O: P; Q: c$ C" b, z- e7 @
发布会结束,网友反应最多的是“提前录制有点败好感”:
5 a3 k% `$ x; a ~
9 s# x( i# ~+ F6 W$ Z3 O
/ h" ]3 J# ?; f" } 对于这一点,李彦宏的解释是,给出的问题都比较长,为了节约现场时间,所以才用了提前录制的形式。
; w$ ?. F1 z+ g9 |) P$ i2 T4 d 还有不少网友对文心一言展示出的能力不太满意。有人调侃,看完之后感觉“提前退休的日子看起来还可以缓一缓”:
- Y5 D( [' P5 u" r 2 y1 }; d5 S3 f+ k; O9 p q, c+ ^
离GPT-4还差了20个老胡。
& P# q$ I* o& I* i( J9 Y0 o7 ^/ } 4 d5 x/ L; U* R: D& A5 W9 [+ ^* V! o
还有网友感觉,文心一言的发布会像极了毕业答辩的自己(doge):& E% e! r2 i5 E7 \, x; g4 b
" G. ]: P& v$ V: ~+ Y 不过也有网友表示,希望能给国产产品一点时间一点耐心。4 e3 I/ l0 [; L" Z( T7 u1 H
. ]' v3 h% c- X& g, o
发布会末尾,王海峰宣布,文心一言将从今天开始对外进行测试,包括个人用户和企业用户。7 j3 F" i' t5 l, w% }
是骡子是马,相信接下来,会得到更多验证。2 @4 v) X9 c0 ^+ ?( A
One More Thing
, e4 X; o. }# K; u9 Y. I 对了,有网友表示,已经拿到了文心一言的内测资格:
/ X3 @" \$ }$ q* r6 I6 ^ 你好,感谢您体验文心一言,体验地址:
% l4 p h7 G% N R/ | https://yiyan.baidu.com/welcome,希望您在体验当中给予更多意见,文心一言邀请码:KFCVME50RMB,2023年3月16日24:00前有效。5 D+ n! v$ f; `9 x8 T
嗯,万物疯狂星期四(手动狗头)。 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|