|
|
编辑部 发自 凹非寺
. n: E1 G( V0 V4 \; ^3 w2 Z 量子位 | 公众号 QbitAI
( J% u$ ]+ \7 ~0 C }* R) P1 { GPT-4发布一天之后,压力全部给到百度这边。
: |9 E/ p( a5 F- Q" Y% y. ? 就在刚刚,百度交卷。( I! f6 C5 H% B6 s A# E% c
文心一言,百度全新一代知识增强大语言模型,正式在百度总部“挥手点江山”会议室里发布。
8 d) l l$ Q; L3 l+ u/ v, S 在一片静寂的氛围里,李彦宏小步登场,语气里带着点紧张:$ j5 K- ?' E- k( k* l5 I% q' H
大家的期望值,是我们对标ChatGPT,对标GPT-4,这个门槛有点高(笑)。
* N3 h$ j- O% L5 X 十月怀胎,我们就带大家来看看这个AI大模型文心一言长什么样。2 O. ^# Z7 G) H+ D+ y
% F J6 J! p. p. n
此前,有人狂转meme图把百度比作GPT-4旁边的垃圾箱。. p v' b) j1 k$ t* f( j/ a$ L, ]8 P
* c1 `5 T5 f3 E( G' V5 a+ o 也有人鼓吹百度是全村的希望。8 O/ w4 j7 n; e0 q
而在发布会进行的同时,百度港股市值大幅下跌,相关话题还冲上了微博热搜。
1 ?1 s. e* Z! P9 W0 z8 x9 R
6 e, R$ d# X# _ 但直播弹幕中也有网友点赞:
9 H/ k% Q0 ?5 t4 E" y / @7 t: C. P; D; G7 v9 a3 g; Q
那么这个中国版ChatGPT到底实力如何?( F, H. D1 L# c9 A9 c0 y9 B
咱们就用百度发布会演示的预录制Demo,对比一下崭新出炉的GPT-4,先凭实力说话。
. U# E `0 ?) n! w g7 ^+ a 文心一言 vs GPT-4, ]; ?, G: B8 ^/ A2 B6 q: B
和GPT-4一样,文心一言是一个多模态大模型。) v) d/ ?+ b( s3 ]" g
李彦宏开场就展示了文心一言具备的5种能力,包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。1 o' B( z' Y B* }
文心一言甚至还现场秀了一口接地气的四川话,现场网友发出一片笑声。
( _: A2 D6 a5 \5 q, e5 r 其他能力如何?我们具体展开来看。
( c1 x* B/ r4 |, S& ^" V! V4 W 文学创作
: G% _$ W! n! R0 q! \& r2 k$ _/ j' E 在文学创作上,李彦宏一开场就搬出了《三体》作者刘慈欣坐镇。
" B1 }' P. I: |5 G! m D, z 先让文心一言介绍一下大刘,“毕竟我也是刘慈欣老乡嘛”:6 k8 t) U- X$ ?3 r3 ?* P
% G: P: k/ n3 X' C5 T
看起来没什么问题。同样的问题问问GPT-4呢?* F s7 o7 v. E Q$ M: T
, Y: J5 x6 ?5 W2 c 嗯???直接把刘慈欣的老家挪到了湖北省洪湖市。湖北人狂喜(doge)" X9 G, J. M; D7 ?5 a
随后,李彦宏又展示了从哲学的角度对这段文章进行续写的demo:
: V8 ]- t+ G6 s : H9 K) M8 m5 _: _
看起来中规中矩,比较理性。老样子,我们也来与GPT-4进行一波对比:2 j. z% l; d: c9 Q, ^8 n
9 y1 i B4 }& L9 f6 ?' t3 O8 ~: E
这波你是想看GPT-4续写的《三体》,还是文心一言的?* _; p& @+ X9 R
再来看看《三体》电视剧中扮演史强和汪淼的老搭档,于和伟和张鲁一,有什么共同点?7 `0 S& X4 t4 `! Q" y$ A
) b/ T& d1 l0 R I7 R) A 也没什么问题。+ |" d; L- h$ K4 n* T
就是看起来展示的速度有点快,比李彦宏的语速还要快上那么一点点(手动狗头)。
y/ X8 r4 ^( R$ K9 ?3 e , q. O% V. ~/ {% I
商业文案创作% L- n( Y6 T8 b) F: u$ _1 A, e
接下来,李彦宏又展示了一下文心一言在商业文案创作上的能力。! x2 s$ M+ J3 Q
比如给新公司起个名字。
9 w! S. [0 n O$ Y5 j' a+ t/ I
9 X. c' s& Z' T( C 并且这个名字它还不是瞎起的:, K& ]" T' P! `4 u$ q1 k
2 y9 |% B' v! J9 C7 {4 a
再来看看GPT-4起名的效果?* s6 p3 ?+ }1 }# p5 O# Q& F
% Y6 L" N# h+ m4 L, H0 T 看起来,GPT-4对中文的掌控能力相比之下还是少了一点精髓。
3 q6 [, |* M; K# m& T2 ?8 t# h' r- I 至于写个公司成立的新闻稿?对文心一言来说似乎也不成问题:
. m% `/ L7 a! M; _/ M 8 h8 b) g3 U" m1 s6 ~1 q9 B9 o6 Z2 w
数理逻辑推算9 h) \9 j- u5 A; D! ~
数学能力,是考验生成式大模型的一大难题。ChatGPT刚上线时,也翻了不少车。/ x1 ^. O* \8 `( L2 Z# i* l8 Q
不过在现场,文心一言处理的数学问题不算复杂,是小学数学竞赛常见的鸡兔同笼问题。/ y! g* E8 ]" j. ]3 Z
7 D! k2 B! T$ ?) P5 W8 [ 彩蛋是,李彦宏现场展示的第一题,引得文心一言说出了《狂飙》里高启盛的经典台词:这题出得不对。
7 Z* y' x* N" i
& ~) {5 B- J7 B 修改一下题目,OK,再扔给文心一言试试:8 P9 u! v$ t' G( c9 P
: ~/ t2 u- i" X; G1 X+ D3 Y 看起来,答案还算是有理有据,一步步逻辑推理出来的那种。0 x( k# s8 A. S- Y7 g
李彦宏表示,这些题“不敢说百分之一百能做对,但至少体现了文心一言的思考历程”。
( h- n2 x/ V$ R6 r7 x, B) P 中文理解
3 x) F# q5 @# P3 v& E' K 接下来,李彦宏着重展示了一下文心一言对中文的理解能力,并特意强调:
& I: w% k7 l- q 文心一言对中国文化的了解,理应超出任何一个预训练大模型。
. e% M c# F) j3 e8 h9 ? 一上来就是一个成语,“洛阳纸贵。到底有多贵?”
: T, k% c2 @( p* s
* o9 }7 J- z' C# n# Q 这是文心一言的效果展示:
3 J- x9 \6 y+ r, Y4 ` + C; ]: T) B( ^. b3 P) c( i
还解释了一下这个成语背后的经济学原理:
?$ ^! g) a" Z1 M
1 S6 N. v5 Z$ N) O0 t 那么,将这个问题抛给GPT-4呢?首先问问它,知不知道洛阳纸贵是什么意思:1 |! A4 _( c% y
* P$ f F) p+ u9 d
接下来,再问问他对应的经济学理论是什么:
4 y* [/ U% }- I. Q0 I
: e: `8 K- S5 G3 c/ |' F2 \- Q- n 这波看起来,GPT-4的中文理解似乎也不输文心一言啊。, k5 z' Z- u/ K$ k: f
那么,再来看看二者写藏头诗的能力?
& j0 u3 Y. N" ^4 m9 d 首先是文心一言的效果展示:% {! g' ]' ^2 R: j( e# [7 E
9 G) v( k1 x; j
接下来,我们再看看GPT-4怎么说:
, P) L7 x0 |! T$ o+ S0 O & j. Z C3 o/ p/ R1 `+ `
诶,看起来反而是GPT-4没有真正理解“藏头诗”的含义。
- t6 R/ ^6 R, ~4 U9 \: N; w: ? 这波文化理解上,属实是文心一言“小胜一筹”了。
; n) w2 t9 U; ~4 | 不过在英文上,李彦宏也承认,虽然文心一言也能处理,但能力是显著不如中文的。
4 g5 h. `4 j7 L( h# u. I 这也和百度目前能用到的训练数据有关。& g1 h3 v h8 d6 ~4 c
多模态生成: j2 e$ U8 y, p. F+ ^. E& h$ F
最后,李彦宏还简单展示了一下文心一言多模态生成的能力。4 z- {0 W6 G+ |5 `/ l5 q% `
首先来看看,为即将到来的2023世界智能交通大会创作海报——
! Y( A7 H* G7 W. u4 o b
; r# h4 L1 L) r$ ^ 而除了前文展示过的文字转四川话能力,文心一言还能文字转视频。5 D5 ]" a6 _; { R8 i4 s0 D$ U
李彦宏一句指令“将以上内容生成视频”,很快啊,不到几秒钟,文心一言就把字幕和视频做好了:
' p" c: Y2 K8 O% B / Q4 d. W1 Y4 n4 b4 E: D
有些遗憾的是,在ChatGPT被频频称赞的编程方面,文心一言并没有现场展示相关能力。
! L; D( K' r' `3 j" n 但王海峰透露,文心一言的训练数据中同样包括代码。
/ }+ P4 f% o1 h 文心一言如何“跑通”?
% p/ R& G: Q; [; N7 ~ 正如ChatGPT脱胎于OpenAI的GPT系列,百度这次推出的文心一言(ERNIE Bot),背后也正是基于文心大模型技术打造。
, M% X1 |4 ?5 `6 C! A; O 据王海峰介绍,文心一言主要脱胎于两大模型:( `+ |; ?2 l+ Q% M3 ^: x) ^
百度ERNIE系列知识增强千亿大模型,以及百度大规模开放域对话模型PLATO。/ B% ?! f: u X5 ?0 i% k* ]
在此基础上,主要采用了六项核心技术。
3 k) n; g6 K7 D+ B 其中三个是广为人知的大模型技术,包括有监督精调、人类反馈强化学习(RLHF)和提示构建。
& F/ j- g5 b8 o) B4 k2 ^ p.s. 人类反馈强化学习也是ChatGPT的关键技术。
. d, y& B; B m. K# P1 b. ?3 X; T 另外三个,则是“百度比较有特色”的技术,包括知识增强、检索增强和对话增强技术。
* A2 ]# S7 G: | / \4 c( E) Q% b" g$ ?
首先来看与ChatGPT类似的技术:有监督精调、RLHF和提示构建。1 F% |. R6 y7 l1 e8 J# c
有监督精调,尤其指中文方面的数据精调。百度基于对中国语言文化和中国应用场景的理解,筛选了特定的数据来训练模型。8 y% p! A" O5 S% Z; }8 P/ B
& ^' _! ~" W. M1 o, c7 f
至于人类反馈的强化学习(RLHF)和提示构建,操作上也与ChatGPT大差不差。) O3 h" T4 ^ v9 C! l% c
$ a0 P$ i0 E3 J4 S 随后是百度提出的、用于进一步改善模型效果的技术。# }5 m7 Z& l! C. f& C& @
知识增强,包括知识内化和知识外用两个部分。其中,知识内化即将知识“渗透”进模型参数中;知识外用指的是模型可以直接使用外部的知识。9 T; c7 I3 } G! V Q9 }+ L7 B
5 G4 J$ _$ f( J: p, G
检索增强,则与百度搜索引擎积累的检索技术有关。
3 H4 X* m; j# o) I! g 百度将把检索技术和生成技术结合起来,先对内容进行检索后,将比较有用的部分用于生成,再整合输出结果:
) F/ t+ g. {9 V" y6 V0 Q. u1 f& s6 @
6 T' z0 T; \$ S# P8 q! K, _1 D6 C9 n 最后是对话增强部分,包括之前百度积累的记忆机制、上下文理解和对话规划等技术:4 W, X: ~ c/ f# @5 P
' l/ R3 j0 y6 F7 O+ N! R 概括来看,文心一言表现出的能力,被李彦宏称为“智能涌现”:# }* _) ^; y1 y% Z4 J9 s
当参数达到千亿量级,训练语料达到足够多的情况下,这种现象就会发生。
# T* `# E" m5 V! A+ r' e 目前,百度拥有的AI技术可以分为四个部分,芯片(昆仑芯)、框架(飞桨)、模型(文心)和应用。$ @% @! o& h: X
之所以软硬件都要布局,百度称,是为了降低成本:
9 l- e; C w2 V8 a 生成式AI需求的算力非常高,费用相当昂贵。. q4 N$ R' l/ x- k
因此,如果在四层架构之间相互进行协同优化,就能让它的效率比别人更高,从而显著降低成本。0 d' T. t' {) }- t( J4 J
李彦宏认为,这也正是百度的优势所在:$ c- g# w+ F$ D8 l! r: |8 {: m2 o' `
四层都有领先产品的公司,绝无仅有。! X8 z6 N. I4 n7 ~9 r3 A
2 n" Q+ {0 K0 S1 `! p* e' G 这次文心大模型背后的硬件算力,也是通过百度智能云提供服务。
) r' _2 E6 o9 t: N) `4 q 目前,文心一言已经接入百度搜索,目的在于提升搜索资源效率。4 \9 n; k; b S, r7 ?
同时,包括小度和自动驾驶Apollo等产品,以及爱奇艺等公司也已经接入百度的文心一言模型。4 ]2 \ ]4 Y- X
4 C5 K- R5 I T* e9 o 网友:看来还不用提前退休
% c/ ~1 Z" E$ n) ^/ k- I& _; a0 I% U 截至发稿,百度港股股价在一波明显下跌之后,有所回弹。4 ]5 B4 J% ~' d# Q+ j
2 t9 P. S( I0 G8 y/ {& q
发布会结束,网友反应最多的是“提前录制有点败好感”:% d; u7 A+ f" y. B2 f
8 b: }& O+ K2 u% K! D5 ~
" x& H9 _6 q4 k) S# F$ Z1 R4 K/ ~' N* y, y) \ 对于这一点,李彦宏的解释是,给出的问题都比较长,为了节约现场时间,所以才用了提前录制的形式。4 L4 @: t1 G/ t
还有不少网友对文心一言展示出的能力不太满意。有人调侃,看完之后感觉“提前退休的日子看起来还可以缓一缓”:
: x" T' l. t/ H% T, B6 Q9 G C 3 k w4 T! d6 x' l' D
离GPT-4还差了20个老胡。
, P2 z2 U% S; }7 ?# e
; r/ m4 h6 a" P 还有网友感觉,文心一言的发布会像极了毕业答辩的自己(doge):6 L/ Q0 ?# P) N4 Z3 o
: x; q: U' y5 I
不过也有网友表示,希望能给国产产品一点时间一点耐心。
) S; k8 ^2 Y: B! A+ v3 j4 ]# e . e& o1 A- U8 e/ ~1 B$ ^
发布会末尾,王海峰宣布,文心一言将从今天开始对外进行测试,包括个人用户和企业用户。
/ v' `+ `" a u- N( b( X+ d0 Q4 M 是骡子是马,相信接下来,会得到更多验证。
3 C( B: g2 G, n4 {' p One More Thing- V4 N# y2 ?, [$ ]
对了,有网友表示,已经拿到了文心一言的内测资格: h3 _ p3 ~% y; T) h
你好,感谢您体验文心一言,体验地址:
5 V' W0 [' ^8 z2 ^7 [5 C& ? https://yiyan.baidu.com/welcome,希望您在体验当中给予更多意见,文心一言邀请码:KFCVME50RMB,2023年3月16日24:00前有效。
- L( p) g; B3 J( U$ W1 ]4 h; ` 嗯,万物疯狂星期四(手动狗头)。 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|