|
|
9 a& \! k3 Y% |- |
7 b; ~' M. e/ w# K新智元报道
- ?* Z( a: X& v: Y) T编辑:编辑部
/ m1 z; W9 V- f; ~【新智元导读】2月20日,复旦大学邱锡鹏团队推出中国版ChatGPT「MOSS」。发布当晚,服务器被挤爆。2月21日,复旦MOSS团队致歉,称模型还不成熟。& j9 N! r4 L7 s7 V
今天,MOSS又火了。不仅登顶知乎热榜,收获近千万流量,还引来诸多媒体竞相报道。) T) O1 I5 q% u, \: T; y
* @* ?' X# S3 f* r9 O, w
/ q+ n; G7 D; b2 p3 t0 |) G
不过,这次出圈的,不是陪刘培强流浪的MOSS,而是复旦大学研发的中国版ChatGPT。' k2 H5 `3 V" U$ |3 S) v" s
4 z, N( h& h1 T6 C- K国内首个对话式大型语言模型
* o8 ^7 w1 z [ChatGPT自发布以来,已经收获了全球巨大关注。尤其是在春节后,ChatGPT突然走红,许多网友开始期待中国版聊天机器人的诞生。/ e. p" c8 {& {
现在,这个愿望得以实现。复旦大学自然语言处理实验室表示,国内第一个对话式大型语言模型「MOSS」已由邱锡鹏教授团队发布至公开平台,邀公众参与内测。6 g2 F- i4 Z: M3 E+ s9 c/ w$ `
) ^3 ]- {$ l' B" L
% R! e% k, E7 E8 e$ k; Y( f5 |MOSS可以执行一系列任务,如对话生成、编程、事实问答等。官网称,MOSS为生成的语言模型打开所有技术路径,以理解人类意图并具有对话能力。% Q. k! t5 l. t+ B
MOSS的出现为国内学术界和业界提供了重要经验,并有助于进一步探索和应用大型语言模型。
- G3 |, @5 o, ]+ w: D4 m) E团队负责人邱锡鹏表示:「尽管MOSS仍有很大的改进空间,但其推出证明,国内科研团队有能力在开发ChatGPT产品的道路上克服重要的技术挑战。」" O4 k% ~6 O' K8 P
_% R( G1 N$ [+ F! p# v5 ~ K$ [3 Y5 e* Y) u+ a0 }: G
据悉,MOSS研发项目得到了上海人工智能实验室的大力支持。后期,该项目将会通过开源方式,和行业人士与社区分享。: F1 P: T# x; N! T& l
开源代码,打造MaaS生态
" o: t% { @7 I% S0 J6 ^7 d8 ^# pMOSS的回答语言流畅、逻辑清晰且观点正确。科研团队在演示时,用英文输入多个指令,展示了MOSS多轮交互、表格生成、代码生成和解释能力。$ L! |- q9 N" _% D0 c) v
「告诉我5部科幻电影。」「生成一张展示这5部电影和导演的表格。」「增加一列表格,显示这些电影上映的时间。」在这个包含表格生成的多轮交互中,MOSS都顺利完成了任务。
0 U4 x, z& b( q q
; {4 q O4 F" @. {$ [8 B5 B1 ?6 ^$ a: W
然而,MOSS与ChatGPT最大的不同,在于其开源属性。
! o, y @$ S2 W% N由于ChatGPT并未开源,其技术解决方案的细节尚未披露,研究人员对此有很多猜测。一些专家认为,ChatGPT是一个复杂的组合系统,无法通过单一的生成语言模型实现。
$ F( K* t2 s1 _# y) O作为自然语言处理专家,邱锡鹏近年来一直致力于研究具有多任务学习能力的一般模型。为了探索ChatGPT的技术路线并获得LLM研究的一手经验,他带领团队加快了MOSS的开发。2 ]0 v& ~2 I3 f* }
% Z+ f6 X# P0 T
' Z7 g" F, Y% E. u% vMOSS开发的基本步骤与ChatGPT相同,包括两个阶段:自然语言模型的基座训练和理解人类意图的对话能力训练。
( T$ d9 ]9 u3 ?2 Z1 q$ ?# K/ w2 t在对话能力培训阶段,OpenAI收集了至少数十万条人工指令,要求各行各业的专业标注员编写指令回复,然后将其输入模型库,以帮助ChatGPT逐步理解各种指令。
4 m4 t6 ?- \2 `% P复旦团队采用不同的技术路线,通过允许MOSS与人类和其他对话模式互动,并在短时间内高效完成对话能力培训,从而显著提高学习效率和研发效率。
1 `) B9 J# Y' r2 N! z为了提高研发效率,MOSS团队选择开源代码。对此,MOSS模型的官方公告表示:
( G' y L6 p: H3 E5 U9 s2 E: i1 S% d6 a4 _: \2 [0 I: @% H5 n
预训练大语言模型的研发门槛很高,需要大量算力、训练语料和人工标注。在我国产业界,只有大型机构才有实力开发大模型。 MOSS开源后,可有效降低预训练语言模型的研发和应用门槛,让中小企业在其基础上开发出智能客服、智能家居、人工智能律师等各种垂直类产品。 3 h+ r1 F# U% t% F5 v% A
推出伊始便开源代码,虽然可以提高数据收集和研发效率,但也不得不称为一个冒险的举动。然而,这也为未来企业的发展提供了一个新的思路:MaaS(基础模型服务)。1 C" B8 I# e( j4 [* [: w& ]
在未来,企业或许不需要在大模型领域「卷生卷死」,有了类似于MOSS的高质量LLM,企业只需对已经完备的模型进行微调,就能获得所需的品质良好的垂类产品。
, L1 h, D0 d" j# v! n. M( x: T. S/ }0 ?; M# b. Z' y, w+ |0 j: }+ e
取名MOSS,致敬《流浪地球》% D, D( T( n+ I& P# U j9 Y
随着MOSS的推出,互联网上出现了怀疑的声音:为什么要叫MOSS?
( r/ w; J+ v, W1 ]+ N. A" f
$ u6 w3 j$ o E$ R, v: t
. {& B6 o# t/ I6 [/ W- q0 q- c面对「蹭热度」的质疑,MOSS团队发公告予以澄清。公告称:: ` }# i/ Q6 ]1 L
9 o& o; |& f% e# h! e尽管我们的对话模型和《流浪地球》中MOSS的能力不能相提并论,但就像过去NLP领域的其它优秀模型一样,作者们都希望使用自己喜欢的影视角色名称命名自己的模型,我们在训练完成第一代模型的时候,正值流浪地球2热映,片中MOSS给团队每个人都留下了深刻的印象,因此便使用了这样一个名称来指代我们的模型,以表示我们对最前沿AI模型的不懈追求。
4 { z8 Z( R& ?; F* j$ o. D& {" v5 H事实上,用大IP给科研项目命名并不是什么新鲜事。ChatGPT基础技术之一的Transformer,其名称来源于大热电影《变形金刚》(Transformer)。8 c$ Y% Y3 b2 R( P+ {
网友评价& }( L8 ~" Q; x
MOSS一上线,官网都快被挤爆了,小编也只能乖乖排队等内测资格啦。
" ?: v" d+ r. j. S* t) M; C8 q# v6 f5 N6 |% E( [
& _4 N. ~9 I. N5 L体验地址:https://moss.fastnlp.top/6 w5 x T/ V0 G, u8 ~/ B7 R
项目地址:https://txsun1997.github.io/blogs/moss.html$ O4 B: p9 P" f; @9 N# J4 `4 @
不过,根据网上记者的对话以及知乎答友们的评价,咱也能来仔细瞅瞅MOSS了。
; q- d; W( L. r3 g* f# `" {文风很AI,但未来可期
0 D# I* T b" l* L4 q' P基于目前已知的信息,「段小草」对Moss的特点进行了总结:
6 z5 j3 l/ }# e5 D1. 上下文的能力是有的,但不确定能保留多少,毕竟展示出来的上下文对话都不是太长;
7 p1 F# x8 a0 V" A J6 b2. 文风很 AI,不过生成的内容不算长。即使是分 1、2、3、4 点回答的时候,句子也比较短。ChatGPT 一般会生成更长的展开。9 Y( j( h G1 u7 E, e+ _
3. 文章中也专门展示了英文能力,但还不确定训练集中不同语言语料的效果。) [4 q4 ?& d& }/ | U
4. 吸取 ChatGPT 和 NewBing 翻车的教训,在上线初期就套上了足够的道德枷锁。: Q+ x6 c, t$ r) g
最后,「段小草」表示:「希望能尽快体验到产品,也期待看到更多产业落地。」
5 E" O4 S! ]" d, j. tMOSS回答:) g" W; c; h) @ B6 N
* S3 N- e) O4 [. }+ q% `8 i% J4 n+ c! C- a, ^+ K3 v& s
ChatGPT回答:
' W. A: ?# N4 ~ {" o7 k% H( ^. A' [; y# o# X
9 K# {, q; Q, P8 H" Q0 n( ~回答地址:https://www.zhihu.com/question/585248111/answer/29031325790 Z+ L* g3 B9 J% h7 M
给国内AI开了个好头/ P1 i0 n1 g9 a
的确,MOSS的发布对国内AI的发展肯定大有益处。, v9 N8 _1 v4 y* R& Z* A( u" `
知友「极智视界」表示,在AI领域,技术源于美国而盛行于世界,例如框架类的pytorch、tensorflow,目标检测算法YOLO以及造就ChatGPT的transformer。我们「对标」国外的技术,虽然赶超美国可能做不到,但是「对标」的过程一定会让国内的AI有一个快速的发展。
- \% K( q/ T, D& t- g: T
6 p' B' G& e D/ L$ ^/ e( j* z: \9 _0 i: u- P& S
回答地址:https://www.zhihu.com/question/585248111/answer/2903303710
) w/ l2 P! W! C3 l$ A「极智视界」还提到,国内首个类ChatGPT模型MOSS的发布既符合预期但也有些意外。
# t% Y" j" z7 f" ]( `& F符合预期是因为近段时间以来也一直有国内版ChatGPT摩拳擦掌的消息,所以迟早都会来的;意外的是在当前这种强大的利益驱动下,研究机构居然还走到了大厂的前头。
* B' s9 }. K% n$ T$ O- P8 t& j( h但总的来说这是一个令业界比较振奋的消息,咱们终于可以用上咱们自己的AI问答系统了。
8 H) E' S$ _) f5 N" j高校的重点还是理论探索- r# y" I! P: M% m
知友「卜寒兮」表示,想研发出类ChatGPT的产品,需要一个团队能撬动各个方面的资源,还要有过硬的技术做支撑。
( Q- V- p9 Q% L: ~以ChatGPT为例,单单想要研发出一个成规模的LLM模型,就需要以下四个方面:
4 g* {9 |& h4 w3 V7 x; O& I
! }" f- ~+ j7 v/ g: T) @
+ c9 n% H* {" @
2 Q2 i4 |" x. _: P% j5 ^1 X( |海量数据的语料库:ChatGPT背后的模型的GPT-3、GPT-3.5系列,初代的GPT-3是2020年发布的,这个模型有1750亿个参数,训练它所使用的语料库包含45TB的数据、约3000亿个单词
0 X& |. `1 z' r5 A6 J0 F/ Q9 Z7 q
) ~, p+ J1 u; u5 L( K- ( T) ^% d: M5 C5 _$ k2 A
大量的人力:毕竟ChatGPT成功的背后是时薪不到2美刀的血汗工厂/ O8 U% }# o5 v% S3 ~# r; m
) N. v! _7 u: G, Q0 x
- 4 X" E! w! @" j; k
算力的支撑:训练chatGPT这样规模的LLM模型需要目前世界上最强大的GPU来满足算力要求而像NVIDIA Tesla A100这种最新的AI超级计算机芯片已经禁止对国内出售了。国内除了几家互联网大厂,很少有公司有实力能长期投入大量资金在算力上,更不要提校内的科研团队了,靠点科研经费可远远不够。
3 |' q7 t5 P( v7 {2 ?2 E8 o* Y) q5 J0 i- O. g5 ]
- - n. z% C: u/ F2 F' k: z0 J o
技术上的壁垒:GPT-3的初代版本在2020年就出现了,而到2022年11月首次推出ChatGPT产品,这期间花了三四年的时间迭代不同的版本。这是一个长期的过程,意味着花大量的时间找到关键的训练tricks,反复调参,在不同的训练集上反复训练、微调,并且还有找到合适的训练方法,才能迭代出一个优秀的版本
: G+ X/ R0 Z3 g. i V' O3 d% s' `: y. Q
# E' U# B9 g" V& k* ~: d( C0 S& x; r9 m8 Z* w8 B/ U: R4 G
: X7 Y% m& _/ o- L7 y) I8 G& k回答地址:https://www.zhihu.com/question/585248111/answer/2903161180
2 U! m7 O/ p7 D( h. v$ q, `目前来看,还真的只有大公司才有能力做得出来。对于高校的科研团队,其优势在于技术和方法上的创新,所以还是要在这方面做更多功夫,为将来有一天该方向的发展做技术储备。
+ B% l, T. Y& a7 {" r8 \4 y: [8 v( f. d& h) X1 \) o/ w* y" _) q
复旦MOSS团队:还不成熟# ]8 f, I$ S7 M
2月20日,就在MOSS模型公布的当晚,不少测试的网友发现,MOSS已经显示服务器流量过载,只能第二天再重试。4 m, S$ F" l! C E8 q- F
2月21日,复旦团队在MOSS官网发布公告称:首先非常感谢大家的关注!MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走。# P0 _1 |6 u+ ?; x* j) i* f0 S
0 S0 r4 C4 w, C' R% L
( U4 J, q% C/ k- M& k
: ]: b( w# [2 ~" u我们一个学术研究的实验室无法做出和ChatGPT能力相近的模型,MOSS只是想在百亿规模参数上探索和验证 ChatGPT的技术路线,并且实现各种对话能力。 我们最初的想法只是想将MOSS进行内测,以便我们可以进一步优化,没有想到会引起这么大的关注,我们的计算资源不足以支持如此大的访问量,并且作为学术团队我们也没有相关的工程经验,给大家造成非常不好的体验和第一印象,在此向大家致以真诚的歉意。 在 MOSS完成初步的验证之后,我们会将MOSS的经验、代码、模型参数开源出来供大家参考。中国版ChatGPT的诞生还需要中国全体AI从业者的努力,也更需要不断。和人交互以提高能力。
d V1 _& b& m% @2 J( [参考资料:. u; a0 y6 c. I
https://txsun1997.github.io/blogs/moss.html) R/ {. W z R( N) J
https://www.zhihu.com/question/585248111
4 S( j+ @: I( V. @, R( j4 Lhttps://m.weibo.cn/status/4871507265982631?wm=3333_2001&from=10D2293010&sourcetype=weixin&featurecode=newtitle
0 l {: B2 F* o/ o特别鸣谢:(授权转载)6 h2 ]! c& J. ^! M- D
「段小草」https://www.zhihu.com/question/585248111/answer/2903132579
: A4 K! B9 i# V+ |「极智视界」https://www.zhihu.com/question/585248111/answer/2903303710( M/ ?* m7 o. k6 I& q& }
「卜寒兮」https://www.zhihu.com/question/585248111/answer/2903161180 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|