京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 899|回复: 3

中国版ChatGPT「MOSS」服务器被挤爆,复旦团队致歉:还不成熟 ...

[复制链接]

1598

主题

713

回帖

6648

积分

论坛元老

积分
6648
发表于 2023-2-22 07:41:41 | 显示全部楼层 |阅读模式 来自 江苏南京
. [5 l$ c& K$ N7 P* P$ j
( f$ t/ Q) r! n9 j% k' \, ^0 ]; D
新智元报道, A9 R$ z" j8 ^; p: Q) O% c: N
编辑:编辑部- J; ]* e( J( @0 p$ U. N
【新智元导读】2月20日,复旦大学邱锡鹏团队推出中国版ChatGPT「MOSS」。发布当晚,服务器被挤爆。2月21日,复旦MOSS团队致歉,称模型还不成熟。
5 a2 W# |! ]* i1 J# c& T5 E今天,MOSS又火了。不仅登顶知乎热榜,收获近千万流量,还引来诸多媒体竞相报道。/ }7 a5 {; `; {

! T  |% O% A3 f" S- z2 o7 n9 O$ |/ Q  p/ o/ Y; ]
不过,这次出圈的,不是陪刘培强流浪的MOSS,而是复旦大学研发的中国版ChatGPT。+ `) Z3 k% E8 Z  ]$ }) K/ R& M* M' k' m

8 ^( _% q* h2 h# _6 O" _$ d+ H2 r国内首个对话式大型语言模型7 K( D8 T- V( k, o, k! A
ChatGPT自发布以来,已经收获了全球巨大关注。尤其是在春节后,ChatGPT突然走红,许多网友开始期待中国版聊天机器人的诞生。+ v* d; y# F1 C+ |  Y9 L6 C
现在,这个愿望得以实现。复旦大学自然语言处理实验室表示,国内第一个对话式大型语言模型「MOSS」已由邱锡鹏教授团队发布至公开平台,邀公众参与内测。
! N. Y( I# k8 {; g# B* r3 q' F' V
/ v! R) I" E% \' I# ]0 Y/ i; \8 l+ ~
MOSS可以执行一系列任务,如对话生成、编程、事实问答等。官网称,MOSS为生成的语言模型打开所有技术路径,以理解人类意图并具有对话能力。
+ |$ _+ F3 `, |: h3 OMOSS的出现为国内学术界和业界提供了重要经验,并有助于进一步探索和应用大型语言模型。. D' V) d3 H5 R
团队负责人邱锡鹏表示:「尽管MOSS仍有很大的改进空间,但其推出证明,国内科研团队有能力在开发ChatGPT产品的道路上克服重要的技术挑战。」% p# X. D3 g9 c

& n- F! G8 u5 W7 m  e1 y
* E$ H7 |" v3 \0 \& h% R# R" o据悉,MOSS研发项目得到了上海人工智能实验室的大力支持。后期,该项目将会通过开源方式,和行业人士与社区分享。
6 m/ o( h9 T! ^! F2 R, D开源代码,打造MaaS生态) C" i  p. ]7 \" n; p) q
MOSS的回答语言流畅、逻辑清晰且观点正确。科研团队在演示时,用英文输入多个指令,展示了MOSS多轮交互、表格生成、代码生成和解释能力。
& x7 |+ i. O3 K$ u( K) C3 x「告诉我5部科幻电影。」「生成一张展示这5部电影和导演的表格。」「增加一列表格,显示这些电影上映的时间。」在这个包含表格生成的多轮交互中,MOSS都顺利完成了任务。
$ c8 j8 Y  D' Q. X$ t  t* U( |7 r  m8 h- @

5 l- T/ c) c3 Z) s+ P( f然而,MOSS与ChatGPT最大的不同,在于其开源属性。
! A- W) E/ [1 ~$ l由于ChatGPT并未开源,其技术解决方案的细节尚未披露,研究人员对此有很多猜测。一些专家认为,ChatGPT是一个复杂的组合系统,无法通过单一的生成语言模型实现。5 z" C7 K$ \6 N; x4 h  n2 G
作为自然语言处理专家,邱锡鹏近年来一直致力于研究具有多任务学习能力的一般模型。为了探索ChatGPT的技术路线并获得LLM研究的一手经验,他带领团队加快了MOSS的开发。
" Y1 a, v" x6 f7 z, Z/ I$ H4 m: H+ G; {0 C* u
+ l6 }; ^- n3 n4 K0 o0 b" E( o  n
MOSS开发的基本步骤与ChatGPT相同,包括两个阶段:自然语言模型的基座训练和理解人类意图的对话能力训练。
( R: Y& k4 a5 ^  o! l0 a在对话能力培训阶段,OpenAI收集了至少数十万条人工指令,要求各行各业的专业标注员编写指令回复,然后将其输入模型库,以帮助ChatGPT逐步理解各种指令。
1 B3 E1 k$ U8 H& [0 o+ Z复旦团队采用不同的技术路线,通过允许MOSS与人类和其他对话模式互动,并在短时间内高效完成对话能力培训,从而显著提高学习效率和研发效率。; X+ d" s! h  p# O
为了提高研发效率,MOSS团队选择开源代码。对此,MOSS模型的官方公告表示:6 h" {$ q. }7 S& x4 `" T

1 ~9 F# b+ N* m
预训练大语言模型的研发门槛很高,需要大量算力、训练语料和人工标注。在我国产业界,只有大型机构才有实力开发大模型。 MOSS开源后,可有效降低预训练语言模型的研发和应用门槛,让中小企业在其基础上开发出智能客服、智能家居、人工智能律师等各种垂直类产品。
9 N! J* W1 ?+ P) k) n$ K
推出伊始便开源代码,虽然可以提高数据收集和研发效率,但也不得不称为一个冒险的举动。然而,这也为未来企业的发展提供了一个新的思路:MaaS(基础模型服务)。
. Y% C, g# {) x) ]* n在未来,企业或许不需要在大模型领域「卷生卷死」,有了类似于MOSS的高质量LLM,企业只需对已经完备的模型进行微调,就能获得所需的品质良好的垂类产品。
$ t' ~. R* c0 y% q2 i- d& s! ^$ t! w$ r4 I* w
取名MOSS,致敬《流浪地球》# O' D' E  j( a3 i" q
随着MOSS的推出,互联网上出现了怀疑的声音:为什么要叫MOSS?
. }! i$ J5 f; K% h: t
; L- P/ x" |$ R1 x2 x- N( i9 G' F9 t' ^, D- n
面对「蹭热度」的质疑,MOSS团队发公告予以澄清。公告称:' Z0 R1 z* j; j- g3 ]* L  d  E

: l  j2 d9 S+ y# Z; b4 e1 r& d$ l
尽管我们的对话模型和《流浪地球》中MOSS的能力不能相提并论,但就像过去NLP领域的其它优秀模型一样,作者们都希望使用自己喜欢的影视角色名称命名自己的模型,我们在训练完成第一代模型的时候,正值流浪地球2热映,片中MOSS给团队每个人都留下了深刻的印象,因此便使用了这样一个名称来指代我们的模型,以表示我们对最前沿AI模型的不懈追求。
6 i1 `% \/ g% h/ q  C5 h6 M
事实上,用大IP给科研项目命名并不是什么新鲜事。ChatGPT基础技术之一的Transformer,其名称来源于大热电影《变形金刚》(Transformer)。* V% Z4 m; A, L; k2 @/ k6 b" F
网友评价" d# q4 E" K1 K/ M# C, x! a7 z
MOSS一上线,官网都快被挤爆了,小编也只能乖乖排队等内测资格啦。
+ Q, y4 m' g6 r$ t8 Q
  }0 \4 R! c3 g! ]! j' l  y5 Z6 P! M* d+ k8 ~
体验地址:https://moss.fastnlp.top/6 |) x- m7 Q) O- A8 l' ^
项目地址:https://txsun1997.github.io/blogs/moss.html
4 z- l1 A' B# i9 s不过,根据网上记者的对话以及知乎答友们的评价,咱也能来仔细瞅瞅MOSS了。
  `, L8 ]! C  J! j6 [3 p文风很AI,但未来可期$ w% ~) z3 R2 F; L2 M  J8 u1 r6 R
基于目前已知的信息,「段小草」对Moss的特点进行了总结:
! q' o; R9 T/ g  v3 f6 l7 W1. 上下文的能力是有的,但不确定能保留多少,毕竟展示出来的上下文对话都不是太长;! a7 u% _* `: x  f6 s3 h
2. 文风很 AI,不过生成的内容不算长。即使是分 1、2、3、4 点回答的时候,句子也比较短。ChatGPT 一般会生成更长的展开。9 L8 v  H) {# l8 [3 a
3. 文章中也专门展示了英文能力,但还不确定训练集中不同语言语料的效果。
9 V- o( H0 G# W+ G! T6 ^4. 吸取 ChatGPT 和 NewBing 翻车的教训,在上线初期就套上了足够的道德枷锁。
& S6 ], N  F% i  J& c! i最后,「段小草」表示:「希望能尽快体验到产品,也期待看到更多产业落地。」9 R  s8 f( x- X2 T/ W6 e
MOSS回答:% J; f, Y& Y0 a6 s. e& J

/ c% m. b- Z  d6 W/ \! z. x
0 P5 E! T: y" l! u2 z4 j" }ChatGPT回答:+ M0 m6 ?7 x! I# X* n5 {

8 W% i& @6 z* L1 z: _2 Y6 P& n# @2 _
回答地址:https://www.zhihu.com/question/585248111/answer/2903132579+ ~7 x# j& [# B; _9 P& M
给国内AI开了个好头
  K4 M0 O- f3 }8 \/ i! I的确,MOSS的发布对国内AI的发展肯定大有益处。
% L- x/ a- E% ?5 I2 z知友「极智视界」表示,在AI领域,技术源于美国而盛行于世界,例如框架类的pytorch、tensorflow,目标检测算法YOLO以及造就ChatGPT的transformer。我们「对标」国外的技术,虽然赶超美国可能做不到,但是「对标」的过程一定会让国内的AI有一个快速的发展。
- p/ z/ a0 Y  h3 }" S* {
/ I+ ?6 B; y# M! v' A
- }+ h, P/ }9 Z$ z2 J  @回答地址:https://www.zhihu.com/question/585248111/answer/2903303710
, _0 J- t9 r4 V/ J「极智视界」还提到,国内首个类ChatGPT模型MOSS的发布既符合预期但也有些意外。/ K$ f5 r: }* X1 a" n& G1 Y2 l
符合预期是因为近段时间以来也一直有国内版ChatGPT摩拳擦掌的消息,所以迟早都会来的;意外的是在当前这种强大的利益驱动下,研究机构居然还走到了大厂的前头。" X2 V' j0 ]( z$ J) N4 J. z; E
但总的来说这是一个令业界比较振奋的消息,咱们终于可以用上咱们自己的AI问答系统了。# i% R1 g, [' M' I6 ^/ C. y3 F5 n
高校的重点还是理论探索
& ~  p" c* `' u1 C4 A9 p3 U/ N知友「卜寒兮」表示,想研发出类ChatGPT的产品,需要一个团队能撬动各个方面的资源,还要有过硬的技术做支撑。1 P7 i# @5 c8 J5 y) W0 X  U
以ChatGPT为例,单单想要研发出一个成规模的LLM模型,就需要以下四个方面:0 S) M9 A8 B, O
, D2 V* R2 h; g: E; o

    ) q  S& D1 h2 v. ~6 N

  • 0 r% H2 {& I+ n0 h0 F9 ~$ @( |海量数据的语料库:ChatGPT背后的模型的GPT-3、GPT-3.5系列,初代的GPT-3是2020年发布的,这个模型有1750亿个参数,训练它所使用的语料库包含45TB的数据、约3000亿个单词
    1 d4 F; b: a* P, S& v% T3 f7 c0 r+ R6 W4 z4 K( f- y7 v  q
  • ) {# x8 V6 u, _0 P
    大量的人力:毕竟ChatGPT成功的背后是时薪不到2美刀的血汗工厂3 g# t. ]( ]8 ?

    $ I0 K, C* K) I

  • / m" A0 H+ q; s& Q算力的支撑:训练chatGPT这样规模的LLM模型需要目前世界上最强大的GPU来满足算力要求而像NVIDIA Tesla A100这种最新的AI超级计算机芯片已经禁止对国内出售了。国内除了几家互联网大厂,很少有公司有实力能长期投入大量资金在算力上,更不要提校内的科研团队了,靠点科研经费可远远不够。
    / f& s1 L* R; z( }+ @# J# |: N, B5 a* n
    & V* T- B( @4 J
  •   R, }5 X5 g; i( A5 u4 q
    技术上的壁垒:GPT-3的初代版本在2020年就出现了,而到2022年11月首次推出ChatGPT产品,这期间花了三四年的时间迭代不同的版本。这是一个长期的过程,意味着花大量的时间找到关键的训练tricks,反复调参,在不同的训练集上反复训练、微调,并且还有找到合适的训练方法,才能迭代出一个优秀的版本
    ' X& k8 y9 U8 M3 b$ W9 |. O0 ?
    ( K: p7 C) {% T2 a) F

6 ?1 [1 I: m7 @3 x; c+ m$ n. Z1 |8 n. j; _( }
& S' H2 X0 X# T. A
回答地址:https://www.zhihu.com/question/585248111/answer/29031611802 g# h0 e( x" V
目前来看,还真的只有大公司才有能力做得出来。对于高校的科研团队,其优势在于技术和方法上的创新,所以还是要在这方面做更多功夫,为将来有一天该方向的发展做技术储备。
1 ]4 o$ ]8 S+ T8 l! c0 A" y9 S8 s1 \, [; J; ~" ~% N
复旦MOSS团队:还不成熟
7 n8 [: h7 ~$ z( J& F2月20日,就在MOSS模型公布的当晚,不少测试的网友发现,MOSS已经显示服务器流量过载,只能第二天再重试。
+ ~! j) G5 |$ I  H* }- }. V2月21日,复旦团队在MOSS官网发布公告称:首先非常感谢大家的关注!MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走。
* Q" V& y, H; @+ X
. j  R8 i1 @6 c" }
+ v1 h6 e6 a6 v* I1 J% F5 r3 C4 H# n- G8 V: O) _
我们一个学术研究的实验室无法做出和ChatGPT能力相近的模型,MOSS只是想在百亿规模参数上探索和验证 ChatGPT的技术路线,并且实现各种对话能力。 我们最初的想法只是想将MOSS进行内测,以便我们可以进一步优化,没有想到会引起这么大的关注,我们的计算资源不足以支持如此大的访问量,并且作为学术团队我们也没有相关的工程经验,给大家造成非常不好的体验和第一印象,在此向大家致以真诚的歉意。 在 MOSS完成初步的验证之后,我们会将MOSS的经验、代码、模型参数开源出来供大家参考。中国版ChatGPT的诞生还需要中国全体AI从业者的努力,也更需要不断。和人交互以提高能力。

  M1 N# x! D+ S% P) l参考资料:  u( a, ~' g9 c$ h# z. E4 T& X
https://txsun1997.github.io/blogs/moss.html7 k- z8 S1 ~& q
https://www.zhihu.com/question/585248111, B3 L& N" ^8 s  X6 L5 Q
https://m.weibo.cn/status/4871507265982631?wm=3333_2001&from=10D2293010&sourcetype=weixin&featurecode=newtitle
  _" B  C" |0 K: I- S( Z' D特别鸣谢:(授权转载)3 S4 k; `% O2 V
「段小草」https://www.zhihu.com/question/585248111/answer/2903132579
! G( w% c$ s3 U: Q「极智视界」https://www.zhihu.com/question/585248111/answer/29033037104 i! G# ~: s' S% r; V% U7 S
「卜寒兮」https://www.zhihu.com/question/585248111/answer/2903161180

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1598

主题

713

回帖

6648

积分

论坛元老

积分
6648
 楼主| 发表于 2023-2-22 08:01:46 | 显示全部楼层 来自 江苏南京
moss为什么不能抢在chat GPT之前推出呢?这样才是领军者啊[斜眼笑]
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1683

主题

711

回帖

7218

积分

论坛元老

积分
7218
发表于 2023-2-22 08:21:28 | 显示全部楼层 来自 江苏南京
英文指令,这是重点
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

1686

主题

678

回帖

6657

积分

论坛元老

积分
6657
发表于 2023-2-22 08:41:26 | 显示全部楼层 来自 江苏南京
好厉害,我认为除了美国,目前只有中国有能力开发如此强大的产品了
梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-6-22 00:13 , Processed in 0.043973 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表