京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 769|回复: 0

商汤版 ChatGPT 来袭,中国激战千亿“大模型”

[复制链接]

1583

主题

693

回帖

6856

积分

论坛元老

积分
6856
发表于 2023-4-11 20:19:06 | 显示全部楼层 |阅读模式 来自 江苏常州

( B% p0 ?1 p! Z& _0 y# Y# e3 z- [9 i; F# Y* g
商汤上海总部(图片来源:钛媒体 App 编辑拍摄)
' b  \+ B& k! i' E- R! i% h随着 ChatGPT 为代表的预训练大模型带来新一轮人工智能(AI)热潮爆发,继百度、阿里、360 之后,又一家大厂推出 GPT 大模型产品。$ f: d% }0 o8 R4 k6 Z4 `" o6 d( i
钛媒体 App 获悉,4 月 10 日,AI 公司商汤科技正式发布全新 " 日日新 SenseNova" 大模型体系,以及自研的中文语言大模型应用平台 " 商量 "(SenseChat),参数量达千亿,可实现文本生成、图像生成、多模态内容生成等能力与场景应用。4 `; J8 |' Z4 @- r8 {* j; W+ c) m
商汤科技董事长兼 CEO 徐立表示,上述这些生成式人工智能(AIGC)产品将在医疗、短视频、教育、营销以及开发等产业领域应用落地。$ |6 P! I5 C, Q$ X7 \& m
商汤科技联合创始人、首席科学家王晓刚表示,目前已经有一些合作伙伴和客户开始内测其产品。未来,商汤版的 GPT 主要面向企业端(B2B)业务。此外,商汤 " 日日新 SenseNova" 大模型体系已全面支持了智能汽车、智慧生活、智慧商业、智慧城市等业务板块,而且商汤将向客户提供涵盖图片生成、自然语言对话、视觉推理和标注服务等 API 接口。0 f2 a$ _' B4 y' n9 q9 d# F. |, A
事实上,自 2022 年 12 月开始,美国 OpenAI 公司推出的 AI 产品 ChatGPT 以及背后的 GPT 大模型,已经引发了一场 AI 新浪潮。
; G( {$ Q9 G% Y, f但 AI 技术的终极目标 通用人工智能(AGI)可不是谁都能获得的。《奇点临近》作者雷 · 库兹韦尔曾表示,直到 2029 年,人类才有超过 50% 的概率开发出 AGI。而作为 AI 技术积累最深厚的中国公司,如今商汤抓住了大模型这波新浪潮,以期在未来几年内实现重大突破,从而迈向 AI 领域这颗皇冠上的明珠—— AGI 的前沿研发与商业化进程。
- w$ y5 p2 n3 i, \4 TGPT 大模型热潮来袭
% _* _5 R5 ~6 }5 T# b& _- Q如今,火爆全网的 AI 聊天大模型应用 ChatGPT 访问量已飙升至 8.89 亿次,它也是历史上最快达到 1 亿月活的应用,而且整个热潮已蔓延至微软、谷歌等很多大厂开始关注大模型。过去 40 天,大模型集中爆发,GPT-4、微软 Microsoft 365 Copilot、Midjourney V5、Google PaLM API、英伟达新显卡接连出场。' \$ F' w3 h" v9 Y
尤其是微软,将 GPT-4 接入 Word、Excel、PowerPoint 等 Microsoft 365 Office 办公套件中,即推出一款新的 AI 驱动的产品 Copilot(副驾驶),像助手一样用 AI 帮助人们生成文档、电子邮件、PPT 等,从而让 AI 接入了生产力。此外,创造出 ChatGPT 的美国 OpenAI 公司还推出插件功能,实现了 "App Store 时刻 ",让生成式 AI 真正变革了人类的生产力。( ~" {& Q8 g4 \% h( |, Y/ L

4 t/ F  z( O4 G% q" @
# }# a& t8 |' r+ }& q
6 L' P& J2 Y* f5 y) ~2 Q$ a2 J GPT-4 加持的微软 Word 平台,支持自由编辑 AI 生成的文本
6 d% ]' b$ T- r' C! D天津大学自然语言处理实验室负责人、教授熊德意表示,从 AI 发展角度看,这是一个重要的里程碑,其意义要高于 7 年前的 " 阿尔法狗 "。
/ ?2 N7 r& m7 U' d# ?" \0 n实际上,过去 60 多年间,利用 AI 技术,智能化、数字化和人口红利共同推动了中国工业与产业快速发展,尤其是深度学习十年间的快速进步,真正让 AI 在很多领域突破了 " 工业红线 ",在诸多特定的垂直场景中带来了效率的提升。* r1 |2 q$ }; k# H& v: K, y
不过,定制化 AI 模型的开发模式,依然面临研发成本高、周期长等问题,而且现在 80% 的应用场景都是低频的、长尾的需求,但却面临投入大量人力、收集巨量数据,却不能解决小数据、小样本等实际应用问题。
' ~6 y$ z2 o, s- l而谷歌 2017 年发布的 Transformer 框架催生了新的研究范式,即基于一个强大的多模态大模型,使整个网络结构完全由 Attention 机制释出,让机器同时学习大量的文字,通过强化学习和人类反馈不断强化大模型的学习能力,从而更高效地解决海量的开放式任务,让 AI 实现了从 " 数据飞轮 " 到 " 智慧飞轮 " 的演进,最终迈向 AGI 人机共智。- E; o4 ?0 r4 F: m6 W! v+ k
"AI 对于开发者来说是一种模式的变化,下一步对很多内容创作者来说,一样会面临工作模式的巨大变化,未来人们不需要具备底层的制作能力,而是需要更多畅想、连接、协同的能力,这些能力才是跟 AI 协同共创的核心商业能力。而这种生产力模型的变革,可能会产生互联网 SaaS(软件运营服务)应用和工具链,或者基于这些工具链新生成的社区,也就是我们可能会拥有下一阶段的‘小红书’、B 站等一系列互联网应用。" 商汤科技董事长兼 CEO 徐立,今年 2 月谈及 ChatGPT 引发的商业产业变革时表示。
- m. F2 q8 w: {6 j作为 AI 行业的领头羊,商汤科技拥有很强的技术实力和积累,能够参与到这场大模型军备赛当中。自 2018 年起,商汤科技便致力于 AI 大模型的研发,有着超过 5 年的技术积淀和实践经验。目前,商汤已成功研发了 320 亿参数量的全球最大的通用视觉模型,在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用。0 X8 x8 g1 s$ A
" ‘好的原材料’就是要深入到各个行业里积累非常多的 know-how。美国公司 OpenAI 能够把 ChatGPT 做出来,背后也有多年积累,从小模型到大模型的研发,中间积累了非常多的 know-how。" 王晓刚表示,商汤具有非常类似的优势,内部有非常多的研发人员能深入到一线,用大模型去解决实际问题,有很好的技术积累。7 i* y/ E7 C) @4 w* ?; @
王晓刚强调," 我们要拥抱全新研究范式,这里面的关键是我们要转变观念。十年前,商汤还没有诞生,我们创始团队在当时做的决定就是 -All In Deep Learning(深度学习)。我们之前在传统视觉技术里也有较长积累,但是,当新技术来了,我们就果断地去拥抱新技术。今天也一样。"
: \0 E) Z! K; H4 z# i6 |/ o实际上,本轮国产大模型竞赛中,有三个能力极为重要:算力、数据和应用场景。而在国内致力于 To B(企业端)业务的大厂中,商汤处于第一梯队。6 X9 A# f+ T8 @% v1 {0 ?0 M/ O
商汤科技前瞻布局,依托 SenseCore AI 大装置,以 5000 Petaflops 超大规模算力和出色的并行计算能力,为大模型研发提供强大的算力基础设施,堪比芯片行业的 " 光刻机 ";同时还有数据算法和强大的产业化能力,在智慧城市、智慧商业等领域的长期耕耘,商汤积累了海量真实世界的高质量视觉数据,支持商汤在视觉技术方面的持续突破。领先的算力布局,以及丰富的视觉数据和技术积累,为商汤多模态大模型的研发提供有力基础。( C) Q3 l6 r# D4 Q' S
9 V' N, Q  P& }. w1 ~
% H- S& A2 a: f* s5 j

+ C0 c, k6 V: i: F/ P, I徐立曾表示,AI 的核心是解决 " 工业红线 " 问题,而商汤 SenseCore AI大装置相当于粒子对撞机,成为业内稀缺的大模型专用基础设施,可以解决 AI 软件所需算力支撑挑战——类似光刻机,解决芯片的 " 工业红线 "。因此,如今基于 " 大模型 + 大算力 ",商汤拥有了 AGI 时代的 " 光刻机 ",成为 AGI 和大模型时代的基础设施服务领导者,对整个行业具有重要的应用价值和战略意义。
" q, q% `5 g# F- a" j9 D" 需要好的顶层设计,很好地把原材料设计成一个体系,商汤能朝着 AGI 的目标努力。除了大装置和基础设施以外,还要能从算法、框架上,把整个系统设计好。" 王晓刚表示。
5 m2 |2 |. k* x  l王晓刚称,如今,商汤研发想要做的事情就是怎么样去用好这些新技术。它带来的新范式包括人机共智,一起去创造新智慧。核心在于怎样用好我们的这个大模型,能够去形成正向的反馈,而不是一味地说 " 很害怕被颠覆了 "。2 c9 e' D5 M: p& S/ I. R" v: X4 `
千亿商汤大模型有何新亮点?2 t" ^$ P+ A" S: T" k8 J! c! p9 p
最近几天,国内科技大厂的 GPT AI 大模型密集呈现,从百度的文心一言,到阿里通义、华为盘古和京东言犀,引发国内企业的大模型 " 逐鹿潮 "。. O0 {0 _" I; o& w
相对于其他大模型产品,商汤此次推出的千亿大模型真正服务于 To B(企业)端客户,而非一个被网络调戏的工具。钛媒体 App 梳理了四大亮点和优势,从体系、语言大模型平台,到应用场景和行业落地,打通大模型产业闭环。
4 X% |- _7 E+ o8 c" B& l& R0 d0 Q" c) k! H" s3 P
8 c' z, S- |2 I' A$ k

$ w' H9 w: W( Q# ?首先是国内首个大模型体系。
- B- j$ n6 T1 A0 f  R; o- Q4 月 10 日,商汤科技正式发布商汤 " 日日新 SenseNova" 大模型体系,基于数据、模型训练以及部署的三位一体的飞轮,提供自然语言生成、图片生成、感知模型预标注、模型研发等多种能力,并持续更新多模态大模型,同时结合决策智能大模型,是实现 AGI 的重要起点。
6 B5 d$ R2 \7 K8 ]8 m, Z2 c. H' r2 A+ {; G7 I

8 d+ h1 [% M" h, A* ~& x* M5 W# `+ f7 W/ Y$ b1 P
据悉,商汤 " 日日新 SenseNova" 大模型体系的名称取自《礼记 · 大学》中,汤之盘铭曰:" 苟日新、日日新、又日新 ",商汤希望在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁 AGI 更多可能。
: P! e" |" C# Q6 Z" {  v* S& `实际上,大模型最核心的需求就是构建体系架构。而在前期,商汤前瞻性打造了人工智能基础设施 SenseCore AI 大装置—— 27000 块 GPU(图形处理器)芯片,5000 Petaflops 超大规模算力、是亚洲最大的智能计算平台之一、支持 20 个千亿参数超大模型同时训练、支持最大 4000 卡并行单任务训练,可持续 7 天以上不间断稳定训练——这是国内为数不多接近 GPT 所需算力的重要基础设施公司。
1 u6 ^4 t% e) C* F# `$ Y  E+ R* ?6 X& [如今,基于 AISaaS 服务架构,商汤已经打造了 CV(计算机视觉)、NLP(自然语言处理)、AIGC(人工智能内容生成)多个 AI 大模型。未来基于这些核心优势,在 " 日日新 SenseNova" 大模型体系和 SenseCore AI 大装置的支持下,商汤的多模态大模型持续演进,同时结合决策智能大模型,为 AGI 的实现提供重要起点。
+ ~& t: D# t2 B6 U( r6 y- Y4 Z2 M% a
, U: P- Z, y4 I5 e

! Z+ J0 V2 L- X+ S$ |第二大亮点是首个自研中文语言大模型应用平台。5 S# }4 V' v* u! j3 z
在 " 日日新 SenseNova" 大模型体系当中,商汤科技 4 月 10 日还推出了自研的中文语言大模型应用平台 " 商量 ",具备领先的语言理解、生成能力,将科技与人文相互交融。作为高效聊天助手,它可以秒解复杂问题,提供定制化建议,还能辅助创作一流文本,并具备不断学习进化的特性等。
: D- T; Y" r8 a0 T4 \5 L具体来说,在用户价值方面," 商量 " 可以实现单轮、多轮对话和超长文本理解能力,而且凭借 " 商量 " 中文语言大模型强大的长文本理解能力,帮助用户快速通过与大模型互动来获取知识、寻找答案;在技术能力优势方面,商汤拥有千亿参数中文语言大模型,具备问答、理解与生成等全面的中文语言能力,支持企业服务、城市管理、汽车出行等 600+ 垂直领域,并拥有逻辑推演与智能、兼具理解广度与深度、知识自动及时更新等能力。
  b8 L1 i1 T8 B/ C- B9 Z1 P2 v9 y) H$ |9 ~+ t' w& H
0 v9 S7 j9 O9 X# A4 U. S4 P1 B
# Y4 j9 E# s: X) H. j
无论是一人一句编故事,还是连续对话能力," 商量 " 都能准确、快捷的回答出来。  J. B4 U5 {  L; m2 x

8 c2 _4 d1 k4 [% `: J" n
5 T. d1 J+ o6 ^- P$ g* x
! w# p- c& I. u' }' w2 F2 H此外," 商量 " 已经在行业实现了应用,尤其在医疗行业和编程领域。从现场实际 demo 当中可以看到,基于大模型应用平台,它能够准确、快捷地回答关于腹部痛等关键性问题,给出医疗参考方案。9 q) ~) C" ?, F5 Y" X+ A  X* R% [- b
第三大亮点是生成式 AI 应用,真正为短视频、直播产业带来生产力提升。: t7 Y1 `' |6 g; e8 l
此次,商汤把 GPT 大模型应用于生成式 AI 领域,重构人与空间在数字时代的结合。商汤基于 " 日日新 SenseNova" 大模型体系,自研了包括秒画、如影、琼宇、格物等视频内容的制作和生成工具平台,为短视频、直播产业带来生产力的提升。7 X1 l* i/ R' `" Y1 C1 N$ v. h
以 " 秒画 " 为例,其是商汤科技打造的 AI 内容创作社区平台,可帮助用户轻松地创作高质量的艺术作品,自动生成元素和细节,并可不断学习与提升。其中," 秒画 " 具备超 10 亿参数自研文生图生成模型,支持二次元、三次元等多种生成风格;推理速度快,单卡支持每 2 秒生成 1 张 512 分辨率的图片;用户可基于单卡 A100,5 分钟内定制属于自己的 LoRA 模型 20 张训练图片;汇聚了 1 万 + 开源模型,基于平台发布的模型可设置为 ToB 服务 API,结合商汤大算力对外提供商业化服务,支持用户训练个性化绘模型,满足不同绘画风格需求。
- O; K8 X  P- `) s# u. P' K& ~1 n5 J1 ?

; i: R" U/ |0 b' h( n: A# P5 L% E7 J0 g6 ^: x! [1 z" u
" 秒画 " 带来个性化文生图能力(来源:商汤)
/ Y$ Z$ a/ q: j而另一种 " 琼宇 "、" 格物 " 3D 内容生成平台,是商汤科技基于神经辐射场技术(NeRF)的 3D 内容生成平台,分别是指琼宇大空间 3D 内容生成应用、格物小物体 3D 内容生成应用,可基于 3D 内容生成技术实现对空间和物体的复刻与交互。传统人工建模 10000 人 / 天的建模任务,通过 " 琼宇 " 只需要 2 天即可完成(算力为 1200 TFLOPS)。+ _2 Y$ M5 w" t) u! X. U5 H% \
商汤表示,上述两套平台生成的各类 3D 内容都够进行再编辑再创作,通过海量高精度数字资产的生产,满足影视创作、建筑设计、商品营销、数字孪生管理等各类对可交互 3D 实景内容有强烈需求的应用场景。
+ c7 B  \9 X, s" S& C! {最后一个亮点就是独特的行业赋能。商汤让大模型对外提供 API 接口,以及多元化、多种大模型即服务(MaaS)。9 c. M, b" ^, _
具体来说,在 " 一平台四支柱 " 的战略体系下,商汤 " 日日新 SenseNova" 大模型体系已全面支持了智能汽车、智慧生活、智慧商业、智慧城市等业务板块,打通了多个领域、行业的应用闭环。
$ Y/ Y2 R5 [5 h, a' I而且,基于 " 日日新 SenseNova" 大模型体系,商汤将向客户提供涵盖图片生成、自然语言对话、视觉推理和标注服务等 API 接口。客户可根据实际应用需求,灵活调用商汤大模型的各项 AI 技术能力,低门槛、低成本、高效率地实现 AI 技术在实际业务环节中的部署,或进行二次开发,创造更多价值。
$ D* L9 @/ W+ y2 @( B5 A/ X! J此外,基于商汤 AI 大装置和大模型体系,商汤将面向客户提供涵盖自动化数据标注、大模型推理部署、大模型并行训练、大模型增量训练、开发者效率提升等多种大模型即服务(Model-as-a-Service),包括自动化数据标注、大模型推理部署、大模型并行训练和大模型增量训练服务、开发者效率提升等。
  u+ g% p9 d2 N+ c( D$ C0 s; q1 D" 这绝对不只是说训练一个参数量非常大的模型,它是一个体系化的大工程。" 王晓刚表示。  H4 q/ K$ t& j; r
王晓刚提及," 涌现 " 这个现象的出现意味着大模型会不断给你惊喜,大模型能有新能力。而商汤在大模型训练本身,以及 know-how 任务理解都有这样的技术实力。结合自身的特点,具有通用性的商汤大模型,能够真正去帮助客户解决需求和问题。4 E8 A* k; M6 D1 c) N9 N6 c/ w
" 未来,我们也是希望能够依靠社区的力量把我们的这些模型进行调教,不只有原始模型,还有各种各样的这样的一些模型存在,能够更好的往前推进。" 王晓刚坦言称。
6 V. t& q/ a. g* h5 Y大模型只是起点,奔向 AGI 之路才是重点
) j1 x; o0 z+ m( h2 X对于整个 AI 技术进程来说,大模型绝对不是 AI 发展的终点,而只是起点。  Z# G" N: S% h8 z  I" U, j
1950 年,才华横溢的计算机科学家艾伦 · 图灵提出了一个他称之为 " 模仿游戏 " 的思想实验。面试官通过打字机与两个对象交谈,知道一个是人,另一个是机器。图灵建议,如果一台机器能够始终让面试官相信它是人类,我们就可以说它有能力思考。这就是著名的 " 图灵测试 "。
: q) T7 h0 F* W! Y# E7 Y后来的 70 年间,整个 AI 行业都为之努力,希望打造通过 " 图灵测试评估 " 能力的 AI 技术。如今,AI 算法、算力、数据 " 三驾马车 " 同步突破,AI 技术已经蓄能完毕,所有人终于可以大展身手了。
! A3 `1 W. |' M4 ?  L作为中国 AI 领域竞争与发展的核心玩家,商汤拥有 AI 行业全栈性研发能力。  t( `# i* o5 b! D3 G9 v# f0 E
商汤科技联合创始人、大装置事业群副总裁陈宇恒表示,所谓的通用人工智能新的创新范式,可以极高的体现商汤现有的一些 AI 产品的模式和能力。从大的方向上,商汤作为人工智能的头部的企业,未来肯定还是要去挑战更大的模型。因为现在很明显的趋势就是,每一代的大模型 AI 和算力有很大的相关性。
# X2 s  V3 S, E5 R3 j" 下一代人工智能比上一代,比如说 GPT-4 比 GPT-3 可能是百倍级的算力的需求,甚至它的参数量是十倍以上的需求,对应也需要更多的数据去完成训练。所以要不断地去接近所谓的通用人工智能或者 AGI 的路线上,肯定是要把基础的超大模型越做越大。这是未来 2 到 3 年,整个无论从学术界还是从工业界,还是从我们自己的对 AI 的理解上,都是比较明确的方向。" 陈宇恒表示。) \% G% i) G# h) ?+ T" ?2 L
此前,商汤科技发布了 2022 财年报告。: P9 U4 l" O( n: }
财报显示,2022 年,商汤研发支出达 38 亿元人民币(扣除以股份为基础的薪酬开支),同比增长 24%,2018 年至今累计研发投入达 128.47 亿元;人均每年研发模型数相较于 2021 年进一步提高了 90%,累计生产的商用模型数提高了 93%,至 6.7 万个。
" s/ s1 B, x8 M% l4 Y- v4 o当中国大力发展 AI 技术的重要时机下,商汤大量投入技术研发,不断推进数字化、智能化、产业化升级,符合科技创新下的时代特征,如今,商汤高强度的研发投入正在开花结果,在国内大模型军备赛中实现了第一梯队的飞跃,成为行业极稀缺的 " 头雁 "。5 E; A2 `. V" r2 N
英伟达 CEO 黄仁勋曾表示,当下 " 我们正处于 Al 的 iPhone 时刻 "。而商汤,也正在迎来属于自己的 "iPhone 时刻 "。
. n" v3 i1 C- w$ L. J* j( q"AI 是生产‘生产力工具’的工具,它将开启软件开发新范式,把我们带入‘新二八定律’的时代,80% 的工作由机器完成,20% 的工作由人来做。" 徐立认为,持续的大规模技术投入带来创新,再有商业模式发展,这是一条罕有人走的路。商汤始终坚信 AI 技术变革带来增量价值,必将推动普惠和公平的智能时代到来。(本文首发钛媒体 App,作者|林志佳)
! j1 U4 q! w) `  f9 w+ I+ b更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-6-20 05:44 , Processed in 0.037542 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表