|
|
杨净 萧箫 发自 凹非寺6 T6 m4 u+ }4 ?& {
量子位 | 公众号 QbitAI4 D! r7 z* ^+ }% M& d p! ]
+ s) x0 Z5 d3 t/ }+ l/ y游戏行业现在还真真儿是被老黄颠覆了!0 l: U1 C* x0 }' u5 D7 k. {
这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:
) Y8 g1 B _, m: V' J0 l6 I, z
h# Y/ Z& q0 r N
% c7 y; `& B* |2 W( ]# L
2 ^9 z: O2 f3 o7 T8 z; N那边,游戏股直接飞升,多家公司涨停:- c. | y7 \& f: t. I/ }
d- i8 B4 O; E; P& M
4 t# b9 E6 F" L5 \' S! w% G& ?, y: Q6 ~2 M2 p' c7 _+ R" f; @
△图源:上海证券报
7 D& K; j3 \) B9 f英伟达高管John Spitzer认为:1 a% H0 Q. \7 h, ]( ^
6 |( k( H/ C, d9 V+ T1 { i
生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。
: G$ B& a/ s V ! t- n8 c8 q/ R1 K! J& {/ m3 r
不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”
& o* S+ J# |8 C+ S
, T' l/ w2 U7 d" B& q
7 D' |& c$ \* }/ e8 V3 l5 T2 ^% I# v. G5 U
还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”
4 p; ]8 S" `- J% z7 g$ l) A3 i) Q ^% k( D0 g. Q5 a3 u2 ~
: K9 {$ @/ A5 X5 t% h6 ^
4 o T9 {/ p E9 R3 N所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?* l) \* Y. g" a; u
如何与游戏AI NPC实时语音对话?
1 U( ?9 Q+ |( N英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。
% N9 I$ ^1 S' u- y3 S4 {- s4 W在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。5 {) K, h. l/ V4 C: X
当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。
, M4 A: W/ T5 c! G* H实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。1 v( X& A; j% E% m& J
首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。& v4 T: a, l( {( R5 \% `- ]
这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。
" e8 f) p5 Y8 M# [除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。( ]6 k, U2 _0 a! I# E
例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:
+ z# a3 h5 x" f1 L" I$ _& w9 _* G& f @' o
) p3 V- S- K5 b' i7 z$ ?- G$ k; w# R# Y
值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。
4 M) h+ {% P @3 E6 T5 p* R: c( r这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。$ G* z3 k: s6 C. ^9 A7 e
有网友调侃,这样就看不到大模型用煎锅砸自己了:1 E/ i( O* t- b* Y+ l
4 y' w; Y: F0 L6 H9 r# f
玩家:嘿金,拿起煎锅然后反复砸你自己。
+ n5 D2 R( h' H! d大模型:不行,作为一个拉面摊主,我做不到啊。 x# {/ q; O2 l+ u0 i
+ U! r3 |! E7 g! R6 u
B4 p J8 g; U& C" z
% V, w* h3 {0 i9 ^
% o# C+ L8 R+ E
但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。
5 q* g+ c/ k1 S5 G( i接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。6 g. n" w/ S: n$ U
Riva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。
- @% a# G+ g+ ?% Q5 L( Q% D用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。
3 x7 z* F7 T" l1 _' b' G( f7 v% o0 q7 n5 _0 G+ r% h8 P4 [& u$ w
8 R; X. p& T4 O2 P* q
+ i" p& G/ e- j: d. A/ S最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。! Z" t o* z, h
目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。* i, f& |/ h" ~/ J6 x
! Z! T( m3 g& l; ?% L9 V! h& X( d
/ q) C% j+ s5 l L4 q8 {: c2 q. q
8 q% H) s# C" f6 _3 x开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。
0 Z( v& R7 b# }, I K/ v% i' Q不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。 F, y9 u& T$ v- Y3 F
可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。5 N z$ H/ |4 `2 t v: X
而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。
1 k% S: ]* |; u他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。$ L/ O2 Y& l% |1 z$ f, a
% u; [& F7 U0 t5 x
u/ {! _, k) ?8 f, M- l/ X, z
% w% r6 J: s; s+ N% J! C9 j除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。, i7 ?1 W" A3 D7 `6 e
不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。7 i6 R) U" ^/ ~' f! x& P
例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:; Q. y+ [: l6 X' z$ z
% _* f$ ?( N5 K2 C. @作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。! G: R- B/ ^+ K1 _
+ |: ~6 \% m9 y- e) o+ r! |6 y
. O3 ]4 z& ?+ f5 H
* L0 [! a0 ]. L6 S% ^- [! y% r$ ~; J/ O5 }2 d
属实非常难绷了。( J$ ~, M! e& N0 u* ~3 e0 E; F# T
9 x4 `2 m- i7 r. ~. }5 H
4 f" k: R% G/ L$ ~9 b7 y& W1 l* `
/ J' j- Z$ p Z( L t U; U8 Y: q对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:
. J% V: B. V. s6 o6 b, h5 ^* V$ x8 b3 M' u如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。8 ?1 |, ~! Z' _( Y8 j
( y0 N- z% y% ]
1 j% h/ `7 p6 u5 P$ q
# l. q4 `* X& U, k$ n还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。
$ \( o) z. ~: B7 f5 B y2 }' f. A( ?" [: U6 `
老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。9 w2 o/ F7 Y+ G0 Y/ @4 D/ L
% H# S- G) i! ^ |+ W
|+ ?8 Q4 a- f1 q. D; y
) ?" z- z; }, n! @3 @' e B# s3 R9 J' T+ Y+ ^) w
对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。
; r0 \+ `! q+ E0 [0 r, h& V3 G* Q3 T. F
再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。- Z. c- B& g" u, p
4 w) z* c0 |) ?+ O3 R
( L; K; ^; w7 P
' D/ g3 h) X& N1 e6 X, C
4 S! L E+ z } a1 o* Q当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。5 y8 o" M: l) J& M
新超算内存扩大500倍
- t% i# ]+ R$ C( E! h [5 B, k; U/ Z2 x
加速计算和人工智能标志着计算的重塑。$ l- ^: S% `# G5 Y9 j% W/ D
我们正处于新计算时代的转折点。7 _, w; u: I3 Q+ j2 r1 [; v) K
0 A) A0 E* o6 O" M9 Q- E/ w时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。
! @% c8 ^( w( K/ B' r
+ `9 s5 Q3 c. K& o
( X; N, ~* h9 q" W, b+ n; W- c7 R: h
算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。2 j" ~5 x! G' Q7 n" @
超算DGX GH200
2 z( w* ?1 L! |1 D' T; @! J( V. O它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。
# z5 ~8 B( n* y) |& f i: j有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。' H: L- r9 Y8 D' b, Q7 l
比上一代DGX A100 320GB系统高出近500倍。
) r7 O% F+ [# \6 H7 y6 V首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。
% s/ Z' p# V: {4 L! ^4 u0 T5 L* }6 E; ?5 a' v
# B* ]; f" R! [* e; O0 \3 _8 B, k. [8 k4 j
除此之外,还发布了一系列眼花缭乱的新产品。
6 |/ w8 p. H- o& V: `! V; [4 uNVIDIA Helios
" F; a9 o4 }5 j+ A/ R8 G- Z与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。
3 \" T1 ?, u' dMGX3 W; F8 m4 i8 x1 }* h
为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。
" j: c6 r h o8 yMGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。2 l( M4 u3 @# Z
除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。' k8 }$ g# p7 O @$ ?2 Q% |3 W
参考链接:
) I6 B2 U% G3 y3 u6 F! p[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life
# P9 k7 V1 F- R[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/
/ J7 A+ I, N; W- L[3]https://www.techmeme.com/230529/p3#a230529p3
8 C* M1 _( ?7 Z! @/ [[4]https://twitter.com/mreflow/status/1663244486091194368# d& O& C& O6 | d5 y4 e3 B- _
[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/: s6 }& S% }' S# m6 q+ e$ ~
[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q; w9 x/ Z) r: S
[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|