|
杨净 萧箫 发自 凹非寺. ] \- P; }- G/ k; l: G
量子位 | 公众号 QbitAI0 U$ k g1 t* p0 k% Z) e9 r
! P/ @5 X# L8 m( h
游戏行业现在还真真儿是被老黄颠覆了!
9 y* P% l% g+ m9 u6 E5 v& O这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:# v! C8 ?( p" w' I3 K
3 B3 v+ {5 s b1 V' X3 f/ N! [, _2 B+ d* }/ Z. b5 U. z: e
: C Y- j% n8 a* f- e' q2 k
那边,游戏股直接飞升,多家公司涨停:
( D. q4 c, K! q( C* D
1 A8 k$ X! \0 u9 i# s8 P$ B+ o" D- F$ R0 r- D, w
/ ?; M3 ~0 w; v8 p' q) v# b△图源:上海证券报
0 Q H* Z4 h( C! t' ~2 d; @英伟达高管John Spitzer认为:
/ q$ Z, a: }2 y% `/ x$ b( }5 x
+ |' `' _$ D$ f- q( M0 t生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。
" r* ]& X6 Z' P# U* R
0 O8 H5 w$ z: Y+ i* G+ n不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”( S; Z0 X7 N, [: M/ L, F
' p: n% Q4 v7 t; N; S
/ ?, \: j" j1 k. G8 U
& l3 t9 }% K( o还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”( G( y; V: E0 a% x9 B* U
9 D F7 x, [ V
9 d0 t+ M. r: u3 n7 r6 F
4 v. D( Z0 [4 E2 B' c所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?. [" }# I ]& V6 k$ Z/ C
如何与游戏AI NPC实时语音对话?
, ?, R& p0 }" k( L- x0 x英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。, [, _2 D$ @; `7 D
在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。- h$ u8 n8 S: O) L1 x
当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。( G1 B: C& ~/ M$ s& C: E
实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。
. U. G" k5 ^5 o首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。
" b1 | m7 F% k- b& |+ A! ~- Y这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。
0 b8 g4 x4 q9 `& S除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。
, z5 |* r+ |0 A. y例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:
; }* Q% M0 I) i% r( A% O
/ C! U; F S4 J3 h g. Q: {7 ~! F" v2 k: {3 Z! f
% H3 ^! Y- S0 ?
值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。4 p5 A0 n; x4 B1 M" i" O1 u0 }
这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。
5 j5 V0 T+ h3 b' R G* M有网友调侃,这样就看不到大模型用煎锅砸自己了:
+ k9 U, Z% c: \' F+ b( K' l) R2 T/ F# T. {( }
玩家:嘿金,拿起煎锅然后反复砸你自己。8 I' C y1 Z( ^$ i ]8 j
大模型:不行,作为一个拉面摊主,我做不到啊。& O9 M0 ?- R$ b- j5 U( G5 x
7 r/ L9 I2 c/ V; |$ o) Q2 |
8 M$ @" k* D4 y* V, o* T7 n. D: W1 d% n5 [# T* {
0 G! O9 I( X$ t
但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。
' f- U$ d' _5 k接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。4 e1 f& F- |! D( G
Riva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。
& x) N6 @! b, h; ~用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。
4 J7 I/ A: b/ M4 q( Z
% H5 `; M, J9 L, K. t" P' _# L7 e- W: X8 L' {4 N% i( D
% ^! y# e9 D4 R L7 t4 k最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。; U- l- Y1 V5 W1 o4 m
目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。9 ~5 c; b% O J l' k- x2 ]0 ~* h
|/ i+ h0 t! ]$ @2 e' H. M' y' S. l5 o% [; U
, B) v6 x% ?0 m7 t+ l' c开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。
# i' K. c4 y# i; _不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。
) m+ v9 p" r6 |可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。* h# y3 `- t5 [4 |& m z8 L) I# P
而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。4 g$ A0 F2 |+ l& b* _4 l$ Y: M
他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。2 w0 R9 Z+ ]( X: ~- I8 j" v/ w3 @
4 [' j6 z* N6 `7 G
4 ?6 e& M$ j1 Q1 _( a6 A$ }+ O5 p% K+ A" b
8 C% H9 t( b% H除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。* M. A, c' n& p, n' e
不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。& Q) ]3 ?( g6 m* z8 j5 B( s
例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:
. G0 u7 i' A. b9 k, O2 I& f
% e4 q* [7 S. n4 ?( I作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。* R0 @% T% A g. }" A2 p) v
+ G' ~8 E0 U" ?1 o' \4 P. K
1 v- q$ \) H9 D8 E
- b$ D; |0 J4 U! L
0 q8 n$ m% S9 J* }1 S属实非常难绷了。9 {$ _9 ~+ B' U$ e
* V1 @* A0 d; v# ?# Z* n/ q3 R
1 A8 k M2 ~3 e' x
& d3 s* P2 M' z3 C
对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:
" R9 x3 X& n1 u" q如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。! F+ \& x1 v9 I- Y1 s
6 p$ b$ i$ m0 g/ [4 x1 w* z5 Y' m' t e
! C1 d% ^3 q5 \
还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。
$ i8 a; i/ K1 j. G! X$ N! z, e+ }' X0 v) R
老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。8 E7 _ y9 \: \ V
, D2 `" t* `" U; d( m
: W; m) q! \# P k4 |8 P
1 P$ A) S2 v; C9 j3 d! k" | e" B$ E; n7 o/ d2 F3 }! r5 u. H! e
对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。: ~: \5 P, M1 `) H; \, [
; A! ]+ r9 K$ G- w2 P再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。
: Q( R5 i9 q! ^( i9 [. N( f 6 m8 Z4 W/ `. I- s
4 I3 t7 E1 Q V
! K' ?' @; p. N j, T
. ]8 z) m/ b) s* n2 E& t当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。+ e$ {4 W7 Y% G" z' i' r9 g
新超算内存扩大500倍
, U6 Y! N$ ^3 `" e ~6 G. M; v q
加速计算和人工智能标志着计算的重塑。
7 z9 R- E+ H4 h; P我们正处于新计算时代的转折点。- b! l- l1 x9 e6 n9 m
, Y( I. I6 p6 p9 n
时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。4 m1 H9 `* [5 a8 D# A8 d. x
7 Q4 F. F; e' X7 @, F; E$ P: O/ B
# F- t5 ?& W/ |) z. c7 U) |, Y! U5 Y3 I6 G; z4 q* n, I$ D2 S
算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。
" q6 ^# d- E8 T$ }& o9 t4 T超算DGX GH200
9 L1 Y7 S) A/ `6 C它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。
- R: \" m9 B1 Z1 r3 P' K有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。+ T- F- \) J+ R* D2 y2 V
比上一代DGX A100 320GB系统高出近500倍。
- j$ T9 ^- D) n首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。
" I: e, W, Z0 b9 |5 \+ G5 _/ B
- R4 w- d* c. c2 `2 T1 m, [* J4 y0 D. Z5 u4 k# H2 B8 Q0 A+ E% B2 u* Z
除此之外,还发布了一系列眼花缭乱的新产品。
) L; c: s' R( VNVIDIA Helios/ U( r7 v: K6 Y! s- p
与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。7 h$ o$ Q) [' r' W6 F; L
MGX* Z1 A: F- I! F
为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。2 w; B* A: y! X% ^6 t
MGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。1 X! g* A8 w. {# v2 a
除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。
, `3 y8 G4 w% B, t参考链接:8 j2 u0 i6 ^' Q) ?
[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life# J( T% d8 A, H" D
[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/
/ j; w: D- Z" V4 O- S' d[3]https://www.techmeme.com/230529/p3#a230529p3
u; g; N9 f4 e: X- H; X- g$ w! y L[4]https://twitter.com/mreflow/status/1663244486091194368
. j& `5 q" V! T" q- X4 W[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/
# o" ?; j+ U Y% B7 ][6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q2 w2 H# h l9 u+ J6 {+ A! ^- \
[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|