|
杨净 萧箫 发自 凹非寺
( }/ Q( s; |% O; }* d5 F: ^- L, N量子位 | 公众号 QbitAI
. f1 S) Q4 C; M. x 5 F( X7 F1 S' `/ y2 Z, ?1 I
游戏行业现在还真真儿是被老黄颠覆了!
4 F4 f; x1 T5 m5 o! L$ K这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:0 S$ }5 d! F- L. ~4 S. l5 i R
/ Q- p1 i% l8 I R4 u$ p3 b7 t" `# G4 v9 B; P
% R2 p9 D* z" P那边,游戏股直接飞升,多家公司涨停:8 H' b9 S$ j4 l8 [' U9 i* r
- D: C6 ]) H4 T9 t+ j& k# k' x% i O- A
) p' t, r. Q3 ?
△图源:上海证券报
4 u7 V" g& x' i x1 X英伟达高管John Spitzer认为:
; O- D- G/ z: U+ T+ s5 |8 \) t
; S6 }3 p0 Z, S/ `3 Y- ?% R生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。* a1 d; |! ^4 \4 R" O m
# K. h! k+ B9 l) E$ C9 b
不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”, w9 s" @: q7 |* H+ r
8 @' O" l+ p2 q' A. C ?; l! p' L
0 X# q* ^1 |+ z6 j* C
/ }5 X4 s5 \+ {% u还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”
) ]/ @4 I. r6 G: V3 Y7 ?% ^5 o! d; R$ v% k$ u9 m M! x
* o0 ?1 Z, ~9 j3 d* k
# e, a1 `$ w* y; C
所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?
2 W9 @- q. I5 W如何与游戏AI NPC实时语音对话?
! l$ j5 n2 d- Y% p: x4 o英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。
% Z0 u7 R2 |- f! B; w o: t: m在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。" }6 v7 z+ T; k1 V* R
当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。' C' r3 j! c' Z$ k7 a+ {
实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。- [. f, }. `9 Z3 g
首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。
y$ k# O- i3 W这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。* @3 i( u3 U4 V" o y( b0 L
除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。 Z2 I! S+ b8 ?
例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:
/ a( r! {1 t0 ]1 k
$ ~7 V1 n' f* f) `" Q) z7 B% _9 {# D# {' Y
0 {7 U# c3 c. Q; T9 i6 @* O& s值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。, E$ \5 @ \% ^
这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。
' @ B _, F& E0 [3 r7 T8 r有网友调侃,这样就看不到大模型用煎锅砸自己了:
5 G# d9 W# U; n Y- x* l& v" Y# t ~4 A9 P! q% e% |
玩家:嘿金,拿起煎锅然后反复砸你自己。4 d' U3 x0 R1 w0 O" b
大模型:不行,作为一个拉面摊主,我做不到啊。
: g% F; ^1 z/ ]# C J( j' Z! B: A. _, u
8 ^) c& k: s" X8 n
. w' J( r" s, v! X6 m5 y6 N7 y7 \3 b& Q
但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。
1 H8 o$ ?6 L; O0 h8 `1 l. B接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。
% A. G+ O, I2 _: v2 h1 I- B8 IRiva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。* b! y" D1 D0 u
用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。! e& u- d, H2 z8 y/ d
. ~- l+ N+ o" _7 y
" t# ?7 z. J5 ]6 N; [: u
# k. u# W5 h0 s$ {最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。/ w0 E1 n% H3 `
目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。7 ~' h& m: q i. x9 B- z/ h
) b* o) Z7 J: p5 I0 d7 O3 ^: x: W$ O" `8 }/ M
# g; w, r. \ s
开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。. L5 f+ ?! t: B' G V
不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。4 v3 s4 ?7 ~. o7 J3 \3 ^
可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。/ S6 A @0 r5 \0 ]
而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。
A3 r0 [' M( e& T5 N: Z他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。
! N) r6 \8 K; v- t4 `; e* \, r5 J) j) o/ b, O' n5 v9 x7 J
6 b" ^+ q9 b+ D' D. e4 m# O8 E
% ]! a# j' C2 R8 a
除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。& h' R! U' Y. h* Q
不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。
V1 F# A5 C% H+ C5 V例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:
{9 C# U" W9 y. ~
3 K1 S2 R. I3 @+ x7 e S! D作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。4 |* h' G$ E1 r/ ~. o
/ S+ Y7 c3 W9 N' s
" r, R! \# o3 p! [4 n, Q( j2 K7 @! M
" V; A2 I5 e% ~8 p7 m/ Q! k& G- z1 k- M
属实非常难绷了。
: j2 e3 z1 `7 q1 o' G: h
$ v' c& Q" w. s- u. \5 z, Q6 s' k5 b# {8 f7 r; c$ ~
2 r5 _. Z+ J' v6 V z+ C% d对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:
' O7 O0 v" }1 d; f如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。( ~4 G: s% W5 |
; F5 _4 y& n; N1 e5 m0 N" w5 `' O; f2 H* x* M" i, t
+ j. [* s( r5 w& B: w还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。) j2 \& O7 t! o2 m+ X
. V7 |7 F+ H5 P4 @& O# v% }( K3 g4 m老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。
1 Y0 z: v1 \$ O4 _# T1 Q) ] " ^1 W9 s! l) {( E) r% Y+ J5 M0 ~5 V
. q9 Q1 s A$ g; j' d E5 b
( G# Q2 S, }9 o7 e* O% W1 i/ o, Y+ O7 y2 Q& y0 h C. a6 N
对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。2 d/ ?9 p+ }! D$ m( G: ~% Y
4 e* Z0 b6 g l4 V; i
再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。
1 f4 c7 g& ]8 Z& p1 [
( M3 v+ ]/ z2 G5 _) Q% g. e/ O$ Z U) s! }9 m6 N
% Y! Y+ w0 J. |0 L" I: p% ^* ~6 K8 Q
+ z3 L7 W- }- C' O; j: O当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。2 s+ K9 g7 f2 c$ J+ l* D. w
新超算内存扩大500倍
) j6 z0 G7 \! ^$ G+ H z6 J0 C* C# i5 ]
加速计算和人工智能标志着计算的重塑。0 f A) |. `* e+ T9 ~! `; y" i
我们正处于新计算时代的转折点。
1 }7 I) L5 J0 G' z' W z , D ?, J8 m- {9 k" h
时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。- e$ P; F: q6 \: F% w) j! K
$ z; @( {8 U6 n6 A
6 x% t% ]1 k5 Y$ _0 f' [2 c1 y4 S+ @6 u* b8 H g
算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。
# L$ Q2 S$ p3 X超算DGX GH200
9 W. l! L8 \& `0 C7 s6 F* K它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。
) l% A# z2 |* n: H有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。
. `; l& }8 b9 ~1 F$ O比上一代DGX A100 320GB系统高出近500倍。
! \+ n. ?1 `9 K# y& @首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。/ s2 L0 w1 m' G! [* u
% u; x. D; K( P
; U" F( O* g7 E/ ]* \( w& G
" D. t1 s. M9 v! Y8 I* _, w8 Q除此之外,还发布了一系列眼花缭乱的新产品。
* ?& x& J$ b. _: g- w6 r- \8 DNVIDIA Helios$ r; ]& K. s) I# Q" y+ ~; t
与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。" {; R P- C7 U* O, A. Z! b4 V. d
MGX+ k: D( ?5 S0 \6 y4 ^% D- {
为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。
6 O8 J; `6 z4 [8 W& aMGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。
/ V% }6 |- l' f& ?除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。
2 L4 q+ K3 O) W; z参考链接:7 O2 Q! |; ]8 [! t
[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life; j* o0 {- N/ B8 F
[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/
; a& J( }/ p) `- t[3]https://www.techmeme.com/230529/p3#a230529p30 J s6 W% K$ T' o2 K* N
[4]https://twitter.com/mreflow/status/1663244486091194368
. x6 a- K0 M2 g2 `$ h- m2 Y# p1 H[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/
/ b( {0 o5 N* s2 {6 ]8 d. |[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q, Y: S5 p1 p3 c
[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|