|
|
杨净 萧箫 发自 凹非寺: W, W. J5 ]3 i4 J3 v
量子位 | 公众号 QbitAI
! ]% q/ u8 G1 R8 y, B; } : M9 y. j+ i" z1 { h* U& H
游戏行业现在还真真儿是被老黄颠覆了!
/ U Q g9 i, ]8 s d这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:% S8 s9 _+ X5 C' h
3 Y0 D0 F, R# b: b4 I4 P
0 A% U! a+ k0 y5 b( D( X$ A$ O1 o
D- ?; G4 V: g- J% [: I那边,游戏股直接飞升,多家公司涨停:. T' U: w {: `9 a% R/ p
7 _" c% A; K X2 c6 Q4 X7 |# k# B; l6 `3 W& ~
7 D- ^' h5 n( _△图源:上海证券报" d9 b& g9 s9 R5 ]+ s- Q) {7 \
英伟达高管John Spitzer认为:
$ _; i& C9 W- n1 T6 U! G( ^* [- i
2 O$ B3 a! q/ ?" \/ U. v: m生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。- W* I, Z$ L. g" H
6 u1 S3 t) S2 p E不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”
: e; g3 k% e+ F' [* w1 o# I9 M- U* ^% b' n9 o( B. R& y9 M
1 F! }: T8 H: g1 k
0 b% f3 Z: X/ n; K还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”2 d' V, K8 r4 }6 b
8 ^, R$ `5 j) I; I/ k( d6 E; r
6 ~8 y+ q; p3 w$ r! M, M7 z* }# T Q$ i& C) E# r9 r: G7 C8 Y
所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?
4 c5 ?. k& |0 Q4 e/ x/ A# [8 E/ _如何与游戏AI NPC实时语音对话?/ I3 }7 I& q$ \
英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。
, Z1 X9 g; h a6 z. M8 e在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。! Q& _: K p0 s. J
当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。5 l$ T. p# t! k ~
实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。* W4 ~8 _9 _. }+ p/ p+ F
首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。
4 ^/ B1 ~) k' z; H% c" @7 R6 n& i这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。
9 K1 o" [) F) v6 i6 b4 n1 W除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。
& i& J1 R9 a0 I" v! r1 `例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:, T: c2 G1 |7 [
7 {3 }" w4 K1 \$ ?1 B! w
' K, G% E& H6 O' { d9 q9 e# N) z3 N/ Y: U
值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。. _. V% q# e5 H
这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。
$ C* J2 W; E3 Q( B {有网友调侃,这样就看不到大模型用煎锅砸自己了:
2 C- U5 l( V% a" X( G* Q0 K- {9 X' r N" t
玩家:嘿金,拿起煎锅然后反复砸你自己。
8 q. t- w8 Q+ y, [0 T/ R ^大模型:不行,作为一个拉面摊主,我做不到啊。
& ] T* q: z9 Z& u, f$ O 9 ~ C* o$ C: m3 ?& H
$ t" [) w/ y2 C; |' m
- a }# a: u( j; D
& D3 h) c: d9 l: n, L0 j但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。
h* M7 h$ }& o1 @2 j0 |# d接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。" w- L$ w( f! i$ W# c/ E
Riva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。
P9 g. M g3 M0 D用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。
3 Q0 F* _& V- V6 x5 H, D# x3 b/ u# ?3 T( D$ T
$ j% p& r2 S1 i& j
6 V3 P' D+ `3 I% Y8 }
最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。$ H1 J; c. x9 G# U
目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。
1 i( e' S8 ]4 W2 p T. O8 V7 Q" o* T! ` m& M1 W
5 j( @/ }5 r/ n" @
* j& o9 Y8 V Z) Q' {: \开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。
# W% g9 Y/ g- B5 [# W不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。, o5 L! H0 e) k- f3 o
可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。1 L9 q, k. |7 V7 l9 n
而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。
5 _ O5 D- f f' \/ o1 P1 h* q他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。
# _7 Y! `$ c( \) y
# l: G0 c' W! c! N2 \
3 f( I2 z9 T% @' Z& ]( l
( Z6 B1 f' P% U# R$ F5 O除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。
% b- P) Q" i c3 ^9 {不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。% `! V3 X; d& `- ?
例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:
& @. |' t! W( ]7 u- h( s h1 p- H, }& F" o
作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。7 y/ H2 {# A1 ~& d+ i* K" z
+ }6 N0 `8 s, Q T, w
( }1 w' p2 X' v! l- U6 y# ]/ S5 [: r4 T3 G
4 H# A, y8 \) v$ V X属实非常难绷了。
( \2 l) w9 C; y1 |% g0 R7 W! G+ k
0 ]% Y% i+ P& e
7 k0 T9 ^& Z( j9 G1 X对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:
( y" ]! N, ~+ [* Y1 ]. q5 D8 I- {/ S' ?如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。; F+ C3 h/ s6 ]+ x5 t+ a
. x" P# {1 Y( B
! }" S; f' I4 X( a' \! z$ n" M7 t P/ a2 ^+ q2 ~! J
还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。2 R0 S o( | D# V( H/ V
5 G. s9 k2 n+ B2 Q* s7 ~7 a% m
老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。6 k# g* _2 O: S# C9 h) y. u
9 W' e# x7 A! T d; p" X7 K+ q
) |& Y1 ]+ l9 W( |
! i; P( W1 ~- ~1 K3 @& [7 V [
$ I. F7 C9 U! i# [" O: e
对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。6 ~ k! _* e6 ^3 c7 }. A
: r# Q* {+ y2 W, G- g S# m
再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。
* f3 X, y0 y. g1 Q
1 t4 D; T& n4 C, M
5 m: v% k* b- d( W7 `1 p* B
; @8 K3 F/ d( v
# C" x, k/ ~6 {5 t$ x+ y: {5 @当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。$ Q3 M8 E; O! k( e$ m# [' [, L
新超算内存扩大500倍0 p% k; h% J! \6 A `
% L+ E& K4 G$ ~7 E2 ^ }$ y( G3 P
加速计算和人工智能标志着计算的重塑。6 p- B; ?4 `! a- ~; F
我们正处于新计算时代的转折点。! B' x/ r+ ~7 k! H. E8 _4 U# Z, e
* \+ @9 Y- Q9 V z$ S3 @
时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。
( j) ?6 ^0 B0 a$ W$ a& d: F, w3 v
1 C' y- q8 b Y% t! W+ j! b0 g9 @, G% k+ e- t
: e" H$ r# R/ Q" h6 B* S
算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。
: V" J5 R: T9 |. i, P% W超算DGX GH200
/ ~: ?% f( @ e* a" \: ?它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。
% u, g4 ^0 d5 {7 Q9 A1 Q有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。. T6 X2 D8 }- l5 Z
比上一代DGX A100 320GB系统高出近500倍。4 r8 @+ b& O& y0 x2 X4 Y, u
首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。, B) l! D3 Q9 R+ U- A4 X* I! E
6 E. V" S" _6 E9 F- I
% K8 W) f. k* U! S5 E3 k; E7 Q) s9 _
. `: o% P" M9 H6 @1 @除此之外,还发布了一系列眼花缭乱的新产品。
5 e, I* ]+ M7 r2 k4 n }" ?6 BNVIDIA Helios$ e! Q+ g" A0 P" O% r4 b
与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。6 x4 Y1 G: s8 N8 s8 z; c4 j
MGX/ k/ x5 z v3 Y" d6 L. q: Y5 m$ |: Y9 r
为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。# J0 o6 P: _) R `/ s) W1 N4 F3 Y; O
MGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。: ]) S y, v0 H4 g2 S. m" i- Y+ R$ F, c
除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。. K/ N4 t; P! @1 t6 X- V% {
参考链接:' r- H- m0 q, A$ @+ y
[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life
4 w' j& o3 v9 l4 M) f[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/1 Y; Q: o. Q. ^9 Y6 S! G, a$ ]3 R
[3]https://www.techmeme.com/230529/p3#a230529p3
$ D. ~4 H) R7 [6 j- e8 }[4]https://twitter.com/mreflow/status/1663244486091194368, o4 R! u# y( X" p2 |# J
[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/
- Z9 s9 s: ^/ n3 F2 y& ^1 G8 B- K[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q
5 s/ K5 l2 w! M- e/ e[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|