|
|
杨净 萧箫 发自 凹非寺: j% c/ a. Q7 N) X" [
量子位 | 公众号 QbitAI
u1 N6 }; z# Z) H' e) L
; P5 w }" w6 o游戏行业现在还真真儿是被老黄颠覆了!
+ U" j! [% D# u这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:8 G; ]% [) t, ]( f1 u9 P6 H
! N& z$ W+ p% I: h6 o
+ l# l* P) H& _9 p H8 i8 L) T
2 G2 v' B6 q% D6 u+ b2 j5 ]那边,游戏股直接飞升,多家公司涨停:, k- q* P1 c; P+ e+ B$ K
; ~* q# h* C, v; V6 I( i; L9 Q& r; ~+ h# j3 ~; E
1 G& s# X# O" Z5 Q
△图源:上海证券报
$ G1 \* Y' e; o' e: d3 }1 v英伟达高管John Spitzer认为:
1 y$ V# Q9 M; y" @+ T# U9 e& g5 |9 P; B g. ^
生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。
4 G y" n; k/ U; S 5 h6 X3 v8 {, H/ V+ X8 ?
不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”) I! L0 a0 @8 O
+ s7 D S+ u0 S$ ~
w9 r1 w/ x K4 }/ E* t
+ Y+ X* X& d& Y0 O
还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”3 \4 R+ ~% W q4 L+ T5 \' v1 W
: R; s, l/ P$ o
# p3 x7 D$ g2 P; t0 `$ q
( o! H) Z8 H4 H" b8 u- h7 {% }所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?, o$ o4 o3 `. Y9 z% V r0 ^+ M1 s M
如何与游戏AI NPC实时语音对话?' r+ Y3 B9 [9 I! ~
英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。
6 y6 I* d7 J' ^: s) _$ c$ u! f% r在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。
$ O% w+ K9 o* v# A# N& t1 u8 k" y当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。
+ v" G4 P/ E) w实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。
4 F/ d7 Q0 ~- i* }3 ~, G首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。2 d3 G& ]: a- _8 g5 d1 J! ]
这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。
6 e" M) j% g- U: `除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。
5 X- a) T5 y! K$ k) ^* Z例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:
; ?& n% q1 R+ T! ?0 X+ ^1 P, a% A* J$ s4 J( E4 Q+ S) m1 a
9 C9 K* c, ~3 M0 }- |
) k8 f1 m" }6 h; L5 N2 g
值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。7 g# Z* b" \7 {+ R$ E. @) i- M
这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。- C# P+ P$ g" `! [: A: g! A, Q
有网友调侃,这样就看不到大模型用煎锅砸自己了:
- u1 W! p# {. f0 g* g0 d5 c5 r1 F
玩家:嘿金,拿起煎锅然后反复砸你自己。- G2 d$ I& u$ z+ z8 L, H% x d& K
大模型:不行,作为一个拉面摊主,我做不到啊。8 C/ l/ @1 P$ k* C
& Y3 a u( s6 ^; N; F, d
9 O* ?" N; S' Z' S3 d# ?4 s' j H7 D) t: C4 r
: a2 A5 O! U0 @& q- x2 r) ~9 B
但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。
0 m9 {! z& r4 y4 B* R接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。& \; S" F9 ?$ M' @) x: a
Riva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。" [9 U% v$ m! ?! P" G
用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。$ w7 @. H8 | c4 Y& u
, c) l: `2 F, d4 D7 i8 d: h% s
' v7 x7 ^0 g5 ~2 g; n* Y% Q. ?) l! N2 D
最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。0 v$ s) \" W# P9 p* N# ?" \
目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。
2 e) D5 d8 f. t4 G2 p p1 v8 n
/ k8 Y- C1 r# Q U' G; y! e3 v/ z" x0 P5 S1 h
0 N! }- @' \ Y# I0 i% I: a. @
开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。
% |( H3 h0 c6 S0 `2 k不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。
D# P( [5 _ A' ]8 {6 }: ~可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。
]; ]* f5 \: v& t而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。
5 A& m- t. Q1 N( q k, A他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。1 i. i9 i* @2 X( T* n
( K* t5 [/ y) J8 `+ e
) b6 W* K, K" b/ N' z" I
: u$ G8 \. O2 e' Y. B- `8 @除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。
( T$ U+ \9 S7 O3 W0 z" @不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。
/ a L% i1 o. \例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:
# m: A3 s+ R1 g* L% @+ t6 Z5 u
4 f! r8 C$ p4 b2 b: U+ i6 \ A作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。
* B" {+ s% h7 u 9 I# }' U3 E- y' a
% _+ x7 Q0 A, ~1 U" H- @
A1 a! J0 i; q( u6 `
1 U! C4 \; ?( M, v9 D; `
属实非常难绷了。
6 _6 J. B, A; b; T9 p9 x6 m9 U# b6 r l$ n( w: W
$ H. N# I" q' j
5 a. a4 E# H- A+ z对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:. k; h% B( U' x- {& C; Z' [9 G
如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。8 y* j# r$ w3 f4 o* c
- J: M4 _0 r" E2 s+ G7 D' m9 v) a6 N1 L( r) E
' U: e. a, [3 `# u7 U, F
还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。3 L# V* k+ F: \7 s" f3 W
3 R) t! |0 V) H老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。0 B/ }/ T+ z* n& |0 I0 r: K+ o
2 I2 d$ m. Q( f, F$ m4 g" g
5 t* T8 Q8 `' D# P( h
# r3 B5 F7 _+ P& B8 R9 U
* ]/ ]) g0 o- Z( }1 n对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。, e+ A& X8 h0 v1 s, R6 H8 O$ @; C
7 f; `/ x% m4 l% e) n8 E9 o再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。
9 p7 M; _& |& a & X l- w1 `: R: G- S
9 r0 u4 ]) E0 W" e
- P) J( \" B7 s( M/ u6 X& d) l
/ z, I5 N/ ]; [. ~/ d$ A. p当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。 v' n+ N5 _$ {* P" O1 G$ Y2 m& T
新超算内存扩大500倍 ]' N: [" O5 g0 D. n4 V7 C
8 q8 W5 e6 @. @+ e3 ` E1 v
加速计算和人工智能标志着计算的重塑。$ p/ ?" H1 {% `# ^ c; \( G* I
我们正处于新计算时代的转折点。
# ^5 @5 l. N8 g; \4 M3 v . p2 n4 _, C' H
时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。
! b5 v p# C5 R$ M7 K& y
( Q# R8 Y- i* }5 i4 u
$ t8 {2 G9 u5 q! W9 ~. L$ A3 m
5 W9 \, x; W) N# |1 G! V$ r算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。( K3 H7 I2 g* v2 T2 T0 l) N
超算DGX GH200
% k+ W$ I) K2 |5 Z它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。/ y4 X O! a2 k4 g
有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。: K$ R9 X1 O5 h$ ^$ r0 Z9 g5 f/ z9 H- G
比上一代DGX A100 320GB系统高出近500倍。
* p! V8 J; M* j! X首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。
# S1 `8 r8 ~1 t: J$ @5 G5 o: m* e; ?; h
: H3 X$ N9 `. y a7 _* x
* e1 B, z5 }) [7 n: B8 u除此之外,还发布了一系列眼花缭乱的新产品。8 {5 M& t$ w* i
NVIDIA Helios$ {6 c u2 r) y; `3 I! \& R9 C A
与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。
0 s1 |5 Q2 |% E3 ~( R4 j( ~: @MGX% ^% D7 B3 p0 ]- s1 u6 G
为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。2 O; C$ N- w. K& w: P
MGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。3 i. c6 U% M9 p/ g
除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。# e$ E5 n3 W6 W3 k" M4 I
参考链接:4 f+ @# q4 [# i
[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life
3 v6 P9 O/ X* ?+ v2 e2 V7 p ~[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/' U* N. g; n( e! B$ u' l0 O
[3]https://www.techmeme.com/230529/p3#a230529p3' X" q' E8 l( w8 Y' b6 w1 X" O
[4]https://twitter.com/mreflow/status/1663244486091194368
+ U4 w+ i9 p, ^0 f[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/
b8 H, x: P; u8 @4 l6 e[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q. ]& {- M: a+ z9 j# n( J
[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|