|
|
杨净 萧箫 发自 凹非寺
' \, E- ^9 F% ?* o量子位 | 公众号 QbitAI
0 i( y; A/ N6 o* `& s [ c5 `- Q, \2 [7 D1 r) u
游戏行业现在还真真儿是被老黄颠覆了!
6 A. c1 _1 v8 j* l* j( q \: |4 J这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:
6 g# c! N* }" ]0 M& M4 y' ~0 o. k5 `! _9 M# H3 s( E+ m
9 t1 A; u. G: a7 g/ c+ M
8 a/ b5 D- A! u
那边,游戏股直接飞升,多家公司涨停:
& z8 {, F0 w" x8 c7 o3 _, W: }, T" L+ F( J
& H4 S+ |$ E8 Z4 t& P* ]0 }9 f+ u" r- {: }5 S% {
△图源:上海证券报
! E7 S' Z- w% x& R英伟达高管John Spitzer认为:
( W0 h4 m3 E0 x8 U* N" i0 F( [
% ^' V- t: R/ @- X5 E* Y- k生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。# q' K3 q+ d+ M' p& N! ]) V. y
6 o0 z6 `3 r% E+ L7 c& F: q不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”
0 C0 T2 y; z6 F- b) K
$ w6 E; m& Z" `. W# G. b: z. r E, [0 A3 w( D
+ Y+ w$ z& A3 @ ]" w5 S
还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”
: I6 G* R2 L: A: ?7 A6 q8 Y! G' M: Y3 ?. q# O$ p F. z5 G
! Q& S5 l. m" S0 x
4 A5 d$ b1 x; b0 p9 f所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?) ]* s# B; B* e( z2 S. [( _
如何与游戏AI NPC实时语音对话?
- X$ _6 M( L+ ?! w% | y$ b英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。
: x6 T( W+ k$ j& ^% I4 X在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。# z8 W+ E7 Q! w2 j1 w( X
当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。* F9 `7 |$ |/ L6 I1 _% U2 @
实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。
8 x* n# Z9 X) y8 T4 G( U$ `. X; x1 v% H首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。
+ t8 U* J( j9 C( s这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。" W7 V! [1 v+ D
除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。
/ n0 |! w( G# a, ~7 W8 H例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:
+ Y7 d1 t* [5 b
8 C7 q4 w& Y3 H* J$ T
$ @' M* N) ~/ u- N0 \
* M( [$ \) ~- @+ i2 D- S( T+ k3 R值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。
9 X- {9 c" ]' v* V# Z这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。4 {% B1 ^8 p% f& C/ Z. a
有网友调侃,这样就看不到大模型用煎锅砸自己了:0 k5 q( z9 f+ \3 y
T6 f f, Y# v, O
玩家:嘿金,拿起煎锅然后反复砸你自己。7 G: Q4 b$ N. q) t
大模型:不行,作为一个拉面摊主,我做不到啊。
1 s5 d2 M" v2 `% t# c 5 t$ A B- D( b% ]6 T/ s O
* L! _4 J! {4 x- K, I0 _5 M- i# O5 I
$ _+ L; a% l0 P3 s6 q但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。
6 k2 g' {7 b& q3 b% u; S接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。 u S( V# I, W4 t Q. N2 |2 O
Riva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。7 O# ?3 T0 Z4 `- i) n' H( `# }
用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。7 I- J: @ B; g D( X7 Z8 j( r
1 M3 S8 x; s9 @7 }* C( P3 [: k" h9 c8 y. F+ e0 T
/ J3 }+ @7 M. k( H最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。3 [7 `9 Z" P4 j# ?3 L
目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。
) h+ w! `3 E9 g S- {9 C7 F! R8 ~
7 m2 v/ b+ a5 Z! r+ ~
5 B7 C5 }5 }. d
开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。
% v3 x# N9 u0 j- R1 U! s/ E( ~$ K不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。
9 c& e- \8 s. S; G9 r4 u4 i. k可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。
$ J, n$ Y* A7 ~3 p而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。
7 S8 R/ V9 T2 Z( w他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。/ @9 T9 W3 R+ n& y6 q5 U6 j
- ]2 C0 j' g& X$ w! z& w7 z! o8 m$ T9 t/ S& d3 q
; r Y- F9 c: ?
除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。, f! R0 [: m! y7 Z
不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。
# s v* r6 Y5 N5 T例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:
( h8 s4 `& w5 g0 y6 v" w& y# k2 O# ]& b# |& y
作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。' C% z) v1 Y; j( Z7 r
' r6 U. U4 n2 Z- D& [- w( _' e9 i5 U" u; M6 ^+ k- _
8 l* j2 h! y. J! _
: {' R" v* y ~9 n属实非常难绷了。3 z! L9 p: t* [( x
. u5 _0 | n* b1 w/ R
$ }) ?! B2 d9 \8 l6 P. `) p: a0 j( Q h7 R! m" W
对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:; E& X! p# |! K& y$ m
如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。1 z3 w! D! H; l" y4 ~* E" U' Y
9 }: \5 C5 d1 Y1 P2 M7 d) k
& R; j i+ p. P1 G
" T; o2 P: f; v6 T- M5 l; r! u% z7 M
还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。' R9 z' G7 o# x
; `. j" }' E! L) Y8 x* U. q5 G老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。! r+ {) j0 u, g
b1 ?! t% P0 x; G0 S
' K- e7 P9 }/ p W( s' _& v! u
, n$ o' ]2 v% p( X
' x, |; Y/ J' C. U对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。* t2 f/ r3 T/ s8 i. l- y
0 G$ G6 V" e" ?再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。$ C: o1 p: g" Q0 Y
9 l" K% t! u0 t* \) p9 ], Y
- B0 U; E K M' | F6 _* [
# n3 b% o j) Q0 N0 F- V2 ^, t
' t' Q. J( z# l1 F4 ~当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。
6 e2 s7 }% A/ |% E" R; E新超算内存扩大500倍
; T2 u$ }; o, M% m
& Z4 Y, f" b3 b/ p: o0 [7 c" g加速计算和人工智能标志着计算的重塑。2 K7 i3 W$ S# Y; a" d& t
我们正处于新计算时代的转折点。
) u/ K( B) m0 y; A2 ]7 X. Z ( `% [' J4 d/ s b$ \4 ^3 D0 F$ s
时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。
+ c. L9 B N! R' f5 b
# c2 s+ Q) N3 @1 h( m- w: @
7 z4 ~, W6 \: P/ b
& s" u; h1 `$ a+ D8 c算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。9 B9 f; P' @7 q5 @- `
超算DGX GH200$ w7 J2 M$ X5 A% v3 l: @
它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。 B/ r3 H& ~- ~3 `7 G
有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。) B5 ?" B6 k7 J
比上一代DGX A100 320GB系统高出近500倍。; q; [; a; o: a4 t7 h
首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。
, j3 C, s+ T0 @: O$ ?: \
" C& B& m1 T3 N+ D. H1 Q6 \* _ e( H: n0 u
8 o3 J2 f% O' b- h$ _' Q
除此之外,还发布了一系列眼花缭乱的新产品。
& E2 [! |! _0 f/ B/ bNVIDIA Helios0 E% v( F. c) t2 u5 t
与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。# @ P, q3 [" t! ]
MGX3 h$ f# ?/ m5 a; Z7 L
为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。( h7 D4 F, B: a6 Z8 t2 B
MGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。
' ~5 K/ ~" n9 D# E& D$ y. g" {' e; Z) @除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。& [8 |. H/ ?2 r/ r. W) r
参考链接:
4 k+ a7 w' O7 x# ~[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life8 r. I* E! C2 K6 Q4 @+ u! U7 ~
[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/
3 _8 w4 H" C9 R p# ~1 z) k$ R[3]https://www.techmeme.com/230529/p3#a230529p35 P: m, F. H. m! N3 E
[4]https://twitter.com/mreflow/status/1663244486091194368" T0 r) \' \9 \: R7 m
[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/
" g/ t6 g( q) G( d[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q- b3 U4 V4 V% e H7 f# E' |
[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|