|
|
杨净 萧箫 发自 凹非寺) d5 u- G3 {; ]( y) C, E
量子位 | 公众号 QbitAI. ~1 T( j) |' Z' k% \0 f. @
6 _/ o. R( }5 \5 y- Y
游戏行业现在还真真儿是被老黄颠覆了!% z$ G+ ~$ A' |# I* ]/ N0 f; Y4 g
这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:
# Y# q r' q. y! N- N
]9 k& K6 O( @$ u2 |! ], e! i/ V' J" @' u; e4 t
: ?, `7 ], H' x
那边,游戏股直接飞升,多家公司涨停:1 y. l; J4 Y: `/ x0 `
' g) n8 p8 @' w @( K" N2 S" T
4 }% W5 \& x& Z: p2 ~# ]$ C! p: g
4 i4 A- Z! `, x+ ?' p△图源:上海证券报" w. d4 ^( S* u* D) [5 v) f: p
英伟达高管John Spitzer认为:
' [1 @. H, P. l+ A9 j
6 ]; c7 K& }: h生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。/ z" ^0 H9 T H0 i0 Y2 E Q- Z- D# S
+ y6 t" y0 x a
不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”
; H( ?$ I' s" t% q* X) C: k- A8 B2 R9 g
; q) t4 ]% d% l7 X8 m/ ?# U
9 Y9 Q* l3 D" c, f; {7 U! w
还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”+ A9 T, f" L- T2 o% C+ R
& J. ^ G0 n+ m8 ~4 y
a1 i% N1 ?# Y# P& f2 F3 @( m+ K6 f; C% h0 q, ~! S
所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?" T$ y3 K# O4 ^: e. H( ~4 i
如何与游戏AI NPC实时语音对话?
- K5 g! q( n# K. ?$ ^英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。/ m3 @1 d- I7 [1 R7 v# ^3 j
在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。) |- |7 Y; n% v. p
当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。# H" G3 `$ i, c8 n# m( a# A( ~
实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。
. U% v1 G0 a* B" Q5 T \首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。5 Z* U* M7 e' R6 N% L2 F
这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。
% x/ U' q( z4 Z) B1 H除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。 h$ e( d7 k" ?$ |$ }( I
例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:
1 ^) h- g3 P' }" ]) L3 O ?) p6 ~
# P" X# F# T1 u( A' k6 |# X" c% Z% H- y* z
值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。+ i+ U7 B& }3 M/ m
这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。
; L! m- I/ ?# s% ?# ~有网友调侃,这样就看不到大模型用煎锅砸自己了:
1 A/ M7 P1 ~ _: [. I r# M* a3 f/ t n
玩家:嘿金,拿起煎锅然后反复砸你自己。
: |+ m9 J# T" m8 H. }大模型:不行,作为一个拉面摊主,我做不到啊。
5 K# m) h4 l, \7 ^0 J
' G" b) ?' j0 H9 m0 A- X: n# C- }
+ S& b, r$ V4 ]8 _1 P# c2 }
! g1 x( ?2 m2 d: {. ?但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。
' u$ q5 v9 ?; R5 ]( Q接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。
$ |/ k' X/ R2 Z8 y! j* pRiva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。$ e% A/ @+ Y7 |2 k1 ]" ?
用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。
. P! N: _' v8 f$ \3 H+ ~5 \
- F! d2 Y; ]" z' T. n8 f* b6 T6 Z
' T7 C# J* K- @% {% D
% C5 Y+ p/ g) k! P; d) |5 l最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。
0 w3 s0 {( x' N% D9 n目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。
6 b# x2 x1 ]1 y- M7 Q$ N0 u9 m3 Z" ]" C; }
, n% d) \9 S& X0 L/ \$ K: V8 |4 K8 n) Q- `6 j% l2 v8 p! v8 D1 t) D
开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。8 k5 f5 p3 P8 d l% \
不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。/ S( R( b9 B6 T4 o/ r% Y
可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。
6 q- R/ r6 m! _6 \5 z而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。
9 n: N6 c& P; q% M他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。. ^ M. i! W( T" L9 J1 h
* g6 `8 `; E+ O7 U& o# h
% N& b, A* q) P# [- M# H8 {
0 U3 C. [- ~" [1 @% g
除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。% j% e: r9 j/ N) G7 V, w3 G' m2 Q! k
不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。( F Q+ F: u6 S2 R2 O
例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:
8 I! t% K& H1 `( T; ~9 `- o
. H. o+ ~) ?2 h( I! |. z作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。4 b' F& ~7 ~+ F, O; D. i D
+ ?6 u4 h$ m5 k. F8 k$ B! J0 R
! W a; _0 |! y" S" \
, k6 W2 p8 _" Y; e
: x5 P- ]/ }: f/ l, w& p属实非常难绷了。' k) u3 L; V0 {$ L% Q3 r
' D0 l1 u% N, o, F- [7 b; N% T( i# T W& t9 H
/ B# i* [$ V6 ?6 U4 j/ n0 o/ j
对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:4 y8 t8 I, \ g$ u- K1 q. d; }
如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。
* Z8 v B) p* c# Q" |7 _7 @$ N
# q( r, h- g% x4 t+ T/ ]) b c( n6 d# k7 m, N4 K
8 Y. I) E3 ]$ N3 k+ n& n
还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。* J: u1 j# j) @. O) R$ R" [
! D' c/ u/ l/ O8 S9 y5 s
老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。& M0 p) {6 v1 g0 ^7 f
" p# J4 y& y* @5 G
2 a! ~; z) Z2 B- T9 X' q6 C# {% q+ N2 i& K. k
! Y$ L$ b4 F* M! Q [3 ?" @: b
对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。; D. f/ S# [4 ?4 q% C5 }# w
7 q) S1 ?" }! e3 x3 I+ w再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。7 }% V. Q4 l, V, t, B3 d& n" f
! y4 e2 ~4 c# v \- I( I+ X
& x% |. h- s8 @3 G* j# c: r
a2 b/ a2 i9 T! F5 g- T6 d& [7 d- G! i* y; {
当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。9 q9 t3 w. j/ k3 L" s2 o- F# K
新超算内存扩大500倍 i2 w5 Q; o, v+ B8 K
/ s$ S/ V( I$ t5 I; A [ G
加速计算和人工智能标志着计算的重塑。# b' }& A' Q9 a& z l
我们正处于新计算时代的转折点。
1 N8 Y* \$ |8 R
% \ P3 \. p/ }% E3 e( P时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。
9 J% d& N3 e5 ~' X
) {7 P) }! W7 M% a3 k1 N0 X4 c' W
5 _ F8 c* C* p& ]4 D
算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。
( F1 n; }, [/ H超算DGX GH200" W5 c) G( ?$ k& g5 C6 h; H8 n+ v
它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。: j' a; _0 @+ G/ G6 q+ c( d% N
有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。: ?) ~; r- q' y
比上一代DGX A100 320GB系统高出近500倍。
0 I4 S( [1 d! U$ p8 c; H+ R1 n首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。
9 l3 \7 }* T( q( D) G. D. G( L% W. @2 \6 f2 j6 a1 A8 K
9 t Y0 @4 [0 y6 p: E! t$ J9 m) N2 Q" u0 Y5 S8 U7 Q5 A
除此之外,还发布了一系列眼花缭乱的新产品。
6 C! Q" |* k1 B+ h6 QNVIDIA Helios# |, A- Q E5 R3 l
与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。
" g I$ y( Z9 u3 Y' bMGX
' q0 V' T/ |( q2 V# s) i6 D. b. R为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。. |0 N5 ^; u! W7 J9 }! }7 s
MGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。) k& L6 c* [- c2 c4 {3 T
除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。
; j$ l/ A) N$ Q+ S参考链接:
5 m) \2 s% C" }! |- g[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life
+ T" j/ v' v) ~8 j# W+ z[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/$ w9 w- K+ q) C- P- q( B5 s5 G/ x
[3]https://www.techmeme.com/230529/p3#a230529p3
% r* d6 z! g( @9 m[4]https://twitter.com/mreflow/status/1663244486091194368
1 d6 r- ?) h3 P3 M[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/
8 D, A2 F; p$ \. l" n0 e8 F; f[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q
0 @+ ^% F1 f3 y[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|