|
|
杨净 萧箫 发自 凹非寺
4 @ ^$ Y! h' L% h. W量子位 | 公众号 QbitAI9 B/ u2 [% }/ L3 G6 v
+ J4 |% A' k. a8 G3 I) x, X游戏行业现在还真真儿是被老黄颠覆了!, f3 A7 }+ R) P. D; K L J
这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:! I1 G, A9 F& F: ]( b/ T; y
5 t* m% [2 X9 P7 X
% R7 V% Y9 `6 k8 c* n/ B! y( f5 @, U) p! z
那边,游戏股直接飞升,多家公司涨停:
* S, s$ V8 |/ I0 b
$ m0 h- [8 J) x
# u/ I! V; N- H, o0 W; p: n/ ~! T; P
9 H J2 w& ]5 R△图源:上海证券报7 C! h! H6 B0 B0 {9 i
英伟达高管John Spitzer认为:
* L3 e x: u6 e. J2 a* f" w6 L* p
; G7 r/ Z0 ]. Q9 L% C1 D; l1 v5 b: m2 Y1 ]生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。
8 f7 }' t4 A+ u
' w' A& u! U/ B1 R! D& b/ S2 n, c6 p不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”4 S$ @- S5 C! n @& n! t9 a
. g; H( K! W5 Y- E7 }2 `4 [
" } t& u5 j+ w: [: B
4 v) M+ M! L$ y' }- o2 h
还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”
2 N$ o0 V u, K6 R
% _7 ~6 U6 S) d! p! @
0 P! U6 q1 a8 L6 H6 D/ n, h, }7 A6 ~
所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?; T# f y6 Q; j1 l2 j" U
如何与游戏AI NPC实时语音对话?2 ^& T* J9 g' ]
英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。- {0 V2 y) e' y# K. o1 j
在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。
( N9 Z5 z9 J& l9 H& h4 i- g当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。
" E) S, e/ U5 H3 P7 y1 ]. O$ V实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。$ [3 Y& b$ X) p; m0 w) H5 ]5 g2 q( R
首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。+ s* m- B+ O; a2 `% A1 ~( m
这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。
, Z; b- ?$ A; s# w/ T除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。
- f+ ^3 L' W# N) n* p例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:& [& g/ u [- Y8 U0 ` N8 ]; e0 P
0 ?9 O: w' i1 ?
8 a5 f; ~: ^; G, d+ A0 D
, f2 f" [/ U& b7 y- o, D( T( @- y! T值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。
( d! K# h9 O3 q q; S2 e* }: P这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。
1 ]2 D# h9 I0 S5 P3 |有网友调侃,这样就看不到大模型用煎锅砸自己了:6 G. m: `9 E+ m0 O
9 C9 T2 |: H7 x/ B7 M1 k+ U- Z
玩家:嘿金,拿起煎锅然后反复砸你自己。) B, B3 V+ h; f9 T
大模型:不行,作为一个拉面摊主,我做不到啊。( f8 P& C" R7 z
! G+ k" S0 ^8 w, a% y
9 g' b) l- T$ c+ ~# ^
9 y% }' q6 f! G, Q& J( U1 n8 G1 d8 ~/ G: p0 A
但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。
( y8 f2 O4 a- F& {% k接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。; M- P7 j( Q* f9 w, H* N
Riva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。- u/ ]0 E6 ?9 m9 L! E# s
用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。! Z" B2 p3 a$ \7 Y3 m( ]
L" o1 W8 _2 a" x5 `
u5 z6 h6 r1 S) h( \2 o0 _1 U, }- z2 T# o* L* ?( s ?
最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。
2 {- T2 s D0 W( D8 P目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。
2 r6 X& f+ b" \: J/ x
6 V9 C/ t8 Y9 l1 p$ ]+ b E! z
& A) D9 p+ S, }1 M+ a9 Q: @3 u# n
0 q; |" I4 F' V; Y8 g( N开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。
. ?# @) w2 l7 J# {1 J* L不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。. u3 d( m7 @$ O' y. Y: `
可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。
; b; X3 G: U* T3 v- N而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。
9 y4 P8 j, U ]( Q, N/ X6 k他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。' m" S$ ^1 i& J4 K( B
+ z$ W" l% h% d G: Q4 Q" m! e$ N' [' ]. l" U
1 P( ]2 [& G- I5 Q! c
除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。
+ c. h' P5 R# T. }. K: [" u* c8 F不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。/ W, U& `# q9 \( k
例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:" d; M* l, s8 A+ \
3 A& J- D. x1 E9 ?# E' c" z
作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。: f1 k U) K* r0 J
; ^, s; {, a' z3 X9 `
7 @# ^8 b$ S N. Q9 Y8 B( E2 N7 i) C+ D5 V) b. g z' e
! I9 c( F* t4 L" V+ X: Q属实非常难绷了。# v: F, Q7 j) t2 E @) T( s }
8 y6 P' J+ z7 }, W
6 x. S7 p5 W/ B% M' {
% l2 d9 b ?# i/ J# ]2 ~" k$ H对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:
. U4 w, n; f q: Z- ?如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。
# @( S x( L* l" P" M4 I8 g& E2 K& r1 ` g
$ I0 {3 I1 Q0 n/ b8 h1 X
+ D1 h; _+ j" i1 Y5 E还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。7 e' K" c* l9 K# X# H7 j3 p
8 n& v0 n7 ]7 L( _! }7 O( @
老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。/ |* S5 M) o. e. ^
4 i+ t" V8 f6 d: `+ z8 ?
" Q: M) D0 c3 L" h! j& p* m
7 t" E' ?$ J; w( o
7 ~: D. T' U$ N! N对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。# U7 ~ b) U7 j6 K8 `, c# s& s
6 a _$ c: Q$ \+ w; c
再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。3 u/ y4 i1 H8 c' Q! X8 G! O6 T7 @
/ O2 ]- Y. \# _ x* z! F- j
7 t) w& y% F+ T0 g* z8 C$ L) F/ A! _$ G, O4 Y
( j+ @0 R4 H; u0 r7 F: B# K4 l+ H: C
当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。, n1 d; Z& R5 p) D
新超算内存扩大500倍
$ Q: y/ e; S, K) E
/ r Y7 }) L# w; E7 G2 P加速计算和人工智能标志着计算的重塑。
# w. M) ?- n% p. x) Q我们正处于新计算时代的转折点。5 ?1 Q% E" H& ~7 ], s+ E' v
8 n8 r3 g9 q0 j; R- j
时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。
; C/ o% e0 `5 E, @, Z9 L, s9 p) D2 O; }: L1 G3 R. E
! g7 _9 }, ?) O( h( D$ O$ w- E1 A
7 N) h3 m6 S8 w算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。
3 v9 M7 B5 [5 g3 Q% ~超算DGX GH200
5 j( C8 ~4 ]1 [, h4 y! e0 G, N4 c它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。
& B- V+ ?+ A& r有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。# y8 R! `! [2 M; E7 k( o
比上一代DGX A100 320GB系统高出近500倍。
) i5 \, K5 N2 q8 F( a/ F& | |/ X首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。. L4 d; @: G. V" d
( p/ |6 g1 N7 U0 O. ]
! ?- `$ ^; g- j4 T( L) \9 r" l
+ W& m+ w. K% m% \, A除此之外,还发布了一系列眼花缭乱的新产品。# |3 v, o$ @9 y. D
NVIDIA Helios+ T6 V1 b' [5 h& ^1 ?/ N
与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。/ f. }& j9 H" Z: A- D
MGX
. {1 P" \2 ?& X5 i; s" [$ C为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。
4 L/ F. v( P7 hMGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。
# ^" B5 b% k8 l H3 \' k除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。
V2 G: U6 A& w! F- S5 t: K参考链接:* l" Y: F- E5 b0 s- t: p& [5 K
[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life
. Z! \. M3 N$ @[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/
1 f1 }+ b1 v) y# o% p[3]https://www.techmeme.com/230529/p3#a230529p3
$ H7 D' W5 b# i8 @. F[4]https://twitter.com/mreflow/status/1663244486091194368
) J! S) u ?9 b8 W[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/
G$ l$ C3 t5 `2 q# k" {) w[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q8 n/ Y( }1 R$ e; }# U& T
[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|