|
|
杨净 萧箫 发自 凹非寺5 c6 ^+ L/ w( x# W& e- {
量子位 | 公众号 QbitAI6 q* M5 h- [/ B
9 U" v/ y$ ]* T0 w8 X, M) k# L; P0 Q$ ]
游戏行业现在还真真儿是被老黄颠覆了!
) E1 p3 v& Z3 o$ A$ I) [这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:
m% n* l( k) r" a" ` i, K/ J8 g7 e' Q! m
+ Z" B7 X3 Y$ \' Z
$ ] B/ H* U1 t( O) `- P7 d那边,游戏股直接飞升,多家公司涨停:
* `/ x/ w* H5 u3 S
# `" Q% |$ `: x: ] u! m G4 h6 ]7 q% I
- \! D" |! ]7 @3 Y! ^# Q2 o9 t. s△图源:上海证券报) W8 C! z5 ?3 I1 u
英伟达高管John Spitzer认为:
: n8 x n n; P$ E" W2 C6 d" v- l
, y$ f" b& m( q0 L( o; M& t- D生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。
1 H6 Q4 x3 M% o: H. W O / s0 {( O( j% E5 b4 x5 y4 n# I
不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”' p! t. B3 m" F* ^, M' q& I) S& |# V$ a2 k
- I# h" j5 P8 i6 m3 F
5 M; M- M; j D! z; ~: q7 P. C
6 E# {6 F' T7 J/ P Y& t8 u还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”* a7 v% W: s1 a2 X* s3 ?' {: C
8 X# Z* x0 Q0 I4 f0 S8 M5 A
/ w5 Z4 g5 h! ^8 r
% b9 [9 A- _2 [: `; Q& y所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?, a9 a! U% D# F9 E$ {( } o
如何与游戏AI NPC实时语音对话?
/ C, }! N( n/ X9 f, V英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。
8 d+ T/ _* h! M0 u" Z0 w+ ]) Y在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。 }, U6 H) ~- x* ?
当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。' ? S! \1 g* M8 s
实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。, X$ I8 E- e$ J% }9 E _. J- A: L
首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。+ w t) q' V r* q, b
这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。
4 C3 ~4 o( q' q" f; w& R除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。4 z: ~& \* {3 R+ b9 Y" e5 u
例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:$ q( P$ }' e$ F; w
- [7 g% J& C8 p& x2 X i0 X1 ^! Z7 n
4 a7 W7 ^! p0 s) L; V9 z8 X
值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。
7 z ~; ], @. W6 @6 `$ C: C这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。
4 ^! j& c, e% t有网友调侃,这样就看不到大模型用煎锅砸自己了:
+ X6 x9 Y3 ^# ]! ~* W; t B; k0 `. L! n! V% n9 z1 n! B3 K1 N
玩家:嘿金,拿起煎锅然后反复砸你自己。* j& e8 e) r$ ^$ A* U
大模型:不行,作为一个拉面摊主,我做不到啊。
" i' a0 h" @1 Q6 z- O
7 b+ \) N. b0 w1 u- H
! y0 x- U8 r/ O5 T: `% k4 p' l9 _2 t3 U& C9 w' [
5 ^: e, l n A# C但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。
% l$ I5 P% j m! a3 N1 U3 w1 _接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。
/ X$ O4 i# q" t9 I$ M8 _Riva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。
9 [. G/ ]$ A6 Y用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。
/ q4 d* y# O3 X0 @- L* @' S6 j
; X) _! v" p! V% [
3 q. ~9 ?- h7 I: |, d; y8 J* ]% T8 a I# D7 R1 e; A$ O: h
最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。
) G6 Z" j; T6 e$ M目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。% [8 @* g& M, \0 v/ G
; _# Q/ M& r) I
C& L1 V9 A9 K2 O/ w* @4 g8 |# C$ |* A* D. n6 I2 ?; ?
开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。5 I* R& X) f) E" D
不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。3 }: Z9 H7 B% i1 \) J g# R& h
可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。
1 c* L; M3 P$ ~而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。& U( H9 e2 f6 H* K! Q
他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。
5 Y6 [: R8 j& y
- s2 l3 p! F. m+ b+ ^9 z' _
3 b, l+ D2 k; g0 `$ J. Z) N+ [
# q+ j. z, m, o% C除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。0 K2 r( G! p8 v. J& y
不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。) b1 d- F. }4 c' Z
例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:
$ L7 ]8 U, j# _2 V2 d7 g* @
+ W* H) C: j9 m* x% W& ~; T作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。' \! U/ ~" [0 r' \
( g) p! X6 j3 p% J3 g
) Y0 V. i4 Q: n# l9 X* X- J
7 q8 Z* k5 l, b% X1 K# C ?( Y' d9 o- B" h9 k& f3 D7 ]
属实非常难绷了。. I. I. @$ V" S M' E
% ]7 @: o; u5 x7 j' x7 ^
% u0 _) g& H9 I3 T+ H+ {, A
! @/ j0 W6 C4 r# a( ~对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:
; G; b2 E$ C( ?5 m/ x% q如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。1 p; m- \+ f5 D
% X/ t' n+ ^6 H7 Z8 `
( T" ?1 X$ k8 }, g2 w7 _/ X* q8 S1 K7 m M: G( a$ J2 L& n
还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。* @! r, g* ?# |% f5 _
* n: u4 R1 \2 l" S9 @老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。
; L7 S% X/ k3 ]6 _5 U ' P& D6 i O; |. ?* j4 U4 q. T7 {
6 i: P5 i" O7 X% l4 A: P8 V; x2 x
$ x" w) T$ {/ u# }. q
) s. T" f% |' g/ t0 F对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。
' J# @% a2 {' C1 A {( i i: R1 f t; r. w/ E* A
再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。5 E# e& e1 }4 L. T' `7 v
4 n: e" Q8 W# r1 G) a/ P/ u) F, b# y; q
: Q2 F, d; q" p$ y( d' I
5 O: w9 j% }/ u/ z0 K- h当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。" r! A c& W+ e
新超算内存扩大500倍
5 E" G) _3 z) ?" b2 l0 F
2 D+ W" N0 A% M! Q加速计算和人工智能标志着计算的重塑。
0 o0 M! j% D, p( z我们正处于新计算时代的转折点。
$ r9 r/ y: N# C) T" f
7 Q, v& B- b( U3 z9 E5 Y) O* j0 k时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。
* H, {0 k3 @" m2 J0 V$ U, x% X% \. g0 d- G H6 l5 [% }! s. s
$ X8 L/ z3 N, q* M
+ W& T6 c) D9 K, i- S* G' k
算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。3 @6 J" X* r6 Y; Q% c% J
超算DGX GH2000 O8 s* ]# u9 U
它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。
1 ^7 L! b7 Z3 J6 ^有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。1 J. }% F, ?, d) C$ {0 c
比上一代DGX A100 320GB系统高出近500倍。3 G0 f6 l5 r( P& a* H7 J( ]7 ?1 X3 m
首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。/ p: {1 g( [9 V" E+ U
$ I! I" b3 W7 i% i% f, b: A5 A0 G) @/ \. u- E! q' N
) v6 r$ w0 Y& N5 ~( {2 P% O* e除此之外,还发布了一系列眼花缭乱的新产品。- \: f: p! a9 W5 X ?9 R
NVIDIA Helios
7 t, ^# G2 j7 S& N与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。8 E5 ]+ O5 O6 c+ @2 \
MGX% |7 E# i; b0 {7 h# G% g
为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。* I! \! D& I. h* J- S3 d5 P
MGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。
. p7 W: h$ M( m3 l$ W% b% L除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。6 D' U6 R7 C/ W6 S5 l
参考链接:- N/ C1 N- s0 k
[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life
; n, q8 V$ |. q% L[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/
7 B# ]0 E" w! P9 D/ y: W[3]https://www.techmeme.com/230529/p3#a230529p3
+ _4 L- L+ B, z! o[4]https://twitter.com/mreflow/status/16632444860911943680 a6 y+ v0 H- }
[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/* o$ V7 S1 a; S: @+ b* H! u+ b0 N
[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q4 S- j* o1 t( }
[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|