|
|
杨净 萧箫 发自 凹非寺; f: c+ V) E; V/ E, s1 D
量子位 | 公众号 QbitAI$ M2 K* R/ f% D: ~
7 c2 [$ |3 n7 J; `( H' `
游戏行业现在还真真儿是被老黄颠覆了!
/ J5 D A* U9 e7 ^. D这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:, W2 g/ B& B. P0 Q4 W
! r* y2 x# e/ J% _6 U
4 w5 Y! _. ]9 [& X( T7 a) k$ F) D0 ^" X+ |7 K
那边,游戏股直接飞升,多家公司涨停:
" Q) h( y6 G0 B& D0 J
0 B- A/ Y4 M I; j: h% i4 ~6 K9 t+ r. }
7 J- Y a/ T. v* p* g9 o△图源:上海证券报+ U# Y W% E/ h0 Q% q
英伟达高管John Spitzer认为:
# S4 g& G# s4 _$ j
5 y9 u3 v7 s4 s生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。" k) T& e5 [8 [/ h" p: Q' Y" W3 s
( j" C: I- v! l: a o不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”" y0 g- v' k8 M3 \
% m1 j; t- D4 j! Z# n/ U& i: c9 b$ S
6 }; O2 ^5 ^0 Q; V, v) [还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”
! x& D/ g# |" u9 Q2 V
1 P. j! J) z+ [$ R' K3 H0 I1 b/ B/ [) u) V
* J y8 j* N1 @, @8 J所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?
K) b' _% K( L2 q" h9 {# W" e$ P如何与游戏AI NPC实时语音对话?
& S. ^, r* b8 b" d: \英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。+ S' a3 [0 d1 x, W9 }
在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。) w; J3 D/ e# D# l
当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。+ R0 q) V2 A" n& L$ a1 i
实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。
' ], G& R$ e3 h; d" B0 I首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。
# H* c6 J; I! f6 L, }8 J, g这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。
1 q" }$ F) ? y) T9 c) R除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。
$ d* F8 [4 z, d& M. x例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:
: Z* T. Y1 T7 K/ s1 m8 j1 G5 J5 f$ z- v0 K
+ F& w. W: s: a p0 O9 D% i, P3 B% f
4 d! o# o/ k1 w! u3 V1 ?$ f" n* K值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。
2 ~0 s( V! q8 [/ Z- P- Z这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。
0 N! d8 ~# k* b有网友调侃,这样就看不到大模型用煎锅砸自己了:
, P: |7 E+ R) O, y% L6 n
N6 B; X. R' K7 `- X7 ]3 f玩家:嘿金,拿起煎锅然后反复砸你自己。, @' R3 R C/ Y4 @5 ^9 j/ s, l% C# L
大模型:不行,作为一个拉面摊主,我做不到啊。: O" R; j' Y+ j/ P# {; g# a
) a3 x: m. |; n' D p1 u5 Q4 e
" J+ _3 ?; ]) S$ R$ k3 ^
0 ^2 I9 g0 i3 [1 c
* S4 R9 ] M4 t0 R' Q但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。. }& f% w, p2 A$ Q
接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。- z J) b/ [) k: a7 X
Riva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。' c% z! f- [4 N0 N) j5 ?8 H
用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。
+ N4 C* d7 U* S$ `/ i9 O) ]3 q$ `- [9 V8 P& ^
: T f/ @" u! O% t7 I2 d
- [( n! D( B' d P- Z7 ]) [
最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。
) E ], g8 O9 u# L* e1 i目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。
) \2 O0 ~) a( Z; j9 B* k( b; Q0 k% S
/ w: |4 W i$ [% O( B
9 u$ T1 C( B @1 X- b$ S* I% G# X
开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。
% x9 l* [& }# H: Z8 S% y1 F; L不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。
. }/ m3 N. P" l# B可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。
( i! d+ L5 M! ]9 g2 g K而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。9 p& [+ V7 X* l! E' F8 F
他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。
( y* r o8 y* H: @) ^. m+ q
1 l" U/ Y. |' D3 k& A3 v- u
6 I& q' s7 `( m0 W+ H; @) O5 M+ g* H/ w! i1 }
除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。7 e; P2 f$ @5 g2 v% U
不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。
# X' S# s% B) b3 @' ~# o; H例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:) ^% |. q1 e8 @4 n0 U2 M( D
/ U. I l) @, e作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。
" w" [% P) |& D x' Q: M" O
: k; f; h1 m9 s$ y' V( o; i" p8 B2 x) ]! b, U% Q$ S4 b5 m1 J1 a
6 H! Z; p j4 _5 n- Y2 K. a1 f% \$ ^- P( @) C
属实非常难绷了。
3 V4 J% H) g! }( `* z2 z2 H: \9 j0 Q" B3 t; o% j/ x
3 `. E/ ^% W- ~3 \4 F3 X
* f1 S0 _- d/ G7 k% R6 G; |# n对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:% a1 Y5 B' y& B' q
如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。
) f- Z9 l) a/ ?
) `1 E) b) I% U
2 F ]" x4 _; D" p; y
# `; Z# M7 g9 m还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。
6 A: w9 w. S) ~5 Y X! j
9 \: @* z8 g* Z" L% Y) A老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。) e) P: P- @/ ~8 O1 `
! n! z( G0 l+ r& U" I/ S) o# N, m& e
V- U, b1 D2 W+ Q- J) |( Y
2 M- c# g5 S a5 H( d R% v对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。
: f! S& E" ~6 B3 M) r1 w3 z' m4 l
, Q- q# U$ P+ {. Z再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。
- g0 m) H; i4 n+ B
" W; G. q+ ?* Q4 ]# [ T( p6 N/ [1 F @0 G6 V
. k; a" J/ h, J/ M; b( V+ E; z
3 L. D8 V1 | G- I' e7 Y当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。
7 B5 }$ _( D# x新超算内存扩大500倍8 P6 g& Y R- R/ c' I! N
$ _3 r+ d( M; t2 g, l* K加速计算和人工智能标志着计算的重塑。
H( C+ `4 G& V( X9 ?/ {5 F我们正处于新计算时代的转折点。3 l8 ]" b2 E, z, L8 @. m# S
# i- g( Q; r& \$ G# O* z3 V时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。# [7 `! U6 x$ Y8 x3 m% Q
' N# I# b1 H1 |4 h ?
' d' I+ t' Y, Y' j
1 M9 d T8 |/ O; f1 Y8 k, [& \算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。7 P4 S, A( G: L* `4 p
超算DGX GH200: Q. Y% }: y/ F- K) q; U8 P
它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。
) @. T0 U. E6 A' N4 ~. E4 o有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。
2 _7 ~. c i+ W比上一代DGX A100 320GB系统高出近500倍。
% y6 b" V8 ]; a首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。# w" m: k/ P4 B* ]9 O
3 b* Y9 Y K6 M! D
7 n* U$ h1 [" y! m) b: U' e3 C, j2 n+ ~
除此之外,还发布了一系列眼花缭乱的新产品。
; \: ]& s$ k1 W$ D) b6 K0 u) `NVIDIA Helios
. U5 `8 A4 P( |; u与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。
! v) p! \3 m! NMGX, g5 e9 u0 `5 d; K( o' e# k G
为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。. e" H" s4 h- P* z' @( T8 ~2 @
MGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。$ K% R6 k8 L1 @: Q4 |3 N
除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。9 r# G- G8 q5 O9 M+ M
参考链接:
]. H4 X) X& t- L* {. v) h) c[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life% `- z0 I9 X& q+ z: d% Z; u! X
[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/8 \5 S: k: c6 p, X% n; p
[3]https://www.techmeme.com/230529/p3#a230529p3: _) Y) K: k8 ~& f$ `1 G5 G# F8 d
[4]https://twitter.com/mreflow/status/1663244486091194368
& c0 R; c3 A/ v$ Y: B# c4 U9 R[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/) C; t* d# O1 d$ A; c4 J
[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q& s2 a3 Z3 K9 ]) ^, e* v4 c, h; ~
[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|