|
|
杨净 萧箫 发自 凹非寺
# W9 o+ C, K l7 g* A4 A, h量子位 | 公众号 QbitAI) b. k) ^' J' x
9 Z! ?+ _& m# F& N; F2 N
游戏行业现在还真真儿是被老黄颠覆了!
, k& U; D$ n7 z5 I这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:5 B6 J9 W% J! ]! Z; @; x R3 m8 ^
# h) _ T9 `2 C: O
8 O0 j$ O0 ^) ~6 ~8 ?3 d1 v
" c$ \- g9 }/ n% [4 T5 R* b那边,游戏股直接飞升,多家公司涨停:
; K7 L6 Y- V% H# R0 A5 [& X6 d! W# U4 M4 K
. E M1 m, C; C" B, c4 r
y& z2 R0 ^( K5 x. f* h△图源:上海证券报
1 O, r5 C# f, e7 H0 C4 s. x7 X英伟达高管John Spitzer认为:
' I* V) C0 s' Y9 C' T) F0 |: K' O3 y% X; ?+ f5 f
生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。* b* A% p: _: u4 }& P- m2 ~) ]
; Z% i9 X/ J3 d4 K! f
不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”+ U% u; s" E+ s& {2 f. n
0 T0 L, u6 f1 W7 a4 u- [0 E
# s0 I, i" o' f* T- D M
3 ?8 S) A5 u R! T* w还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”7 U( }+ K- N; k5 ~
8 N! X: G/ B5 M% `% b8 r% \( E# F* l4 ]4 O# I$ i
7 ]1 R2 P* F% z6 X8 F5 d, Y
所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?
! {# B6 I1 w/ w3 L4 m$ |如何与游戏AI NPC实时语音对话?! T9 T8 w9 U$ C+ H* b9 _% P
英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。* D; T! P0 S4 T, M4 ]
在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。. U5 B3 U0 N6 u8 C i \
当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。
+ P) e x/ ^$ ^8 V5 m/ J. U实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。' e- |' A1 x& M: _
首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。
3 `' R& h$ D" D6 A这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。
& D5 t: G4 V% l2 h4 V3 {除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。
9 u f0 s' A) W1 L5 ?. L例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:- y# @, \ X$ P3 x
4 @1 [2 L! r# q
) A2 }9 O3 X+ F7 z. C) b" Y6 @
* a& z& u$ ^- L5 D2 u6 w
值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。
" s8 x* @7 v( I: b这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。
' J- d! V! E( m有网友调侃,这样就看不到大模型用煎锅砸自己了:8 v1 M7 v# D7 D
4 U# S6 w* p& q7 n: a3 P
玩家:嘿金,拿起煎锅然后反复砸你自己。
7 F5 b$ D+ ?3 ^# F1 a9 P* W大模型:不行,作为一个拉面摊主,我做不到啊。
3 t1 m, h% o7 S7 U4 T5 W! l3 d" \
- Y3 m+ `0 ^. k, ]% P& @. ?1 ~, X4 H2 P* z
5 P h( A# t. Y9 u' d M, d9 K2 Q- C* J! D$ _- n/ u( p/ X4 P( ]2 ?& }
但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。
% D! R* @* {& H0 x+ {4 c接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。( F/ \, A0 Y3 |1 {+ b. W
Riva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。
+ x! s$ t6 P ?7 z1 h. y用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。
4 i* h6 ?6 Z, z' o( H' Y! j
7 |3 t1 Z4 ]* t) r) U: a0 d+ n7 f, q
( {; S! I N# y2 K
最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。
$ _" ?, T2 l# M' i- q& H目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。. }" \/ [# d6 }# d7 }1 z
$ D0 M- p$ ~, m4 ^3 e) x, H) N; y2 P
6 e& N, U1 j7 B开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。
' u% Z5 J5 M/ R( v8 H$ x) K, A不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。, S5 d2 j; ^4 g8 E
可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。8 T* f; b2 B% [6 n1 @: \
而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。, I* N# R s$ N9 Z
他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。
, t8 p) T3 z" k c* O0 X7 o9 w
: `) ]0 ^8 D0 ~+ f: M- { F& j a4 C* N( B/ a6 y0 k
. x n! @. ], U( [5 I# `3 C
除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。
n! P& [. p* f, t; k不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。& q! C' T+ S6 h. g
例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:+ O" A$ ^7 u, E
8 O5 p( t5 |/ H作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。
$ S! u$ g1 d8 c 7 h( K- h. B; o$ G5 ^. p# r2 Q
! v2 x/ }& h! y- c1 g. k
# G3 b- a+ t: Z) W
# R8 F" p! R- f0 W* B# ~属实非常难绷了。' O9 g0 ^/ C6 V4 X
* W. P: C5 v* Y& h& @% K0 N4 U* H4 v- Z! `
% f) z9 o4 S, p4 X, j% l3 Y& O对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:4 d* D L( p% s3 l( b6 J' p
如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。
1 R) a1 k) p* ]2 `/ e0 N8 E! B6 C8 ]' [
# y9 E3 S. u4 T; m- b2 ^* \1 k. Q6 g% L( H+ ]5 w$ }9 M3 W
还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。
& ~3 @) n/ A" _5 i! y9 S8 U9 T7 H4 d" `
老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。: v2 {: R3 e9 T: V1 y
& s) D9 {/ M# \1 h; E% c. W- c V
$ A( J1 x0 M, r& _5 G8 H
& L6 r) x- Y1 X
- @& h9 b$ M7 K对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。
; x( |4 V, C9 M( n2 m5 y( u4 [* r6 h3 _- L* J
再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。5 d1 }, ?. p4 t
1 t" B+ r$ i) e! C) W! h2 c" R( u2 W) I, e; Y0 H
. i- G5 @3 t9 @9 `
8 }. {% V) b0 s# r当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。& H4 G. O$ O1 A& e) X7 w9 [
新超算内存扩大500倍
7 G6 L2 c; r; `! s, ], ?. z) ]% C) p+ A; r
加速计算和人工智能标志着计算的重塑。
/ Y% H) E) I4 p6 ?7 @1 @9 y我们正处于新计算时代的转折点。
; k+ W3 X" ^9 Y( d 7 I" y6 J: y, P' k ?# e; Y7 j
时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。$ M0 J) [/ G3 r) m; {6 T
9 s0 C# r" ] X
1 C- f' g4 n; [7 G" L: [0 k
, ^7 u) t j- B$ N! `算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。
! |1 c+ H4 r1 c% _ Q* X5 n超算DGX GH2004 K* Y* U6 @9 M
它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。. q1 t1 i2 c& f6 z q' Y
有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。
+ k" L5 H! e% k! @. F' f比上一代DGX A100 320GB系统高出近500倍。
1 k9 }1 u1 ~ @7 s& y5 e首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。. K+ M" P! Q5 j4 v
5 B& ^ A* T7 V2 I; A
4 f4 b+ I0 s9 N% ^( L3 t) E3 J; ^: X
除此之外,还发布了一系列眼花缭乱的新产品。
$ L: Y2 L- M2 K, r$ TNVIDIA Helios5 v6 e7 b& H3 W- U
与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。
9 v. w f+ v% O' C9 jMGX% F/ Q! ~' e4 c5 X& e2 Z
为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。
: z3 ?; G0 Q, ~; S, S! u" n* S% N1 q: uMGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。2 Z' R; F& v/ _0 O7 W$ G
除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。% y8 ~0 c& e5 Y2 S$ c8 s+ \4 B
参考链接:
H( ]6 H( }3 I1 M8 m9 A# x[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life
5 z+ `1 b7 D3 K[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/$ t/ P/ r/ j, Z8 ?) e. t
[3]https://www.techmeme.com/230529/p3#a230529p3
% J6 H# z( h- o3 j2 R[4]https://twitter.com/mreflow/status/16632444860911943684 k/ N9 _: y- @+ q/ K7 R+ x
[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/5 e5 d$ h, g3 N' d
[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q- [' ]# c. @4 l6 T; p; V
[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|