|
杨净 萧箫 发自 凹非寺
/ t9 t. Z& [1 r9 q9 i9 m量子位 | 公众号 QbitAI
2 g" E2 a @2 F9 O 5 d; b \8 V" R9 E2 [( x" c G
游戏行业现在还真真儿是被老黄颠覆了!) r \0 X# T0 @
这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶:3 w9 W& H: R4 I2 c* \5 K% r
* G! k% t& e5 u! C) s% w( ]* t; f. X" l% m4 _8 P, O+ Z
6 Z" { J9 O0 f% _5 {
那边,游戏股直接飞升,多家公司涨停:
9 g9 m/ M0 H5 c) L- W
: V; T% u3 b1 \. I/ L4 J) b$ G- y1 ]% O9 i
: z8 v5 E, h+ l! {5 R
△图源:上海证券报
6 C A( J! a" R英伟达高管John Spitzer认为:
, b, S( v" q% l1 _6 d
0 k6 ]' t* U. K& C# E# t3 `/ `; a生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。
2 U; ]% [, K4 M, L1 ?' V& ? 8 j! k8 Y4 _; {4 q. U* @% z; Q: V
不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”
, X1 `1 ~' C6 n0 r/ m( s) C2 \! }0 [# \( `! x# S( d
* x7 }4 i0 ~1 E6 C0 V# s& S1 W
0 t6 f& u3 A/ y$ a" D还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”
6 d$ r1 Z6 T) r% g) _; U4 N
# r X7 B. o; x9 Q8 a
0 }, p3 ~ m+ A; V$ B/ p( j' |5 K2 R# y A9 `3 n, c/ @" E3 \
所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?
' h* D7 f2 x7 t& _如何与游戏AI NPC实时语音对话?( W! G; _8 `" r
英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。
2 _! U% j% d# H7 ^; L1 ^在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天。1 `9 P1 C# j2 i2 k7 g3 o
当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示。
8 F) H" h8 O5 h+ Y; x. b' w实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。
" a! Z+ _4 Y( r, p4 l首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。
1 ]: l5 v$ E6 Z. N- L H3 ~这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。: l. P% V) u! W* V% y
除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。
8 _6 \$ }! I t例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:
) |3 l7 U( n; c2 g. e. X# d& q6 h* Y
( }) ]2 Q/ D8 b0 E' `- J
5 E8 ]- H4 p& Y( N+ q+ r7 f* |
值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。
% A4 x& M. T3 O' z0 w) n这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。 W6 {- f$ J5 P! i2 \4 {; K
有网友调侃,这样就看不到大模型用煎锅砸自己了:
( \- `' K5 M5 G- w4 V: V1 J2 K7 ]# ]9 ?% e8 g% }$ y/ P4 N: B
玩家:嘿金,拿起煎锅然后反复砸你自己。
- w d9 B! V7 M( T大模型:不行,作为一个拉面摊主,我做不到啊。
8 U( g8 Q4 |" J# M! f- ~ / u. r# d7 P; }+ }
4 f* x! j0 W0 C) b4 W/ f; m, \, B7 }1 ~& l3 z* h- w
4 Q) a, y' t2 z& X) ^. G0 Q* G
但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。
5 J b+ {, j7 L _" X2 c1 ?3 y. D接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。) o5 ?# c, m7 o7 k. ?
Riva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。
: I0 r: S& C: [" X+ D3 P( m用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。: _! ^6 o* M! q, m
: ~' W1 f$ g% T) z; x/ x$ E& }, Q9 {) p+ N' S
) z Q1 k6 Y8 C" L+ i* ?$ }最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。/ H0 I% t# K0 c. m& S
目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。
3 F) V& I0 ~/ e' s' G
7 n. j" O1 O# k4 k$ z7 r6 d5 v0 t: M5 a& I
- v) {) I( o! X9 A( y) c/ p4 n
开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。1 H5 c" j. D! f
不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。2 d7 A6 M. O3 o1 m: d4 l5 }. J
可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。0 Q0 b6 t& ~2 ^3 c
而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。7 {7 I: v- Q9 s( W( [
他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。( k! N8 H: v# a# f
& S$ _: t; x0 G" v) u6 o
. p) @* E3 x$ k1 y) r
% W- o& F( d7 o' M4 \; p+ H除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。
8 O$ K2 ~6 p" B c3 }不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。/ }3 T+ C; k! u# ]
例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:
6 @4 k1 |* i K0 V- d1 ]" a0 A9 `0 } T5 q( O5 P- ?' ]. k
作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。
9 [9 t7 p+ j: F: ]# R
; E# a3 s6 C5 p* s& [
) f: ~$ {+ b- @1 h( z$ y3 B1 h3 v3 }$ T2 l) s
( B; m6 [5 X- m属实非常难绷了。
0 {& @/ d5 w) C9 c a4 I( f. [
^; H9 q. ^% q: L1 o5 K4 G" y5 G$ h; {; b. ?* K0 I: I
: @/ w' T( s7 g* G对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:
6 }5 C. F0 P& M如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。
( H* v3 Y; Q7 Z$ f; j& h. ^9 x1 V$ m) _( O/ w
: G) |* h1 l' h
* X! t* y! E1 i% k: f还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。& p" ~6 C0 u1 Z: u# q$ V
% o3 }) g m* l( p1 Y3 }, W
老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。; U x2 R2 v2 N& g
) \/ K0 Q" D1 S. [/ R3 r' _
. O3 a5 p5 `& H, h+ r
' @0 i7 F- n8 W; B; Q" ?2 K. a
, r3 u; r) D! e7 z对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。8 m# t' B7 c* F$ `( r
& L6 v3 i+ U J6 G再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。6 y4 y. j, T+ {4 O6 F5 D
& Y( Y$ a( K& ~9 c
: P2 H( P# ~7 A7 M3 O; s. D6 z6 U
" P( o( v5 W7 k1 B" f- C
5 d" _' ]# _! y* l当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。
+ ?7 N K/ h3 }新超算内存扩大500倍
1 ^! l! f4 {1 W5 K% N7 ]5 P' x$ K9 O4 w3 e& {: P& r
加速计算和人工智能标志着计算的重塑。
* n8 R, i% D6 g% t我们正处于新计算时代的转折点。
. A3 S4 n* m4 m" Q: K. S
' @7 K! ^. I' a* f时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。
" h! {9 b I: i- w/ ]4 x3 W4 s2 c5 C; e8 B% u- a. D7 }
" ~" J4 H2 ]2 g( g+ k' _% k
$ M1 x0 T6 Z# G, l: O( k3 q算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。
' m' S+ N: e% ^- K超算DGX GH200- I5 q. t3 O3 P/ p( W y
它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。
) \6 H+ ?9 B; D/ O! A; `" J8 @1 ]有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。1 j# G0 E- |, F3 ?7 }
比上一代DGX A100 320GB系统高出近500倍。
: Z% f' L& z2 x4 e$ j2 D首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。
# V% W9 f$ \, _! }" w( j. |' @8 |7 S& y4 J9 N! W2 O- p' R
+ f) B. w# _, I
! A+ |. P2 j1 {+ z/ j; }, U" k3 L! X除此之外,还发布了一系列眼花缭乱的新产品。9 m# T4 p2 a; y
NVIDIA Helios
2 n! |6 u! T! W$ B+ ?6 S与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。
+ ]# X5 d H9 |/ D9 u+ l0 hMGX
6 E- D+ ^ g4 M Q7 b为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。' u5 p* n- H" j' x
MGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。
4 e! l! M3 ~( N除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。
6 ~# Y* l/ u- h: g9 n/ H! X参考链接:! f0 ~' r) u- Z+ C# Z( J
[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life
! u2 x/ @. h7 h3 \% z[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/ a2 |7 B. y: v% q: [
[3]https://www.techmeme.com/230529/p3#a230529p3
; Q8 v" l+ w; j( q, q8 W5 ~+ U[4]https://twitter.com/mreflow/status/1663244486091194368. c9 J' v* h8 j3 R9 [8 Q! \
[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/8 ]: I4 f$ l: z7 H% r: R: K8 |$ l9 F
[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q! t0 R% `1 j+ O* f! ^
[7]https://www.zhihu.com/question/603617327/answer/3049813360 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|