|
|
# @0 h2 k- C" G& u0 {( c, R
【新智元导读】Google Coral Edge TPU和NVIDIA Jetson Nano大比拼!本文从分别对两款最新推出的EdgeAI芯片做了对比,分析了二者各自的优劣势。4 I: N5 O; N9 u. A+ m, ^4 [6 k
% {* m8 D8 A i5 h, k$ k" v5 Q# u边缘智能被称作是人工智能的最后一公里。
: {7 T6 F- H* e$ M5 X( \& ^5 h; v6 C6 y: r0 ^ s1 T/ r3 B2 i# v0 v
Google刚刚在3月份推出了Coral Edge TPU,是一款售价不到1000元人民币的开发板(Coral Dev Board),由Edge TPU模块和 Baseboard 组成。参数如下:
" |: `* C$ @9 l5 g$ C
7 q+ g* h; ?; K* z 4 g" g% g. ~; @$ R
英伟达同样在上个月发布了最新的NVIDIA Jetson Nano,Jetson Nano是一款类似于树莓派的嵌入式电脑设备,其搭载了四核Cortex-A57处理器,GPU则是拥有128个NVIDIA CUDA核心的NVIDIA麦克斯韦架构显卡,内存4GB LPDDR4,存储则为16GB eMMC 5.1,支持4K 60Hz视频解码。
; D7 x n+ e% P z) d+ Z' n' ~目前位置并没有太多关于这两款产品的评测报告。今天新智元为大家带来一篇由网友Sam Sterckval对两款产品的评测,除此以外他还测试了i7-7700K + GTX1080(2560CUDA),Raspberry Pi 3B +,以及一个2014年的MacBook pro包含一个i7-4870HQ(没有支持CUDA的内核)。
. I+ K3 s) M: u* f1 i2 [' N( zSam使用MobileNetV2作为分类器,在imagenet数据集上进行预训练,直接从Keras使用这个模型,后端则使用TensorFlow。使用GPU的浮点权重,以及CPU和Coral Edge TPU的8bit量化tflite版本。4 O! W( s8 n- Q4 h6 r2 [/ t
首先,加载模型以及一张喜鹊图像。先执行1个预测作为预热,Sam发现第一个预测总是比随后的预测更能说明问题。然后Sleep 1秒,确保所有的线程的活动都终止,然后对同一图像进行250次分类。
4 B* ~+ K) }7 ^. o: S
7 U2 k0 p# N+ Y+ M对所有分类使用相同的图像,能够确保在整个测试过程中保持接近的数据总线。
) _$ ~/ A/ |( ^& j' D, B! }9 a7 E0 }% i( M2 E3 F
对比结果 先来看最终的结果:9 o3 S" u$ B7 I5 [& \( y( r9 U

- Q. \9 y1 d# O 线性刻度,FPS * x4 M5 N- y: c8 p
对数刻度,FPS' r9 q8 ]3 U& s
& \2 s9 @ H q8 S

& } T, Y3 y8 G$ `2 a5 h线性刻度,推理时间(250x)+ V. P0 ~6 a1 J: |$ L2 r
9 B: }6 F6 Y4 \# v$ _
Sam发现使用CPU的量化tflite模型得分是不同的,但似乎它总是返回与其它产品相同的预测结果,他怀疑模型有点奇怪,但能确保它不会影响性能。
% a8 U4 d! x1 M* w3 q对比分析 第一个柱状图中我们可以看到有3个比较突出的数据,其中两个2个是由Google Coral Edge TPU USB加速器实现的,第3个是由英特尔i7-7700K辅助NVIDIA GTX1080实现。. @9 W- x7 n" v% }0 z2 Z7 m6 g
我们再仔细对比一下就会发现,GTX1080实际上完全无法跟Google的Coral对飚。要知道GTX1080的最大功率为180W,而Coral Edge TPU只有2.5W。
4 ^4 t6 P; f; n8 [1 ?NVIDIA Jetson Nano的得分并不高。虽然它有一个支持CUDA的GPU,但实际上并没比那台2014年MBP的i7-4870HQ快太多,但毕竟还是比这款四核,超线程的CPU要快。- _9 {( Q8 p( q* w0 D4 M4 O/ g
然而相比i7 50W的能耗,Jetson Nano平均能耗始终保持在12.5W,也就是说功耗降低75%,性能提升了10%。 j' m* A( K# l2 Y6 m/ V# e
NVIDIA Jetson Nano
: ]& k# B) Q3 X- H& U! r3 A1 R a/ [7 ^尽管Jetson Nano并没有在MobileNetV2分类器中表现出令人印象深刻的FPS率,但它的优势非常明显:
! I+ E* w: t& [* U: w+ ]它很便宜,能耗低,更重要的是,它运行TensorFlow-gpu或任何其他ML平台的操作,和我们平时使用的其他设备一样。只要我们的脚本没有深入到CPU体系结构中,就可以运行与i7 + CUDA GPU完全相同的脚本,也可以进行训练!Sam强烈希望NVIDIA应该使用TensorFlow预加载L4T。- o5 F2 i) V& m' j' ]
/ z5 H0 T8 s) U0 I8 i' q6 ]; E C( |
Google Coral Edge TPU
( K$ |' d: _: m1 ~% } Z2 _! s! oSam毫不掩饰的表达了他对Google Coral Edge TPU的精心设计以及高效率的喜爱。下图我们可以对比Edge TPU有多小。
" a' V5 I: s4 z( m7 c1 k
5 ^% b4 H( k2 Q1 s0 m8 WPenny for scale,来源:谷歌
3 ?2 c9 k9 |! z: R/ R! l* x0 x P) o
Edge TPU就是所谓的“ASIC”(专用集成电路),这意味着它具有FET等小型电子部件,以及能够直接在硅层上烧制,这样它就可以加快在特定场景下的推力速度。但Edge TPU无法执行反向传播。
2 E5 H* m! M4 G5 p" v. Z4 N- i4 ~' ]9 b
+ e' V' A+ d& u0 `' ZGoogle Coral Edge TPU USB加速器
4 k, @2 r1 c# K U8 Q/ Z4 Y3 {! p# b/ T. Q8 S7 V
下图显示了Edge TPU的基本原理。( }2 ^1 o% p. y( |& u' g) s8 M
; x; @/ J1 O1 a7 d5 n; G- G; q; t( v
像MobileNetV2这样的网络主要由后面带有激活层的卷积组成。公式如下:
; G s% A9 c6 @6 h% d
( }; u# e5 P& @7 r! i+ |$ n. [. f+ h卷积
+ l6 J1 X- ~# o, e6 D2 q5 N& ?, F- J4 S1 M% ]7 s4 n
这意味着将图像的每个元素(像素)与内核的每个像素相乘,然后将这些结果相加,以创建新的“图像”(特征图)。这正是Edge TPU的主要工作。将所有内容同时相乘,然后以疯狂的速度添加所有内容。这背后没有CPU,只要你将数据泵入左边的缓冲区就可以了。' E7 {; ?% { a
我们看到Coral在性能/瓦特的对比中,差异如此大的原因,它是一堆电子设备,旨在完成所需的按位操作,基本上没有任何开销。
) {( q5 M3 S/ W总结 为什么GPU没有8位模型?7 D( w; w4 s" N6 ^
GPU本质上被设计为细粒度并行浮点计算器。而Edge TPU设计用于执行8位操作,并且CPU具有比完全位宽浮点数更快的8位内容更快的方法,因为它们在很多情况下必须处理这个问题。
8 u* ^2 z8 ^5 T1 [$ L. G为何选择MobileNetV2?
$ F1 s7 A% z2 b5 n7 p+ U主要原因是,MobileNetV2是谷歌为Edge TPU提供的预编译模型之一。# E& x, C w( _
Edge TPU还有哪些其他产品?% q( [9 K" t; E6 C) ]; ~- ~9 W- b
它曾经是不同版本的MobileNet和Inception,截至上周末,谷歌推出了一个更新,允许我们编译自定义TensorFlow Lite模型。但仅限于TensorFlow Lite模型。而反观Jetson Nano就没有这方面的限制。; r: {/ O/ m1 L' b$ k
Raspberry Pi + Coral与其他人相比
' [% l) S/ ?1 m% e o为什么连接到Raspberry Pi时Coral看起来要慢得多?因为Raspberry Pi只有USB 2.0端口。6 G8 n: g2 A3 F& d* k" p- d! g
i7-7700K在Coral和Jetson Nano上的速度都会更快一些,但仍然无法和后两者比肩。因此推测瓶颈是数据速率,不是Edge TPU。
3 s" W( N. x3 S) _( d
& Q, F) L' Z% K; X5 J* N
* Y* ]: o$ D# r* W% ~3 D【加入社群】6 P7 ^( q1 R% }+ }
& I2 p ~9 V1 F. X, y6 k
$ ?" z" _; r$ @2 T, {, e来源:http://www.yidianzixun.com/article/0Lt3VMHK
$ T, C/ m: c0 `" J9 \4 c免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|