|
|
! R% r. B) i: ^
【新智元导读】Google Coral Edge TPU和NVIDIA Jetson Nano大比拼!本文从分别对两款最新推出的EdgeAI芯片做了对比,分析了二者各自的优劣势。; z( ^, u4 f. k( g2 {
* @; j( {; X3 S' g4 N u! V边缘智能被称作是人工智能的最后一公里。
+ l% z; k2 C _0 G* R' V5 B0 t# k. Q$ Z: T, Z; V) N9 ^
Google刚刚在3月份推出了Coral Edge TPU,是一款售价不到1000元人民币的开发板(Coral Dev Board),由Edge TPU模块和 Baseboard 组成。参数如下:- Y6 g7 z' r2 f) c
3 U& T7 ~' o. l$ [: N
- A2 M' h% ~. D
英伟达同样在上个月发布了最新的NVIDIA Jetson Nano,Jetson Nano是一款类似于树莓派的嵌入式电脑设备,其搭载了四核Cortex-A57处理器,GPU则是拥有128个NVIDIA CUDA核心的NVIDIA麦克斯韦架构显卡,内存4GB LPDDR4,存储则为16GB eMMC 5.1,支持4K 60Hz视频解码。
) I# O2 m2 M& k1 P1 }" Z2 U5 {目前位置并没有太多关于这两款产品的评测报告。今天新智元为大家带来一篇由网友Sam Sterckval对两款产品的评测,除此以外他还测试了i7-7700K + GTX1080(2560CUDA),Raspberry Pi 3B +,以及一个2014年的MacBook pro包含一个i7-4870HQ(没有支持CUDA的内核)。% Q, r6 k" N& s" Y0 m6 ^/ H
Sam使用MobileNetV2作为分类器,在imagenet数据集上进行预训练,直接从Keras使用这个模型,后端则使用TensorFlow。使用GPU的浮点权重,以及CPU和Coral Edge TPU的8bit量化tflite版本。
% d |$ L% w, ?; ^4 I; E首先,加载模型以及一张喜鹊图像。先执行1个预测作为预热,Sam发现第一个预测总是比随后的预测更能说明问题。然后Sleep 1秒,确保所有的线程的活动都终止,然后对同一图像进行250次分类。* M% r$ t) d W& `' d" i; k

9 k' b( h7 }: s对所有分类使用相同的图像,能够确保在整个测试过程中保持接近的数据总线。
6 r3 d; K6 p7 e, n. T) E8 c8 A; a: ?( Y0 Z+ g" h: N, K* J0 v1 |
对比结果 先来看最终的结果:
Q' R$ _( s% e. E- B" A. ] # c4 {1 O- L) t/ O6 x$ Z) I+ C! a
线性刻度,FPS
P# Y% E6 f) K1 e7 A! M9 w: F. [对数刻度,FPS
- ?# U+ X+ p1 w, }: D& D# m. p( y3 ?( A5 _; u! I' |

% I5 m0 m: Y- Q: L+ |* g线性刻度,推理时间(250x); s1 i" ?; C; q m# _$ N& \1 k
( A% c# C3 F* e, N/ G3 d8 d- d" C
Sam发现使用CPU的量化tflite模型得分是不同的,但似乎它总是返回与其它产品相同的预测结果,他怀疑模型有点奇怪,但能确保它不会影响性能。. m% I3 Y& v: u0 ]7 r
对比分析 第一个柱状图中我们可以看到有3个比较突出的数据,其中两个2个是由Google Coral Edge TPU USB加速器实现的,第3个是由英特尔i7-7700K辅助NVIDIA GTX1080实现。" s5 b% l q% a' q! I0 w
我们再仔细对比一下就会发现,GTX1080实际上完全无法跟Google的Coral对飚。要知道GTX1080的最大功率为180W,而Coral Edge TPU只有2.5W。
# F% M* h( v l5 \8 e0 `4 ?; i v3 X- uNVIDIA Jetson Nano的得分并不高。虽然它有一个支持CUDA的GPU,但实际上并没比那台2014年MBP的i7-4870HQ快太多,但毕竟还是比这款四核,超线程的CPU要快。: p6 f8 Z" z; `2 X- z9 e
然而相比i7 50W的能耗,Jetson Nano平均能耗始终保持在12.5W,也就是说功耗降低75%,性能提升了10%。
+ D+ ~' |( R2 P+ _NVIDIA Jetson Nano/ g1 a" O- I2 z( c& w r( T; u, }8 ~) [
尽管Jetson Nano并没有在MobileNetV2分类器中表现出令人印象深刻的FPS率,但它的优势非常明显:" G( i) ] k" g5 \: l1 H; \
它很便宜,能耗低,更重要的是,它运行TensorFlow-gpu或任何其他ML平台的操作,和我们平时使用的其他设备一样。只要我们的脚本没有深入到CPU体系结构中,就可以运行与i7 + CUDA GPU完全相同的脚本,也可以进行训练!Sam强烈希望NVIDIA应该使用TensorFlow预加载L4T。
! Z+ T5 [; c0 H2 p# B/ s 5 h% v. D# I+ m0 L9 V6 E; V+ x
Google Coral Edge TPU
% t6 ?$ ^- m2 T/ u' ASam毫不掩饰的表达了他对Google Coral Edge TPU的精心设计以及高效率的喜爱。下图我们可以对比Edge TPU有多小。
L# i, N( K5 a$ R7 A ! ~# a7 H+ c2 _& @+ [/ A* u, D
Penny for scale,来源:谷歌
1 H* Q3 Y7 d. o8 @* s5 a. ^# r
+ G9 i! Z) c( MEdge TPU就是所谓的“ASIC”(专用集成电路),这意味着它具有FET等小型电子部件,以及能够直接在硅层上烧制,这样它就可以加快在特定场景下的推力速度。但Edge TPU无法执行反向传播。
1 G1 X9 y$ T0 w, ]! W* [4 r
0 z4 D6 _0 z& o: Z* N+ t' UGoogle Coral Edge TPU USB加速器
6 a/ Y! @+ }1 X* F
% D7 P; R1 Z, o) Q( c2 |# C# I下图显示了Edge TPU的基本原理。
E( D7 \, _* i . O9 c0 t" C1 _ s$ o
像MobileNetV2这样的网络主要由后面带有激活层的卷积组成。公式如下:
: f. l+ m" H/ \# h8 H ]7 T# D
9 |/ ^( ^( C8 F& @" U卷积5 p! x+ g' d% o
( \8 w( ]8 n7 ?9 {$ i3 W& y
这意味着将图像的每个元素(像素)与内核的每个像素相乘,然后将这些结果相加,以创建新的“图像”(特征图)。这正是Edge TPU的主要工作。将所有内容同时相乘,然后以疯狂的速度添加所有内容。这背后没有CPU,只要你将数据泵入左边的缓冲区就可以了。2 y) y& o) n6 O$ c
我们看到Coral在性能/瓦特的对比中,差异如此大的原因,它是一堆电子设备,旨在完成所需的按位操作,基本上没有任何开销。, Q4 R& p2 a1 x' I# b
总结 为什么GPU没有8位模型?" t- W1 j/ N) u% m
GPU本质上被设计为细粒度并行浮点计算器。而Edge TPU设计用于执行8位操作,并且CPU具有比完全位宽浮点数更快的8位内容更快的方法,因为它们在很多情况下必须处理这个问题。
# r& ^9 j3 A6 q/ J0 n0 J$ q; u为何选择MobileNetV2?( w- j, k/ l7 n* q
主要原因是,MobileNetV2是谷歌为Edge TPU提供的预编译模型之一。
6 _5 i0 X# S! c4 n) W0 nEdge TPU还有哪些其他产品?
# {4 j6 e! q& H% R! e; `1 [+ P8 U& G它曾经是不同版本的MobileNet和Inception,截至上周末,谷歌推出了一个更新,允许我们编译自定义TensorFlow Lite模型。但仅限于TensorFlow Lite模型。而反观Jetson Nano就没有这方面的限制。% y9 r1 \4 o# }( x
Raspberry Pi + Coral与其他人相比* s$ E2 y+ r6 P9 {$ A
为什么连接到Raspberry Pi时Coral看起来要慢得多?因为Raspberry Pi只有USB 2.0端口。
( ~+ M3 H# z% T' z$ g1 Z& K$ qi7-7700K在Coral和Jetson Nano上的速度都会更快一些,但仍然无法和后两者比肩。因此推测瓶颈是数据速率,不是Edge TPU。4 z% |' G# |! q# ^4 E

/ R1 K# P+ U* G" H3 X ( W: l0 t7 W0 a5 X: U& G
【加入社群】% N+ p2 o" m. N+ T
+ @+ n( d- X( d
; k- X7 ]. z6 L) V) s ^! p5 B
来源:http://www.yidianzixun.com/article/0Lt3VMHK; R9 |. o! b% ^+ H
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|