|
|
8 `) t8 z8 U4 \
【新智元导读】Google Coral Edge TPU和NVIDIA Jetson Nano大比拼!本文从分别对两款最新推出的EdgeAI芯片做了对比,分析了二者各自的优劣势。/ M5 B' K/ b5 V2 |2 z$ o4 R0 c
( b5 C. z( ^6 `+ _. }* F- f$ `! M边缘智能被称作是人工智能的最后一公里。& I! J* T, g0 c8 [% [6 _4 W( s/ _
d" y9 J7 ~8 i% j4 {8 j* ]; s( sGoogle刚刚在3月份推出了Coral Edge TPU,是一款售价不到1000元人民币的开发板(Coral Dev Board),由Edge TPU模块和 Baseboard 组成。参数如下:, _2 l* n( g! t2 u4 M
$ _, o- o9 ?6 [! G- T- G/ b, ?4 b

% |! G( L6 q' |7 e; t英伟达同样在上个月发布了最新的NVIDIA Jetson Nano,Jetson Nano是一款类似于树莓派的嵌入式电脑设备,其搭载了四核Cortex-A57处理器,GPU则是拥有128个NVIDIA CUDA核心的NVIDIA麦克斯韦架构显卡,内存4GB LPDDR4,存储则为16GB eMMC 5.1,支持4K 60Hz视频解码。4 a3 M% u$ I" A; m' I4 K6 s8 T; X6 }
目前位置并没有太多关于这两款产品的评测报告。今天新智元为大家带来一篇由网友Sam Sterckval对两款产品的评测,除此以外他还测试了i7-7700K + GTX1080(2560CUDA),Raspberry Pi 3B +,以及一个2014年的MacBook pro包含一个i7-4870HQ(没有支持CUDA的内核)。9 q! M+ U; O6 V8 k
Sam使用MobileNetV2作为分类器,在imagenet数据集上进行预训练,直接从Keras使用这个模型,后端则使用TensorFlow。使用GPU的浮点权重,以及CPU和Coral Edge TPU的8bit量化tflite版本。
% o$ U, ^+ W* ~9 a' k( g8 D( B首先,加载模型以及一张喜鹊图像。先执行1个预测作为预热,Sam发现第一个预测总是比随后的预测更能说明问题。然后Sleep 1秒,确保所有的线程的活动都终止,然后对同一图像进行250次分类。- y5 h4 k( J, V; @/ f, Y6 U

) I& u+ e8 Y- L* j% s对所有分类使用相同的图像,能够确保在整个测试过程中保持接近的数据总线。; v3 }- p, Q: m- k: L
; A* ~0 }$ M% x, ^$ R6 w; G对比结果 先来看最终的结果:. V' [8 [7 ~) k7 ?
: X) x. t5 J5 ~4 t( d4 W# w9 T
线性刻度,FPS 2 a5 i6 ^2 A4 u# U5 T% i# _* a- w
对数刻度,FPS
/ @ i7 C- v2 ^, f! d
- u6 X5 O: ]! g5 G# | e2 {7 Y " @0 f( L2 g. K1 R9 Y
线性刻度,推理时间(250x)- r* A6 l0 n( P& i5 Y9 {" A
# u2 f; O8 D" U' g+ G6 ?& t6 L+ I0 hSam发现使用CPU的量化tflite模型得分是不同的,但似乎它总是返回与其它产品相同的预测结果,他怀疑模型有点奇怪,但能确保它不会影响性能。
# G4 _8 J B1 Y! M& q; f: A& F9 B1 x对比分析 第一个柱状图中我们可以看到有3个比较突出的数据,其中两个2个是由Google Coral Edge TPU USB加速器实现的,第3个是由英特尔i7-7700K辅助NVIDIA GTX1080实现。" I4 v. a5 t7 V; j6 Y+ G4 t
我们再仔细对比一下就会发现,GTX1080实际上完全无法跟Google的Coral对飚。要知道GTX1080的最大功率为180W,而Coral Edge TPU只有2.5W。
4 L( r7 V/ X- v8 p5 ]% qNVIDIA Jetson Nano的得分并不高。虽然它有一个支持CUDA的GPU,但实际上并没比那台2014年MBP的i7-4870HQ快太多,但毕竟还是比这款四核,超线程的CPU要快。
2 h$ A: m" _3 r: k然而相比i7 50W的能耗,Jetson Nano平均能耗始终保持在12.5W,也就是说功耗降低75%,性能提升了10%。: [3 P3 z4 F& g, C3 E
NVIDIA Jetson Nano" B+ U3 y' s1 l( k8 ~! ^9 b2 ?
尽管Jetson Nano并没有在MobileNetV2分类器中表现出令人印象深刻的FPS率,但它的优势非常明显:
2 Y P, `) m' w9 R它很便宜,能耗低,更重要的是,它运行TensorFlow-gpu或任何其他ML平台的操作,和我们平时使用的其他设备一样。只要我们的脚本没有深入到CPU体系结构中,就可以运行与i7 + CUDA GPU完全相同的脚本,也可以进行训练!Sam强烈希望NVIDIA应该使用TensorFlow预加载L4T。
7 |2 @+ [! A9 K( L1 N 6 H" K0 g$ i/ h% |3 h) t3 m
Google Coral Edge TPU6 ^2 l* Q0 i4 w2 r( u# ~ W% t
Sam毫不掩饰的表达了他对Google Coral Edge TPU的精心设计以及高效率的喜爱。下图我们可以对比Edge TPU有多小。5 u3 @( c# H$ {' C! b3 B+ V/ L

& @, s% L3 K/ K, _; tPenny for scale,来源:谷歌
# N* ^5 E$ A& u S% E; q) Z. h
+ e3 f+ D. C$ G V1 VEdge TPU就是所谓的“ASIC”(专用集成电路),这意味着它具有FET等小型电子部件,以及能够直接在硅层上烧制,这样它就可以加快在特定场景下的推力速度。但Edge TPU无法执行反向传播。
' S, t( {6 M1 U9 a9 d/ ?* ^ . X* N7 }+ l: Y$ }4 F
Google Coral Edge TPU USB加速器$ S3 X, B. X1 R5 `' S7 D Q; V& w% k
# C9 X$ i* D2 s# U+ Z& C* F. d# J
下图显示了Edge TPU的基本原理。
! ], Y& o' E) q( w + e4 k ^# B2 b
像MobileNetV2这样的网络主要由后面带有激活层的卷积组成。公式如下:
1 {! l) g, {( f7 H
. w) x( S4 P% U H4 \2 D3 n+ W卷积: p. G# D. j O/ p& D
' i0 @7 i7 I3 x# c4 J# G/ c这意味着将图像的每个元素(像素)与内核的每个像素相乘,然后将这些结果相加,以创建新的“图像”(特征图)。这正是Edge TPU的主要工作。将所有内容同时相乘,然后以疯狂的速度添加所有内容。这背后没有CPU,只要你将数据泵入左边的缓冲区就可以了。$ A0 i @! R0 f9 ]" W7 T3 I: V
我们看到Coral在性能/瓦特的对比中,差异如此大的原因,它是一堆电子设备,旨在完成所需的按位操作,基本上没有任何开销。+ e# \, C6 K1 }9 z) o
总结 为什么GPU没有8位模型?4 ]9 ]) V9 i- Z* Q# ^
GPU本质上被设计为细粒度并行浮点计算器。而Edge TPU设计用于执行8位操作,并且CPU具有比完全位宽浮点数更快的8位内容更快的方法,因为它们在很多情况下必须处理这个问题。; ^, y. |! `* _" H' ?
为何选择MobileNetV2?+ I, \0 n" z( ~5 Y
主要原因是,MobileNetV2是谷歌为Edge TPU提供的预编译模型之一。0 M8 n) }2 g5 L6 s; F& X
Edge TPU还有哪些其他产品?
9 ^2 @ [( c- E- e( w它曾经是不同版本的MobileNet和Inception,截至上周末,谷歌推出了一个更新,允许我们编译自定义TensorFlow Lite模型。但仅限于TensorFlow Lite模型。而反观Jetson Nano就没有这方面的限制。
v& T) b9 M7 E% _Raspberry Pi + Coral与其他人相比% a W* z& U1 |
为什么连接到Raspberry Pi时Coral看起来要慢得多?因为Raspberry Pi只有USB 2.0端口。4 y, i0 i1 q7 u8 A O* E$ |
i7-7700K在Coral和Jetson Nano上的速度都会更快一些,但仍然无法和后两者比肩。因此推测瓶颈是数据速率,不是Edge TPU。" G2 ~3 k6 Y9 @! W6 W; p( [

0 P; Z. j; u c1 O/ ^
3 F& ]; `6 i, {7 E3 w4 N/ D【加入社群】; I( ?6 _5 S. _* @! }

+ k$ B1 {3 n& P$ ]$ \. g
9 Z% r6 J/ x4 ~. ? i7 b来源:http://www.yidianzixun.com/article/0Lt3VMHK) _* V4 w4 l) c# K( R$ L9 E! m
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|