|
|

2 ^; _/ d: t0 z1 [【新智元导读】Google Coral Edge TPU和NVIDIA Jetson Nano大比拼!本文从分别对两款最新推出的EdgeAI芯片做了对比,分析了二者各自的优劣势。
! I5 }, Y1 x0 ~2 b
+ d) K$ X; m! R0 G( M& C* F; U边缘智能被称作是人工智能的最后一公里。
! [7 e; z$ |( ~3 u: Q, p; o6 r# b! S3 n, Y
Google刚刚在3月份推出了Coral Edge TPU,是一款售价不到1000元人民币的开发板(Coral Dev Board),由Edge TPU模块和 Baseboard 组成。参数如下:- z) t3 G4 l1 @8 U

5 [. I& v0 [- k( C% {0 ?
1 M; T, W! u" h- ?5 I+ v英伟达同样在上个月发布了最新的NVIDIA Jetson Nano,Jetson Nano是一款类似于树莓派的嵌入式电脑设备,其搭载了四核Cortex-A57处理器,GPU则是拥有128个NVIDIA CUDA核心的NVIDIA麦克斯韦架构显卡,内存4GB LPDDR4,存储则为16GB eMMC 5.1,支持4K 60Hz视频解码。
$ ~' F, ?' J/ A+ o6 m G目前位置并没有太多关于这两款产品的评测报告。今天新智元为大家带来一篇由网友Sam Sterckval对两款产品的评测,除此以外他还测试了i7-7700K + GTX1080(2560CUDA),Raspberry Pi 3B +,以及一个2014年的MacBook pro包含一个i7-4870HQ(没有支持CUDA的内核)。 T. E2 S5 F. e& H5 w1 b* h2 }
Sam使用MobileNetV2作为分类器,在imagenet数据集上进行预训练,直接从Keras使用这个模型,后端则使用TensorFlow。使用GPU的浮点权重,以及CPU和Coral Edge TPU的8bit量化tflite版本。( Q' L" X; m/ {! F p
首先,加载模型以及一张喜鹊图像。先执行1个预测作为预热,Sam发现第一个预测总是比随后的预测更能说明问题。然后Sleep 1秒,确保所有的线程的活动都终止,然后对同一图像进行250次分类。6 T' X; F6 x/ q, m9 X" e) m

& z6 X& s% f) L/ }1 ] m对所有分类使用相同的图像,能够确保在整个测试过程中保持接近的数据总线。4 j2 v+ o$ E- p% E' | i: N
& }4 u) |+ L$ W" ]- v/ C; `对比结果 先来看最终的结果:0 B2 n! \8 _% U) ~/ U6 D5 Q

. ]0 q/ e' I( D* x5 e 线性刻度,FPS
" p9 R6 [+ y, m% M9 H! V/ O对数刻度,FPS2 ^4 a& G" f$ i' W2 J- r
( f* t" Y S3 E# ?/ \1 x 1 J# |* `4 e1 {3 ?: q5 r
线性刻度,推理时间(250x)) Y# X1 A$ m D {' Y E
6 a/ L: D( r: s7 F( fSam发现使用CPU的量化tflite模型得分是不同的,但似乎它总是返回与其它产品相同的预测结果,他怀疑模型有点奇怪,但能确保它不会影响性能。8 i- ~9 q- l( Q- U% j# s X
对比分析 第一个柱状图中我们可以看到有3个比较突出的数据,其中两个2个是由Google Coral Edge TPU USB加速器实现的,第3个是由英特尔i7-7700K辅助NVIDIA GTX1080实现。
4 g3 J$ ~5 s# L. z我们再仔细对比一下就会发现,GTX1080实际上完全无法跟Google的Coral对飚。要知道GTX1080的最大功率为180W,而Coral Edge TPU只有2.5W。 Z# P. S! P9 y
NVIDIA Jetson Nano的得分并不高。虽然它有一个支持CUDA的GPU,但实际上并没比那台2014年MBP的i7-4870HQ快太多,但毕竟还是比这款四核,超线程的CPU要快。7 W$ v$ q: \/ J, e+ r
然而相比i7 50W的能耗,Jetson Nano平均能耗始终保持在12.5W,也就是说功耗降低75%,性能提升了10%。5 ~# Q8 G+ {; Z! h8 H
NVIDIA Jetson Nano
/ \7 H; J4 S9 r4 }0 H4 I尽管Jetson Nano并没有在MobileNetV2分类器中表现出令人印象深刻的FPS率,但它的优势非常明显:- b& t- T S3 Z- D4 S7 Q6 Z
它很便宜,能耗低,更重要的是,它运行TensorFlow-gpu或任何其他ML平台的操作,和我们平时使用的其他设备一样。只要我们的脚本没有深入到CPU体系结构中,就可以运行与i7 + CUDA GPU完全相同的脚本,也可以进行训练!Sam强烈希望NVIDIA应该使用TensorFlow预加载L4T。2 Q- T* j9 A" l6 [ v A
! J& |- O" A) v& Y1 i( s8 ~
Google Coral Edge TPU
9 M$ ~8 |' V! D- {( a% S! ?% zSam毫不掩饰的表达了他对Google Coral Edge TPU的精心设计以及高效率的喜爱。下图我们可以对比Edge TPU有多小。2 H3 N c* H3 x+ i* \( E6 t
- P8 p+ d* t- U9 R# g9 m, u
Penny for scale,来源:谷歌
6 Q3 h, g: p% T$ A
7 i+ K! \- G9 e& Q' _Edge TPU就是所谓的“ASIC”(专用集成电路),这意味着它具有FET等小型电子部件,以及能够直接在硅层上烧制,这样它就可以加快在特定场景下的推力速度。但Edge TPU无法执行反向传播。) s- i' o8 p1 e5 z3 U
6 x; u, P0 j, M, w2 a0 a
Google Coral Edge TPU USB加速器
& V O2 P' g3 _7 a/ m5 e/ d
( Y+ S% K8 }) z) e" }, S" x1 U下图显示了Edge TPU的基本原理。
" y, P1 K7 x0 Z+ @6 L& Z2 \ # J W6 f! T. A! u7 M
像MobileNetV2这样的网络主要由后面带有激活层的卷积组成。公式如下:$ [; D8 ?5 P$ j" k7 I& |8 z7 o7 a
|6 ]" o" B. w9 Q9 z* [# d3 ]/ M& p
卷积' J* B9 e n8 l/ w: Q) t2 F$ n
# D+ d p9 }9 M$ C7 j( l这意味着将图像的每个元素(像素)与内核的每个像素相乘,然后将这些结果相加,以创建新的“图像”(特征图)。这正是Edge TPU的主要工作。将所有内容同时相乘,然后以疯狂的速度添加所有内容。这背后没有CPU,只要你将数据泵入左边的缓冲区就可以了。6 o* R' y# ^/ ]& u, k* ]
我们看到Coral在性能/瓦特的对比中,差异如此大的原因,它是一堆电子设备,旨在完成所需的按位操作,基本上没有任何开销。
1 ^1 k3 V7 x! q5 T% ?! t总结 为什么GPU没有8位模型?6 [" U( E4 ?, s2 N2 K- f) I# {$ f: H
GPU本质上被设计为细粒度并行浮点计算器。而Edge TPU设计用于执行8位操作,并且CPU具有比完全位宽浮点数更快的8位内容更快的方法,因为它们在很多情况下必须处理这个问题。
* h7 ?; q8 `) n* G* M为何选择MobileNetV2?1 l, B% p1 s/ ~0 K5 o) v8 C
主要原因是,MobileNetV2是谷歌为Edge TPU提供的预编译模型之一。. s8 y9 B% ?* ?4 @3 q
Edge TPU还有哪些其他产品?' O$ P7 Z1 @ q- I1 A! L" X
它曾经是不同版本的MobileNet和Inception,截至上周末,谷歌推出了一个更新,允许我们编译自定义TensorFlow Lite模型。但仅限于TensorFlow Lite模型。而反观Jetson Nano就没有这方面的限制。0 g" X& ^. ]8 x' m. s4 _
Raspberry Pi + Coral与其他人相比
/ z) K0 }7 d @$ r8 C+ }* a" D为什么连接到Raspberry Pi时Coral看起来要慢得多?因为Raspberry Pi只有USB 2.0端口。
# `& y: q! G( q% P9 I: Ni7-7700K在Coral和Jetson Nano上的速度都会更快一些,但仍然无法和后两者比肩。因此推测瓶颈是数据速率,不是Edge TPU。
, C/ j7 u) l( A' M ( y! V) z- U% ^- p7 Y

" w5 d& J4 ^+ d8 w【加入社群】
5 B7 p& x( W* N" V+ A9 z' h & f1 W6 [: H4 h
5 C3 D+ ?- [7 l
来源:http://www.yidianzixun.com/article/0Lt3VMHK
5 n4 ~* z" _* Z+ @免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|