|
|

$ k( l0 L' w* X, x【新智元导读】Google Coral Edge TPU和NVIDIA Jetson Nano大比拼!本文从分别对两款最新推出的EdgeAI芯片做了对比,分析了二者各自的优劣势。) K D T/ R1 ]% U. I" q2 z z0 n, W
* {; L5 L) ]8 N/ }( D边缘智能被称作是人工智能的最后一公里。/ K4 |$ }* ?! ]* ?/ o0 B1 w
# [% @1 Y) k9 LGoogle刚刚在3月份推出了Coral Edge TPU,是一款售价不到1000元人民币的开发板(Coral Dev Board),由Edge TPU模块和 Baseboard 组成。参数如下:
8 P5 v* K' q2 h0 G) ?, @8 J
9 v. t6 B2 D H: i% S# @) R, l4 b ( O4 I v- I! F, M5 f) E4 {7 Y! f' w
英伟达同样在上个月发布了最新的NVIDIA Jetson Nano,Jetson Nano是一款类似于树莓派的嵌入式电脑设备,其搭载了四核Cortex-A57处理器,GPU则是拥有128个NVIDIA CUDA核心的NVIDIA麦克斯韦架构显卡,内存4GB LPDDR4,存储则为16GB eMMC 5.1,支持4K 60Hz视频解码。
! q7 c: Z6 `% g+ M& ]1 }目前位置并没有太多关于这两款产品的评测报告。今天新智元为大家带来一篇由网友Sam Sterckval对两款产品的评测,除此以外他还测试了i7-7700K + GTX1080(2560CUDA),Raspberry Pi 3B +,以及一个2014年的MacBook pro包含一个i7-4870HQ(没有支持CUDA的内核)。
: a7 M5 L) X/ h u7 g* S3 V! j+ rSam使用MobileNetV2作为分类器,在imagenet数据集上进行预训练,直接从Keras使用这个模型,后端则使用TensorFlow。使用GPU的浮点权重,以及CPU和Coral Edge TPU的8bit量化tflite版本。0 S! @7 U8 T( C' `9 P: w, n9 i
首先,加载模型以及一张喜鹊图像。先执行1个预测作为预热,Sam发现第一个预测总是比随后的预测更能说明问题。然后Sleep 1秒,确保所有的线程的活动都终止,然后对同一图像进行250次分类。+ t& G4 B R- y) i( s8 Y: H( Y, L! o
5 F( M! z1 J2 O v$ J
对所有分类使用相同的图像,能够确保在整个测试过程中保持接近的数据总线。3 F) D3 j$ W0 M
: t5 u( `1 e M* Z1 {. a. d
对比结果 先来看最终的结果:
% k) V8 m/ ?' f* F; Y# A; P' ~, H
, ]! f8 B/ P: E. l3 q 线性刻度,FPS
# p6 k& o( ?$ m7 N2 N对数刻度,FPS
1 Q8 W" r- Z- i8 p
3 W$ |$ F/ I5 p: s+ ^( [ : z6 T$ ?* ?9 K
线性刻度,推理时间(250x), j( J# J. S( o% k9 a
2 z( C( l! ~; m, B* z2 Y. b/ Q* B
Sam发现使用CPU的量化tflite模型得分是不同的,但似乎它总是返回与其它产品相同的预测结果,他怀疑模型有点奇怪,但能确保它不会影响性能。1 b4 P7 G0 c$ Y v
对比分析 第一个柱状图中我们可以看到有3个比较突出的数据,其中两个2个是由Google Coral Edge TPU USB加速器实现的,第3个是由英特尔i7-7700K辅助NVIDIA GTX1080实现。6 L$ `5 @! t) S* j7 c
我们再仔细对比一下就会发现,GTX1080实际上完全无法跟Google的Coral对飚。要知道GTX1080的最大功率为180W,而Coral Edge TPU只有2.5W。
) y4 \) u. d) MNVIDIA Jetson Nano的得分并不高。虽然它有一个支持CUDA的GPU,但实际上并没比那台2014年MBP的i7-4870HQ快太多,但毕竟还是比这款四核,超线程的CPU要快。
0 i1 F8 [0 ^8 S' k1 m" |% z0 B6 g9 O然而相比i7 50W的能耗,Jetson Nano平均能耗始终保持在12.5W,也就是说功耗降低75%,性能提升了10%。1 [% x: J3 E' U/ T# Y) C7 O/ w
NVIDIA Jetson Nano+ x- \3 f: @+ J$ B- h
尽管Jetson Nano并没有在MobileNetV2分类器中表现出令人印象深刻的FPS率,但它的优势非常明显:
8 l3 ]3 q; @* X' ?1 N- C6 ~& R9 C它很便宜,能耗低,更重要的是,它运行TensorFlow-gpu或任何其他ML平台的操作,和我们平时使用的其他设备一样。只要我们的脚本没有深入到CPU体系结构中,就可以运行与i7 + CUDA GPU完全相同的脚本,也可以进行训练!Sam强烈希望NVIDIA应该使用TensorFlow预加载L4T。
# v+ B' L3 S" K" p, E9 S 1 d. R: }3 e1 J' X0 Z4 C4 V
Google Coral Edge TPU
4 y5 ]: ^9 D6 g: `0 v9 v0 U; Z5 fSam毫不掩饰的表达了他对Google Coral Edge TPU的精心设计以及高效率的喜爱。下图我们可以对比Edge TPU有多小。
4 x$ O4 A3 y) |% V6 e1 s
, I5 }8 V2 E3 H2 O6 Y# UPenny for scale,来源:谷歌! R, \! I. G6 d
6 v. R7 t" |8 G& }* L0 lEdge TPU就是所谓的“ASIC”(专用集成电路),这意味着它具有FET等小型电子部件,以及能够直接在硅层上烧制,这样它就可以加快在特定场景下的推力速度。但Edge TPU无法执行反向传播。5 G: d9 s/ ]) z3 J. y( a

5 B( y2 {: B4 p+ {" U* cGoogle Coral Edge TPU USB加速器
9 L4 ?' W4 j5 ]" U6 T
4 L2 Z# w, x1 |: b3 M/ y% ^" n, H i下图显示了Edge TPU的基本原理。( I5 {' X6 I4 W- ~( F* L

* h- A. \$ \& Y- w, U; _像MobileNetV2这样的网络主要由后面带有激活层的卷积组成。公式如下:4 z. _9 I( W8 \, [

4 H( y: K3 x& T* e9 a% z卷积
B3 L6 U, m9 T) Y$ b8 g" l
* F$ D! q L3 T5 k/ j3 G- Z: X/ K这意味着将图像的每个元素(像素)与内核的每个像素相乘,然后将这些结果相加,以创建新的“图像”(特征图)。这正是Edge TPU的主要工作。将所有内容同时相乘,然后以疯狂的速度添加所有内容。这背后没有CPU,只要你将数据泵入左边的缓冲区就可以了。
" p+ w: J1 u/ N% Q; x我们看到Coral在性能/瓦特的对比中,差异如此大的原因,它是一堆电子设备,旨在完成所需的按位操作,基本上没有任何开销。+ |8 q; j0 j( W2 E
总结 为什么GPU没有8位模型?/ ]; ~/ ~) Z$ K
GPU本质上被设计为细粒度并行浮点计算器。而Edge TPU设计用于执行8位操作,并且CPU具有比完全位宽浮点数更快的8位内容更快的方法,因为它们在很多情况下必须处理这个问题。( s/ b- p& F! z! N/ m7 _
为何选择MobileNetV2?" ]. O' T, K: Z. b m& d8 W0 ^
主要原因是,MobileNetV2是谷歌为Edge TPU提供的预编译模型之一。
/ ?& ^% D0 T9 u6 s7 ^) m( A/ w) uEdge TPU还有哪些其他产品?
y/ `* n$ |% r- A3 G' {' Z& o它曾经是不同版本的MobileNet和Inception,截至上周末,谷歌推出了一个更新,允许我们编译自定义TensorFlow Lite模型。但仅限于TensorFlow Lite模型。而反观Jetson Nano就没有这方面的限制。. O8 I# Y& j+ q% j, f. L1 I5 S
Raspberry Pi + Coral与其他人相比5 E0 Y1 i+ v4 o) |
为什么连接到Raspberry Pi时Coral看起来要慢得多?因为Raspberry Pi只有USB 2.0端口。
+ |3 C: E* n6 P. Si7-7700K在Coral和Jetson Nano上的速度都会更快一些,但仍然无法和后两者比肩。因此推测瓶颈是数据速率,不是Edge TPU。6 \; p; Z# r5 b" s, w
) `3 }4 L$ H; \0 m
! d: G$ i* H' R7 K
【加入社群】; x6 X+ E4 n$ D
f7 i% `1 }/ z# p m
6 U2 s7 I9 b7 E( r" e
来源:http://www.yidianzixun.com/article/0Lt3VMHK
- t7 v$ R, b4 s! G* Q& \: f% n5 B! d D免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|