|
|

: y. c A( v( n4 Y9 }0 v& W【新智元导读】Google Coral Edge TPU和NVIDIA Jetson Nano大比拼!本文从分别对两款最新推出的EdgeAI芯片做了对比,分析了二者各自的优劣势。) G: r$ g/ h: J% s) M# u* c
; { B S0 x' O( U! ]5 f' V+ D
边缘智能被称作是人工智能的最后一公里。! k0 J% d6 |: O# |0 ]4 e6 e0 i
. D' w8 d9 Y) T1 l
Google刚刚在3月份推出了Coral Edge TPU,是一款售价不到1000元人民币的开发板(Coral Dev Board),由Edge TPU模块和 Baseboard 组成。参数如下:% P9 B4 {& @, Q. n

; u/ |9 j7 h! t5 U K0 {, H0 J4 N
6 [# S- ?, _. W; B. s8 s# s9 J4 V9 I英伟达同样在上个月发布了最新的NVIDIA Jetson Nano,Jetson Nano是一款类似于树莓派的嵌入式电脑设备,其搭载了四核Cortex-A57处理器,GPU则是拥有128个NVIDIA CUDA核心的NVIDIA麦克斯韦架构显卡,内存4GB LPDDR4,存储则为16GB eMMC 5.1,支持4K 60Hz视频解码。8 B: b. d) M1 l0 v/ U+ d- }
目前位置并没有太多关于这两款产品的评测报告。今天新智元为大家带来一篇由网友Sam Sterckval对两款产品的评测,除此以外他还测试了i7-7700K + GTX1080(2560CUDA),Raspberry Pi 3B +,以及一个2014年的MacBook pro包含一个i7-4870HQ(没有支持CUDA的内核)。0 a0 S2 e/ D6 i! X3 ]2 Z
Sam使用MobileNetV2作为分类器,在imagenet数据集上进行预训练,直接从Keras使用这个模型,后端则使用TensorFlow。使用GPU的浮点权重,以及CPU和Coral Edge TPU的8bit量化tflite版本。
: q/ ~* R. n6 {$ k9 D9 d. U首先,加载模型以及一张喜鹊图像。先执行1个预测作为预热,Sam发现第一个预测总是比随后的预测更能说明问题。然后Sleep 1秒,确保所有的线程的活动都终止,然后对同一图像进行250次分类。
9 P$ {3 w1 v4 Q7 k/ q ; ^7 f" d, C- _; `# A4 W, F
对所有分类使用相同的图像,能够确保在整个测试过程中保持接近的数据总线。- M; X. R! w) }6 M- C
, Y( B, l; E: t( ~对比结果 先来看最终的结果:0 r' d' O5 Y" N& x

: V- d) [# W# x4 d6 _6 B 线性刻度,FPS
6 o( L5 z) f# }4 b% {) P对数刻度,FPS# x" j- z/ Y+ }' q( i' _+ B
" z1 w6 ~! m3 c% k ' L E& }7 C1 E$ T. P! V# Z& o
线性刻度,推理时间(250x) `/ u o. Z5 l
; ?- ~, o e& @1 wSam发现使用CPU的量化tflite模型得分是不同的,但似乎它总是返回与其它产品相同的预测结果,他怀疑模型有点奇怪,但能确保它不会影响性能。
2 w% G! X. K X( @对比分析 第一个柱状图中我们可以看到有3个比较突出的数据,其中两个2个是由Google Coral Edge TPU USB加速器实现的,第3个是由英特尔i7-7700K辅助NVIDIA GTX1080实现。8 E) J L, `8 t" G( S
我们再仔细对比一下就会发现,GTX1080实际上完全无法跟Google的Coral对飚。要知道GTX1080的最大功率为180W,而Coral Edge TPU只有2.5W。; A( }3 W o9 `
NVIDIA Jetson Nano的得分并不高。虽然它有一个支持CUDA的GPU,但实际上并没比那台2014年MBP的i7-4870HQ快太多,但毕竟还是比这款四核,超线程的CPU要快。
- x3 z! H" ]/ k; ^* E; m) ?然而相比i7 50W的能耗,Jetson Nano平均能耗始终保持在12.5W,也就是说功耗降低75%,性能提升了10%。5 W' O% B4 F* v3 ^1 g
NVIDIA Jetson Nano! R4 u2 R2 F" Y4 A3 _8 b
尽管Jetson Nano并没有在MobileNetV2分类器中表现出令人印象深刻的FPS率,但它的优势非常明显:
+ S4 Q, U: X2 \4 W7 a7 _: S它很便宜,能耗低,更重要的是,它运行TensorFlow-gpu或任何其他ML平台的操作,和我们平时使用的其他设备一样。只要我们的脚本没有深入到CPU体系结构中,就可以运行与i7 + CUDA GPU完全相同的脚本,也可以进行训练!Sam强烈希望NVIDIA应该使用TensorFlow预加载L4T。, l2 n+ @: {/ K+ H- V
0 y2 U8 k( e( H1 v
Google Coral Edge TPU, H8 l3 l; Q3 B, B' l4 Q
Sam毫不掩饰的表达了他对Google Coral Edge TPU的精心设计以及高效率的喜爱。下图我们可以对比Edge TPU有多小。
! R* @# e& |: t! }# m( b 5 \* ~9 h5 A0 r3 v4 l6 l R
Penny for scale,来源:谷歌$ X3 }+ K' D1 S7 f$ C' r1 A
. d- P M8 O7 ?8 O
Edge TPU就是所谓的“ASIC”(专用集成电路),这意味着它具有FET等小型电子部件,以及能够直接在硅层上烧制,这样它就可以加快在特定场景下的推力速度。但Edge TPU无法执行反向传播。
" }% ~# n4 D7 r& a & l5 @! T- z1 ]4 V" d4 I% Q
Google Coral Edge TPU USB加速器
. f b' n8 I3 t* ?) q; L; E, U7 D& S! [" O u" e
下图显示了Edge TPU的基本原理。
6 R0 N: L0 {4 W$ d7 @2 u9 Y7 G ) j# V4 U- q% D: X
像MobileNetV2这样的网络主要由后面带有激活层的卷积组成。公式如下:
* E! ~% \1 c: ~ u4 h+ l3 t & u( r# z: o! s9 T9 N% p; a
卷积7 D+ {# x% {$ k4 r
0 E5 C/ Q3 I" U4 u$ Q z+ J: z这意味着将图像的每个元素(像素)与内核的每个像素相乘,然后将这些结果相加,以创建新的“图像”(特征图)。这正是Edge TPU的主要工作。将所有内容同时相乘,然后以疯狂的速度添加所有内容。这背后没有CPU,只要你将数据泵入左边的缓冲区就可以了。% t3 F5 R0 s, R1 J
我们看到Coral在性能/瓦特的对比中,差异如此大的原因,它是一堆电子设备,旨在完成所需的按位操作,基本上没有任何开销。5 P( r8 m# E1 j+ |( n) A
总结 为什么GPU没有8位模型?
" G: O' T/ ^/ B! d8 i2 [GPU本质上被设计为细粒度并行浮点计算器。而Edge TPU设计用于执行8位操作,并且CPU具有比完全位宽浮点数更快的8位内容更快的方法,因为它们在很多情况下必须处理这个问题。0 m) i; `& y O! M# |$ v' m
为何选择MobileNetV2?
3 Q0 \% f- H" B$ P' F! K% E主要原因是,MobileNetV2是谷歌为Edge TPU提供的预编译模型之一。
7 j4 a% H8 \$ E8 A) DEdge TPU还有哪些其他产品?
' O* h" R" t+ k9 i& T" p它曾经是不同版本的MobileNet和Inception,截至上周末,谷歌推出了一个更新,允许我们编译自定义TensorFlow Lite模型。但仅限于TensorFlow Lite模型。而反观Jetson Nano就没有这方面的限制。2 p4 @& H/ P3 m7 O8 u" w0 }
Raspberry Pi + Coral与其他人相比
* ~$ C- ^& y& U: Y v D% M为什么连接到Raspberry Pi时Coral看起来要慢得多?因为Raspberry Pi只有USB 2.0端口。, F2 z8 q* w, f2 Z5 c$ h9 ]
i7-7700K在Coral和Jetson Nano上的速度都会更快一些,但仍然无法和后两者比肩。因此推测瓶颈是数据速率,不是Edge TPU。: C8 E1 G/ B1 W1 `

; n3 D- Q+ I! B5 ^1 o" L5 o 4 @ D$ ]9 |; Q6 J( W1 \
【加入社群】7 R( x/ \' Z$ Q; Z

; I0 L# V- E& l- m, ]8 Q! P9 v5 Q: W, @4 q5 U) P
来源:http://www.yidianzixun.com/article/0Lt3VMHK9 E/ R3 G& c5 D+ R# y; J& n
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|