京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 774|回复: 0

最新千元边缘AI芯片比拼:谷歌Coral和英伟达Jetson谁更厉害?

[复制链接]

17

主题

0

回帖

10

积分

新手上路

积分
10
发表于 2019-5-1 07:41:01 | 显示全部楼层 |阅读模式 来自 中国

1 s) D0 t3 R2 w4 {# m, m【新智元导读】Google Coral Edge TPU和NVIDIA Jetson Nano大比拼!本文从分别对两款最新推出的EdgeAI芯片做了对比,分析了二者各自的优劣势。2 O3 I0 H* j" `7 z' j: J

" o: |6 U: q8 m+ ~" ]6 x- p  Y边缘智能被称作是人工智能的最后一公里。
  O8 b1 Q( I8 X
; g- h3 h, z& i1 A  ]7 QGoogle刚刚在3月份推出了Coral Edge TPU,是一款售价不到1000元人民币的开发板(Coral Dev Board),由Edge TPU模块和 Baseboard 组成。参数如下:7 y$ }; Z# a! Z2 l. B, @% H. X7 Q2 n

% I( k/ b* I# U1 X( c! q4 U2 D4 D3 F, _  s2 Q
英伟达同样在上个月发布了最新的NVIDIA Jetson Nano,Jetson Nano是一款类似于树莓派的嵌入式电脑设备,其搭载了四核Cortex-A57处理器,GPU则是拥有128个NVIDIA CUDA核心的NVIDIA麦克斯韦架构显卡,内存4GB LPDDR4,存储则为16GB eMMC 5.1,支持4K 60Hz视频解码。
, Y8 ~. S4 ]/ d9 Y3 z) u1 q目前位置并没有太多关于这两款产品的评测报告。今天新智元为大家带来一篇由网友Sam Sterckval对两款产品的评测,除此以外他还测试了i7-7700K + GTX1080(2560CUDA),Raspberry Pi 3B +,以及一个2014年的MacBook pro包含一个i7-4870HQ(没有支持CUDA的内核)。
5 F. B( y& l# y4 ]/ gSam使用MobileNetV2作为分类器,在imagenet数据集上进行预训练,直接从Keras使用这个模型,后端则使用TensorFlow。使用GPU的浮点权重,以及CPU和Coral Edge TPU的8bit量化tflite版本。
$ b4 e7 D4 U) N6 Z首先,加载模型以及一张喜鹊图像。先执行1个预测作为预热,Sam发现第一个预测总是比随后的预测更能说明问题。然后Sleep 1秒,确保所有的线程的活动都终止,然后对同一图像进行250次分类。
4 f/ n6 ], S0 t" v/ f" @9 C/ a& n) N/ L' Q8 B6 o* j, P/ `) w
对所有分类使用相同的图像,能够确保在整个测试过程中保持接近的数据总线。" M4 P7 ]" b: D% |( a3 [
  K" b- w: S/ q  `# V
对比结果 先来看最终的结果:
  H+ u3 e3 _) @2 Z% ?, Q; s$ a/ L7 b7 Z- U; c/ j
线性刻度,FPS: ^" O: ]: }4 t
对数刻度,FPS
7 G/ Y' |7 ^5 t% S2 P3 _& `
* ^1 G" _* t1 ^* h0 y1 G+ ]6 J; i
1 V3 X4 Q+ S1 {0 G1 j线性刻度,推理时间(250x)- T! B' J& G7 v9 B7 i; a

" m& O9 K* _; D+ ?Sam发现使用CPU的量化tflite模型得分是不同的,但似乎它总是返回与其它产品相同的预测结果,他怀疑模型有点奇怪,但能确保它不会影响性能。/ q% _0 W& R; K6 Z, N
对比分析 第一个柱状图中我们可以看到有3个比较突出的数据,其中两个2个是由Google Coral Edge TPU USB加速器实现的,第3个是由英特尔i7-7700K辅助NVIDIA GTX1080实现。. M' Z6 I" Y, Y
我们再仔细对比一下就会发现,GTX1080实际上完全无法跟Google的Coral对飚。要知道GTX1080的最大功率为180W,而Coral Edge TPU只有2.5W。  s" e3 t8 q* Q: ~  h! [' p+ N
NVIDIA Jetson Nano的得分并不高。虽然它有一个支持CUDA的GPU,但实际上并没比那台2014年MBP的i7-4870HQ快太多,但毕竟还是比这款四核,超线程的CPU要快。
; n# O1 J7 L7 r. }* i) c) U然而相比i7 50W的能耗,Jetson Nano平均能耗始终保持在12.5W,也就是说功耗降低75%,性能提升了10%。8 d9 D  g( Q8 X: ~/ Y0 \6 o
NVIDIA Jetson Nano
7 s0 Y: r0 q, |: ]$ e% ], ?尽管Jetson Nano并没有在MobileNetV2分类器中表现出令人印象深刻的FPS率,但它的优势非常明显:
/ q, E; H. f4 L* R* Q  Y它很便宜,能耗低,更重要的是,它运行TensorFlow-gpu或任何其他ML平台的操作,和我们平时使用的其他设备一样。只要我们的脚本没有深入到CPU体系结构中,就可以运行与i7 + CUDA GPU完全相同的脚本,也可以进行训练!Sam强烈希望NVIDIA应该使用TensorFlow预加载L4T。5 V- c/ l# ~% m7 u; d6 j

0 G7 n8 Z! _/ u  mGoogle Coral Edge TPU
8 l& p  w  R0 u/ ~! S) {" fSam毫不掩饰的表达了他对Google Coral Edge TPU的精心设计以及高效率的喜爱。下图我们可以对比Edge TPU有多小。( T# W0 ]( a9 K
7 ^) R. e- s, {
Penny for scale,来源:谷歌+ |  @! Q& a6 q2 _% _; r2 D3 M
) i; I, P+ i" d. n
Edge TPU就是所谓的“ASIC”(专用集成电路),这意味着它具有FET等小型电子部件,以及能够直接在硅层上烧制,这样它就可以加快在特定场景下的推力速度。但Edge TPU无法执行反向传播。
1 w2 e& K6 Y! P; d+ ^$ Z
  T: T. Q6 a; E5 LGoogle Coral Edge TPU USB加速器
2 q, f5 f7 ~9 v7 ^8 p' O) c; j* H4 h! A! j% B
下图显示了Edge TPU的基本原理。
# U1 s0 m5 X) T8 @0 O# m. Y; c6 Y5 H  |6 L
像MobileNetV2这样的网络主要由后面带有激活层的卷积组成。公式如下:
1 U& h, E3 c" C% h6 [/ Z+ }7 @5 ?# v) i
卷积
% \, d' J0 c) H( W, X
3 y+ K& g1 Y8 p3 A' m" b这意味着将图像的每个元素(像素)与内核的每个像素相乘,然后将这些结果相加,以创建新的“图像”(特征图)。这正是Edge TPU的主要工作。将所有内容同时相乘,然后以疯狂的速度添加所有内容。这背后没有CPU,只要你将数据泵入左边的缓冲区就可以了。  {! [5 c/ m" ?
我们看到Coral在性能/瓦特的对比中,差异如此大的原因,它是一堆电子设备,旨在完成所需的按位操作,基本上没有任何开销。7 M8 ~. M5 D1 }2 w; @- b) a! q3 s
总结 为什么GPU没有8位模型?
# Y( J, G, r3 v& M% GGPU本质上被设计为细粒度并行浮点计算器。而Edge TPU设计用于执行8位操作,并且CPU具有比完全位宽浮点数更快的8位内容更快的方法,因为它们在很多情况下必须处理这个问题。
( @2 j4 e9 g2 d( O4 L为何选择MobileNetV2?& J( S  U  S$ A+ \! C  I/ Y
主要原因是,MobileNetV2是谷歌为Edge TPU提供的预编译模型之一。
* J' u- B+ H/ x' M: A- c/ W( LEdge TPU还有哪些其他产品?# e% \; [  L! V# w  M, D6 |; a
它曾经是不同版本的MobileNet和Inception,截至上周末,谷歌推出了一个更新,允许我们编译自定义TensorFlow Lite模型。但仅限于TensorFlow Lite模型。而反观Jetson Nano就没有这方面的限制。( m, u& Z6 g! L% Q  R& Q& j+ Y# j
Raspberry Pi + Coral与其他人相比
8 _  ^% O! M: }2 H" N0 i% A( x- N为什么连接到Raspberry Pi时Coral看起来要慢得多?因为Raspberry Pi只有USB 2.0端口。; n  A, K. o0 `& Z7 ^; b% a
i7-7700K在Coral和Jetson Nano上的速度都会更快一些,但仍然无法和后两者比肩。因此推测瓶颈是数据速率,不是Edge TPU。$ e+ o" e& u3 [9 @& @: K

8 i* @* ~/ b' ^# E- X3 T
! H3 U0 O( v% ^+ p0 _/ f# v" J【加入社群】
, Q8 }" E2 |# I6 c( A
& L/ {& A0 s7 U  w% w: P6 ~) m. x: m
来源:http://www.yidianzixun.com/article/0Lt3VMHK0 J- _; v0 A* Q0 ]1 c
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-7-20 02:43 , Processed in 0.053190 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表