京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 776|回复: 0

最新千元边缘AI芯片比拼:谷歌Coral和英伟达Jetson谁更厉害?

[复制链接]

17

主题

0

回帖

10

积分

新手上路

积分
10
发表于 2019-5-1 07:41:01 | 显示全部楼层 |阅读模式 来自 中国
$ [+ G. U8 b6 F& L" e; D
【新智元导读】Google Coral Edge TPU和NVIDIA Jetson Nano大比拼!本文从分别对两款最新推出的EdgeAI芯片做了对比,分析了二者各自的优劣势。
. o/ w, s( z! q
5 z2 O6 O1 h+ G边缘智能被称作是人工智能的最后一公里。
9 e$ y( z- c; Y9 J7 A
+ V1 j; W# h6 v9 G$ `Google刚刚在3月份推出了Coral Edge TPU,是一款售价不到1000元人民币的开发板(Coral Dev Board),由Edge TPU模块和 Baseboard 组成。参数如下:
9 z" Q  r. k, B- p
+ K5 L0 Y# x; X5 V" |# p
* |: g' \4 U5 x. B% x5 b7 u/ r1 \英伟达同样在上个月发布了最新的NVIDIA Jetson Nano,Jetson Nano是一款类似于树莓派的嵌入式电脑设备,其搭载了四核Cortex-A57处理器,GPU则是拥有128个NVIDIA CUDA核心的NVIDIA麦克斯韦架构显卡,内存4GB LPDDR4,存储则为16GB eMMC 5.1,支持4K 60Hz视频解码。
4 U- W/ i% d/ R! D( {. u+ n: w目前位置并没有太多关于这两款产品的评测报告。今天新智元为大家带来一篇由网友Sam Sterckval对两款产品的评测,除此以外他还测试了i7-7700K + GTX1080(2560CUDA),Raspberry Pi 3B +,以及一个2014年的MacBook pro包含一个i7-4870HQ(没有支持CUDA的内核)。9 e& Q& F* g" m: r* x
Sam使用MobileNetV2作为分类器,在imagenet数据集上进行预训练,直接从Keras使用这个模型,后端则使用TensorFlow。使用GPU的浮点权重,以及CPU和Coral Edge TPU的8bit量化tflite版本。9 h4 f+ H- d& r9 p( `; y
首先,加载模型以及一张喜鹊图像。先执行1个预测作为预热,Sam发现第一个预测总是比随后的预测更能说明问题。然后Sleep 1秒,确保所有的线程的活动都终止,然后对同一图像进行250次分类。3 J( P, j3 P* S* s: ]
. C, O, K' h' \' N2 Z( u' U" z- A( c
对所有分类使用相同的图像,能够确保在整个测试过程中保持接近的数据总线。' c5 t/ `$ a( b* }8 D; C

; A6 j# X6 [8 j% j0 o对比结果 先来看最终的结果:
- q+ I  m3 A& i& D+ ?, q- R* h. j5 c
: w# W! _: a7 e; x' r$ n1 v! W线性刻度,FPS
* z7 c! S8 ~: ?. b! X对数刻度,FPS
; Y+ g0 G& T5 g- H6 b
/ T0 u* N% d2 L! n% r3 H! z9 A$ A
; B) @* k( t' V. v% |5 y2 [2 y线性刻度,推理时间(250x)* S( U8 ^  m( b/ ?
- q  ~6 t$ d/ `7 a" T
Sam发现使用CPU的量化tflite模型得分是不同的,但似乎它总是返回与其它产品相同的预测结果,他怀疑模型有点奇怪,但能确保它不会影响性能。
6 ^' b: v- Y& O% _7 B7 z+ m对比分析 第一个柱状图中我们可以看到有3个比较突出的数据,其中两个2个是由Google Coral Edge TPU USB加速器实现的,第3个是由英特尔i7-7700K辅助NVIDIA GTX1080实现。- C# M/ w; S: Z$ [9 l( K0 z- Q
我们再仔细对比一下就会发现,GTX1080实际上完全无法跟Google的Coral对飚。要知道GTX1080的最大功率为180W,而Coral Edge TPU只有2.5W。
' ?. A, W: f) o/ ^8 ZNVIDIA Jetson Nano的得分并不高。虽然它有一个支持CUDA的GPU,但实际上并没比那台2014年MBP的i7-4870HQ快太多,但毕竟还是比这款四核,超线程的CPU要快。5 L; T7 \( P1 y
然而相比i7 50W的能耗,Jetson Nano平均能耗始终保持在12.5W,也就是说功耗降低75%,性能提升了10%。
, c$ Z9 u! {0 S* k( f( MNVIDIA Jetson Nano7 S2 B) R8 \+ C; P! f
尽管Jetson Nano并没有在MobileNetV2分类器中表现出令人印象深刻的FPS率,但它的优势非常明显:
& F! p8 }0 U* S0 g# A% w( _; V它很便宜,能耗低,更重要的是,它运行TensorFlow-gpu或任何其他ML平台的操作,和我们平时使用的其他设备一样。只要我们的脚本没有深入到CPU体系结构中,就可以运行与i7 + CUDA GPU完全相同的脚本,也可以进行训练!Sam强烈希望NVIDIA应该使用TensorFlow预加载L4T。+ N8 I8 B& y8 f( G- T9 y
6 k8 R- o- h8 d: \  S
Google Coral Edge TPU
. z4 V3 S: C/ T% Z4 X' }+ GSam毫不掩饰的表达了他对Google Coral Edge TPU的精心设计以及高效率的喜爱。下图我们可以对比Edge TPU有多小。9 ~! r/ w* H0 ?- p8 a

1 H- F4 W) [9 `1 ~" W5 Q  ~Penny for scale,来源:谷歌
, x0 u5 Y" t( w8 _! \" p2 [0 h& G6 `, y
Edge TPU就是所谓的“ASIC”(专用集成电路),这意味着它具有FET等小型电子部件,以及能够直接在硅层上烧制,这样它就可以加快在特定场景下的推力速度。但Edge TPU无法执行反向传播。2 Q( {" Y: k7 v9 J

1 Q  p/ m3 r* L7 M5 c' D  x1 c: x- GGoogle Coral Edge TPU USB加速器9 A  T; s+ r( K
8 G& J- c. y" W( h3 e
下图显示了Edge TPU的基本原理。
; c2 r/ s4 |$ ^! W& H) U% [& w
2 F1 U& `& |; }, e& H像MobileNetV2这样的网络主要由后面带有激活层的卷积组成。公式如下:7 ?6 I* A, T5 H
6 E8 H# a- P$ |
卷积
! q0 j" c% Q7 X0 p
! ~# M9 A) {% n这意味着将图像的每个元素(像素)与内核的每个像素相乘,然后将这些结果相加,以创建新的“图像”(特征图)。这正是Edge TPU的主要工作。将所有内容同时相乘,然后以疯狂的速度添加所有内容。这背后没有CPU,只要你将数据泵入左边的缓冲区就可以了。. }  S4 Z5 l. L, }! o  x
我们看到Coral在性能/瓦特的对比中,差异如此大的原因,它是一堆电子设备,旨在完成所需的按位操作,基本上没有任何开销。
5 L9 _4 n2 a2 ]& k- x总结 为什么GPU没有8位模型?$ N3 m% ]9 C# M* c6 w, c' U
GPU本质上被设计为细粒度并行浮点计算器。而Edge TPU设计用于执行8位操作,并且CPU具有比完全位宽浮点数更快的8位内容更快的方法,因为它们在很多情况下必须处理这个问题。
8 c# k/ C1 P1 P为何选择MobileNetV2?
4 |! F8 A+ N& H$ x2 \主要原因是,MobileNetV2是谷歌为Edge TPU提供的预编译模型之一。- W3 k2 l0 |$ x+ z' m$ W
Edge TPU还有哪些其他产品?
2 W/ J) F3 I1 [9 J* D7 ?. X它曾经是不同版本的MobileNet和Inception,截至上周末,谷歌推出了一个更新,允许我们编译自定义TensorFlow Lite模型。但仅限于TensorFlow Lite模型。而反观Jetson Nano就没有这方面的限制。
* N0 x! p& @% o4 ~6 m6 NRaspberry Pi + Coral与其他人相比
# w0 ^, w, S7 l! {. u- T为什么连接到Raspberry Pi时Coral看起来要慢得多?因为Raspberry Pi只有USB 2.0端口。
6 v: C  L. _. L9 hi7-7700K在Coral和Jetson Nano上的速度都会更快一些,但仍然无法和后两者比肩。因此推测瓶颈是数据速率,不是Edge TPU。
0 ^/ C! x9 ^# F' H% |& ?. b, {4 q  L4 W  s" T

5 F8 H4 |6 X' A0 t& N+ v# i7 ~【加入社群】) q' l: F! Q" V( w6 t

& d$ C2 e  K2 r2 x% [2 w
* h; P' g) g, V+ ~5 t: N3 ?* T来源:http://www.yidianzixun.com/article/0Lt3VMHK
/ _2 y2 i" c, T6 S5 U免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-7-20 06:01 , Processed in 0.043320 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表