京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 873|回复: 0

最新千元边缘AI芯片比拼:谷歌Coral和英伟达Jetson谁更厉害?

[复制链接]

17

主题

0

回帖

10

积分

新手上路

积分
10
发表于 2019-5-1 07:41:01 | 显示全部楼层 |阅读模式 来自 中国
( g2 w- L5 j6 \1 e  B0 o
【新智元导读】Google Coral Edge TPU和NVIDIA Jetson Nano大比拼!本文从分别对两款最新推出的EdgeAI芯片做了对比,分析了二者各自的优劣势。5 O/ H1 n1 G, |- Q
" g6 z5 T' \$ J
边缘智能被称作是人工智能的最后一公里。! Y7 W% V* I& X" x

, q/ z7 T( B& z! ~0 s% F/ W6 KGoogle刚刚在3月份推出了Coral Edge TPU,是一款售价不到1000元人民币的开发板(Coral Dev Board),由Edge TPU模块和 Baseboard 组成。参数如下:$ A% p- M7 Z" a0 I5 d
- M5 w) g1 I2 q; z- Z" f; }6 [

/ o2 ?0 n7 ]) C, R英伟达同样在上个月发布了最新的NVIDIA Jetson Nano,Jetson Nano是一款类似于树莓派的嵌入式电脑设备,其搭载了四核Cortex-A57处理器,GPU则是拥有128个NVIDIA CUDA核心的NVIDIA麦克斯韦架构显卡,内存4GB LPDDR4,存储则为16GB eMMC 5.1,支持4K 60Hz视频解码。
6 i2 ^) ?: p# S/ t) A; J8 g. U3 n" |目前位置并没有太多关于这两款产品的评测报告。今天新智元为大家带来一篇由网友Sam Sterckval对两款产品的评测,除此以外他还测试了i7-7700K + GTX1080(2560CUDA),Raspberry Pi 3B +,以及一个2014年的MacBook pro包含一个i7-4870HQ(没有支持CUDA的内核)。% Z' O0 e3 q) q' y! k' ]
Sam使用MobileNetV2作为分类器,在imagenet数据集上进行预训练,直接从Keras使用这个模型,后端则使用TensorFlow。使用GPU的浮点权重,以及CPU和Coral Edge TPU的8bit量化tflite版本。
, M5 I, N8 {; ?. j4 N) P首先,加载模型以及一张喜鹊图像。先执行1个预测作为预热,Sam发现第一个预测总是比随后的预测更能说明问题。然后Sleep 1秒,确保所有的线程的活动都终止,然后对同一图像进行250次分类。
, X4 G% W. [1 ]2 I: A  |
2 d$ n8 B) Y! U8 _, w, M4 B对所有分类使用相同的图像,能够确保在整个测试过程中保持接近的数据总线。
8 R& G) {% |! a. v, e# _, c" o
! S1 O: D& Z- u9 d& I% ~: j, C对比结果 先来看最终的结果:
, d) O& q/ O, U  L
) R3 B+ c- n2 U3 i3 m0 S$ l线性刻度,FPS8 X+ w. l7 D# m$ {3 X/ k
对数刻度,FPS
) E2 P8 Z2 \# z0 m( u4 ~; M; A* z- K$ C. F% s8 Q

6 @( g- ~% T: f0 E线性刻度,推理时间(250x)0 \& ~! M7 y; Y) C1 F, W
7 E" |7 L$ J4 t- x- p
Sam发现使用CPU的量化tflite模型得分是不同的,但似乎它总是返回与其它产品相同的预测结果,他怀疑模型有点奇怪,但能确保它不会影响性能。+ d3 v( h, \! Q: o  B/ k& W
对比分析 第一个柱状图中我们可以看到有3个比较突出的数据,其中两个2个是由Google Coral Edge TPU USB加速器实现的,第3个是由英特尔i7-7700K辅助NVIDIA GTX1080实现。
' p" `2 t6 S! P5 q3 }# x- Q+ a+ {我们再仔细对比一下就会发现,GTX1080实际上完全无法跟Google的Coral对飚。要知道GTX1080的最大功率为180W,而Coral Edge TPU只有2.5W。2 S5 ]) H! [  P% v, y& l# o7 a# n1 i
NVIDIA Jetson Nano的得分并不高。虽然它有一个支持CUDA的GPU,但实际上并没比那台2014年MBP的i7-4870HQ快太多,但毕竟还是比这款四核,超线程的CPU要快。
( t* k% g( J* \然而相比i7 50W的能耗,Jetson Nano平均能耗始终保持在12.5W,也就是说功耗降低75%,性能提升了10%。
' s8 p3 ]; J9 h! d) W2 t/ SNVIDIA Jetson Nano- c# M# z" W* [
尽管Jetson Nano并没有在MobileNetV2分类器中表现出令人印象深刻的FPS率,但它的优势非常明显:6 y( `4 z- F+ [" U& t6 n
它很便宜,能耗低,更重要的是,它运行TensorFlow-gpu或任何其他ML平台的操作,和我们平时使用的其他设备一样。只要我们的脚本没有深入到CPU体系结构中,就可以运行与i7 + CUDA GPU完全相同的脚本,也可以进行训练!Sam强烈希望NVIDIA应该使用TensorFlow预加载L4T。) [, _' u5 ]5 G. ]4 v! M% v: y/ r

* q3 G$ `* H) T4 K9 Q* D$ ^' dGoogle Coral Edge TPU; ^. B; ]; Z  K4 g6 `$ ]5 t( k
Sam毫不掩饰的表达了他对Google Coral Edge TPU的精心设计以及高效率的喜爱。下图我们可以对比Edge TPU有多小。
' A, h1 v7 D2 A/ `2 q$ \0 j' @) T- l; T6 e/ {. L* |
Penny for scale,来源:谷歌
7 [! _2 S$ u- C! O* K  |; v, \4 v
Edge TPU就是所谓的“ASIC”(专用集成电路),这意味着它具有FET等小型电子部件,以及能够直接在硅层上烧制,这样它就可以加快在特定场景下的推力速度。但Edge TPU无法执行反向传播。1 B1 i8 Z: @# [8 b7 X0 r  U8 U

' i: q$ m, [! O% ^6 rGoogle Coral Edge TPU USB加速器; ?, l8 \& _4 s1 c2 w
) ^( y) V. ?" p3 a$ I! B: M
下图显示了Edge TPU的基本原理。  h  z1 E% @* R# x: l7 ?$ @' l

9 C7 ?- {, {/ [, a; Y0 u" x0 G" Z像MobileNetV2这样的网络主要由后面带有激活层的卷积组成。公式如下:% r# ]7 R+ B' G" f+ O

( ~6 t$ E, R: ?" {- }+ a$ Z卷积
. A6 N/ ]' i7 O
/ A" C; s5 w3 T# x4 g7 q, }6 i0 D这意味着将图像的每个元素(像素)与内核的每个像素相乘,然后将这些结果相加,以创建新的“图像”(特征图)。这正是Edge TPU的主要工作。将所有内容同时相乘,然后以疯狂的速度添加所有内容。这背后没有CPU,只要你将数据泵入左边的缓冲区就可以了。
: n9 p* h) I; s+ \( L& j4 H/ n我们看到Coral在性能/瓦特的对比中,差异如此大的原因,它是一堆电子设备,旨在完成所需的按位操作,基本上没有任何开销。7 k: S& [6 }7 O5 w; R
总结 为什么GPU没有8位模型?
, E, E1 L- Q: X+ i& {GPU本质上被设计为细粒度并行浮点计算器。而Edge TPU设计用于执行8位操作,并且CPU具有比完全位宽浮点数更快的8位内容更快的方法,因为它们在很多情况下必须处理这个问题。
$ G* N6 z7 Y, M( |4 A为何选择MobileNetV2?: Q, j  q" A, ~4 b: F
主要原因是,MobileNetV2是谷歌为Edge TPU提供的预编译模型之一。: F. m0 O* }8 G7 {
Edge TPU还有哪些其他产品?* A6 d, x/ J& H$ L1 ]* F& I! Z
它曾经是不同版本的MobileNet和Inception,截至上周末,谷歌推出了一个更新,允许我们编译自定义TensorFlow Lite模型。但仅限于TensorFlow Lite模型。而反观Jetson Nano就没有这方面的限制。! J$ C1 q- [5 u: x3 p
Raspberry Pi + Coral与其他人相比
4 i) C+ @+ O- x9 O4 H* }为什么连接到Raspberry Pi时Coral看起来要慢得多?因为Raspberry Pi只有USB 2.0端口。
$ g: h4 k3 G8 Qi7-7700K在Coral和Jetson Nano上的速度都会更快一些,但仍然无法和后两者比肩。因此推测瓶颈是数据速率,不是Edge TPU。- F! Z' j9 L/ I' o% f

# f# ]/ c7 e4 N) Y( e7 \1 p6 F! L9 J/ A# ]( W# b' P
【加入社群】4 y% o: w$ M* C/ v* Z$ Y8 i
. G/ J1 _' {- a: e: x6 W0 Y4 R

6 Q, ^& U, P3 r$ z* O来源:http://www.yidianzixun.com/article/0Lt3VMHK
  D7 u9 b* A8 v7 J) C+ E6 x- S( @免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2026-3-19 09:53 , Processed in 0.038381 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表