|
|
|
机器之心报道 4 j3 C, ?. q) N' n: ?0 |1 p4 s* d
机器之心编辑部用来刷脸解锁的 Face ID 也可以被「对抗样本」攻击了。最近,来自莫斯科国立大学、华为莫斯科研究中心的研究者们找到的新型攻击方法,让已经广泛用于手机、门禁和支付上的人脸识别系统突然变得不再靠谱。
r5 I9 H) o- z2 _$ M5 n 在这一新研究中,科学家们只需用普通打印机打出一张带有图案的纸条贴在脑门上,就能让目前业内性能领先的公开 Face ID 系统识别出错,这是首次有 AI 算法可以在现实世界中实现攻击:
, b' p6 C8 ]6 ~3 p( H' u, Y5 P# f+ y% N
; }# ? O& b5 L9 S6 @
AI 人脸识别系统在正常情况下的分类效果,它识别出了特定的人:Person_1。/ G6 F) F8 K4 J' F: G T
; I6 f' b3 p, R8 x" b- F
7 R. B' V# t v+ ~+ s贴上纸条以后,即使没有遮住脸,系统也会把 Person_1 识别成另外一些人「0000663」和「0000268」等。9 t2 I: z6 c, R: \
7 s2 Y; I! M: `1 }, v2 L! c
T! N% p% J0 `" C. v% ^6 z变换角度、改变光照条件都不会改变错误的识别效果。加了贴纸后,我们可以看到 Person_1 的概率非常低。
( R/ `& r- R% `1 s1 [" {2 t4 \2 y
使用对抗样本攻击图像识别系统,在人工智能领域里已经不算什么新鲜事了,但是想要在现实世界里做到无差别攻击,还是人脸识别这种数千万人都在使用的应用技术,这就显得有些可怕了。使用这种新方法,人们可以轻松地打印一个破解纸条贴在脑门上,随后让 AI 识别的准确率显著下降。
- O4 X; z. b% b8 H/ [& A" o/ x
1 ]( o0 I% D% ^2 F) W从上面的动图可以看出,研究者实现的是非定向的攻击,且对抗信息都集成在贴纸上。那么如果我们要找到一种定向的攻击方式,让系统将我们识别为特定的某个人,然后解锁 ta 的手机,这也并不遥远,只要我们将以前定向攻击的方式迁移到贴纸上就行了。9 r. G# n- `* x9 G/ E
$ V3 G* Q8 \+ k j+ t# H研究人员不仅发布了论文:https://arxiv.org/abs/1908.08705
. x" h3 I+ \+ u' K
$ i T- q1 R ~9 T8 S0 Z0 ^0 B更是直接公开了项目的代码:https://github.com/papermsucode/advhat" i7 f- c0 W6 w$ C1 f3 f
1 x, x. u9 w3 \3 m: g9 p4 E「对抗样本」是人工智能的软肋,这是一种可以欺骗神经网络,让图像识别 AI 系统出错的技术,是近期计算机视觉,以及机器学习领域的热门研究方向。5 S+ _5 N) `4 N+ i1 I4 {. L* U& w
- v6 V& v& O1 c9 w& }6 U) i3 `( [在这篇论文中,研究者们提出了一种全新且易于复现的技术 AdvHat,可以在多种不同的拍摄条件下攻击目前最强的公共 Face ID 系统。想要实现这种攻击并不需要复杂的设备——只需在彩色打印机上打印特定的对抗样本,并将其贴到你的帽子上,而对抗样本的制作采用了全新的算法,可在非平面的条件下保持有效。% i( C) |/ ?1 }
1 n0 j4 T4 h6 @/ A9 C5 A. {6 Y研究人员称,这种方法已经成功地破解了目前最先进的 Face ID 模型 LResNet100E-IR、ArcFace@ms1m-refine-v2,其攻击方式也可以迁移到其他 Face ID 模型上。$ ~8 ^! C& k$ }
. z, ^" v# G1 |% B6 K现实 Face ID 也能被攻击2 f3 V' T' t5 f# c' s7 h0 W' `( U+ S
+ t) y; S! [) t# M8 E' |1 L
以前对抗攻击主要体现在虚拟世界中,我们可以用电子版的对抗样本欺骗各种识别系统,例如通用的图像识别或更细致的人脸识别等。但这些攻击有一些问题,例如人脸识别攻击只能是在线的识别 API,将对抗样本打印出来也不能欺骗真实系统。
) p: W- _; k% K5 y
) F+ [& \: U5 x+ b; s5 h& U
( O9 A! W& ^- i9 P' |一个标准的线上人脸对抗样本,它只能攻击线上人脸识别模型或 API,无法用于线下的真实人脸识别场景。
' C% d" U% l! u' A% s& {( H- a
% t ^) L5 ~ s: a6 v, v! z对抗样本的这种局限性,很大程度在于真实识别系统不止有人脸识别模块,还有活体检测等其它处理模块。只要活体检测判断对抗样本不是真人,那么它自然就失去了效果。因此,很多研究者在思考,我们能不能将对抗信息打印出来,贴在脸上或头上某个位置,那么这不就能攻击真实的人脸识别了么。甚至,我们可以把对抗信息嵌入到帽子或其它饰品内,这样不会更方便么。
$ ?/ r* h9 A. K" c6 _9 i0 H
0 @- O G+ @" `: g9 h* L! ?沿着这样的思路,华为莫斯科研究中心的两位研究者就创造了这样的对抗样本。他们表示在以前 Face ID 模型还需要大量的私有数据,而随着大规模公开数据的发布,ArcFace 等研究模型也能与微软或谷歌的模型相媲美。如果他们的对抗样本能攻击到 ArcFace,那么差不多就能攻击业务模型。+ b; H/ w$ P3 a* G
! P: b: ]! g- S2 C. A
研究者表示他们提出的 AdvHat 有如下特点:
& m0 I1 u# S' b3 @' ~0 D2 i9 P0 ?; T+ n8 r
5 X8 z# g0 M2 q; x, [7 K( i- AdvHat 是一种现实世界的对抗样本,只要在帽子加上这种「贴纸」,那么就能攻击顶尖的公开 Face ID 系统; T1 |/ k6 o* e! n1 A; k y6 U6 O
- 这种攻击是非常容易实现的,只要有彩印就行;! U5 O# T! F* I/ J/ |, J/ w
- 该攻击在各种识别环境下都能起作用,包括光照、角度和远近等;1 W7 _3 q5 R5 H8 V: E& \- ?
- 这种攻击可以迁移到其它 Face ID 系统上。5 Z/ B, i$ f! _" \! O2 k7 ^7 }; j. o
g7 e- a3 Z' ~: L, Y/ N0 f% H+ e
Face ID 该怎样攻击
% t. I! j6 U! g, Y# V9 |8 o% T4 o
# m: Q6 d Q U4 Y5 H6 y在 Face ID 系统的真实应用场景中,并非捕获到的每张人脸都是已知的,因此 top-1 类的预测相似度必须超过一些预定义的阈值,才能识别出人脸。8 {- w- n# _- r+ `- f2 Z
; J$ ?7 R( b1 O5 ~2 [% u/ F
这篇论文的目的是创造一个可以粘贴在帽子上的矩形图像,以诱导 Face ID 系统将人脸与 ground truth 相似度降到决策阈值之下。( G' v) W) X- ^3 l
( i1 I7 \) W. \- y1 `" s4 D: U G8 }/ k这种攻击大概包含以下流程:
, n2 l" {: o& I1 E4 }, ]+ m: G" _) y
9 @( b3 I5 }1 W) G" `1 {5 |- 将平面贴纸进行转换以凸显三维信息,转换结果模拟矩形图像放在帽子上后的形状。
4 C5 _% j/ k) ~6 j - 为了提高攻击的鲁棒性,研究者将得到的图像投影到高质量人脸图像上,投影参数中含有轻微的扰动。
: n' a: n0 K, J3 ?0 F7 Z - 将得到的图像转换为 ArcFace 输入的标准模板。3 \' |- Q7 A" F" k8 q2 c A
- 降低初始矩形图像的 TV 损失以及余弦相似度损失之和,其中相似性是原图嵌入向量与 ArcFace 算出嵌入向量之间的距离。2 R6 O& u2 c; ?
' q5 @, x4 G$ p8 }; g- B, B% K6 H; B
7 e- h# A8 j" X. ~# W; O9 P流程图如下图 2 所示:
3 H) a2 n! y$ H; d: F5 Z E/ F$ {
. Z3 D" N1 i! x% Y0 p9 m
! q4 X* u; J9 C) Q图 2:攻击流程示意图。" N3 P7 T: G" Q
9 N" x% M1 ?! i& C4 l8 X4 |
首先,研究者将贴纸重塑成真实大小和外观的图像,之后将其添加到人脸图像上,然后再使用略为不同的转换参数将图像转换为 ArcFace 输入模板,最后将模板输入到 ArcFace 中。由此评估余弦相似度和 TV 损失,这样就可以得到用于改进贴纸图像的梯度信号。
# x' i2 _) Q: R: C& g' C
: B# ~' [" t4 @" h! @# ~ 8 O; Y- ?3 t% y1 F& Q0 d
图 3:步骤 1 转换贴纸的示意图。
0 ~# {" Z2 b. ?/ s/ ]/ l4 @6 V+ N0 V( B2 y! Q3 B2 y) L0 f
贴纸攻击试验细节( G8 ~# g! s* ]/ u2 Q2 c* @' U0 ]
/ @7 Q9 K! H6 v3 w% B
如前所言,在将图像输入到 ArcFace 之前,研究者对其进行了随机修改。他们构造了一批生成图像,并通过整个流程计算在初始贴纸上的平均梯度。可以用一种简单的方法计算梯度,因为每个变换都是可微分的。
* q6 G! t7 |; B+ P1 E4 G! h
( v! J2 f' }" N+ S$ z- G2 ]5 M注意,在每一次迭代中,批中的每一个图像上的贴纸都是相同的,只有转换参数是不同的。此外,研究者使用了带有动量的 Iterative FGSM 以及在实验中非常有效的几个启发式方法。- ^+ ^/ r2 Z. P. {& d9 l
5 m4 N- U N. v6 |8 }5 ?* Y% }
研究者将攻击分为两个阶段。在第一阶段,研究者使用了 5255 的步长值和 0.9 的动量;在第二阶段,研究者使用了 1255 的步长值和 0.995 的动量。TV 损失的权重一直为 1e − 4。
* D6 O. w5 ^( H6 Q
2 F, S N! R& M# P5 t e研究者利用一张带有贴纸的固定图像进行验证,其中他们将所有参数都设置为看起来最真实的值。 P+ v3 L4 x0 V& ]
* u+ l* z6 l" ?+ T9 ]他们使用了最小二乘法法,并通过线性函数来插入最后 100 个验证值:经历了第一阶段的 100 次迭代和第二阶段的 200 次迭代。如果线性函数的角系数不小于 0,则:1)从第一阶段过渡到第二阶段的攻击;2)在第二阶段停止攻击。
6 M" h { s6 _ F. h X0 H: W$ z/ v
「对抗样本贴」效果怎么样. A' r- x3 S! p( Z) A
. e, u6 I" m& {" l r
研究者在实验中使用一张 400×900 像素的图像作为贴纸图像,接着将这张贴纸图像投射到 600×600 像素的人脸图像上,然后再将其转换成 112×112 像素的图像。
4 z/ \: {6 @2 A7 a" g- ?
z* l* R" I6 ^为了找出最适合贴纸的位置,研究者针对贴纸定位进行了两次实验。首先,他们利用粘贴在 eyez 线上方不同高度的贴纸来攻击数字域中的图像。然后,他们根据空间 transformer 层参数的梯度值,在每次迭代后变更贴纸的位置。
; y: g$ e z" ]+ m7 X2 d4 m; F# X" W
下图 4 展示了典型对抗贴纸的一些示例。看起来就像是模特在贴纸上画了挑起的眉毛。3 D/ Y( {/ l$ w% A* o* J! I
$ C# K) H8 |" n" [. c2 r+ m 2 d9 t- H+ A- [" q# R% K
图 4:对抗贴纸示例。5 Q3 e U/ F& |" o7 N* x
5 o; `7 J4 u6 f/ |# I, r* B3 A$ d4 y为了检测 AdvHat 方法在不同拍摄条件下的鲁棒性,研究者为最开始 10 个人中的 4 人另拍了 11 张照片。拍摄条件示例如下图 6 所示:. T5 e8 r" C; \ ?! i+ @0 C! P8 `
4 v# C" z+ [* D4 e 9 L2 v* b1 {7 n5 u
图 6:研究者为一些人另拍了 11 张照片,以检测不同拍摄条件下的攻击效果。
, c6 \ r! M& i& E0 h8 I4 _; C3 H1 ]( k5 D0 l( p/ Q
检测结果如下图 7 所示:虽然最终相似度增加了,但攻击依然有效。
# [$ A. ^, f2 f9 S) j0 A% B! v q( i; z
( d. [4 k" I, }$ J3 d
图 7:各种拍摄条件下的基线和最终相似度。图中不同颜色的圆点代表不同的人。圆表示对抗攻击下的相似性,而 x 表示基线条件下的相似性。
/ v9 x. V9 A! b8 B' |- {: {9 ~' A8 Z8 [9 U
最后,研究人员检验了该方法对于其他 Face ID 模型的攻击效果。他们选取了 InsightFace Model Zoo 中的一些人脸识别方法。在每个模型上均测试了 10 个不同的人。4 N3 ]; c& d+ \1 d' ?
0 Z P9 W8 H& j1 N" i# w6 s

@4 N* @" } _+ }* h图 8:不同模型中,基线和最终相似度的差异。
/ M6 k4 d7 u" `; T3 W
9 W8 x7 j6 b7 S) e7 \1 t虽然 AdvHat 生成的对抗样本很简单,但这种攻击方式看起来已适用于大多数基于摄像头的人脸识别系统。看来想要不被人「冒名顶替」,我们还是需要回到虹膜识别?, T& [- G9 z E% f, X0 \+ Z
. F/ W/ P. E" [. V本文为机器之心报道,转载请联系本公众号获得授权。
( [$ [" G' b; s& S6 f✄------------------------------------------------加入机器之心(全职记者 / 实习生):hr@jiqizhixin.com投稿或寻求报道:content@jiqizhixin.com广告 & 商务合作:bd@jiqizhixin.com
+ B! O% T- U( L3 ~! s- {& Q来源:http://mp.weixin.qq.com/s?src=11×tamp=1566896404&ver=1815&signature=*oejD6KZNIeFBedjGfko-HVWxUK5JqJymcLMEI2vQKpnGBbeLDP70080UA4XKxKdpIqy8GtZ8Ak8dD6y3mZXTrdi2HDgNe5e17ZDjbih8ZOWHLwlikFYQ99AEVxcEl0F&new=15 ]0 t' d+ C4 j/ {2 L$ V/ C2 U
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|