|
|
|
机器之心报道 5 k9 w0 N4 c/ e; [, w
机器之心编辑部用来刷脸解锁的 Face ID 也可以被「对抗样本」攻击了。最近,来自莫斯科国立大学、华为莫斯科研究中心的研究者们找到的新型攻击方法,让已经广泛用于手机、门禁和支付上的人脸识别系统突然变得不再靠谱。
8 p) c% U( `! V1 R8 x, ? 在这一新研究中,科学家们只需用普通打印机打出一张带有图案的纸条贴在脑门上,就能让目前业内性能领先的公开 Face ID 系统识别出错,这是首次有 AI 算法可以在现实世界中实现攻击:
' n; \3 f0 Q+ B J' b
+ |4 x; d. V/ n: z1 b/ m" g! Y0 ]+ d0 T8 T; c0 l) D0 m
AI 人脸识别系统在正常情况下的分类效果,它识别出了特定的人:Person_1。
) U2 [" t9 |1 X5 R) j$ G5 V6 ?2 j" }
# m7 t3 v1 ], u! P2 A贴上纸条以后,即使没有遮住脸,系统也会把 Person_1 识别成另外一些人「0000663」和「0000268」等。
6 p- P4 i' t0 u* ?3 D7 n" P A
' k% g. x2 k3 p! O3 \3 P: |
% e9 R( _" `# N0 ~ Y变换角度、改变光照条件都不会改变错误的识别效果。加了贴纸后,我们可以看到 Person_1 的概率非常低。
/ S* W, y8 Q+ E) Y% u+ a5 j3 z# R7 O
1 ^7 m" b4 X8 K( a$ h) C3 }使用对抗样本攻击图像识别系统,在人工智能领域里已经不算什么新鲜事了,但是想要在现实世界里做到无差别攻击,还是人脸识别这种数千万人都在使用的应用技术,这就显得有些可怕了。使用这种新方法,人们可以轻松地打印一个破解纸条贴在脑门上,随后让 AI 识别的准确率显著下降。
: K5 c: K/ W, i5 j( K4 P7 s: x
3 c( R) U1 d$ `8 B$ ~. z从上面的动图可以看出,研究者实现的是非定向的攻击,且对抗信息都集成在贴纸上。那么如果我们要找到一种定向的攻击方式,让系统将我们识别为特定的某个人,然后解锁 ta 的手机,这也并不遥远,只要我们将以前定向攻击的方式迁移到贴纸上就行了。; e- p7 h; P1 v2 _% o
, o8 k( u& y# W
研究人员不仅发布了论文:https://arxiv.org/abs/1908.08705. a3 a3 g0 ~* G( Z9 r' s
$ u6 D+ W& W6 U/ a) ~
更是直接公开了项目的代码:https://github.com/papermsucode/advhat
6 f2 u* e0 b0 e) j: X, C3 X- }: A8 Z/ p k! k; C4 x0 {) z% ~
「对抗样本」是人工智能的软肋,这是一种可以欺骗神经网络,让图像识别 AI 系统出错的技术,是近期计算机视觉,以及机器学习领域的热门研究方向。
7 i/ D: y& M, K/ m, `
3 ^1 d) B. S" i% ^* g在这篇论文中,研究者们提出了一种全新且易于复现的技术 AdvHat,可以在多种不同的拍摄条件下攻击目前最强的公共 Face ID 系统。想要实现这种攻击并不需要复杂的设备——只需在彩色打印机上打印特定的对抗样本,并将其贴到你的帽子上,而对抗样本的制作采用了全新的算法,可在非平面的条件下保持有效。, u6 T; j8 m1 Y# t1 K+ e
/ x) f9 G/ W W/ z! x9 p
研究人员称,这种方法已经成功地破解了目前最先进的 Face ID 模型 LResNet100E-IR、ArcFace@ms1m-refine-v2,其攻击方式也可以迁移到其他 Face ID 模型上。5 p/ d# C& H9 z6 M
. u& U# |8 w( P7 w; v- }, O; _0 D现实 Face ID 也能被攻击- k6 R+ t3 Y! Y2 N( l
4 j/ b0 x! ^7 D) Z9 l以前对抗攻击主要体现在虚拟世界中,我们可以用电子版的对抗样本欺骗各种识别系统,例如通用的图像识别或更细致的人脸识别等。但这些攻击有一些问题,例如人脸识别攻击只能是在线的识别 API,将对抗样本打印出来也不能欺骗真实系统。' ~7 E5 J* D1 r# e
R. c2 @- |5 E6 ^
* W* p% x' u; N* M" B) i一个标准的线上人脸对抗样本,它只能攻击线上人脸识别模型或 API,无法用于线下的真实人脸识别场景。
5 L" Z# u3 f6 o: H% g& j
7 K% }! e' _6 g& E: P3 U对抗样本的这种局限性,很大程度在于真实识别系统不止有人脸识别模块,还有活体检测等其它处理模块。只要活体检测判断对抗样本不是真人,那么它自然就失去了效果。因此,很多研究者在思考,我们能不能将对抗信息打印出来,贴在脸上或头上某个位置,那么这不就能攻击真实的人脸识别了么。甚至,我们可以把对抗信息嵌入到帽子或其它饰品内,这样不会更方便么。6 o% l: O% ~6 d# O% \
' C. b0 m: ~5 f沿着这样的思路,华为莫斯科研究中心的两位研究者就创造了这样的对抗样本。他们表示在以前 Face ID 模型还需要大量的私有数据,而随着大规模公开数据的发布,ArcFace 等研究模型也能与微软或谷歌的模型相媲美。如果他们的对抗样本能攻击到 ArcFace,那么差不多就能攻击业务模型。# K% ^( H7 I! [- A7 y# K+ Z) {
' K8 @4 g9 j) y: V. J" A% r. H2 k研究者表示他们提出的 AdvHat 有如下特点:! s& P& |, F; q% Y: @/ |
/ o \ U6 v7 _* E+ d0 w P6 W
8 I; e. |1 R0 Q
- AdvHat 是一种现实世界的对抗样本,只要在帽子加上这种「贴纸」,那么就能攻击顶尖的公开 Face ID 系统;
1 s) S6 l7 V, |. E: X+ N" A - 这种攻击是非常容易实现的,只要有彩印就行;
6 `' p2 m7 d' [3 @ - 该攻击在各种识别环境下都能起作用,包括光照、角度和远近等;
* K. a: t1 y( o; J" T5 D7 I6 K- \ - 这种攻击可以迁移到其它 Face ID 系统上。
9 V3 o+ C; A' `9 \8 x. s ; D% r% D) f* a& }
$ A# U# V, ] B$ U2 Y* P' r! ^6 ?
Face ID 该怎样攻击
, C" g3 t3 g# o) Q; R$ Q0 v/ V4 g' K- G( q' c
在 Face ID 系统的真实应用场景中,并非捕获到的每张人脸都是已知的,因此 top-1 类的预测相似度必须超过一些预定义的阈值,才能识别出人脸。9 U( M8 ^ T5 [# a$ B
0 y5 b. g) U; h2 P3 O. |4 l
这篇论文的目的是创造一个可以粘贴在帽子上的矩形图像,以诱导 Face ID 系统将人脸与 ground truth 相似度降到决策阈值之下。7 p R0 j3 T8 l& ^
, Z7 t8 I. p( v! t
这种攻击大概包含以下流程:
' r9 T( U! r, N+ O. o) E3 ]" m/ u8 m; Y7 k- b5 Y
, _2 X4 E7 Q+ D4 V0 N3 B/ f7 g- 将平面贴纸进行转换以凸显三维信息,转换结果模拟矩形图像放在帽子上后的形状。
8 B- D4 `1 `5 F# U/ t3 | - 为了提高攻击的鲁棒性,研究者将得到的图像投影到高质量人脸图像上,投影参数中含有轻微的扰动。/ `& t# o5 r# F( [% E* q% B
- 将得到的图像转换为 ArcFace 输入的标准模板。' W1 ?4 H" F4 |- E5 [& T8 w! Q
- 降低初始矩形图像的 TV 损失以及余弦相似度损失之和,其中相似性是原图嵌入向量与 ArcFace 算出嵌入向量之间的距离。
( Z8 S* {4 L' C$ O9 E3 [ & }* x! p+ X( W% @( O
/ E7 ?# {2 T0 ~" [流程图如下图 2 所示:
& E7 L7 P' q+ ~6 Z: I1 o9 @6 X2 Z8 D9 `4 q+ |
2 c4 b L& E+ y3 p% R- W# v
图 2:攻击流程示意图。% ]+ H8 Y+ f( o! H# J h4 {
) K4 }- @" n' H0 m
首先,研究者将贴纸重塑成真实大小和外观的图像,之后将其添加到人脸图像上,然后再使用略为不同的转换参数将图像转换为 ArcFace 输入模板,最后将模板输入到 ArcFace 中。由此评估余弦相似度和 TV 损失,这样就可以得到用于改进贴纸图像的梯度信号。
. F! ~9 l: f7 S7 p; Z' @: ^& v# U4 i7 j. Z
1 t* J3 J. O& }0 P: d
图 3:步骤 1 转换贴纸的示意图。/ K$ u) w' g$ ]
8 N! G" z: h: }贴纸攻击试验细节, b- r4 O/ p) M3 t: t
) v+ q. z1 ~6 ~% r' g$ _如前所言,在将图像输入到 ArcFace 之前,研究者对其进行了随机修改。他们构造了一批生成图像,并通过整个流程计算在初始贴纸上的平均梯度。可以用一种简单的方法计算梯度,因为每个变换都是可微分的。9 f" }5 j2 g' f% _. A
' w, ?% _! P, x注意,在每一次迭代中,批中的每一个图像上的贴纸都是相同的,只有转换参数是不同的。此外,研究者使用了带有动量的 Iterative FGSM 以及在实验中非常有效的几个启发式方法。
- b! u/ I: u2 E/ C8 [: R
' B& T% R' U% }( @, h1 O1 M$ w/ n研究者将攻击分为两个阶段。在第一阶段,研究者使用了 5255 的步长值和 0.9 的动量;在第二阶段,研究者使用了 1255 的步长值和 0.995 的动量。TV 损失的权重一直为 1e − 4。
' H( T1 X2 C5 E+ i& z- C
& M' D! T5 D3 v8 ~; I9 K* J研究者利用一张带有贴纸的固定图像进行验证,其中他们将所有参数都设置为看起来最真实的值。9 j1 C, V! q9 c* \; c! j
/ |9 i2 @& b+ b0 I4 e8 V. c. u他们使用了最小二乘法法,并通过线性函数来插入最后 100 个验证值:经历了第一阶段的 100 次迭代和第二阶段的 200 次迭代。如果线性函数的角系数不小于 0,则:1)从第一阶段过渡到第二阶段的攻击;2)在第二阶段停止攻击。
( K4 C" o5 W# O4 s0 C! Z
# l3 x# U, @! u「对抗样本贴」效果怎么样
8 _ E& p% R. J* f4 ~# w
* @% k: x) D8 q: J" d/ Z. c6 r: z研究者在实验中使用一张 400×900 像素的图像作为贴纸图像,接着将这张贴纸图像投射到 600×600 像素的人脸图像上,然后再将其转换成 112×112 像素的图像。. B {0 S% L- G. L
4 {' B+ `: ^- k* A4 d
为了找出最适合贴纸的位置,研究者针对贴纸定位进行了两次实验。首先,他们利用粘贴在 eyez 线上方不同高度的贴纸来攻击数字域中的图像。然后,他们根据空间 transformer 层参数的梯度值,在每次迭代后变更贴纸的位置。2 B4 [& x2 w: s6 F
8 I4 g+ ~. W/ H2 j8 X C5 {. |0 S
下图 4 展示了典型对抗贴纸的一些示例。看起来就像是模特在贴纸上画了挑起的眉毛。
" j/ E3 _' o2 _# B) q8 G H! k: y1 T) a
% N# O; Z1 i5 |6 _2 B
图 4:对抗贴纸示例。4 V0 E( ~, x& F; r% P; r; E
! \. u' a3 [2 n& b! x. ~为了检测 AdvHat 方法在不同拍摄条件下的鲁棒性,研究者为最开始 10 个人中的 4 人另拍了 11 张照片。拍摄条件示例如下图 6 所示:
5 J) ~- p/ x& s* R9 e" q i
: m; E O0 x8 }; w: Q, D
- c: X# X, B6 a: v- s/ V图 6:研究者为一些人另拍了 11 张照片,以检测不同拍摄条件下的攻击效果。
6 I7 k9 q$ P5 V9 _6 E9 ?- a, c1 g' i
检测结果如下图 7 所示:虽然最终相似度增加了,但攻击依然有效。
! L5 T, L$ J. K+ Q* z, `
: H0 S' @5 W8 W; y& C % `/ K: ^: t1 \- Z$ e" }* a6 n
图 7:各种拍摄条件下的基线和最终相似度。图中不同颜色的圆点代表不同的人。圆表示对抗攻击下的相似性,而 x 表示基线条件下的相似性。. @3 ]2 v/ B9 ]( n& H
. e; t" @# w2 G% B( @0 y. o最后,研究人员检验了该方法对于其他 Face ID 模型的攻击效果。他们选取了 InsightFace Model Zoo 中的一些人脸识别方法。在每个模型上均测试了 10 个不同的人。2 Q( \% ]( a8 c1 f# Q+ n
+ e+ X% f) v. t: V$ Q 7 x, U% I, H7 c. a+ }! f
图 8:不同模型中,基线和最终相似度的差异。* p/ k# \# L. Y% O* a
: i% [3 Z! i. Y虽然 AdvHat 生成的对抗样本很简单,但这种攻击方式看起来已适用于大多数基于摄像头的人脸识别系统。看来想要不被人「冒名顶替」,我们还是需要回到虹膜识别?% b4 c; N$ N# l3 h1 D# P) k
: _) i0 s8 ~5 v( {: K
本文为机器之心报道,转载请联系本公众号获得授权。- Q( u5 Z2 S( L/ S
✄------------------------------------------------加入机器之心(全职记者 / 实习生):hr@jiqizhixin.com投稿或寻求报道:content@jiqizhixin.com广告 & 商务合作:bd@jiqizhixin.com( a6 C e3 n% ~. G+ s2 {
来源:http://mp.weixin.qq.com/s?src=11×tamp=1566896404&ver=1815&signature=*oejD6KZNIeFBedjGfko-HVWxUK5JqJymcLMEI2vQKpnGBbeLDP70080UA4XKxKdpIqy8GtZ8Ak8dD6y3mZXTrdi2HDgNe5e17ZDjbih8ZOWHLwlikFYQ99AEVxcEl0F&new=1" W- z% j* \* `, }
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|