京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1015|回复: 0

三个关键技术给予 AR 界面的力量

[复制链接]

1641

主题

735

回帖

7156

积分

论坛元老

积分
7156
发表于 2023-6-10 07:36:35 | 显示全部楼层 |阅读模式 来自 山东济南
本篇文章将从技术角度出发,并以最近推出的苹果 MR 为例,分析 AR 世界里所需要依托的三个关键技术点:眼动追踪、手动识别和空间计算。让我们一起看看作者对这三个技术点的分析吧 ~
  p' t5 e/ F, S: ]2 _  n( X6 _5 H* j8 \6 ]. {; G

3 c. \3 y7 O7 F) o+ H) L% L1 U$ X5 |& M! X; r' P: F
用眼睛看,用手操作,是我们在物理世界里再自然不过的交互方式了。但要在 AR 世界里延续这种自然交互,却需要依托的三个关键技术点。+ @9 W3 `, R  u' {& I( L9 N8 I! {- D
Apple Vision Pro 的发布没有让我们失望,在里面,我看到了这三个技术带给自然交互的力量。. v& a, u2 R0 w9 m8 u
一、眼动追踪技术3 N. X2 _: C/ `6 J
我们在现实中如果需要与哪个物体有进一步的交互,都会自然地将视线集中在它的身上,当我们耗费注意力让视线聚焦在它身上的时候,就已经代表了我们的选择。8 Q- n) `  E6 q' q6 ?
这个过程涵盖了目前界面领域上的两个状态:激活态(聚焦)和点击态(选择)。眼动追踪技术,实现的是看到聚焦这个过程。
6 z; A8 E& I4 u5 C这个技术当然并不是首创。AR 眼镜的先驱,Microsoft Holoens 第 2 代的交互就主打了 Eye-gaze,就是用眼睛来聚焦的功能。1 v+ y, `2 }0 [" y' X0 a% D- c
而在之前,Microsoft Holoens 第 1 代的头动(Head-gaze)交互其实也已经有用眼睛来看和激活的概念了。但 Head-gaze 里使用头部微微移动来控制屏幕中心的一个点(Gaze)来激活内容,和我们本来的自然交互始终是有差距的,因为实际上我们聚焦一个物体,并不需要每次都靠头动,靠眼睛动就行了。& a8 f$ ?, _& `' F! X
不过,虽然眼动追踪技术更解决自然交互的标准,但头动交互并不是没有可取之处,比如我团队目前自研的眼镜还只能支持 Head-gaze 交互。这种交互手段的成本和技术难度更低,比起用手 / 鼠标 / 遥控器等去聚焦激活的方式,它更加贴近我们用眼睛看这个自然交互理念。7 l, }& c( g6 |1 H0 z( Q* z# p* v
另外,眼动追踪技术实现了激活态,却还没真正实现选择,也就是那个点击态。作用是告诉机器我确认是它了。2 u* U; D7 \# t
严格来说,对于不需要操作的东西,省去手这个确认操作是很有必要的。比如,我一边吃零食一边追剧的时候,就很希望不用每次操作前都要擦一擦我的脏手……在制造领域,类似这种解放双手的需求也经常被客户提出。
* U* w$ ^1 F7 d+ ]! J为了更自然的交互,也许这也可以成为我们畅想的一部分。之前我写过一个专利,就是靠脑电波技术来进行简单的确认。$ t4 T5 M4 T3 L: v) l5 e: V
二、手势识别技术& q9 {3 K% p3 p% Y* x1 R9 F- K# p
眼动追踪满足用眼睛看这部分的交互,用手操作,则需要手势识别技术。
9 O* h) U6 i; o8 B4 x3 C7 ?这也不是什么新技术了,之前很多 ARVR 的设备上都有搭载,当然实现程度还要实际体验再确认。4 O( C% ~% |3 H( ^. X8 }" t, i
Vision Pro 的宣传视频里,手势识别看上去很自然,手甚至都不需要抬起来,这应该是依靠 4 组下视角相机(这大概也是需要 12 个摄像头配置的原因之一吧)。
3 ~4 E+ }) k( J2 b! B0 K( i9 E+ r) X* g1 P  B  S2 }

- }7 H( f5 r6 a2 E6 X! T
6 b" j9 Y) b6 Y; M8 h  W+ T相比 Hololens2 的宣传视频,可以看出手势是在头顶摄像头涵盖范围的。
  i) G: p! O4 t( V4 [( s- o2 I, Q7 B( q+ H7 U7 @& M* y% _

! a- @. B8 g; |
$ L/ h6 P; m; W/ X$ ]7 \因为手势识别是需要依托摄像头的(计算机需要输入才能知晓你的手在怎么动),那么同样的手势从不同角度拍摄的结果就不一样,识别的结果也会受到影响。+ h  k; K" i5 Z6 |) g2 U
另外,2D 手势识别和 3D 手势识别技术的体验感也不太一样。' R0 H- o- ?: v' s. a1 e
三、空间计算
7 a$ e* W# ?7 n7 s要让眼睛看得更爽,用手操作得更自然,设备需要有对空间的理解能力。空间计算,也是 Vision Pro 想主推的,对于这个能力的注重,让他们认为这块能力可以划分一个时代8 X! H( m! ~" H, U
" 空间计算时代 "。( \( T+ x( f& m4 q4 Q7 }
没有空间计算能力,也就是如果机器不能理解空间的话,很多交互都自然不起来。我们现在所听到的 Nerf、SLAM、3DOF、6DOF,都属于空间计算技术的一员。
' {) z0 {7 y+ q- a$ {; T6 r/ P# F+ G从体验角度来说,空间深度所带来的物体之间、物体与用户之间的距离感知; 用户在不同位置和姿态下的视角朝向所带来的物体形状变化;真实环境中因时间和天气等光线不同所导致的色彩感知变化;甚至不同空间位置所传来的声音等,空间计算能给予设计师更多自然交互的空间。$ {0 ~+ h& ?* o( e) g  ^+ X
可以说,空间计算,是能让 AR 在未来,成为不同于普通屏幕界面的、我们真正所期待的 " 凡所看之处,皆可成为界面 " 的关键技术。
$ W! H& N% r7 r/ h9 u4 S' E3 B: g专栏作家
7 {( s# i2 g+ G7 l& w8 G林影落,微信公众号:林间有影落,人人都是产品经理专栏作家。一枚会玩卡的用户体验设计师,《AR 界面设计》作者,10 年 +UIUX 设计经验,专注于 AR 及智能化领域用户体验设计 6 年;设计 & 心理学教育背景,国家职业认证高级 OH 卡师 / 天赋挖掘教练。愿意用我的一份努力,让设计这个领域在智能化的未来更有价值,让设计师这个职业更加值钱!' G6 w- S7 N; W6 W, _3 Q; |" r) Y
本文原创发布于人人都是产品经理,未经许可,禁止转载。
, i" y( F, I7 r1 t: M& F% u题图来自 Unsplash,基于 CC0 协议

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-7-13 12:28 , Processed in 0.045614 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表