京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

升哲资讯:人工智能学会从视频中预测人类行为

2021-7-1 16:00| 发布者: q554551334| 查看: 322| 评论: 0

摘要: 【对于人类来说,预测人类行为很简单,但是对于机器来说很难。哥伦比亚的研究员公布了一项计算机视觉技术,可以让机器对于人类行为有所预测。这项研究结果为人机交互、自动驾驶和辅助技术开辟了更多可能性。】 根据
【对于人类来说,预测人类行为很简单,但是对于机器来说很难。哥伦比亚的研究员公布了一项计算机视觉技术,可以让机器对于人类行为有所预测。这项研究结果为人机交互、自动驾驶和辅助技术开辟了更多可能性。】

根据一个人的肢体语言来预测他下一步要做什么对人类来说很自然,但对电脑来说则不然。当我们遇见另一个人时,他们可能会和我们打招呼,握手,甚至碰拳,我们可以了解情况并适当地做出反应。在一项新的研究中,哥伦比亚工程学院的研究人员公布了一种计算机视觉技术,通过利用人、动物和物体之间更高层次的联系,让机器对接下来将发生的事情有更直观的感觉。

这项研究的负责人、哥伦比亚大学计算机科学助理教授Carl Vondrick表示:“新算法朝着机器能够更好地预测人类行为迈出了一步,从而更好地协调它们的行动。我们的研究结果为人机合作、自动驾驶汽车和辅助技术开辟了多种可能性。”

研究人员称,这是迄今为止预测未来几分钟内视频动作事件最准确的方法。在分析了长达数千小时的电影、体育比赛和办公室生活类的节目后,该系统学会预测从握手到碰面等数百种活动。当它无法预测具体的动作时,它会找到更高层次的概念来联系他们,在上面的例子中,就会出现“问候”这个词。

过去在预测性机器学习方面的尝试,都集中在一次只预测一个动作。算法决定是否将动作归类为拥抱、击掌、握手,甚至是像“忽略”这样的非动作。但当不确定性很高时,大多数机器学习模型无法在可能的选项之间找到共性。

哥伦比亚大学工程学博士Didac Suris和Rushi Liu决定从一个不同的角度来研究长期预测问题。“并不是所有的事情在未来都是可以预测的,当一个人无法准确预测将要发生的事情时,他们会谨慎行事,并以更高的抽象层次进行预测。我们的算法是第一个学习抽象推理未来事件能力的算法。”

Suris和Liu需要复习古希腊时期的数学问题。高中学生们熟悉和直观的几何规则是,直线是直线,平行线永不相交。大多数机器学习系统也遵守这些规则。但是其他的几何,却有着奇异的、反直觉的性质; 直线弯曲,三角形凸出。Suris和Liu利用这些不寻常的几何图形来构建人工智能模型,这些模型可以组织高级概念,预测人类未来的行为。预测是人类智能的基础,机器会犯人类永远不会犯的错误,因为它们缺乏人类抽象推理的能力。这项工作是缩小这一技术差距的关键一步。

研究人员开发的数学框架使机器能够根据事件对未来的可预测性来组织事件。例如,我们知道游泳和跑步都是锻炼的形式。这项新技术学会了如何自行对这些活动进行分类。系统意识到不确定性,当有确定性时提供更具体的操作,当没有确定性时提供更通用的预测。

研究人员说,这项技术可以让计算机更接近于能够判断情况并做出细微的决定,而不是预先编程的行动。这是在人类和计算机之间建立信任的关键一步。“信任来自于机器人真正理解人类的感觉,如果机器能够理解并预测我们的行为,计算机将能够在日常活动中无缝地帮助人们。”Liu 说。

虽然新算法比以前的方法对基准任务做出了更准确的预测,但接下来的步骤是验证它在实验室之外的工作。研究人员表示,如果该系统可以在多种环境下工作,那么部署机器和机器人的可能性就大很多,这可能会改善我们的健康和安全。该小组计划继续利用更大的数据集、计算机和其他形式的几何图形来改进算法的性能。

来源:https://tieba.baidu.com/p/7430590987
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-7-2 14:53 , Processed in 0.035244 second(s), 19 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

返回顶部