京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1126|回复: 0

在国家智能语音创新中心看民企活力—— “创新链产业链深度融合,步伐更快 ...

[复制链接]

1676

主题

740

回帖

6929

积分

论坛元老

积分
6929
发表于 2023-5-12 11:20:26 | 显示全部楼层 |阅读模式 来自 江苏苏州
(原标题:在国家智能语音创新中心看民企活力—— “创新链产业链深度融合,步伐更快”(经济新方位·支持民营经济发展))                    
' y2 g( F# r: k/ o( y                                       
# ?  H' Z: `) f" Z9 w. n
4 o2 K. K) c1 o" u6 |  Q制图:沈亦伶
0 v1 _2 w/ J$ y8 s- D0 O" r企业是科技创新的主体。习近平总书记强调:“有能力、有条件的民营企业要加强自主创新,在推进科技自立自强和科技成果转化中发挥更大作用。”
' B( g# Z7 N! J% \越来越多的民营企业创新步伐不断加快,成为推动经济高质量发展的重要力量。在安徽合肥,记者走进国家智能语音创新中心。这是工业和信息化部2021年批复组建的4家国家制造业创新中心之一,由科大讯飞牵头,依托合肥智能语音创新发展有限公司,国内10多家智能语音企业和科研院所联手组建而成。中心与企业联动,充分发挥科技创新驱动作用,不断促进创新链产业链深度融合,为生产生活带来更多想象空间。
; U9 N4 l0 F! T$ x: m+ ~/ m助生产提质增效——
! d7 r5 s7 w5 V“智能耳朵”将质检效率提高2/3; c+ ^1 |* A" A* z+ c
浙江捷昌线性驱动科技股份有限公司主营电机生产。“在传统工业场景中,电机设备一旦出现故障,发出异常声音,通常都是经验丰富的老师傅用耳朵听,来判断故障点。”公司新昌生产基地生产总监张巍峰介绍:“我们实现了电机在流水线组装完成后,通过声纹质检系统检测采集产品运转数据。”% X! X+ Q$ C( c; _" \
一款系统,如何通过声音识别产品质量?; _; `8 F* r$ r, ?4 S" q7 ?: h1 i, e
静音房中,电机运转,嗡嗡声响接连不断;显示屏上,声纹起伏,数据被采集捕捉;存在故障,通过数据分析,维修点位随即可以确定。一直以来,张巍峰都在琢磨怎样通过机器“听音”提高质检效率,“自个儿摸索两三年,没有取得一点进展”。( z2 q7 I9 q. u1 e; s5 Z/ u; [
机缘巧合,一次技术推介会上,得知国家智能语音创新中心正在开展工业声学方向的研究,张巍峰当即寻求合作:“我们有需求,他们懂技术,优势互补,说不定能研发出来。”
+ D8 J, j) o2 G; q研发初期,中心委派的声纹分析工程师入厂调研,收集样本;质检工人现场听音,记录特征。6个多月时间,采集近5万条数据,算法选型、深度学习、参数调节,经过与人工听音多轮比拼试验,工业声纹质检系统初步建成。
6 \# @4 O! C& }8 b! H国家智能语音创新中心总经理吴江照介绍,利用工业声学技术开展设备质检,除了民营企业自主创新,还离不开科研院所的大力支持。“发声位置、距离远近都会对收音造成影响,为了解决工业领域的麦克风阵列分布问题,我们和西北工业大学科研团队开展交流,共同探讨技术方案。”吴江照说。
$ \9 f. n- c9 M如今,这款“智能耳朵”已在产线投用,质检识别准确率达到95%。“一次联合研发,仅一条产线每年就能为我们节省成本近15万元!”张巍峰算了笔账,过去人工听音,易因疲劳而失准,现在使用工业声纹质检系统,不仅效率提高2/3,还增强了一致性。曾经难以分辨的齿轮或换向器故障点,通过声纹数据分析,有了改进方向。
8 ]0 N' C* v7 W: {让生活智慧便捷——% L6 n; R, t" V( N
“全屋智控”识别用户指令更精准精确, z& \& f8 m$ a+ C4 x1 j
一进门,灯光自动点亮,空调自行开启;一句语音指令,舒缓的音乐在耳边响起,阳台上的晾衣架开始升降;厨房里,感应装置监测到煤气泄漏,既能报警,还会开窗……走进合肥荣事达电子电器集团智能全屋体验生活馆,研发中心技术人员孙杰指向巴掌大小的控制面板:“能集中控制空调、音箱、窗帘等,启动各种智能情景。”
  d/ f$ {" @* L) t) Q% S( p$ i$ d一块屏幕,如何实现“全屋智控”?$ Y5 r; S) F' m$ T% P% g: c! S8 Y
从传统的按键控制到智能的语音交互,为实现多款产品集成,孙杰带领团队与国家智能语音创新中心一道攻关,花了约一年时间。
2 b- m: P. y5 f; N6 j首先要解决的,是用户反映最多的“免唤醒”功能。孙杰介绍,唤醒词是为了激活设备进入运行状态,一般来说,唤醒词说出后,若能立刻给出反应,有利于提升用户体验。可如果每次使用智能设备都需要唤醒词,也会造成交互冗余,增添麻烦。
' |/ }, ~( M% q2 N+ F为此,企业结合市场调研,分析常用指令,中心则利用声学技术,提供算法支持。通过具有AI(人工智能)交互能力的语音芯片加持,这款控制面板可以实现一分钟内“一次唤醒,多轮交互”。$ j6 _9 p+ u5 Y: |/ @' W. S
“误操作”是横在面前的另一道难题。“居家生活时,经常出现闲聊触发关键词、设备作出响应的情况,尤其是在开发‘免唤醒’功能后。”中心AI语音芯片部研发总监周正友介绍。
6 s- M+ K8 X2 M是否可以通过识别声音、判断方向,进而给出正确回应?为了解决这个难题,周正友和同事们根据波速强度,算法分析音频,经过多次试验,系统识别准确度大幅提升。8 Y% B1 @' W: Z/ e
眼下,除了智能家居,这款具有语音交互功能的面板产品还被应用到其他领域。“医院、养老院、办公室等商用客户也很感兴趣!”孙杰表示,企业与中心联合攻关,既增强了创新能力,还开拓了应用市场。- ^% k: c/ a( f* _/ v/ I
为创新提供支撑——. ^% }) l1 u+ a; M) r/ D' u0 P
AR字幕眼镜带来“看得见的声音”7 `9 Y- [/ r  W3 q6 t
耳边,交流声音不断,眼前,文字逐句呈现。这让弱听患者刘烁感觉不错:“跟看剧一样!戴上眼镜,声音就能转化成文字显示在眼前,还可以调节字体大小、背景颜色,丝毫不影响视线。”- P' y. Z( ]$ ~/ ]- i8 C
这款AR(增强现实)字幕眼镜,由北京亮亮视野科技有限公司与国家智能语音创新中心联合研发,具备实时转写、语音翻译等功能,已为5000多名弱听患者带来“看得见的声音”。, L0 k' u  u8 K' y( }0 A
面向市场需求,兼具技术基础,新品研发按说应该很顺利。令亮亮视野系统研发部总监赵伟没想到的是,技术迁移并不简单。“我们想的是把眼镜和声学技术相结合,增强用户体验,可眼镜收集声音后,难以依托眼镜本体算力进行转写。”赵伟思来想去,决定“上云”一试。& j* W# U& _0 l( q/ P# y
这朵“云”,是国家智能语音创新中心构建的端云一体语音云平台,为金融、医疗、智能交通等领域企业提供技术服务,助力企业高效稳定运营,日交互量达20亿次。
* S. A5 x5 L# o# g近半年时间里,赵伟在合肥、北京两地奔走,从拾音降噪到接入“云端”,企业、中心协同创新。如何精准识别人声?科研人员调节上千次麦克风阵列组合,确定声音增益最佳范围。怎样确保转写迅速稳定?技术人员将数据接入云平台,提供响应及时的算力支撑。7 M+ L# B" F. k/ l, p
“简化操作步骤、调节字幕位置,产品去年研发成功以来,软件前后更新了三四个版本。现在,我们正在和中心讨论,如何增加语音控制开关功能,让用户操作更加便捷。”赵伟说。: E! @6 d5 r0 O% Z+ j1 v! V
近年来,为支持智能语音产业发展,工信部批复组建国家智能语音创新中心,给予专项支持;2021年,安徽省印发《支持中国声谷创新发展若干政策》,鼓励人工智能及智能语音产业发展和推广应用,引导企业协同创新发展。“政府有政策,企业有场景、有需求,中心有技术、有实力。依托这样的创新合作形式,可以更有效实现资源联动。创新链产业链深度融合,步伐更快。”吴江照说。
5 B! t- W7 S5 h
9 E0 V9 J6 `4 x  S- {                    

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-7-17 10:32 , Processed in 0.039140 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表