小米

首页 » 常识 » 诊断 » 从就近唤醒到协同唤醒,小爱50
TUhjnbcbe - 2023/3/14 19:18:00
白癜风症状图片 http://m.39.net/pf/a_4793221.html

在小米十年之际,雷军宣布小米下一个十年的核心战略将升级为手机×AIoT,也就是要打造以智能手机为核心的智能生活体验。配合这一战略升级,小爱同学5.0版本起,从语音助手升级为智能生活助手。

“智能协同”和“情感陪伴”是小爱5.0的突出特点。

在MiDC上,小爱团队负责人王刚介绍,智能协同是为应对多设备场景的使用。当家里有几个智能设备时,用户需要以适当的方式优先唤醒某一个设备,要避免的是几个设备同时被唤醒。

在年时,小爱推出的是“就近唤醒”,不过后来小米发现,通过设备距离用户远近来决定唤醒优先级并不足够。

王刚介绍,“比如手机和音箱的组合,大部分场景下用户希望音箱优先被唤醒;如果一个房间里面有两台音箱,正在播放音乐的音箱应该被优先唤醒,所以我们将就近唤醒升级为协同唤醒。”因此,除了考虑距离因素,设备的活跃情况,设备形态都成为考虑的因素。

除了控制设备的功能,提供情感陪伴也成为小爱考虑的重要因素。

主动对话的属性能让小爱对用户表达关心,这体现在一些交流细节方面。比如,用户能够指定小爱5.0用特定的昵称称呼自己;小爱也会记住用户的生日,并主动送出祝福。

此外,小爱5.0能够定制专属声音,用户可以录入家人的声音,作为小爱的声音。这样,家人的声音就能以智能生活助手的语音形式,作为一种陪伴。5.0版本的小爱还新增了粤语交互、多模态融合交互等功能。

小爱的“陪伴”功能(来源:小米)

以语音交互为核心的AIoT

以语音交互为形式,小爱代表了小米对未来IoT探索的重要方向。小米人工智能部总经理叶航军、小爱负责人王刚、小米AI实验室主任王斌围绕以小爱为主的AI技术,与媒体进行了交流。

叶航军在谈及对于IoT的发展的思考时表示,以智能手机为例,现在IoT可能处于功能机到智能机的早期阶段。不过由于有了智能手机的发展经验,人们会去预测未来AIoT比较完善的状态,不过目前行业还没有达到理想的水平。

理想的IoT体验背后是AI技术的支撑。

王刚分享了目前小爱正在努力突破的语音技术难点,包括唤醒,语音识别,自然语言理解。以唤醒为例,误唤醒依旧是用户的痛点。当用户语音中有类似小爱同学的发音,此时即使没有唤醒意图,小爱依旧会被唤醒。而当多人在对话,或者有嘈杂的背景音时,小爱是不是依旧能准确辨认出某一个用户的唤醒意图。

在自然语言理解方面,基于目前框架,目前小爱的模型中可以有多种组合,王刚表示,这方面目前处于渐进式的进步,需要新的技术突破,才能够更好地处理多轮会话能力,现有的模型技术框架会面临限制。

在语音识别方面,王斌则表示,小爱5.0中的动态语音识别技术是一个有前景的技术。动态语音识别的特点是模型跟新快,依据线上反馈进行动态调整。未来希望实现的效果是,针对个体的语音特征进行个性化训练,这样即使用户的普通话语音不标准,也能欧享受质量一致的语音服务。

小米公司在年将AI升级为公司的战略部门,并成立小爱团队。叶航军表示,这个时间点不算早,因此对于小米而言是一个挑战,小米目前的核心竞争力在场景,基于智能产品线,拥有最丰富的场景。在AI发展中遇到的最大挑战则是人才。解决这一问题主要是通过在公司内部寻找合适的人才、外部聘请人才、以及培养应届毕业生。

在MiDC大会的第一天,雷军就表示了对人才的渴求。年将在十大领域招聘名工程师。他还强调,人才是小米发展的根本大计。

“现在还有很多环节并不智能。”叶航军在分享小米未来人工智能的长期目标时说,未来希望在小米的业务体系里将各个层面的智能做深入,比如解决客服场景。除了提供消费级产品的服务外,小米也希望将AI技术运用到制造业的产业链上游,提升智能制造的水平。

小米AI实验室研究布局及应用情况(来源:小米)

1
查看完整版本: 从就近唤醒到协同唤醒,小爱50