“手机×AIoT”双引擎战略下,小米AI提速。
明年再扩招名工程师,小米加速储备人才
小米在招揽人才上再使出“大招”。
近日,雷军在小米年小米开发者大会上宣布,小米在年将在十大领域扩招名工程师,占小米目前员工总数的20%以上。
“人才是创新之源,提升技术实力的第一步,就是聚拢最顶尖的人才”,雷军表示,小米目标创造最好的工作环境,以激发工程师的创造力和创新力。“未来十年,我的愿望之一就是,要继续努力将小米打造成工程师们向往的圣地”。
小米在招人上一直不遗余力。雷军以相机技术部门举例,年相机部成立时工程师只有人,目前相机部工程师已达人,增长了近6倍,这还不包括AI实验室为相机提供技术支持的多位工程师。小米相机研发中心的选址也主要以人才聚集地作为主要考虑因素。目前,小米已在北京、巴黎、东京、圣地亚哥等城市设立了九地研发中心,共设立5个国际研发中心。
今年受到疫情黑天鹅影响,不少互联网公司减少或者关闭招聘编制。但小米启动了创业以来规模最大的校园招聘。年,小米共入职了名大学生,其中研究生学历达人。
这两年,小米AI引入了不少学术界、业界的重量级人才。年8月,中科院研究员王斌博士加盟小米,出任小米NLP首席科学家,负责自然语言处理基础平台的构建及前沿技术的探索与创新。年2月,小米进行组织架构调整,王斌被任命为人工智能部AI实验室主任,负责推动AI技术的预研和落地。同年11月,语音识别大牛Kaldi之父DanielPovey博士加入小米,出任小米语音首席科学家,将负责开发下一代Kaldi。
上周,根据全球三大知名调研机构的数据,小米在全球智能手机市场的份额重回世界第三。这是继小米在年后再次回归全球第三。雷军认为,这次回归是6年来积极补课、夯实基础的结果,也反映了小米过硬的技术实力。
雷军提到,今年小米今年研发投入将超过亿元,研发投入在科创板所有上市公司研发成本总和的一半,在所有上市和未上市的高科技公司中,也能进入前20。他表示,小米未来还会继续死磕硬核科技。小米还将在相机、屏幕、充电、IoT、智能制造等多个领域继续加强研发投入。
手机×AIoT战略下,小爱同学5.0版本5大升级
小米集团副总裁、技术委主席崔宝秋博士在开发者大会上发布了四大新技术:小爱同学5.0升级;新一代Kaldi;物联网软件平台XiaomiVela;开放三大系统影像能力,包括手机影像能力向第三方APP开放,手机影像处理能力为IoT设备赋能,复眼分布式相机开放协议。
小爱同学5.0将产品定位从语音助手升级为智能生活助手,这一变化是顺应小米战略升级做出的。今年8月,小米公布了新战略—“手机×AIoT”战略来构建智能生活。为配合该战略,小爱同学进行了相应的升级,她现在不只是语音助手,还覆盖了在智能生活上的方方面面,希望降低用户使用智能产品的门槛。
小爱同学5.0共有五大升级,包括全场景智能协同、对话式主动智能、多模态融合交互、个性化情感声音和智慧学习助手。其中,全场景智能协同包括了协同唤醒、协同响应和协同提醒,能对家庭中的家居基于用户的意图进行统一决策,多设备协同配合,用户不用担心多设备协作配合的问题,小爱同学降低了使用智能设备的负担。
在引导对话方面,小米人工智能部副总经理、小爱同学研发总负责人王刚博士在接受InfoQ等媒体采访时表示,小爱同学开发了对话式主动智能,会用比较自然的对话方式,更主动与用户进行交互,在UI交互上不打扰用户,在对话过程中,小爱会主动抛出一些带有用户专属信息的话题与用户沟通,拉近与用户的距离,和用户亲近地打招呼,关怀提醒。在5.0版本中发布了“个性化动态语音识别”、“协同唤醒”等多项自研技术,新版本的小爱同学在语音交互上理解更准确,对话更加自然。
据悉,截止6月30日,小爱同学累计唤醒次数达亿次,全球激活设备数2.28亿,小爱同学月活跃用户达到万。
小米AI的
小米AI实验室主任、NLP首席科学家王斌介绍了小米AI技术在过去一年来的进展与应用。
王斌表示,小米AI需求主要来自于公司内部,包括硬件产品、电商及新零售、互联网服务等“铁人三项”业务。
基于此需求,小米的AI战略分为两个部分,一是打造核心AI能力,二是通过开放合作建立合作关系,并将技术输送给社会。
小米AI目前已经建立了比较完整的技术图谱。
王斌详细介绍了小米在计算机视觉、语音、声学、NLP、知识图谱、机器学习等AI技术方面的进展。
在计算机视觉方面,大的突破主要来自HDR/超级夜景、超级分辨率、文档/OCR、魔法换天、魔法分身、Vlog等技术。HDR技术助力下,小米手机今年两次获得DXOMARK评测相机拍照第一名。
语音技术近一年的成果主要体现在唤醒、识别、生成和声纹技术等方面。声学在手机降噪、阵列唤醒、分布式放音、评测等方面取得了很大进展。声学、语音技术广泛落地到小爱同学以及手机、电视、音箱等产品。
在知识图谱技术上,小米在知识问答,智能坐席辅助、智能外呼、客服机器人等技术获得多项创新。
小米在机器学习方面近一年的成果主要包括,推出了面向微处理器的深度学习推理框架MACEMicro,打造了面向广告推荐的自研稀疏模型自动优化架构AutoSparseDL,进一步完善深度学习云服务平台CloudML等等。
在自然语音处理技术方面,小米自然语言处理平台MiNLP平台最新版3.0版发布,包括26个模块,落地30多个业务,目前MiNLP每天调用80亿次。抗噪机器翻译、统一机器翻译技术取得进展,目前已经落地手机、小爱同学等业务。在多模态内容理解方面,能够联合文本、语音、视频进行联合分析,已落地信息流、广告等业务。人机对话上,改写回复、生成式对话,多样性回复等技术已应用在小爱同学的闲聊技能上。对联、诗歌写作等技术已经落地到小米多个业务中,得到了很好的反馈。
值得一提的是,MiNLP平台后续准备开源。
小米集团副总裁、技术委员会主席崔宝秋在开发者大会现场发布了MiNLP平台开源计划,MiNLP的分词功能将于11月中下旬正式对外开源,词性标注功能将于明年一季度开源,命名实体识别功能将于明年二季度开源,语义相关功能将于明年三季度开源。
王斌介绍说,开源的NLP工具主要源自学术界或者工业界。来自学术界的开源NLP工具一般会侧重考虑学术实验场景,能为对学术研究带来很大的帮助。而来自工业界的开源工具,则倾向于考虑实际应用场景。目前业内一些公司诸如百度、腾讯等也都开源了一些NLP工具。
王斌介绍,小米MiNLP平台来自业务需求的驱动,更倾向于实际落地场景。不少模块自上线以来历经多个工业界实际上线场景的考验,小米开源的就是这个经历过考验的最新版本。
谈到与学术界和工业界已开源工具的区别,王斌博士表示,小米MiNLP在设计时充分借鉴了已有工具的一些思想和理念,并根据我们的实际经验进行了区别性设计,有自己的一些特点。比如,工业界最有力的干预机制,小米事先在设计时靠考虑到框架的灵活性,不用重新训练模型,就能方便地支持有效的干预机制。这样,用户就可以很灵活地将自己的东西放上去,并在短时间内获得一个更符合线上需求的版本。
目前,小米AI应用中的大部分核心技术以自主研发为主导,这些技术已经全面赋能到小米的各个产品和业务线。
谈到小米人工智能的未来,小米人工智能部总经理叶航军博士表示,小米AI已有了比较明确的短期目标和长期目标。
短期目标目前有两个大方向,一个是AI产品和小爱同学要支持好小米的智能生活战略,即“手机×AIoT”构建智能生活的战略。因为在这个战略中,小爱同学是非常重要的环节,可以认为,她发挥的是一个入口和落地的作用。另一个是AIOT方向,这六大技术方向现在都有非常明确的业务和落地场景。现在大家对AI的期望很高,其实它有非常多的技术问题解决得还很不好。这是小米后面要努力把这个事情做好的一个决心。
长期目标也主要有2个,一个是要把各个环节的智能化做的更深入一些。现在很多环节其实并不智能,在整个小米的业务体系里面,需要把各个层面的智能做得很深入。除了用户可见的产品体验以外,还有一些不太容易注意得到的场景,比如客服也是需要智能的。现阶段用户对客服的体验可能还不太好,大部分客服的问题其实是相对比较简单的问题,对目前的AI来说,都是能解决的问题。因此,针对这个方面,小米也在加大投入。
第二个长期目标是,往产业的上游去做。例如,小米将智能制造作为非常重要的场景。除了向消费者直接提供产品之外,小米也希望通过技术来帮助整个国内的制造业提升制造水平,智能制造里非常重要的技术就是AI技术。