小米生态链,AI智能手机 - 小米 - Powered by Discuz!NT Archiver

TUhjnbcbe - 2023/1/27 0:20:00

白癜风治疗的医院 https://jbk.39.net/yiyuanfengcai/tsyl_bjzkbdfyy/

“手机×AIoT”双引擎战略下，小米AI提速。

明年再扩招名工程师，小米加速储备人才

小米在招揽人才上再使出“大招”。

近日，雷军在小米年小米开发者大会上宣布，小米在年将在十大领域扩招名工程师，占小米目前员工总数的20%以上。

“人才是创新之源，提升技术实力的第一步，就是聚拢最顶尖的人才”，雷军表示，小米目标创造最好的工作环境，以激发工程师的创造力和创新力。“未来十年，我的愿望之一就是，要继续努力将小米打造成工程师们向往的圣地”。

小米在招人上一直不遗余力。雷军以相机技术部门举例，年相机部成立时工程师只有人，目前相机部工程师已达人，增长了近6倍，这还不包括AI实验室为相机提供技术支持的多位工程师。小米相机研发中心的选址也主要以人才聚集地作为主要考虑因素。目前，小米已在北京、巴黎、东京、圣地亚哥等城市设立了九地研发中心，共设立5个国际研发中心。

今年受到疫情黑天鹅影响，不少互联网公司减少或者关闭招聘编制。但小米启动了创业以来规模最大的校园招聘。年，小米共入职了名大学生，其中研究生学历达人。

这两年，小米AI引入了不少学术界、业界的重量级人才。年8月，中科院研究员王斌博士加盟小米，出任小米NLP首席科学家，负责自然语言处理基础平台的构建及前沿技术的探索与创新。年2月，小米进行组织架构调整，王斌被任命为人工智能部AI实验室主任，负责推动AI技术的预研和落地。同年11月，语音识别大牛Kaldi之父DanielPovey博士加入小米，出任小米语音首席科学家，将负责开发下一代Kaldi。

上周，根据全球三大知名调研机构的数据，小米在全球智能手机市场的份额重回世界第三。这是继小米在年后再次回归全球第三。雷军认为，这次回归是6年来积极补课、夯实基础的结果，也反映了小米过硬的技术实力。

雷军提到，今年小米今年研发投入将超过亿元，研发投入在科创板所有上市公司研发成本总和的一半，在所有上市和未上市的高科技公司中，也能进入前20。他表示，小米未来还会继续死磕硬核科技。小米还将在相机、屏幕、充电、IoT、智能制造等多个领域继续加强研发投入。

手机×AIoT战略下，小爱同学5.0版本5大升级

小米集团副总裁、技术委主席崔宝秋博士在开发者大会上发布了四大新技术：小爱同学5.0升级；新一代Kaldi；物联网软件平台XiaomiVela；开放三大系统影像能力，包括手机影像能力向第三方APP开放，手机影像处理能力为IoT设备赋能，复眼分布式相机开放协议。

小爱同学5.0将产品定位从语音助手升级为智能生活助手，这一变化是顺应小米战略升级做出的。今年8月，小米公布了新战略—“手机×AIoT”战略来构建智能生活。为配合该战略，小爱同学进行了相应的升级，她现在不只是语音助手，还覆盖了在智能生活上的方方面面，希望降低用户使用智能产品的门槛。

小爱同学5.0共有五大升级，包括全场景智能协同、对话式主动智能、多模态融合交互、个性化情感声音和智慧学习助手。其中，全场景智能协同包括了协同唤醒、协同响应和协同提醒，能对家庭中的家居基于用户的意图进行统一决策，多设备协同配合，用户不用担心多设备协作配合的问题，小爱同学降低了使用智能设备的负担。

在引导对话方面，小米人工智能部副总经理、小爱同学研发总负责人王刚博士在接受InfoQ等媒体采访时表示，小爱同学开发了对话式主动智能，会用比较自然的对话方式，更主动与用户进行交互，在UI交互上不打扰用户，在对话过程中，小爱会主动抛出一些带有用户专属信息的话题与用户沟通，拉近与用户的距离，和用户亲近地打招呼，关怀提醒。在5.0版本中发布了“个性化动态语音识别”、“协同唤醒”等多项自研技术，新版本的小爱同学在语音交互上理解更准确，对话更加自然。

据悉，截止6月30日，小爱同学累计唤醒次数达亿次，全球激活设备数2.28亿，小爱同学月活跃用户达到万。

小米AI的

小米AI实验室主任、NLP首席科学家王斌介绍了小米AI技术在过去一年来的进展与应用。

王斌表示，小米AI需求主要来自于公司内部，包括硬件产品、电商及新零售、互联网服务等“铁人三项”业务。

基于此需求，小米的AI战略分为两个部分，一是打造核心AI能力，二是通过开放合作建立合作关系，并将技术输送给社会。

小米AI目前已经建立了比较完整的技术图谱。

王斌详细介绍了小米在计算机视觉、语音、声学、NLP、知识图谱、机器学习等AI技术方面的进展。

在计算机视觉方面，大的突破主要来自HDR/超级夜景、超级分辨率、文档/OCR、魔法换天、魔法分身、Vlog等技术。HDR技术助力下，小米手机今年两次获得DXOMARK评测相机拍照第一名。

语音技术近一年的成果主要体现在唤醒、识别、生成和声纹技术等方面。声学在手机降噪、阵列唤醒、分布式放音、评测等方面取得了很大进展。声学、语音技术广泛落地到小爱同学以及手机、电视、音箱等产品。

在知识图谱技术上，小米在知识问答，智能坐席辅助、智能外呼、客服机器人等技术获得多项创新。

小米在机器学习方面近一年的成果主要包括，推出了面向微处理器的深度学习推理框架MACEMicro，打造了面向广告推荐的自研稀疏模型自动优化架构AutoSparseDL，进一步完善深度学习云服务平台CloudML等等。

在自然语音处理技术方面，小米自然语言处理平台MiNLP平台最新版3.0版发布，包括26个模块，落地30多个业务，目前MiNLP每天调用80亿次。抗噪机器翻译、统一机器翻译技术取得进展，目前已经落地手机、小爱同学等业务。在多模态内容理解方面，能够联合文本、语音、视频进行联合分析，已落地信息流、广告等业务。人机对话上，改写回复、生成式对话，多样性回复等技术已应用在小爱同学的闲聊技能上。对联、诗歌写作等技术已经落地到小米多个业务中，得到了很好的反馈。

值得一提的是，MiNLP平台后续准备开源。

小米集团副总裁、技术委员会主席崔宝秋在开发者大会现场发布了MiNLP平台开源计划，MiNLP的分词功能将于11月中下旬正式对外开源，词性标注功能将于明年一季度开源，命名实体识别功能将于明年二季度开源，语义相关功能将于明年三季度开源。

王斌介绍说，开源的NLP工具主要源自学术界或者工业界。来自学术界的开源NLP工具一般会侧重考虑学术实验场景，能为对学术研究带来很大的帮助。而来自工业界的开源工具，则倾向于考虑实际应用场景。目前业内一些公司诸如百度、腾讯等也都开源了一些NLP工具。

王斌介绍，小米MiNLP平台来自业务需求的驱动，更倾向于实际落地场景。不少模块自上线以来历经多个工业界实际上线场景的考验，小米开源的就是这个经历过考验的最新版本。

谈到与学术界和工业界已开源工具的区别，王斌博士表示，小米MiNLP在设计时充分借鉴了已有工具的一些思想和理念，并根据我们的实际经验进行了区别性设计，有自己的一些特点。比如，工业界最有力的干预机制，小米事先在设计时靠考虑到框架的灵活性，不用重新训练模型，就能方便地支持有效的干预机制。这样，用户就可以很灵活地将自己的东西放上去，并在短时间内获得一个更符合线上需求的版本。

目前，小米AI应用中的大部分核心技术以自主研发为主导，这些技术已经全面赋能到小米的各个产品和业务线。

谈到小米人工智能的未来，小米人工智能部总经理叶航军博士表示，小米AI已有了比较明确的短期目标和长期目标。

短期目标目前有两个大方向，一个是AI产品和小爱同学要支持好小米的智能生活战略，即“手机×AIoT”构建智能生活的战略。因为在这个战略中，小爱同学是非常重要的环节，可以认为，她发挥的是一个入口和落地的作用。另一个是AIOT方向，这六大技术方向现在都有非常明确的业务和落地场景。现在大家对AI的期望很高，其实它有非常多的技术问题解决得还很不好。这是小米后面要努力把这个事情做好的一个决心。

长期目标也主要有2个，一个是要把各个环节的智能化做的更深入一些。现在很多环节其实并不智能，在整个小米的业务体系里面，需要把各个层面的智能做得很深入。除了用户可见的产品体验以外，还有一些不太容易注意得到的场景，比如客服也是需要智能的。现阶段用户对客服的体验可能还不太好，大部分客服的问题其实是相对比较简单的问题，对目前的AI来说，都是能解决的问题。因此，针对这个方面，小米也在加大投入。

第二个长期目标是，往产业的上游去做。例如，小米将智能制造作为非常重要的场景。除了向消费者直接提供产品之外，小米也希望通过技术来帮助整个国内的制造业提升制造水平，智能制造里非常重要的技术就是AI技术。