【环球网科技记者 林迪】“智能和智障的区别,很大部分是要做到‘知之为知之,不知为不知’。在理解的时候快速给答案,不理解时给出合理澄清,不装懂。‘智障’很大部分是不懂瞎说才引起用户的抵触。”日前,百度智能生活事业群组(SLG)首席技术官朱凯华在媒体沟通会上对记者表示。
据数据机构Strategy Analytics最新发布的研究报告《2019年Q2智能音箱厂商&OS出货量和使用量市场份额按区域划分》显示,2019年Q2智能音箱的全球销量持续飙升,达到3030万台,几乎是2018年同期的两倍。国内智能音箱小度Q2以470万台的出货量再次获得国内第一,全球第三的成绩,并进一步缩小与亚马逊、谷歌之间的差距。
在他看来,百度旗下小度智能音箱的持续增长势头背后是强大的技术能力支撑。朱凯华告诉记者:“智能音箱的智能性,一直是用户和行业关注的焦点,也是决定一款智能音箱体验的重要标准。百度技术在音箱的智能性方面可以概括为两大优势,第一是对听清、听懂、满足这三方面的实现能力;第二是做到了真正意义上的软硬件结合,很好地实现了端到端的语音和理解技术。”
听清
简单来说,首先是要做到唤得醒,并且要充分考虑到外部噪音和内部噪音干扰的前提下。在内外噪音的干扰之下,机器能够准确地识别用户的指令,将声波转换为文字,这是需要非常强大和细致的技术支持。小度有严格的测试标准,包括噪音干扰、声源远近等,在诸多纬度的评测中,小度产品的表现,都要更为优异。
听懂
朱凯华坦言,关于听懂这部分,是最考验智能音箱的“实力”。之前有网友评论一些智能音箱品牌的产品像人工智障,其根本原因之一就是没有做到“知之为知之,不知为不知”。市面上一些产品插浑打科地“趣味性回答”,其实并没有做到很好的用户体验,第一次这样互动用户或许会觉得有趣,但是多次如此,用户则会产生抵触和厌烦的情绪。朱凯华现场使用小度演示了真正的智能音箱在遇到这方面难题的解决方案:当他对小度说“我想听….”的时候,小度的回答是,“你想听什么呢?”当他再次说出“我想听刘德华的歌”时,小度响应并播放了刘德华的歌曲。这只是小度“听懂”方面的一个小例子,但这样的能力却已经要高于市面上的绝大部分产品。小度的听懂在于,当它获得模糊需求(不清晰指令)的时候,它会尝试分析和校对自己的指定,以便更准确地满足用户的需求。
满足
智能音箱的满足能力主要看两点,设备的知识完备程度和技能服务生态。
在这两方面,小度都有行业领先的优势。首先因为背靠百度,小度拥有百度十亿级的知识图谱,百亿级的搜索请求,和万亿级的网页内容支持。这在智能音箱领域,是得天独厚的核心资源。另外在技能服务生态方面,小度助手的开放平台上,已经拥有了33000多名的开发者,并且已经累积了2400+的优秀线上技能。
关于软硬一体结合方面的优势,小度推出的全球领先的全双工免唤醒技术,就是最好的证明。虽然此前市面上有其他品牌展示过相关技术的演示,但工业化量产,目前只有小度做到。
朱凯华指出,能够首先推出“全双工免唤醒”有3个必要条件:软件和硬件结合(Hardware Designed for Software);语音识别和语义理解结合,端到端的识别和理解整合的深度优化;所有技术百度都In house具备,能够深度整合。
“软件和硬件要结合,在智能音箱这个行业里面,很重要的一点需要Designed for software。硬件构建的时候,需要为软件的特征进行专门制作。小度在设计的一开始,就对它的声学效果要有非常高的要求,在高噪音的环境下,也可以准确唤醒。这个前提是对于硬件整个声学结构的要求很高,而小度则是从硬件设计伊始就是已经做好了准备。语音识别需要和语义理解完全结合起来,能够做端到端的识别和理解。”朱凯华解释道。
此外,朱凯华还谈到了关于智能家居和语音交互技术的未来发展。他认为,科技不停地向前发展,在技术落地的过程中一定会有各种不同的产品形态,但核心在于,技术能力有没有更好地在阶段时间内满足用户的需求,只有遵循解决用户需求,提供有服务价值的技术,才能够有更持续的生命力和发展空间。