语音交互将成为智能家居产业标配和入口

语音交互将成为智能家居产业标配和入口

语音交互将成为智能家居产业标配和入口



谢冠超 | 云知声IoT事业部总裁

活动:2016年9月27日,由云知声和中国家电网联合举办的智能家电高端峰会在深圳召开。

笔记:云知声   深度好文:4395字 | 6分钟阅读



 独家笔记 



各位嘉宾下午好,非常荣幸跟大家分享一下云知声在家电智能化方面做出的尝试和努力。

  语音交互将成为智能家居产业标配和入口
  

我们看到同样的趋势,整个智能家居市场的规模迅速成长,不管是从全球还是从中国,整个市场规模成长非常迅速,我们看到在2016年,国内市场规模已经接近百亿美元,另外一个我想跟大家说的,我们看到的另一个趋势,智能家居生活正在改变我们的生活习惯,我们看到在家居环境里面不同的智能设备所使用的情况,大家看到基本上覆盖了我们日常生活中所有的电器和设备单品,基本都在走向迅速智能化的趋势,右边这个更有趣,在我们目前看到的整个智能化程度相对最高的家电单品—智能电视,智能电视的智能化程度走得相对比较快。


有几个方面的原因,一个是它本身的交互比较复杂,涉及到非常非常多的内容搜索方面的需求,另外一个它越来越多成为正常的家居环境里面,广大用户获取信息的终端设备,这是我们真实统计的数据情况,我们统计的数据说明在智能电视里面,大家看到除了遥控器之外,越来越多的语音交互技术还有体感手势,这种创新的交互手段被采用,这些交互方式被提供之后,有57%的智能电视用户会选择在沙发上用语音来换台、内容搜索,做这些操作。


语音交互将成为智能家居产业标配和入口
    

在人工智能在家电智能化的过程中我们能起什么作用?人工智能的家电智能化还是在我们目前看到的物联网、大数据时代发生的事情,在整个人工智能基础架构上,这是一个行业的共识了,深度学习到智能计算、感知数据,这些对交互来说,对大部分的设备来说,人机交互从时间和交互体验上占更大的比例,而深度学习是在非消费品的家居里面,比如工业级的应用里面,通过这两种方式应用在了物联网和IoT的应用设备里面,而这些应用因为它提升了用户体验,所以它促进了物联网、IoT智能设备的普及,而智能设备的普及和广泛使用又产生了大量的数据,来增强了我们AI基础架构。


大家知道整个AI技术的发展取决于三个相关条件:深度学习,指的是人工智能的引擎本身。高性能计算是指系统的运算能力,非常容易理解,必须系统有比较好的运算能力,才能够使用比较复杂的引擎,而这两部分从技术发展到今天来讲,都得到了比较好的解决。另外目前对整个人工智能发展最大的局限来源于数据,很容易理解,不管系统有多么强的运算能力,不管我的学习引擎做的多么复杂,多么高效,如果没有足够的数据是产生不了人工智能的,就像一个人一样,不管生下来多聪明,智商多高,如果没有不断从外界环境获取知识,也产生不了最后的智能性。

伴随着人工智能技术在新一代的智能设备上转换使用,我们看到交互方式发生了巨大的变化,传统上我们从最初的PC年代的键盘、鼠标,到以智能手机为代表的触摸屏的交互,我们在目前的情况下看到的确存在更多的创新交互方式,包括语音、手势、图像、体感,目前已经被广泛是用在比较新的智能设备上面。



我们看一下语音的应用, 我们的理解是把整个家电智能化认为分两个不同的阶段,一个是人与设备之间的连接,我们更多强调设备本身的智能性,设备会变得更聪明,人可以用更自然的方式,设备了解人的意图。一种是设备和设备之间的连接,设备具有智能性,设备与设备之间的共享,设备与设备的连接。


人与设备的连接在增强设备的智能性方面,语音产生了比较明确的,相对传统遥控器方式,产生了明确的优势,当然我们可以实现像遥控器这样的远程遥控,另外和普通的遥控器相比,我们有一个命令直达的优势,我们以智能电视为例,基本上还是以传统的IT方式来设计的,如果遥控器需要点播某一个内容的时候,操作分若干部,比如要点播一个电视剧,你需要在菜单里面找到这个电视剧,你的点播不是直达的,而语音非常的方便,你可以直接对着电视说你要看这个电视剧。


我们语音可以解决长尾需求的问题,大家在门口进来的时候看到我们放了一个小床台灯,那个设备是完全没有遥控器的,大家想象一个台灯以前只有一个开关功能,或者在开的情况下,会有若干亮度的选择,但是是不是用户就没有其他的需求,是不是有一些用户有其他的需求没有被我们做出来。我们有了语音可以换灯光的颜色,按不同的场景设计灯光的颜色、亮度,这些是不可能在遥控器上实现的,要在遥控器上实现这样的要求,需要做出若干的按键才能解决。

我们看到以语音交互形态为主的人机交互操控方式将会成为智能家居产业普及的标配和入口,这是我们看到的明确趋势。



我们是这样理解整个语音在智能化交互中的发展路线,我们第一步是说去手机的APP化,智能家居的交互第一代产品就是以手机APP为主的方式,提供了手机APP和设备之间的连接,但是这个局限性还是比较大的,你脱离不了手机,实际上你要在家居环节必须拿着手机才可以,我们能不能丢掉手机,去APP化操作,另外我们非常强调自然语言的交互。


这个非常容易理解,一个设备应该是智能的,它应该适应我的需求,而不是我需要被一些被指令级,去适应机器。远场识别,我们去手机化、去智能化,如果还要拿着语音遥控器,没有产生本质的区别,我们非常强调远场。模块化、标准化,因为整个产业环境,各位很多是家电行业的前辈,不需要我多讲,整个产品更新换代非常非常快,所以我们必须提供一个标准化、模块化的接口,能够让各位在家电行业做开发的时候,迅速实现产品上市。

这是我们在第一步实现的,第二步我们目前正在做的就是在模块化、标准化上面,我们会做进一步的努力和尝试,强调一个低成本、低功耗,低成本毫无疑问就是说,整个智能家居、智能家电的构成非常复杂,有一些售价比较高的单品,也有一些售价相对比较低一些的单品,如果我们的成本不能做到足够低的话,我们只能在比较高端的产品上被采用,这是我们现在的使用场景。


低功耗,因为在类似一些空调的单品上,节能、绿色,因为语音解决方案强调的是随时可以唤醒,始终处在待机的状况下来,功耗非常的重要,实现低功耗、低成本我们采用的是集成化、芯片化,我们会进一步推进自由说在线识别,所谓自然语言,我们的理解是更多的我对用户可能会使用到的指令做了预置,我们做的自由说在线识别是真正做到了用户无论怎么说都可以理解。这是我们本身计划的技术路线图。

这是我们在智能家居方案中的一些技术亮点,或者我们认为的挑战。自由说在线识别使用到了深度神经网络和全智能交互这两个技术,另外两个是和人工智能的认知部分关系不是特别密切,但是它是我们定义为感知智能的部分,这两个问题解决得好不好,低功耗和麦克风阵列解决得好不好,会极大的影响到用户的感知体验,对用户来说识别率低和反映慢,这两个是工程性的问题,但是极其影响用户的体验。


另外一个是远距离的识别,我们现在所有的在家居行业提供的支持远讲方案都是支持识别距离5米,5米是非常具有技术挑战点的原因在于几方面,家居环境本身,当我们用在类似空调、抽油烟机、电视设备上的时候,本身有比较强的背景噪音,空调压缩机、抽油烟机的风扇,另外在远距离的时候会存在声音的非线性衰减的问题,这构成了整个智能家居解决方案的亮点,这些问题都得到有效解决之后,大家才会看到我们今天所提供的这些方案和落地产品。提供了一个相对让用户满意的体验。

我简单给大家介绍一下云知声在这方面做的具体工作。云知声是一个四年的创业公司,创业初期我们在技术上做了一些行业里面比较有突破性和创新性的尝试,在公司成立之后的6个月里面,我们是国内第一家把深度学习的技术运用在语音识别方面,我们上线了服务,在业界影响比较大,基本上跟行业里面的其他厂商比,我们在识别率上领先了10%左右,算是当时在行业里面比较标志性、比较有影响力的实验。我们在资本市场完成了A轮、B轮的融资,在智能家居行业,我们在2015年9月,完成了整个智能家居方案的发布。


语音交互将成为智能家居产业标配和入口
    

这个谈到的是产品体系问题,云知声提供的是从云端到芯片端的完整解决方案,云知声作为一个公司主要专注在四个业务领域,有两个垂直行业,教育和医疗,主要是基于云端的人工智能和语音服务,另外就是解决了云端的问题,还必须解决设备端的问题,所以我们提出AI、UI的交互服务产品,主要运用在车载上面,另外一个我们还必须解决终端感知的问题,除了前端,比较解决感知的问题,谈认知才有意义,主要是AI芯的问题,AI、UI也是运用在AI芯上面。

云知声 核心技术图谱架构,我们以语音识别为最初的切入口,延伸出语义理解、语用计算、自然语言生成,和人声交互的时候,会有语音的ATS的合成部分,下面是我们自学习的架构,能够持续的提供更好的用户体验和服务,我反复在里面讲到语音计算,我后面会谈一下语音计算的问题。

我们分为感知和认知部分,云知声在过去几个月里面完成了我们新的引擎升级,升级之后整个识别错误率降低了20%,识别速度提升了40%,又一次我们发布了第一个语用计算引擎。 语用计算是云知声在两个月前提出的一个想法,一个概念,我们语用计算的核心含义是我们以语境为中心,跨越垂直行业,跨越交互形式。


大家看到有几个特点,1、它有上下文的理解能力,当你前面问我青蜂侠的时候,后面再跟我说在附近定一个什么东西的时候,我有上下文的理解能力。2、它可以跨越从问答聊天到问,可以把所有的场景连接起来。云知声还有用户帐号的问题,我们强调针对特定用户,对特定用户的使用习惯的学习和自动适应,另外一个就是跨越垂直领域,跨越场景,场景是非常重要的一个部分,这是目前在我们的AI、UI产品里面全线升级为支持语用计算的引擎了。


语音交互将成为智能家居产业标配和入口
    

简单介绍一下我们目前在智能家居的应用上的产品,我们叫IVM—M,智能语音模块,我们提供的是软硬件一体的解决方案,模块化、标准化的。它提供了语音唤醒、离线命令的解决、真人录音、TTS、我们的语音唤醒是一个非常高性能的唤醒引擎,唤醒时间小于500ms,说话任务管,支持带口音的普通话,完全的方言现在还没有做到,我们支持30—300条离线命令词,300条命令词基本已经超过一个正常人能够记忆的极限了吧。

我们整个产品的几个特点简单介绍一下。集成度高、可靠性高,缩短产品上市时间,我们提供的是一个完整的软硬件一体的解决方案,用户通过一个标准的串口跟自己原来的设备做适配就可以了,整个的语音识别和控制都在我们的硬件上实现。

第二个就是我们支持一些个性化的定制,差异化的需求,不同厂商、不同产品系列有按照自己的产品定制需求,我们的离线命令词也可以定制,以支持不同的产品功能控制,根据不同的产品形态,离线命令词的定制,可以灵活定制。

基本上我们的产品有这样6个特点,我想强调的是这样几个,一个是唤醒,灵敏的唤醒是保证用户第一体验的感受,一个设备如果不能被灵敏的唤醒,用户跟他尝试几次之后,产生挫败感,基本后面的用户体验一定不会太好。

另外一个就是说,引导用户操作,我们设计了比较好的交互逻辑,让用户不支持,可以给用户良好的操作,不至于让用户不知道干什么。还有自由的打断,当机器进行语音播报比较长的反馈时,用户可以打断它,你不想听它不停重复一个回馈的时候可以打断它,比较人性化,我们所追求的就是面向人和人的正常交互方式。 这是我们IVM在今年行业里面应用的情况,包括空调、电视这些产品形态。

我要讲的就是这些,谢谢大家。


语音交互将成为智能家居产业标配和入口



交互是语音,感知是传感器,网关将逐步退出舞台。

关注“智能空间”,了解未知世界吧。



语音交互将成为智能家居产业标配和入口


来源:云之声

随意打赏

智能家居 人机交互语音交互 智能家居智能家居语音系统语音控制智能家居机器人语音交互智能语音交互语音智能家居语音控制家居海尔智能家居智能家居交互
提交建议
微信扫一扫,分享给好友吧。