小冰、小娜Cortana、Siri、腾讯小鲸、出门问问、科大讯飞、度秘……哪家语音语义技术牛?

虎嗅网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

从1945年到2015年,以人工智能为题讲述了许多很美的故事,模仿游戏便是其实之一。但春冬轮回,在人工智能的世界里,人们的幻想像一个小球一样,被抛得高高,也注定摔得惨惨 (1974与1987年两次人工智能寒冬)


这一次,人们对人工智能的幻想被扔得更高了。强人工智能、机器毁灭人类的说法时常有。但这更像是预言家的说法,像阴谋论。目前的人工智能还是基于逻辑与数据、没有直觉,对情感的理解与创造力更是无从谈起。


球被抛得高就一定会落得惨,甚至摔得粉碎。不过,做工程的人更谨慎些,要给这个球栓上一根绳子。这根绳子就是“从实际应用出发、从用户角度考虑”。


语音语义的现状可以大致描绘人工智能在工程界的应用情况。有自主语音语义相关技术且可以在国内使用其服务的几家公司有:出门问问、科大讯飞、云知声、思必驰、百度 (度秘)腾讯 (腾讯小鲸) 以及Google (Google Now)微软 (小冰、小娜Cortana)苹果 (Siri)


到底哪家的语音语义技术牛?


微软小冰属于聊天机器人,主打人机对话,每周例常解锁一种玩法。但微软小冰不能提供太多的实质性的服务,比如查询机票、查询车票、叫车,这些出门问问却能做到。


如何客观的评价技术的优劣?在这个信息交流特别频繁的时代,被使用的人工智能算法大都来自学术界的公开成果,很难有一家公司拥有不属于这个时代的技术。就从语音识别的角度上讲,各个公司的识别率大都在90%以上 (这个问题实际上要复杂些,比如方言识别率、生僻词识别率等就有更多说法了) 。当一家公司的技术只比另一家的好5%或者1%,用户便很难感受到优劣,技术被应用的场景便成了重要的不同之处。


人工智能语音语义系统的基本实现方法


这些公司的语音语义技术都和“云”离不开关系。人工智能系统按照一套逻辑推理程序,在海量的数据中寻找其认为最正确的答案。这就意味着,被使用的人工智能系统其覆盖的领域越广,就越是对数据以及运算能力饥渴。小型离线设备,如手机、家用电脑都无法满足这样的需求。解决办法是搭建一个拥有超强处理能力以及海量数据的“计算机集群”,并将其接入网络,也就是我们所说的“云”。搭建了AI语音语义系统的云就是AI语音语义云,是这些AI公司的基础设施。


搭建了智能云之后,还需要合适的语音输入端口。这个端口可以来自公众号、APP这类软件,也可以来自音箱、可穿戴智能手表这类硬件。


如何正确看待目前市面上知名的语音语义系统?


虽然人工智能系统的概念很广,具体到语音语义的概念还是很广,因此这么多类似但不同的人工智能公司在不同方向上深耕。从用户角度看,这些产品的不同之处还蛮大。


擅长搜索查询消息的个人助理的有腾讯小鲸和出门问问


1、腾讯小鲸 目前公开的信息较少,主要被嵌入TOS系统。与Ticwear类似,TOS系统被搭载在智能手表当中。不过,小鲸的功能与其他语音助手类似,可以设置闹钟、查询信息,但不能像出门问问那样直接叫车、订咖啡。


有资料显示,曾在GoogleBrain工作过的工程师创立了名为ScaledInference的公司,该公司的种子轮投资者就包括腾讯首席探索官David Wallerstein和腾讯本身。另外,也有消息称,腾讯没有停止其他视觉识别产品的研发。


这有点像微信当年的研发。


2、出门问问 主要做2C (面向消费者) 硬件产品,其智能手表Ticwatch是国内销量较高的一款全交互智能手表。出门问问的人工智能语交互技术自成体系,包含语音识别、语音合成 (TTS) 、语义理解、垂直搜索、智能推送5个部分。其最大的特点是可以语音呼唤本地化生活服务,导航、看新闻、查天气等都可以通过手机APP或者手表实现。


最近,出门问问推出了内测版的“魔法小问”,要把人工智能从查询信息——如“今天有什么电影”——提升到提供完整服务,如直接帮助用户订电影票。这一点是其他智能系统做不到的。


擅长连续对话的“聊天机器人”有图灵机器人和度秘


3、图灵机器人 主要做2B业务,其语音语义系统与小冰很相似,是连续对话机器人。图灵可以被嵌入微信公众号、APP、网站或者智能硬件,用户可以让它讲笑话、做游戏,也可以用它查快递、查新闻。最近图灵机器人接受了奥飞动漫的投资,走智能儿童玩具的路。


4、度秘 是百度推出的一款与小冰类似的连续对话机器人。另外,用户可以在对话的同时,查询“图灵是谁”这样的信息——这借助了百度的搜索引擎。最近,百度推出嵌入了”度秘“的实体机器人”小度“。


还有一类人工智能系统即不是助理也不是聊天机器人,而是被用于做智能语音交互解决方案,他们有讯飞语音云、云知声的、思必驰


5、科大讯飞的“讯飞语音云” 包括语音合成、语音识别和搜索、语音听写等技术,该云对方言、生僻字的语音识别率较高。讯飞语音输入法就是基于此云开发的。科大讯飞“主要”做的是2B (面向企业用户) 服务,将自己的人工智能服务授权给其他企业。


另外,科大讯飞在最近几年也开始发力2C (面向消费者) 的产品,比如智能音箱、录音宝、录音笔等硬件。可以看到,科大讯飞的产品多是智能化的传统产品,而非个人助理或聊天机器人。另外,科大讯飞偏向深耕“语音识别”,而非连续对话。


6、云知声 主要做2B业务,方向是智能家居和车载市场,这里便有了与出门问问类似的“软硬结合”的概念。


与“可穿戴设备、手机及电脑上的智能语音语义系统”不同,智能家居语音系统的声源可能很远且被噪音包围。也正因此,云知声把推广的重点放在了“声源识别、噪声抑制、回声消除”以及指令的识别上,而非对用户意图的理解上 (语义理解)


值得一提的是,在京东与科大讯飞宣布“在一起”的时候,阿里与云知声就达成了合作。不过,最近一段时间,未有相关消息。


7、思必驰 与云知声的方向挺相似,为企业客户提供智能硬件语音交互方案,比如通过语音控制智能硬件的开关。思必驰在车载领域的合作多一些,比如车萝卜。最近,思必驰又宣布完成了融资,要把“智能语音融进硬件”这条路走得更远些。


8、小冰、小娜(Cortana)、Siri和Google Now


Cortana、Siri和Google Now,即是聊天机器人,也是个人助理。


微软小冰与微软小娜都基于必应搜索和深度神经网络等技术,属于2C产品。微软小娜如今可以在iOS、Android、Window 10系统中使用,她更像一个秘书,可以打电话、发短信、发邮件以及查询上一场曼联的比分。但是微软小娜在国内手机中的功能少很多,语音响应很慢。


微软小冰作为一个对话系统,入驻于微信、微博等应用或者Windows 10系统中,她也可以查询各种信息。与小娜不同,小冰不可以调用电话等应用,她更像一个虚拟人物,可以陪用户聊天 (连续对话) 、玩游戏 (基于图像识别等人工智能技术)


总的来看微软小娜和小冰代表着微软的两个方向:小冰连续对话能力强,可移植行强,因此可以嵌入到微信、微博、美拍等应用中。小娜是Window 10配套的人工智能系统,能够调用Windows 10中的各种应用和数据,被视为个人助理。


Siri 大家熟悉,是一款可以调用应用的聊天机器人。如今的Siri除了定闹钟、发短信以外,还可搜索照片、播放音乐、提供建议。它或许不是最强大的,但更面向用户。


Google Now 在国内无法良好的使用,对中文的识别效果很差,中文版的能力也很弱。但是作为Google的产品,它天生便有了比其他人工智能产品更多的数据、更好的数据挖掘能力,这使得Google Now成为了一款“主动推送”能力很强的助理产品。


Google Now凭借与Chrome浏览器、Gmail、Google日历等等Google应用以及Android系统的“近亲关系”,使得其可以实现很多其他产品做不到的功能。比如,语音解锁、任意界面“OK,Google”唤醒、主动推送你喜欢的和你需要的“即时帖”。有人曾称赞:


“早上醒来,我惊奇的发现Google Now居然直接告诉了我去兼职工作的路上所要花费的时间。但是我没有设置,而且那不是我真正工作的地方。”


可以看到,Google从用户的地理与实践信息中明白了他何时去何地兼职。但仍需强调,Google Now在国内的功能很少,而且实现一些即时功能,用户必须把个人数据交给Google。


作为巨头推出的产品,小娜、Siri和Google Now经常被媒体用来比较,但这种比较有些不太恰当。一方面,几款产品中,只有Siri的易用性在国内不错。另一方面,人工智能系统要明白用户的用意,必须获取数据——越多越好。因此,人工智能系统必须入驻更多的软件或者平台,获取更高的权限。小娜虽然入驻了Android与iOS,但她仍然是微软的产品,在Windows 10上才有更好的易用性。同样,Google Now与Siri分别是Android阵营与iOS阵营的产品,前者擅长挖掘数据、主动推送,后者擅长聊天、被动建议。


可以看到,这些语音方面的人工智能公司有业务2B或2C的,选择软硬结合或者只做软件解决方案,深耕智能家居或者智能穿戴。这些选择,无分对错或者好坏。但总体来看,人工智能仍然没有认知能力,人与人工智能聊天又涉及到感情投入——这是一个超出自然科学范畴的问题。用户对智能家居的认知度还不够高,相关产品不够成熟、定价不够亲民。这样看,搞智能家居系统这样的生态,似乎有点望得太远。


因此,人工智能在普通消费者身上的落地是否可以先在“一个点”上引爆,比如人工智能系统作为助理,从仅可查阅机票信息提升到可以提供订票服务。

*文章为作者独立观点,不代表虎嗅网立场
本文由 科技行业观察 授权 虎嗅网 发表,并经虎嗅网编辑。转载此文章须经作者同意,并请附上出处( 虎嗅网 )及本页链接。原文链接http:http://www.huxiu.comhttp://www.huxiu.comwww.huxiu.comhttp://www.huxiu.comarticlehttp://www.huxiu.com137733http://www.huxiu.com1.html

本文被转载1次

首发媒体 虎嗅网 | 转发媒体

随意打赏

  • 一分钟读懂腾讯一季报:毛利同比增23% 视频号、企业服务等多引擎发力

    砍柴网  • 
    5月14日腾讯控股发布2024年第一季度财报,当季腾讯实现营收1595亿元,毛利838.7亿元,经营利润(Non-IFRS)586.19亿元,净利润(Non-IFRS)502.65亿元,毛利、经营利润(Non-IFRS)以及净利润(Non-IFRS)同比增速分别达到23%、30%、54%,均继续跑赢收入增速。在视频号、
  • 《报告发布,腾讯云、华为云、Aloudata等入选》

    砍柴网  • 
    近日,国际知名数据咨询机构 IDC 重磅发布了《IDC PeerScape: 金融 领域中数据管理分析服务最佳实践案例》报告,Aloudata 与招商银行联合打造的 DDH 数据研发运维一体化平台成功入选,Aloudata 的技术、产品实力,以及在金融领域的实践应用价值,再获权威认可。
  • 腾讯音乐Q1超预期:总收入67.7亿元 在线音乐付费用户净增创新高

    砍柴网  • 
    中国深圳,2024年5月13日 – 中国领先的在线音乐与音频娱乐平台腾讯音乐娱乐集团(以下简称“腾讯音乐”)(纽交所股票代码:TME及港交所股票代码:1698)今日宣布其截至2024年3月31日止第一季度的未经审计财务业绩。2024年第一季度,腾讯音乐整体业绩表现稳中有进,并超出市场预期。第一季度,腾讯音乐娱乐集团总收
  • QQ微信上线地震预警功能

    i黑马  • 
    5 月 13 日,据“腾讯”官方公众号,腾讯为 QQ 平台上线地震预警功能,同时还升级了微信平台预警功能及“四川省地震预警平台微信小程序”,实现四川全省 5 级以上地震在震后 5-15 秒发布地震预警的能力。文章评价匿名用户发布发布
  • 2024中国品牌价值榜发布:字节跳动、腾讯、工商银行位列前三

    i黑马  • 
    上海企业文化与品牌研究所发布“TBB中国品牌价值榜(TOP100)”,字节跳动以近万亿的品牌价值首次入榜并名列百强榜榜首,腾讯、工商银行分列二、三位;阿里巴巴、华为、中国移动等均进入前十榜单,分列第四、第七、第八。文章评价匿名用户发布发布
  • 腾讯云大数据TBDS数据湖荣获IDC金融领域最佳实践案例

    砍柴网  • 
    国际权威市场研究机构IDC近日发布了《IDC PeerScape: 金融 领域中数据管理分析服务最佳实践案例》报告,腾讯云大数据TBDS和某股份制银行的存算分离数据湖项目凭借其 领先的技术架构、强大的数据能力以及全面的国产化适配 ,荣获该报告的 最佳实践案例 。
  • 深圳数据交易所联合腾讯云,数据交易全流程创新应用区块链技术

    砍柴网  • 
    近日,深圳数据交易所(以下简称“深数所”)正式上线全国性全流程数据交易服务平台,为买方卖方、数据商、数据经纪人、第三方专业服务机构提供主体认证、供需发布、产品登记、合规审查、交易撮合、交付管理、清结算等全生命周期流程化线上化服务能力。 深数所依托腾讯云 区块链 服务平台(Tencent Bloc
  • 腾讯云携手阿布扎比文旅部,打造“体验阿布扎比”一站式旅游智慧服务小程序

    砍柴网  • 
    5月10日记者获悉,腾讯云与阿布扎比文旅部共同打造的“体验阿布扎比”游客服务小程序已经上线。小程序通过整合当地的旅游信息资源,为游客提供一站式智能化游览服务,提升游客游玩体验。这款小程序集餐饮、住宿、交通、旅游、购物、娱乐等多元化信息与一体,提供包括门票预定、行程规划、景点状况、语音导览多项在线功能,覆盖旅游前、中、后
  • 独家丨腾讯云产业生态合作负责人轮岗调整,杨晨接管

    雷锋网  • 
    近日,据雷峰网独家获悉,腾讯云副总裁、产业生态合作负责人王峰或将转岗至金融云部门,原腾讯云副总裁、腾讯政务总裁杨晨或将接管腾讯云产业生态合作部。王峰是To B行业的老兵,在加入腾讯云之前,先后任职于IBM、联想、浪潮等科技公司,担任高管职务,拥有深厚的ToB&ToG的企业和政府信息与数字化转型经验。2023年年
  • 阿里腾讯押注,这个自动驾驶独角兽被曝赴美IPO

    i黑马  • 
    来源:直通IPO(ID:zhitongIPO)作者:王非不到五年,累计融资超12亿美元。又一家自动驾驶公司,被曝赴美IPO。 继2020年初、2023年3月接连被传考虑在美国或香港IPO后,外媒近日再次发出消息称,北京初速度科技有限公司(Momenta)已秘密启动在美国进行IPO的程序。 外媒称,Momenta正与中金
  • 科大讯飞董事长成为蔚来第50万台量产车型的车主

    i黑马  • 
    5月9日,蔚来50万台量产车下线。科大讯飞董事长刘庆峰成为蔚来第50万台量产车型的车主。在活动现场,刘庆峰戏称自己的迈巴赫,在路上没有蔚来快。“我亲眼看着那辆灰色的ES8,快得像一道闪电,超过了我的迈巴赫。” 此外,刘庆峰还现场夸赞蔚来创始人李斌颜值:“他不仅是中国最早洞察新能源汽车纯电汽车战略未来的极少数几位,而且在
  • 讯飞星火“云边端”解决方案亮相北京车展,科大讯飞重塑“大模型+汽车”新生态

    砍柴网  • 
    4月25日至5月4日,2024(第十八届)北京国际 汽车 展览会(简称“2024北京车展”)在北京举行,10多个国家和地区近500家海内外知名零部件企业及 科技 公司参展。人工智能技术龙头企业科大讯飞携自研的最新一代“讯飞星火+座舱”解决方案亮相北京车展,为汽车产业的人车交互体
  • 讯飞星火V3.5春季上新,科大讯飞首发星火图文识别大模型

    砍柴网  • 
    4 月 26 日,科大讯飞发布讯飞星火 V3.5 更新版本,首发星火图文识别大模型,赋予大模型感知现实世界的能力。这标志着国产大模型在支持图文输入领域的一次重要突破。事实上,尽管先进的大模型在语言交互方面展现出了卓越的能力,但它们在图文识别领域的表现却不尽如人意。去年10月,华南理工大学针对此前发布的 GPT-4Vis
  • 科大讯飞的2023年:营收净利双增长,生态属性持续增强

    砍柴网  • 
    在经过的近一年的与通用人工智能深度拥抱后,4月22日,科大讯飞交出了2023年考卷,发布2023年年度报告。报告显示,营业收入196.5亿元,同比增长4.41%;归属于上市公司股东的净利润6.57亿元,同比增长17.12%。同时研发投入持续增加,达到38.4亿元,同比增长14.36%,占营收比重达19.53%,人工智能
  • 科大讯飞2024年Q1营收同增26.27%,讯飞星火APP位列国内工具类通用大模型安卓端下载量第一

    砍柴网  • 
    4月22日晚间,科大讯飞发布2023年财报及2024年一季报,财报显示,2023年科大讯飞实现营业收入196.5亿元,同比增长4.41%,归母净利润为6.6亿元,同比增长17.12%。 公司开放平台及消费者业务实现营业收入61.9亿元,同比增长33.4%,占总营收的比重为31.47%,这也是该业务营收占比首次超
  • 科大讯飞助力中智卫安,打造迎宾服务机器人VOCA

    砍柴网  • 
    在人工智能的浪潮中,大模型技术正以其强大的数据处理能力和深度学习能力,引领服务机器人行业进入一个全新的发展阶段。这种技术通过模拟和扩展人类的认知功能,极大地提升了服务机器人的交互体验、决策制定和个性化服务能力。它不仅优化了用户体验,还拓展了服务机器人的应用范围,从而为各行各业带来了革命性的变化。随着大模型技术的不断进步
  • 科大讯飞2023年营收持续向好,开放平台收入同比增长41.61%

    砍柴网  • 
    4月23日,科大讯飞发布2023年年度及2024年Q1业绩报告。2023年营业收入为196.5亿元,同比增长4.41%;归属于上市公司股东的净利润为6.57亿元,同比增长17.12%。 受星火大模型强势带动,2023年,科大讯飞旗下各主营业务表现良好,其中 智能硬件 业务收入同比增长了22.35
  • “超级知识助手”来了,科大讯飞发布首个长文本、长图文、长语音的大模型

    砍柴网  • 
    砍柴网讯 4月26日,讯飞星火大模型V3.5(以下简称“讯飞星火”)春季上新。面向用户高效准确知识获取的痛点,科大讯飞发布业界首个长文本、长图文、长语音大模型,不仅能够把各种信息来源的海量文本、图文资料、会议录音等进行快速学习,还能够在各种行业场景给出专业、准确回答。 科大讯飞进一步升级星火语音
  • 科大讯飞AI学习机新品S30,满足家长们的“既要又要还要”

    砍柴网  • 
    想买学习机,却不知道选哪款合适,这是眼下很多家长会遇到的一大难题。特别是那些孩子正处升学关键期,使用学习机越来越高频的家庭,家长在选购学习机的时候就更纠结了。为了拯救家长们的“选择困难症”,更为了给孩子们带去极致的学习体验,4月24日,科大讯飞AI学习机郑重推出新品S30。作为科大讯飞的又一诚意力作,主打AI 1对1个
  • 科大讯飞2023年净利润同增超17%,大模型商业效应开始显现

    砍柴网  • 
    对于科大讯飞来说,2023年是不很平凡的一年,这一年,科大讯飞加大投入,积极加入大模型阵营,从而在一定层面上影响了营收,另一方面,2023年也是科大讯飞大模型有所回报的一年。据4月22日晚间科大讯飞发布的2023年财报显示,2023年科大讯飞实现营业收入196.5亿元,同比增长4.41%,归母净利润为6.6亿元,同比增
  • 评论
提交建议
微信扫一扫,分享给好友吧。