科大讯飞胡郁:人工智能的三次浪潮,语音识别实用化得益于涟漪效应

亿欧网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
科大讯飞胡郁:人工智能的三次浪潮,语音识别实用化得益于涟漪效应

【编者按】 人工智能 正在引领下一次技术革命,而语音交互将成为主要应用场景之一。近日, 科大讯飞 执行总裁、消费者BG总裁 胡郁 在小饭桌人工智能 创业 班上发表主题演讲,对人工智能的前世今生、人工智能得以实现的相关解析和人工智能在创业方面的影响和建议进行了分享。

本文转载自小饭桌,亿欧编辑,供行业内人士参考。


人工智能的前世今生

人工智能来自何方

人工智能这一话题,最早可以回溯到1946年世界上第一台电子计算机埃尼阿克的诞生,埃尼阿克产生以后,许多的计算机科学家对于计算机将来能够代替人类做什么事情有很多联想,其中最著名的一个人是图灵,他在1950年左右在人工智能领域进行了很多的探讨,并且提出了著名的“图灵测试”。

而“人工智能”一词真正被提出来,是在1956年Dartmouth的会议上,由四位图灵奖得主、信息论创始人和一位诺贝尔奖得主一起将人工智能的名词定义出来,包括明斯基、西蒙、麦卡塞等等,这次会议被公认为人工智能研究的出生典礼。

人工智能与 机器人 的关系:“机器人”一词出现更早,1920年第一次出现robot这个词,原本是蒸汽机械时代出现的东西,主要为机械原理,跟计算机数字化、数学没有什么关系。但在表现形式上有所不同,比如想要开家里二楼的灯,如果通过人工智能,那我只需要对着系统说一句,系统就会从后台对语音指令进行分析并开灯,如果是机器人,则需要爬到二楼去把灯打开。

正本清源,人工智能(Artificial Intelligence)是指能够和人一样进行感知、认知、决策、执行的人工程序或系统。

人工智能去向何处

人工智能发展的60年不是一帆风顺的,起起伏伏共经历了 三次浪潮 。

1)1970第一次黄金期: 自从Dartmouth会议以后,人们陆续发明了第一款的感知神经网络软件和聊天软件,证明了数学定理,那个时候大家都惊呼“人工智能来了,再过十年机器要超越人类了”。不过,很快到了70年代后期,人们发现过去的理论和模型,只能解决一些非常简单的问题,很快人工智能进入了第一次的冬天。

2)1990第二次黄金期: 随着1982年Hopfield神经网络和BT训练算法的提出,大家发现人工智能的春天又来了。80年代又兴起一拨人工智能的热潮,包括语音识别、语音翻译计划,以及日本提出的第五代计算机。不过,到了90年代后期,人们发现这种东西离我们的实际生活还很遥远。大家都有印象IBM在90年代的时候提出了一款语音听写的软件叫IBM Viavoice,在演示当中效果不错,但是真正用的时候却很难使用。因此,在2000年左右第二次人工智能的浪潮又破灭了。

3)现在到了真正爆发的前夜: 随着2006年Hinton提出的深度学习的技术,以及在图像、语音识别以及其他领域内取得的一些成功,大家认为经过了两次起伏,人工智能开始进入了真正爆发的前夜。

总之,就国内外人工智能公司这么多年的发展来看,使命是内在的,阶段性目标是变化的。

人工智能何时到来

1)人工智能时代的到来离不开人机交互模式的变革

IT产业五大浪潮:自60年代至今,IT产业已经历硬件、软件、互联网、移动互联网与人工智能这五大浪潮,当前我们已进入物联网产业 万物互联 的时代,在无屏、移动、远场状态下,以语音为主,键盘、触摸等为辅的人机交互时代正在到来。

2)在物联网时代下,人机交互主要有两种方式

弱/强视觉呈现语音交互 :当前我们现在主要面临两种交互,一种是只需要语音即可,比如蓝牙音箱、手环等,语音之外,你不需要看到任何信息; 另一种是语音+图像 ,比如电视上的语音交互、手机等。在这种情况下,触摸交互的学术名词应该叫做强视觉呈现的触摸交互语音作为人机交互最自然的方式,将有效促进人工智能与各行业的结合,让人工智能更容易进入大家的生活。

3)人工智能将进入智能+的时代:人工智能与各个行业的深入结合蕴含着巨大的机会。除了交互,人工智能还可以用来在教育、医疗、智慧城市、出行、司法、安全、金融等众多领域;同时,它在各个行业里面可以做一个最简单的事情就是替代人工。德勤的报告显示,人类工种中大概只有20%的工作可以被其代替,其中园丁、清洁工被代替的比例最低,为10%;同时,它开始能够写稿,陈述性的稿件也许比人还要精确。

现在大家能够看到,在将来的10年,人工智能也会像技术的服务进入到我们的生活当中,每个人都离不开。人工智能之所以受到这么广大的关注,不仅仅是因为这个技术炫,而且影响到我们的生活,不仅关系到我们每个人,还关系到我们国家。

人工智能如何得以实现

人工智能的演进发展分成计算智能(能存会算)、感知智能(能听会说,能看会认)和认知智能(能理解会思考)三个阶段。

计算智能就是计算机与人类比存储、比记忆,在此方面已经远远超过人类了。不过,在感知层面,计算机在语音识别、图象识别的方面与人类还有较大差距,让计算机真正能理解、会思考、进行自我学习,还是很欠缺的。

只有实现认知智能的突破,AI才能部分取代脑力劳动,除了语音交互,科大讯飞也在研究人脸识别技术,其特色是可以将人脸识别加上声纹识别结合在一起,特别是用声音,图片混合,来做活性检测。

人类智能与人工智能的区别:这是两种不同形式的人工智能路径——脑科学与人工智能。杰夫·霍金斯在《人工智能的未来》一书中指出,大脑的感知认知机理:大脑皮层区域间的信息传递、多通道感知融合与认知产生。

语音和语言为入口的认知革命:人类从200万年前发展到如今经历了农业革命、工业革命、信息革命,但实际上在此之前还有一次很关键的革命——认知革命。

大约7万年以前,有一种人发生了突破性的变化,使得整个进化和迭代的周期加快,产生认知革命的原因就是7万年以前的这些人突然会说话了,发明了语言。语言的广泛使用,可以表达非常复杂的信息;有了语言以后就可以反馈社会的信息,可以组织和形成更有凝聚力,更大的团体;语言可以传递一些虚构的或者是抽象的概念,有了这样的概念,大量的陌生人就可以进行合作、进行创新,这就是语言的重要性。

语音和语言是认知的基础,人类智能的基奠是语言。 如果机器想要从“弱的人工智能”变成“强的人工智能”怎么办?我们也需要一场认知革命。弱人工智能是指充分利用机器学习和 大数据 方向的最新进展,结合脑科学和数据学习实现人工智能。智能动力学是人工智能的关键。强人工智能是指将脑科学与信息科学形成紧密融合,期待大突破,模拟人脑的工作方式来实现人工智能。人工智能的三大法宝是深度神经网络、大数据、 涟漪效应 。

现代工业界的人工智能为什么能够成功

1) 深度神经网络。 其模型和算法和传统的方法是有本质的不同,虽然它与我们人类的神经网络相比,还有很多不足,但是确实在架构和描述方面有其强大之处。

2) 大数据。 随着移动互联网的迅猛发展,数据每天都是以指数级增加,通过手机和微信等,人们可以随时随地把视觉、听觉上的这些数据轻松地传到网上,汇聚起来形成大数据;

3) 涟漪效应。 随着移动互联网的发展,各种软件、各种设备接触用户的门槛极大地降低了。例如,当一款新的APP找到第一批用户时,他们使用的行为和记录就被后台记录下来了,开发者再对这种行为和记录进行迭代的改进,当再把APP投向第二批用户的时候,软件行为已经比第一代提升了,这就是涟漪效应。

语音识别实用化得益于“涟漪效应”。讯飞的语音识别2010年推出的时候,坦白说它的识别率只有60%左右水平,刚开始大家都觉得很难用,但是有一批尝鲜的用户。随着技术的迭代、更新,以及数据持续的迭代,如今讯飞语音识别率已经达到了97%以上的水平,达到完全实用的状态。 图片识别也同样如此,在ImageNet图像识别任务中,2012年的时候错误率高达26.2%,但是到2015年底已经降到了3.57%。基本上可以说这个技术使得我们只要通过一个摄像头,就能将家中的各种物体很轻易地分辨出来。

因此,可以得出两点结论:深度神经网络与大数据的结合成为当前主流路径;基于互联网和移动互联网的“研究—工程—产品—用户”闭环优化加速了迭代优化进程。

人工智能与创业

从技术层面看,微创新到系统创新 :二者是相对立存在的,微创新体现在产品创新层面,而系统创新资金时间耗费大,从没有到开始立项、最后商用需要15-20年,基本上一辈子只能做出一个。当然,航空发动机是机械工业时代“皇冠上的明珠”,人工智能是信息时代皇冠上的明珠,只有系统创新才能创造出这样的工业艺术品。

从公司竞争角度看,公司竞争到生态系统竞争 :现在的公司竞争不是单独两个公司,而是生态里面的竞争。比如人工智能非常难,创业公司很难独立把它做好,于是各大公司都要做人工智能平台,包括我们的讯飞开放平台,现在已有25万开发者,每天服务超30亿次,连接的数目达90多亿。

同时,在这个过程中,商业模式的创新非常重要,即好的技术创新一定要配合好的商业模式创新。 高科技企业的早期市场和主流市场之间存在着一条巨大的“鸿沟”,能否顺利跨越鸿沟并进入主流市场,成功赢得实用主义者的支持,就决定了一项高科技产品的成败。破坏性创新之父-克里斯坦森提出:“大公司卓越有效的管理对于延续性创新的成功具有决定性的作用,而破坏式创新能够让创业公司和小公司拥有颠覆现有产业链的能力!”

哈佛商学院James Moore和Marco Iansiti教授提出并发展的商业生态系统构造理论成为当前美国IT领域商业竞争战略分析的核心价值理论。“只有成为商业生态系统中的核心节点(Keystone),整合各种资源并带动整个系统的发展,实现共赢,才能够成为真正伟大而有影响力的公司!”

最后,我想给创业者提三点个人建议:

1)去玩儿的事业一定是你真心喜欢的事情,如果你去玩儿还不选你喜欢的事情,我想你一定是神经病。

2)去玩儿的事业,一定要跟你喜欢的人一起去做。

3)玩耍中的过程比结果更重要。谋事在人成事在天,能成为马云和马化腾是历史的必然,但成为这两个具体的人一定有很多未然的因素。改变你能改变的,接受你不能改变的。

所以,我觉得创业不管是做系统创新,还是做产品创新、微创新,我们要以这样的心态,真正去享受到我们生活中的每一个小细节,同时要有使命感与宏伟蓝图。

随意打赏

科大讯飞 人工智能科大讯飞语音识别胡郁 科大讯飞科大讯飞胡郁浪潮服务器浪潮集团
提交建议
微信扫一扫,分享给好友吧。