科大讯飞:AI图象技术会结合产业优势,看好个性化学习中的应用

亿欧网  •  扫码分享
科大讯飞:AI图象技术会结合产业优势,看好个性化学习中的应用

6月27日,科大讯飞举办投资者关系活动,董事会秘书兼高级副总裁江涛负责接待。

近期, 中科曙光 被列入美国商务部工业与信息安全局的“实体清单,引发市场讨论和部分焦虑 。科大讯飞持有智能芯片公司 寒武纪 部分股权,董事会秘书兼高级副总裁江涛回应: 科大讯飞在 AI计算领域 具备自主可控的能力,所有人工智能核心技术全部是来自于我们自主研发,拥有自主知识产权,在AI技术上不需要任何人的授权。

此外,科大讯飞解答, 公司近年在 图象领域 的发力,还是跟产业的比较优势能够结合的。未来在图象领域看得非常清楚的增长点,就是个性化学习。

亿欧智慧城市对公告进行二次编辑,供读者参考。


一、董事会秘书江涛先生介绍产品及业务进展情况

各位投资者大家下午好,我是科大讯飞的江涛,感谢安信证券安排的这个机会,我们跟投资人电话会议交流。

今年年初我们董事长在各种场合下都在对外说,科大讯飞经历了从人工智能1.0到人工智能2.0的一个过程。人工智能1.0是什么呢,我们2014年发布了讯飞超脑,就是从“能听会说”到“能理解会思考”,在整个人工智能还没落下来之前,我们已经在扎扎实实投入了。

2015年上半年,讯飞的董事会给经营班子定下这样的任务,未来几年科大讯飞的经营班子,管理班子对公司经营三大关键任务, 第一保持销售收入和毛利的快速增长;第二用户规模,AI、人工智能用户的规模快速增长,第三亘古不变的,科大讯飞必须保持核心技术全球领先。

从2015年到2018年,我们很快完成董事会交给的任务,销售收入和毛利基本上按照50%的速度在增长,无论是我们开放平台的用户规模,还是我们在教育、医疗、办公这些平台上的规模都实现快速增长。另外以2018年为例,从“能听会说先到能理解会思考的”顶级的人工智能竞赛中,科大讯飞代表全球取得最好的成绩。

人工智能1.0阶段是一个探索过程,但人工智能整个场景应用下,究竟哪个产品能够率先跑出来,我们2015年到2018年几年的探索,最重要成果是有一批单产品能够做到几十亿、上百亿的产品跑出来了,所以自然而然就到了我们人工智能2.0阶段。人工智能2.0阶段是一个AI红利兑现的阶段,相对于我们在前几年长期积累的人工智能的应用,到了最先商业化价值的阶段。我们过去几年有一批产品能够跑出来,未来几年这些产品逐步的在落地的阶段,这些产品最重要的。

典型的产品,第一个就是大家比较关注的2C消费者中间的办公产品 ,我们5月份发布会上,科大讯飞发布一系列围绕办公这些产品,在我们去年已经有的会议系统和麦克风阵列基础上,会议系统是几十万的系统,麦克风阵列一千块钱的产品的基础上,我们这次521发布会上把全线产品全部补齐了,两千多块钱的录音笔,五千多块钱的转写本,两万多块钱视频会议记录系统,到几十万的便携式的转写机,科大讯飞围绕办公这个产品线已经基本上就绪,办公这个产品基本逻辑是,我们在线的各位投资人也都是典型的脑力劳动者,脑力劳动者在工作过程中会产生两类非典型结构化信息,一类我们在讨论、交谈、会议演讲培训过程中产生的声音,过去这些声音说完了就说完了,没有留下沉淀,通过我们的语音转写技术,这就是全球目前唯一达到高准确率的语言转写技术,把会议交谈这些声音转成文字,这是一类。

第二类就是以我们的转写本为代表的 ,大家手写的信息转成结构化信息,未来多年可以检索,可以总结,可以提炼,可以统计可以分析,把声音和手写的文字变成结构化信息,对于所有办公室白领来说都是辅音,相当于它的知识可以长期管理下来,这个市场空间至少是百亿级的,科大讯飞我们在市场上还没看到跟讯飞PK的产品,所以我们对这个产品下的增长,我们是充满信心的。

第二个产品就是我们的个性化学习 ,我们从2015年开始,费了很大的力气做了高强度的投入,到现在为止,全国已经15000多个学校布局了我们的智学网系统,我们的平台给学校的老师命题,出卷子,改卷子,在这个过程中支持他上课高效率讲评卷子,帮助老师大幅度减少时间,减少工作量,在这个过程中我们收集到了孩子过程化学习数据。

我们2015年到现在智学网的布局,绝大部分学校可以免费提供,我们做了大量的投入,这些投入在过去几年,一定程度上形成了影响,但是我们觉得这都是值得的,为了讯飞有更大的未来。

去年我们开启智学网商业化,以个性化学习产品为代表,去年已经有规模化的收入了,今年在这个基础上会上一个很大的台阶。就是我们智学网平台在收集到了孩子的过程化学习数据,包括他的周考,双周考,月考,期中,期末考试信息以后,机器能够理解,哪个孩子在哪个知识点上掌握有薄弱环节,针对这个孩子的层次和水平,给他提供一个适合他的个性化学习的材料,包括哪个知识点他要学习,哪些题目他要做。去年我们在小一千的学校进行商业化试点,取得了很好的成功,让孩子在大幅度节约重复做题时间基础上提高了学习效果,所以我们现在对这个业务方向充满了信心,未来我们相信至少是个百亿级的市场,中国有这么多高考、中考的学生,每个学生面临最大的问题就是在高考、中考的复习中,如何能提高效率,提高效率最好的办法就是减少无效的重复的做题。过去依赖老师的责任心和记忆力,现在能够通过跟踪孩子过程化学习数据,已经给每个孩子提供点对点的个性化指导,将持续为每个孩子,让他们用更短的时间起到更好的学习效果,把更好的时间做体育锻炼,看课外书,我相信对整个中华民族的素质提高都非常有意义。

另外一个我们看得比较清楚的增长点,就是我们的司法, 无论是公安、检察院还是法院,还是司法,整个过程都要求可追溯,可留痕 ,把过程中的信息能够记录下来,这是中央政法委提出来的要求,这也是未来法治中国的要求。过去这些司法领域的工作者,工作强度很大,要把这些过程记录下来,我们去年推出了庭审和审讯系统,很好地解决了这个问题。这些司法工作他们典型的工作场景就是谈话,我们机器能够把谈话的过程全程的记录下来,帮助他们大幅度提升工作效率,同时也是有力的推动了法治中国的进程。所以这块的市场空间也是非常大的,我们的产品,无论是方言的兼容性,还是说对司法领域专业名词理解的准确度,识别的准确度都是在业界遥遥领先,拥有垄断的市场占有率。所以在未来一段时间,这个也会成为科大讯飞一个重要的增长点。

另外我们这次正在进行的融资,我们对外披露科大讯飞人工智能开发平台,现在也在保持一个稳健的增长态势,我们把语音和人工智能的核心能力开放给业绩的开发者,让各位在科大讯飞的基础上做各种各样的应用,这块整个增长势头也还不错。科大讯飞我们人工智能算法,无论在用户的精确画像,还是在流量上都为我们广告金主创造了大量的价值,所以也不断得到市场大量的验证。

二、问答环节

问:好的,感谢江总,非常详细的介绍。我们这边把我们这边普遍关注的问题请江总解读一下,第一个资本市场大家最关注的,因为去年下半年我们人员增长出现一个拐点,大家今年比较关注,今年以来我们人员增长大势的情况,跟去年相比怎么样?

答:2018年半年报交流会上,我们董事长对外宣称,我们整个核心岗位一些关键人员基本上已经基本到位,所以从去年下半年到今年上半年整个来看,虽然今年上半年具体的数字还没有,但是我们可以从整个趋势来看,我们现在对人员的控制非常到位的,全年大概会在5%左右的增幅,大概是这么一个情况。

问:那么第二个我们大家普遍关注的,大家看到我们翻译机销售数据非常惊艳,另外大家也看到,咱们翻译机也是同类产品最贵的,2.0应该接近3000块钱,最新3.0好像又到了3400多块钱,大家对讯飞感到很认可,也比较好奇,为什么我们价格那么高还能卖得那么好?

答:我们2.0销售30万台,随着我们整个机器翻译和机器持续的进步,我们在翻译机的品类上,也有越来越多的用户反馈,他们需要这种性能更强,功能点更丰富的产品。所以我们从3.0整个机器和2.0来对比,我们大概从几个方面看,为什么它比2.0要贵500块钱。从硬件参数上来看,首先大家可以看到3.0我们整个屏幕比2.0大,我们3.0是3.1寸的,所以用户在使用应用性上会更好。另外它的CPU现在是8核,2.0还是4核的CPU,我们在翻译机前后有麦克风阵列,我们现在也已经换成四麦二代的阵列,所以它收音降噪效果相比前几代更好,还有扬声器和硬件上都做了进一步优化。包括我们从2.0开始支持的拍照翻译,在3.0上我们把摄像头又作了进一步性能的提升,包括自动对焦闪光灯,这些都比2.0更上了一个量级。包括我们电池容量待机的时长。另外本身从我们最强的翻译能力来看,我们2.0整个在线翻译在英语6级的水平,离线4级的水平,3.0我们发布的时候,我们整个在线达到专业8级的水平,离线也达到英语6级的水平。大家也可以放心,之前买的前一段产品,未来在软件上也会给大家做进一步的升级。

在支持的语种方面,3.0会更加丰富了,2.0我们当时支持中文和50多种外语,3.0随着技术以及语种的进一步丰富,我们现在已经58种了。包括民族语言我们这一次也增加进来了。另外对于行业人士的需求,3.0大家知道,我们针对医疗,金融计算机三种行业的,随着后续逐步越来越多的需求,我们在3.0增加了外贸、法律、体育、能源这几种,现在七大类行业的行业翻译,所以在价格上我们基本上跟市场整体的调研来看,价格上我们比2.0会高一些,谢谢。

问:还有一个大家比较关注的问题,之前大家普遍有一个预期差,觉得我们公司更多是语音识别比较好的公司,可能会限制我们整个AI运用的场景,但是最近我们大家发现,科大讯飞不仅在语言识别全球领先的,包括图像识别,包括最近在世界顶级的的会议上也取得很多世界冠军。大家比较好奇,公司为何在最近几年突然图象识别也做到全球顶级。另外一个图象识别,我们公司在图象识别下,未来有哪些商业落地的战略。

答:图象识别这块,其实科大讯飞做语音识别,在技术上是让机器来读语谱图,说话声音会形成一个语谱图,其实机器也是识别这个语谱图以后判断你说的是什么内容, 所以语言识别和图象识别在底层基本的理论框架和算法上是共通的,这是第一点,就是它的理论基础是共通的,在软件框架上也是共通的。

第二点就是我们判断,图象识别也是一个非常难的课题,特别延伸到了图象理解这方面就更难,我们在图象方面已经有很多非常优秀的AI公司在做图象各种各样的应用,并不是说所有的领域都去做。 我们做图象重点聚焦在这么几个地方,还是跟我们产业的比较优势能够结合的。

第一个,未来我们看得非常清楚的增长点,就是我刚才说的个性化学习 ,个性化学习要收集到孩子的过程化学习数据,纸笔学习还是最主流的学习方式,但是纸笔学习有一个问题,过去我们每个人在手机上写得很潦草,机器都能识别,那是因为有笔划、笔顺这个信息,如果说孩子把答题作业这个信息写在纸上,然后再拍照或者扫描输入,他的笔划信息在这个过程中是丢失的,所以在这种情况下,机器在多大程度上读懂孩子考试答题做作业的信息,这是一个很大的挑战,这也是科大讯飞做图象识别第一重点。我们刚刚在全球最顶级的图象识别大赛中,关于图文手写拿到了全球第一名,说明我们在特定任务上的核心技术上,我们非常自豪告诉投资人我们是全球第一,这个技术之一就是能够把孩子写在纸上的,甚至孩子写的像狗爬的字机器能够读懂,读懂之后分析这道题哪个知识点没掌握好,根据他学习水平,机器分析完以后应该给他推送哪个层次的,什么样的题目,让他尽量在少做题的情况下,做他最需要的题,提升学习效果。这个是科大讯飞做图象识别最重要的一个方向。我们不会说什么都做,但是科大讯飞重点聚焦的这个领域我们一定要做到全球领先。

问:我们这边大家关注最后一个问题,这个也是最近资本市场的焦点,5G的速度在加速,大家其实也会感受到,因为连接数会大幅提升,那么物联网的设备各方面都会远远超过以往的时代,大家比较关注,公司认为这是在5G时代来临的时候,我们会面临哪些比较好的机遇,我们公司做了哪些战略的升级?

答:这确实也是我们在高度关注的话题。5G+AI是推开了一扇大门,给所有产业公司提供了前所未有的机会。对于科大讯飞来说, 5G带来的AIOT,IOT再加一个A,在AIOT时代终端一定会呈现多样性 ,咱们的眼镜,手表各种各样的设备都有可能成为一个智能终端,这些智能终端未必都会有屏幕,都会像现在的手机这种交互方式,在这种情况下语音是最智能最便捷的手段,所以5G带来连接数增加,万物互联时代提前到来,对我们科大讯飞来说打开了一个巨大的市场空间,未来万物互联时代的人机交互,我们现在已经有一百万的开发者,我们讯飞开放平台已经为万物互联时代做好了准备,所以对于讯飞是一个巨大的机会,我们一定会把握好这个机会。

问:最近中科曙光对美国制裁,现在市场上也比较担心,公司很早在AI计算领域投资了一个寒武纪,我想请教一下,公司在AI计算领域未来自主可控的能力,还有寒武纪的应用情况。

答:其实从自主可控来看,我觉得这点投资人对科大讯飞完全可以放心的。 其实我们所有人工智能核心技术全部是来自于我们自主研发 ,拥有自主知识产权,包括讯飞大家也知道,我们也是业界最早构建深度学习的平台之一,其实在这些框架发布之前,包括流行之前我们就已经开展了自主研发工作,并且我们有自己的研究算法,包括在训练层面,包括在模型处理层面,都做了很大的提升。 一句话,我们在AI技术上不需要任何人的授权。

本文已标注来源和出处,版权归原作者所有,如有侵权,请联系我们。

随意打赏

科大讯飞ai造假科大讯飞ai同传
提交建议
微信扫一扫,分享给好友吧。