百度王海峰:大数据支撑下的NLP让搜索引擎更智能

数据观  •  扫码分享

近日,美国问答网站Quora邀请百度副总裁王海峰博士回答网友提问。Quora是美国问答型SNS网站,被誉为“获取高质量内容的来源地”,聚集了大量高质量知识用户。在接受邀请后,王海峰在前后近三个小时的时间里,就人工智能在中国的发展、百度在自然语言处理(NLP)领域所取得的技术成果,以及实际应用等问题进行了回答。

   NLP技术赋能新搜索生态圈

NLP是计算机科学、人工智能以及语言学的交叉学科,旨在解决计算机与人类语言之间的交互问题,这其中包括对自然语言的分析、理解、生成、检索、变换及翻译等方面。王海峰介绍,百度研发了多种NLP技术,包括知识图谱、语义理解、内容标签、情感分析、文本生成、摘要、深度问答、机器翻译和对话系统等。这些技术广泛应用于百度的搜索、信息流、智能助手等产品中,为数亿用户提供服务。

除了对NLP技术本身的研究,百度还将这些技术集成到统一的平台——NLP云,从而为百度各种产品提供服务支持。王海峰说,百度开发的NLP云平台拥有 20多种 NLP 模块,每天的请求数量超过1000亿次。

以百度的核心业务搜索来说,分词、命名实体识别、句法分析和复述等NLP模块都是其必不可少的基础模块。另一个NLP技术在搜索中的典型应用是问答,高性能的问答系统需要对查询实行精准的语义语法分析,构建大规模知识图谱,以及对网页搜索结果全面深入的分析,用户在搜索框中输入问题,搜索引擎就可以直接提供答案。

  NLP成下一代搜索引擎技术之本

在百度众多产品中,搜索引擎无疑是 NLP 技术最大的用武之地。搜索引擎最基本的模式是自动化地聚合足够多的内容,对之进行解析、处理和组织,响应用户的搜索请求找到对应结果返回,这其中每一个环节都离不开自然语言处理技术。

作为搜索引擎领域的领军者,百度再一次扮演了改革者的角色,将人工智能与搜索引擎紧密捆绑在一起。王海峰表示,下一代搜索引擎将可以更加理解用户的意图和内容,意图与内容的匹配也更加精准,这些都将大大增强用户的使用体验。

此外,搜索引擎与用户的交互界面也将发生创新性变化,随着语音、图像等技术更加成熟和实用,用户将可以使用更加高效、便捷的多模搜索,自然语言交互将成为搜索引擎的主流交互模式。

王海峰在问答中重点提到,“未来的搜索将无处不在,随处可见,搜索将不仅仅是使用搜索引擎,还会融入到各种产品中。我们还将重新定义可搜索的内容,不仅包括当前搜索引擎已经索引的内容,还将纳入更多服务、物体、设备和数据。”

 

责任编辑:陈近梅

随意打赏

百度副总裁王海峰王海峰 百度
提交建议
微信扫一扫,分享给好友吧。