Google是如何做移动搜索的(下)

36氪  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  


长久以来Google的旗舰产品已成为我们生活的一部分。但Google并不认为搜索理所当然就应该是那样的。此文编译自《In The Plex : How Google thinks, Works, and Shapes Our Lives》作者Steven Levy的 文章 ,是有关Google搜索变革研究的第一部分。

Google是如何做移动搜索的(上)

语音搜索

在意识到移动技术即将变得无所不在后,Google决定对搜索进行一个微妙但同时又是巨大的变动。它 不再把查询视为提交给计算机系统的指令,而是把所有的输入当作是对话 。而在这里面,交互方式比输入更自然的语音将起到非常重要的作用。

这种改变并不仅仅是搜索引擎处理查询方式的改变,也需要用户在思想上做出改变。就像以前Google教育用户要以查询的方式组织搜索一样,现在Google需要用户以对话的方式进行思考。不过显然后面这种方式并不需要太多的教育,因为这是我们自然的交互方式。

实现这一变动需要两方面的举措。首先是搜索引擎必须更仔细地倾听,甚至要解析含糊不清的语音输入,这种能力此前只有人类才具备。然后Google还需要确保人对着手机说话或在搜索框输入口语化文字时系统知道人在说什么。

Google攻关语音识别技术已有好些年头。2000年代中期时,Google曾推出过一个名为 Google 411 的服务,做的事情跟电话公司一样,就是给客户提供电话查询系统,不同的是后者是付费的。而Google的收获是通过数百万的免费电话学习如何正确解析多语种多口音的语音。但是Google无法获得其所需的2500条短语在一部分地区的样本,于是Google就直接派人去到哪些地方采样。

付出终于获得回报—Google搜索可兼容159种语言,而语音搜索现在已能识别其中的59种。公司宣称,其“单词错误率”已经降到了8%。

Amit Singhal的副手Ben Gomes以自己为例演示了Google取得的里程碑式进展。这位印度出生的工程师发音不太标准,在上述行动前,他是没有机会亲自演示Google的语音识别能力的,以往Google都是派一位发音纯正深受机器青睐的专家来做演示的。不过现在Gomes跟那位家伙已经失去了联系。“他已经变得可有可无了。我就可以做演示。哪怕你让我站在记者前进行查询我也不怕。”

此外,Google还需要考虑让手机给人回话。 它应该用哪一种嗓音呢?像Siri那样拟人化?还是用一种可辨识的机器人语音来让用户意识到对自己正在跟系统(而不是人造人)对话?Google选择了后者。 其首席搜索设计师Wiley说,为了避免造成与有意识的实体对话的幻觉,你需要自动化一种皮克斯级的叙事能力。“我认为我们与计算机可以唤起人性到人类感到舒服的地步仍有很长一段距离。”

但是技术的发展很快,足以为Google提供一种高级的语音交互能力。Gomes认为,语音识别能力的提高得益于计算机的处理速度变快、硬件变好以及软件算法的改进,但是最大的变化是Google对语言的理解能力提升了。

头衔为搜索部门“著名研究科学家”的Fernando Pereira研究自然语言处理(NLP)已有30个年头。过去几年,在如何将搜索查询与网上的文档及其他信息集匹配上Google已经解决得相当好,但是像Knowledge Graph这样得数据库的引入给搜索引擎带来机遇的同时也带来了挑战。Pereira说:“你使用的语言是否与数据库的设计方式匹配变得更加难以判断。”

比方说,Google会收到这样的查询:“巨人队在哪里打比赛?”虽然是短短的一句话,但引擎需要了解大量信息:这涉及到了体育,某支队伍打的是主场等等。然后它还得做出选择,这里指的是棒球队还是橄榄球队?用户是想知道这支队伍的主场体育场还是像了解它下周去哪里打比赛?Google通过信号和此前的用户行为去构建答案。这些理解、判断、推理都是几年前Google没有做过的。

一旦清除了这些障碍,Google的NLP系统就能从知识图中获得更大的推力,开始逐渐理解世界。包括在用户措辞不佳甚至表达混乱的情况下揣摩用户想问什么。比方说用户在手机上输入“戴维▪卡梅伦”时系统已经知道这两个词是配对的,知道这是一个人—然后赋予代词“他”。哪怕麦克风捕捉不到姓氏,知识图也能断定这位英国总理是主题。

Google懂得越多,就能更好地理解你

2004年,我问Larry Page和Sergey Brin对搜索的长期愿景是什么。 Larry说,搜索应该被包含进人的大脑里。“当你思考某件东西时如果不太了解的话,你可以自动获得信息。” Sergey指出,关键点在于:“你有对话的设备,或者留意周围发生的事的计算机,从而可以提供有用的信息。”

2010年,两位Android工程师Baris Gultekin和Andrew Kirsme倒腾的一个“20%(注:Google的70/20/10时间分配原则)”项目跟这一愿景的精神非常一致,于是就诞生了后来的Google Now。

根据Gultekin的说法,目前的Google Now与他们最初的设想也保持着高度的一致。“其核心观点是你现在的手机并不智能,但是是可以做到智能的,”他说:“如果我们能够把可感知、可连接的强大设备与Google的威力结合到一起的话会怎样?”

换言之,Google Now可回答你太懒或没时间问的查询。这意味着要通过多领域信息的结合来处理某件重要的事。Gultekin说一开始要建立这样一套系统去做这样的事是很恐怖的,但他和伙伴先把目标分解成一个领域,通勤。但即便这样一件有限的事情也需要系统具备大量的知识:家和办公室的位置,最佳往返路线,交通模式。当然,Google Maps(以及后来的Waze)知道如何导航是关键。Google调用所有的力量去增强这一搜索工具。不久之后,他们有了一款可靠的app来帮助通勤者。“不过我们不希望这只是一款通勤app,” Gultekin说:“我们希望它成为一位主动的助手,能帮助处理很多事情。”2012年7月,Google Now发布,当时具备7个领域知识:通勤、飞行、体育、附近地方、旅游、公交以及天气。现在Google Now的领域已经增加到70个,且还在快速增长。“我希望Google Now能够提供你所需的大部分信息,其他的app只有在Google Now没有你所需的东西时才用,” Gultekin说。

Google Now的效率取决于对世界的深度知识(这个Google搜索和知识图可以提供)与大量个人信息的整合 。这正是为什么有人会提出搜索的这个子集实际上是Google本身的借代:每次它都会提供一张即时信息“卡片”。Google Now吸收了一大批的Google服务。一张典型的卡片往往结合了个人邮件、日程表、通信录、交通安排、交通信息以及天气等信息。

大家往往不知道Google Now是做什么的,直到它做了。比方说,你停车时,Google Now会记录下你停止行驶了,并记住你在什么地方离开了车子—以防你忘了车子停在哪里。如果邮件告诉Google Now你在找房子,它可能就会推送一些你希望居住地区的待售房产。

随着Google Now的不断演变,现在它已经从20%项目变成了全职服务。不过给Google Now的发展提供最大动力的也许是苹果。2011年,苹果发布了Siri,给Google总部造成了一点点的恐慌,从而加大了这一语音助手项目的投入。随后它变成了搜索部门的官方组成部分,尽管团队仍同时分属搜索和Android。当然这种安排也是合适的,除了推送给用户的非查询消息外,所有的个人信息最终都会为登录用户的搜索框所利用(目前可做到“送我上班要多久?”很快将实现“我的车在哪里?”)。搜索和Google Now非常具有互补性,Gultekin说:“我们希望在你开始搜索前就提供信息,但还是会有很多情况是我们不知道的,比方说你的水管爆了,你需要管道工。” (当然,未来通过Google收购的智能家庭平台Nest,Google有可能会知道这一点的。)

与旧版搜索相比, Google Now化的搜索只有在使用全系Google产品时才能发挥最大效用 。“Larry有个说法—‘搜索应该理解你的意思并提供你想要的东西,’” Yehoshua说:“这是一个Google生态体系—如果你登录手机和桌面,我们可以利用这一点。如果你希望获得飞行信息,跟踪包裹以及任何我们可从Gmail获得的信息,你都可以得到。如果你不用Gmail(当然你不会),你仍然可以获得我们丰富的语音和回答等等。”

没有绕行方式—如果你想用Google,但Gmail不是你的首选,那就无法获得Google Now或甚至Google搜索的全部价值。“生活在一个我们能够分享所有这些信息的世界里将是非常美好的,” Yehoshua说:“我不认为明天就会实现。苹果做起来会好点,但我们实现会更加困难。”

Google有意识地不把Google Now当作独立产品。相反,它把Now包含进搜索app里面。而app本身也不叫“搜索”,很简单,就叫“Google”。这种取名方式不仅说明了搜索与Google关系之紧密,也说明了Google Now对公司的重要。

尽管如此,Google Now组件还是可选的。使用前Google会提出隐私方面的警告,而该产品的无所不知也可能会成为令人不安的提醒器,告诉我们这家巨头对我们的了解有多少。Google掌握我们的个人信息越多,它惹上的麻烦也越多—尤其是在欧洲,加强监管、巨额罚款甚至解体威胁一个没落,其服务我们的抱负也许会被对隐私的担忧挫败。哪怕是那些相信Google的人,在斯诺登披露政府如何轻易获得我们的信息之后也无法淡定了。如果Google Now知道你在哪里停的车的话,当地的情报机构是不是也一样知道?

Amit Singhal认为,第一代搜索是在人与远端机器的交互之间隔着一道墙。而我们逐步进入的搜索新时代将会打破这堵墙,这与把移动设备当作电子人化的附体是同步的。我们预期手机会知道我们的意思。我们预计搜索既精通于提供包含我们个人信息的答案,又能从网页、文档及公共数据库中挖掘事实。

我把搜索视为一切计算的接口 ,”Singhal说:“设备消失或最小化或融入环境之后,你又如何跟它们交互呢?因为大多数时候,你需要采取行动—或者简单如播放音乐,或者复杂点,写备忘录提醒自己来到小卖部附近时记得买牛奶。或者你会有‘我老婆的航班是否准时?’或者“奥巴马有多高?”之类的问题”

大家也许会把过去当作理所当然—抱怨Google搜索已经不像以前那样。但Singhal指出,Google搜索已经越过了那道横亘在他面前几十年的障碍。“作为一名研究人员我攻关了20年都没有成功,”Singhal说。他指的就是他的团队在Google搜索上面所取得的成就。但他也承认,还有比现在多得多的问题有待解决。但在描述某类他不再失败的查询背后的科学时,他的声音充满了自豪。对了,那个问题就是:

天为什么是蓝的?

[本文编译自: medium.com ]

本文被转载1次

首发媒体 36氪 | 转发媒体

随意打赏

提交建议
微信扫一扫,分享给好友吧。