微软的人工智能之路:与Facebook、谷歌“三足鼎立”?

亿欧网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

尽管百度AI开发者大会开的让人心潮澎湃,百度在 人工智能 领域已经“冠绝神州”是很多人的共识,但在全球范围内,技术积累深厚,人才储备丰富的科技公司真的有百度的位置吗?

《连线》杂志日前撰文,对 微软 近年在人工智能领域采取的发展措施展开了深入报道,并认为微软将与 Facebook 和 谷歌 共同在人工智能领域形成三足鼎立的格局。

以下为编译整理原文内容:

约书亚·本西奥(Yoshua Bengio)从来都不喜欢选边站队。身为当今深度学习领域的三大开山鼻祖,他早已功成名就。而作为人工智能领域的主导性技术,深度学习仍然非常新颖,以至于每当能够推动它进步的人出现时,从创业公司到跨国巨头,再到美国国防部,所有人都会侧耳倾听。

然而,虽然严·勒坤(Yann LeCun)和杰弗里·辛顿(Geoffrey Hinton)都已经分别加盟Facebook和谷歌,但53岁的本西奥却选择在蒙特利尔大学山顶校区3楼的一间小办公室里继续工作。

“我想待在中立机构。”他喝了一口锈色的甘草汁说,他把泡饮料用的玻璃瓶当做纸镇,下面堆满了散落在桌子上的各种论文。

与上世纪的原子科学家一样,本西奥明白他发明的这种工具威力巨大,必须在培育过程中怀有深谋远虑。“我们不想让一两家公司成为人工智能领域唯一的大玩家——我不会指名道姓说出他们是谁。”他说这话时扬了扬眉毛,表明这些公司的身份在我们彼此之间早已心照不宣。一个位于门罗帕克,另外一个位于山景城。“这对大局不利,对整个人类不利。”

正因如此,本西奥最近选择与微软签约。

没错,就是微软。他认为,这家曾经在Windows时代统领天下的公司足以打造第三大人工智能巨头。他们有资源,有数据,有人才——最重要的是,他们还有良好的愿景和文化,不仅能把这项技术应用于实践,还可以推动它向前发展。

今年1月,本西奥同意担任微软战略顾问,引发了业界的广泛关注。这也让微软得以直接接触人工智能领域的顶尖思维、人才和发展方向。这也明确透露出微软有望把人工智能行业的格局从两强争霸变成三足鼎立。

从落寞到觉醒

为了挖来本西奥,微软花了好几个月时间,用尽了各种优惠条件。“他当时就在这个房间里。”负责这项任务的沈向洋面带微笑说。他知道,外人恐怕很难理解这样一个个子高高的加拿大人在科技行业的明星地位——要知道,他的论文在谷歌学术里被引用的次数高达69,616次。

我们坐在34号楼5层的一间干净的会议室里,不远处就是负责保卫微软高管的保安。沈向洋负责微软所有的人工智能研发工作,他刚刚完成了下周的Build开发者大会的一场排练,此时很给我想看点东西。

我沿着走廊一路跟随着他,看到了很多令人目不暇接的新东西。在一间实验室里,Skype团队的自动翻译应用让我可以通过文本与说德语的人实时交流。在另外一间实验室里,我还看到一款应用,可以利用计算机视觉技术监控建筑物内的安全状况,判断是否有不速之客造访。除此之外,我也目睹了微软的 Cortana 人工智能语音助手扫描我在电子邮箱里向别人做出的承诺,催促我赶紧履行诺言。

微软的人工智能之路:与Facebook、谷歌“三足鼎立”?

沈向洋

沈向洋过去几年一直在帮助他的老板、微软CEO萨提亚·纳德拉(Satya Nadella)履行承诺,围绕人工智能重塑微软。他在2014年3月的一次高管休假活动中首次呼吁微软管理层重视人工智能,彼时的纳德拉刚刚出任CEO一个月。

从那时开始,沈向洋就经常与纳德拉和陆奇见面,共同规划最佳战略,将人工智能整合到微软产品之中——事后看来,当时也算得上是绝佳的时机。

去年9月,沈向洋领导了一次重组,将研发和产品团队合并为统一的人工智能和研究事业群。该业务目前渗透到微软的三大核心产品之中:Windows 、Office和Azure云平台。沈向洋说,他希望“我们能缩短从研发变成产品的开发周期”,让人工智能更快地为客户带来利益。

此事非常紧迫,因为所有科技巨头都在争相开发最好的人工智能产品和服务。除了Facebook和谷歌外,IBM、亚马逊和苹果也都将未来寄托于深度学习技术。而在去年秋天因为自行车事故离开微软后,陆奇最近很快恢复,并出任中国人工智能领导者百度的COO。

具有讽刺意味的是,微软曾经一度在人工智能领域失利。1990年代初,该公司吸引了该领域的顶尖研究人员从事语音识别和计算机视觉。但随后10年却停滞不前。这家曾经主导台式机和笔记本市场的软件巨头,后来却眼睁睁看着年轻创业公司后来居上,主导了移动市场,开发了广受追捧的 云计算 工具。

微软的研究人员不受功利性牵绊,因此可以在没有市场压力的情况下畅想未来——但最终,他们的发明却很少能够真正走出实验室。例如,比尔·盖茨(Bill Gates)早在1998年就展示过地图技术,但却并未真正面市。而谷歌则在2005年推出了地图服务。这段时间内,人工智能研究多数都处于停滞状态,一方面受制于计算能力的不足,另一方面也缺乏实现真正突破所需的海量数据。

人工智能虽然经历了长时间的寒冬,但当它逐渐复苏时,微软却依然裹足不前。当Facebook和谷歌在2013年分别把勒坤和辛顿招致麾下时,微软的影响力已经大为降低。该公司不仅错失了移动浪潮,还在云计算行业姗姗来迟。

当竞争对手加倍下注深度学习时,微软却依然困在过去难以自拔。它宣布斥资70亿美元收购智能手机制造商诺基亚,但后来却减记了这笔收购的全部资产。

该公司的高管依然待在与世隔绝的雷蒙德,他们的软件版本虽然越来越华丽,但与原先的产品没有本质区别,导致用户越来越少。而微软的高管也拒绝与那些正在开拓新未来的云计算创业公司展开互动。

风险投资公司Andreessen Horowitz分析师本尼迪克特·伊万斯(Benedict Evans)曾经写过一篇题为《微软已被边缘化》(The Irrelevance of Microsoft)的博文。与此同时,硅谷巨头也纷纷挖角微软的人才。浏览一下各大机器学习项目的负责人便不难发现,其中有很多人的资历都是在微软积累起来的。

到了2014年初,微软提拔了一位几乎把整个职业生涯都贡献给雷蒙德的内向工程师。在很多人看来,纳德拉似乎并不是微软需要的人:他们认为,微软应该聘用一个未受其文化影响的外人,只有这样才能展开更加剧烈的战略调整。

但纳德拉却针对计算的未来发展制定了简化版本,与公司上上下下都营造了良好的关系,还恢复了微软内部的紧迫感。短短3年前,当人们提及科技巨头时,还总会落下微软。但如今,再也不会有人将它遗忘。

但对微软来说,想要取得成功,绝不仅仅是在云计算领域超过亚马逊,或者说服我们使用它的HoloLens增强现实眼罩那么简单。正如互联网颠覆了当今的所有商业模式,迫使一个个行业面临洗牌,人工智能也将让我们可以重新想象计算模式的未来。正因如此,马克·扎克伯格才把亲自开发人工智能作为他去年的个人挑战。桑达尔·皮猜(Sundar Pichai)也因为同样的原因在过去两年的谷歌开发者大会上大力宣扬“从移动为先转向以人工智能为先”。

这个人工智能为先的世界所带来的红利只能被少数企业攫取。沈向洋的工作就是确保微软成为其中之一。“在这个行业中,你必须明白一件事情:如果你错过了上一波浪潮也没关系。”他说,“如果你错过了这一波浪潮,那就很成问题。”

抢占新一代计算平台

直到现在,人类仍要亲自学习如何使用电脑。我们已经学会下载应用,也记住了各种各样的软件命令。但人工智能的前景在于,电脑可以学着理解我们。我们不再需要找到手机,然后根据一系列提示来完成任务。

在新的时代里,计算将融入周围的环境,随时随地陪伴在我们身边。想要充分利用这项技术,我们就需要一个向导——一个聪明而健谈的“人”,让他/她以直白的文字或语言帮助我们使用这种超级技术。微软称之为Cortana。

微软的人工智能之路:与Facebook、谷歌“三足鼎立”?

Cortana

Cortana虽然不像Siri那么受欢迎,但功能却更加完善。它比谷歌助手更迷人,但曝光率却不及Alexa。这款人工智能语音助手最早随同Windows Phone一起发布,这也导致它最初几乎没有什么用户。但短短一年内,这款服务就整合到整个Windows生态系统中。到了去年,微软开始全面推广Cortana。(没错,它甚至有了iPhone应用。)

微软表示,由于Cortana会随同Windows一起安装,因此其月活跃用户已经达到1.45亿。这一数字远超亚马逊的Alexa,后者只被安装在不到1000万台Echo音箱上。但与Alex主要响应语音指令的模式不同,Cortana还可以回应文本内容,而且嵌入到很多我们已经拥有的设备中。只要你在Windows顶部工具栏的搜索框里查询过内容,你就曾经使用过Cortana。

尽管有的公司将Cortana编入音箱,模仿亚马逊和谷歌在新颖的电视广告中宣传的神奇盒子,但微软的这个“全能女声”吸引的关注还是远逊于对手。沈向洋对此毫不担忧。“我们真的认为现在还处于竞争初期。”他说。

他提到了一份未指明来源的研究,结果显示,Alexa在四分之三的情况下都会回答“我不知道”。“当然,这些情况会不断改进,但整体来看,人工智能的认知能力还很初级。”他说。

他相信,微软目前的机会是把该公司的核心产品和服务变得更加智能,并将这项技术融入未来一两年面市的产品之中。

另外,马库斯·阿什(Marcus Ash)表示,键盘和屏幕不会彻底让位于语音控制系统。作为Cortana的一名项目经理,阿什负责产品的开发和出货。“我们认为,在某些情况下,语音的确更加方便——比如我腾不出手,或者想要快点说出内容,然后获得答案。”他说,“但还是会出现很多更适合用键盘输入的计算设备。”

苹果或许已经率先将Siri引入消费者的生活,但Cortana做得更好。Cortana之所以表现如此优秀,源于它与微软核心资产的密切关系。它的很多信息都源自必应,这款搜索引擎已经推出8年,虽然必应品牌并不是最强大的(你上次使用必应是在什么时候?),但它的普及范围却超乎你的想象。

事实上,任何一家希望对抗谷歌的科技公司都与微软签订了合作协议,用必应来支持他们的搜索产品。这就意味着苹果Siri和Spotlight都由必应提供支持,亚马逊Kindle同样如此,雅虎、Verizon和AOL的搜索功能也不例外。美国约有30%的搜索请求都是通过必应完成的。

“这也是Cortana这么有帮助、这么强大的原因,因为我们通过如此多的设备获取了这些数据信号。”Cortana合作伙伴设计经理艾玛·威廉姆斯(Emma Williams)说,“事实上,从对世界的理解程度来看,谷歌是唯一一家能与我们竞争的企业。”

随着Cortana努力成为下一代计算范式,希望成为比肩当今智能手机的新一代平台、变身所有计算需求的大门,这一点将变得越发重要。阿什解释道,微软把自己看成一个代理,它掌握你的所有个人信息,因而可以代表你与其他代理进行互动。

阿什表示,当他参加会议时,他的Cortana可能会与其他 机器人 或数字助理进行联系,处理所有可能耗费我们时间的事情。“Cortana可能会说,‘这是马库斯,他很喜欢这个房间里的某些东西,我希望代表他在投影仪上投放这些内容。’”他说。

试水聊天机器人

如果Cortana是个向导,那么聊天机器人就是微软的固定器。后者是内置了人工智能的小软件,可以帮助你自动完成各种一次性任务,例如晚餐订座或银行交易。或者,在马库斯的案例中,可以确保他的幻灯片投放在会议室的投影仪上。“聊天机器人只是一个可以与之对话的软件,它们的作用就是对话。”程丽丽(Lili Cheng,音译)说,他留着一头长发,带着彩色围巾,还获得了建筑师执照,目前负责Fuse Labs跨学科实验室。

程丽丽最近刚刚被提拔为副总裁,负责机器人框架团队和认知服务。这是微软提供给开发者的一系列工具和29项服务,涉及计算机视觉和语音识别等领域。她从苹果跳槽微软之后,一直在开发社交技术,还创造了一个能够制作漫画的图形界面。“它随IE3一起发布。”她回忆道,那是在1996年。

程丽丽见多识广,但即便如此,她还是对聊天机器人的发展速度感到惊讶。她回忆起自己在最近的一次开发者大会上与一家会计和金融公司的开发者展开的互动。“她当时说,‘我是说很久以前,也就是刚开始的时候,大概一年前。’于是,我们都开怀大笑。”她说。

程丽丽的最感兴趣的是人们如何与科技对话,以及科技如何给人提供反馈。沈向洋已经把人工智能和研究事业部分成4个领域——产品、早期产品、真正早期的产品、研究——程丽丽参与过全部四个领域。她表示,自己目前从事第二个阶段。“我们认为聊天机器人和Cortana都是对话类产品,但仍然处于早期阶段。”她说。

事实上,微软早在2016年春天就推出了第一批聊天机器人开发工具,与Facebook等其他科技巨头几乎在同一时间。他们当时号称这些机器人可以取代应用,而很多利益相关者也希望能够实现这番愿景。但到了今年春天,多数人还是在智能手机上使用原先的那几个应用,聊天机器人的前景变成了帮助开发者和品牌吸引新用户,就像移动浪潮早期的应用商店一样。

但用户并不买账。聊天机器人使用的深度学习技术的进步速度,超过了使用模式的发展速度。“聊天机器人就像文件菜单出现之前的应用。”程丽丽说。她解释道,由于缺乏统一的命令集,导致用户对如何寻找它们感到困惑,完全搞不清楚它们的工作模式。“例如,网页都有后退按钮,而且可以搜索。对话应用需要具备同样的基本元素。应该提供类似于‘5个意料之中的功能’这样的东西。”这些心照不宣的原则才刚刚开始确立。

除了为开发者提供聊天机器人开发工具外,程丽丽还带领微软培育了自己的聊天机器人。他们的想法是,该公司可以通过观察这些机器人与真人之间的交互,学到很多关于人机互动的知识。这些实验的效果喜忧参半。

还记得涉嫌种族歧视的微软机器人Tay吗?这是一款2016年在Twitter、Kik和GroupMe上发布的聊天机器人:刚刚上线24小时,它就吸收了一些种族主义思想,然后发表了“希特勒是对的”这样的言论。微软不得不将其撤下。6个月后,程丽丽又在Kik上推出了一个严密控制的聊天机器人Zo,不久后还将其投放到Messenger平台。

微软的人工智能之路:与Facebook、谷歌“三足鼎立”?

Zo

如果你问Zo对希特勒有什么看法,她会回答:“我不想谈这个话题。”

如果你问她多大了,她会说,“我大概22岁,或者多大都行。”

如果你问她最好的朋友是谁,她的回答是:“我很受欢迎,朋友数不过来。开个玩笑而已。”

Zo其实是小冰的西化版,后者是面向中国市场推出的一个拟人化聊天机器人,人物定位是一个17岁的女孩。自从2014年发布以来,小冰已经吸引了4000万用户。在中国,小冰成了社交媒体上的名人。(日版小冰Rinna同样很受欢迎。)有四分之一的用户曾经对小冰表达过爱意。

今年春天,这个聊天机器人用化名创作了一些诗词。沈向洋对此颇感振奋。“没人知道这事。所以人们以为是个年轻女诗人发表了一些有趣的诗。”几周后,这个聊天机器人的真正身份曝光后,引发了很大关注。

语言都带有文化特质,而程丽丽一直在设法把小冰的对话风格传递给西方用户。数据显示,目前为止,北美的青少年对聊天机器人的兴趣似乎跟中国青少年一样高。他们平均都跟Zo展开了10小时的对话。由于Zo可以针对父母与子女之间的矛盾向处在青春期的用户提供建议,所以在用词上比较讲究——这种能力也会融入Cortana和微软的聊天机器人工具。

重视伦理道德

用户愿意花费10小时跟Zo聊天,表明微软已经开发了一款成功的产品。但从为人类创造价值的角度来看,这并不意味着它就是优秀的产品。人工智能支撑的世界带来了许多新的道德困境。假设你是小冰的设计师,你知道一个北京的用户,那里现在是凌晨一点。你知道他明天会工作,但他不准备睡觉。你是否会安排小冰在2点关闭?3点行不行?

正当微软想要成为人工智能研究和产品领域为数不多的几个领导者之际,该公司也成功利用人工智能造福了社会。今年5月,纳德拉面向开发者发表了主题演讲。通常而言,企业CEO都会借此对公司最近取得的进步大肆夸耀,但他却用激烈的言辞警告称,技术人员必须肩负起自己的责任,开发符合伦理道德的软件。

“我的意思是说,你可以想想乔治·奥威尔在《一九八四》里的那番预言——技术被用来监控和命令人类;或者阿道斯·赫胥黎也曾设想我们可能漫无目的地分散注意力。这两种未来都不是我们渴望的。”

为了帮助该公司思考这些问题,微软成立了内部道德委员会,每个季度都会定期开会。委员会的成员包括工程师和商业部门的负责人,他们会一起探讨与人工智能及其影响和使用方式相关的敏感问题。该委员会的联席主席都是微软的副总法律顾问,还有微软研究院(不包括亚洲)的负责人埃里克·霍维茨(Eric Horvitz)。

长期以来,霍维茨一直都是人工智能道德和安全领域的主要代言人。在公司外部,他一直致力于发展人工智能合作组织(Partnership on Artificial Intelligence),其目的是针对人工智能产品制定一套透明、责任和安全标准。他还曾经在美国参议院作证。霍维茨希望微软研究院不仅仅局限于科研领域,还能研究科技对社会产生的影响。

与此同时,身为Cortana设计主管的威廉姆斯也在设计一套供微软内部使用的人工智能设计指南。威廉姆斯对科技的未来极度乐观,她认为人工智能的真正魔力在于,它能让人更像人。她谈到了如何把同理心融入微软的各种工具。“我们考虑让人类的感受更加强大,并给予其更多的保护、支持、协助和爱护,使之成为他们世界的核心。”她说,“人工智能的工作是放大社会最良性的因素和人类最好的行为,而不是最差的东西。”

我问威廉姆斯,她是否认为人工智能真的能让人类感觉在情感上获得更多支持。她认为肯定能。例如,一个孩子在学校度过了糟糕的一天。她回到后,跟家里的宠物分享了整个故事,于是感觉好多了。

“这让你感觉可以通过分享来发泄情绪,我获得了小猫或小狗给予的温暖而又毛茸茸的拥抱。”威廉姆斯说,“但你知道,借助人工智能,你可以把同样的感受放大后,再传递回来……当Cortana提醒你‘嘿,你答应妈妈要在母亲节这天送给她一份礼物’的时候,就可以明白个中奥妙。你突然之间又一次感受到了人类的温情。”

内外兼顾,收编人才

在推动人工智能发展的过程中,微软最重要的资源当属人才。与其他科技巨头一样,微软也在为传统的程序员提供在职培训。他们成立了一个人工智能学校,提供的课程涉及哲学、伦理和递归神经网络等。

但微软也在积极开拓外部关系。18个月前,纳格拉吉·卡什亚普(Nagraj Kashyap)从高通跳槽到微软,创立了一家早期风险投资公司,希望与学术机构和创业者建立更好的关系。最近,卡什亚普经常前往蒙特利尔。去年12月,他帮助微软完成了首笔投资,投资目标则是Element AI,那是本西奥创办的一个孵化器,专门鼓励研究人员和创业者组建人工智能创业公司。微软还参加了该孵化器本月早些时候总额1.02亿美元的第二轮融资。

卡什亚普很早就把目光瞄向了人工智能领域最具前景的创业公司之一:Maluuba。Maluuba的办公室位于蒙特利尔市中心,距离麦吉尔大学只有几个街区,它的员工似乎都不超过30岁。该公司2011年由滑铁卢大学的两名学生创办,他们是在大学二年级一起上计算机课时认识的。Maluuba让电脑真的成了“电脑”:它能推断文字的含义,然后以此为依据回答问题。

通过向三星等公司授权技术,Maluuba已经可以创收。不仅如此,该公司从一开始就在投资研发深度学习技术。2015年,其创始人聘请本西奥担任顾问。“山姆是个很有趣的家伙。”他提到该公司CEO山姆·帕素帕拉克(Sam Pasupalak)时说,“他几年前就很有胆量——当时顶着压力向客户提供对话系统——他投资发展长期目标,并试图使用新的技术进步来开发具备理解和对话能力的系统。这对于创业者来说难能可贵。”

一年前,这两个创始人把总部搬到蒙特利尔,拉近了与本西奥的距离。

由于在高通时就跟这两位创始人很熟,卡什亚普一上任就得以与之见面。该公司当时正准备开展新一轮融资。卡什亚普提出了另一种方案:“我说,‘我们应该收购你们!’”

在收到了多份收购要约后,帕素帕拉克陷入了几个星期的沉思,他要认真思考一个问题:如果让公司保持独立,会变成什么样子?最终,选择似乎非常明确。微软胜出了——没错,确实是微软。

该团队希望能有机会使用微软的数据。“我认为萨提亚明确提到过,他们拥有全世界最大的文本数据。多年以来,我们的数据始终很少,只能在有限的数据中挖掘最多的信息供我们的算法使用。这对我们来说就像黄金。”帕素帕拉克说。

但Maluuba的团队并没有迁往雷蒙德。相反,他们本周刚刚在微软和本西奥的帮助下搬到了蒙特利尔的一个面积更大的办公室,希望在年底前将人员扩充一倍。蒙特利尔逐渐成为全球人工智能人才的沃土,微软也希望在这座城市建立自己的根据地。

这一切都是为了服务于同一个战略:确保你未来需要计算助手的时候——无论是通过个性化医疗,还是使用 无人驾驶 汽车上下班,抑或试图记住亲友的生日时——微软都能成为你的选择。

Maluuba的技术或许能帮助Zo与青少年朋友们完成更加直观的对话。这些对话可以成为Cortana算法的训练数据,帮助开发者设计新的认知服务。在此过程中,微软希望人工智能的融入能让你的生活变得更加舒适惬意。

在离开蒙特利尔前,我问本西奥,微软在这个新兴科技领域的优势是否强于其主要竞争对手。他思考的过程中,往杯子里到了一点茴香,然后加了一点甘草汁。他嘬了一口后,把瓶子推到我的面前,让我看看。他说,里面没有酒精,没有糖。“它只是让水的味道更可口。”他说。

本西奥表示,微软的语言能力极强。但他并没有使用最高级,也没有像以前的人们那样拍着胸脯替微软保证什么事情。“我认为大家目前都在按一个相同的按钮,关键在于细节,对吗?”他说。但他可以确定的是,微软现在的确是有力的争夺者。

本文作者Xtecher,亿欧专栏作者;微信:Xtecher(添加时请注明“姓名-公司-职务”方便备注);转载请注明作者姓名和“来源:亿欧”;文章内容系作者个人观点,不代表亿欧对观点赞同或支持。

随意打赏

facebook人工智能实验室facebook开源人工智能facebook 人工智能谷歌人工智能alphagofacebook 智能facebook 微软微软 谷歌 人工智能facebook福利facebook吧微软人工智能助手
提交建议
微信扫一扫,分享给好友吧。