AI人才不够用？看看脸书的员工是如何学习的！

威腾网 • 7年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

慧聪安防网讯 萨克拉门托在Facebook总部的FullCircleCafe吃午饭的时候，他手机上收到一则消息：拉里泽尼克（LarryZitnick）是Facebook 人工智能研究实验室的主要人物之一，他正在一个教室教授关于深度学习的课程。

萨克拉门托已经34岁了，他是的Facebook数字图形工程师，每个人都知道他最喜欢指挥家索尔蒂（Solti），所以大家都称呼他索尔蒂。他在Facebook中找不到这个班级的注册方式。于是，他只吃了一半午餐就站了起来，跑着穿过了MPK20，一个比足球场还长的Facebook大楼。“我的书桌在那边，”他说。他快速跑到他的书桌前，打开笔记本电脑，又回到了注册页面。但这门课的注册空间已经满了。

他第一次被泽尼克（Zitnick）的课堂拒之门外。这一次，当泽尼克的讲座在1月中旬开始时，他又出现了。他也加入了研讨会，加入了其他同学的队伍，他们争相从公司数据中打造出最好的人工智能模型。在接下来的几周里，他登上了排行榜的榜首。“我之前没有进入这个班级，所以我想做得最好，”他说。Facebook的员工比他更高兴，正如索尔蒂（Solti）所担心的那样，这个课堂是一门私人的讲座和研讨会，只对公司员工开放，而Facebook员工则是最大的受益者。

深度学习是指你在Facebook上发布的照片中识别人脸的技术。它还能识别谷歌手机的指令，在微软的Skype应用上翻译外语，在Twitter上与人谈论色情片，更不用提它正在改变互联网搜索、网络安全识别等各种事情的方式。在过去的五年里，这项技术已经从根本上改变了互联网上所有大型的业务。

在杰夫辛顿（GeoffHinton）的帮助下，谷歌公司建立了一个核心人工智能实验室，为公司的其他部门服务。随后，该公司向位于伦敦的第二个人工智能实验室DeepMind提供了超过6.5亿美元的研发资金。另一位创始人，扬勒恩（YannLeCun），在Facebook也有类似的行动。还有很多其他的深度学习创业公司和学者加入了该互联网公司，他们都是被巨大的薪资所吸引的。

现在的问题是：这些公司现在虽然已经把大部分可用的人才都挖了过来，但他们还需要更多的人才。直到现在，深度学习也是依然处于学术研究的边缘阶段。相对而言，很少有人接受过这些技术的正规培训，这是一种非常不同的思维方式，而不是传统的软件工程。因此，Facebook现在正在组织深度学习正式课程和长期研究实习，以培养新的深度学习人才，并将其推广到整个公司。泽尼克（Zitnick）说：“我们这里有许多非常聪明的人。他们只是需要工具。”

与此同时，就在Facebook位于加州门洛帕克的总部已经开始行动时，谷歌也在做着同样的事情，并且显然规模更大，因为许多公司都在努力应对人工智能人才的真空。大卫艾利顿（DavidElkington）是一家将人工智能技术应用于在线销售服务的公司的首席执行官，他说，他现在在爱尔兰安排了猎头，因为他无法在美国找到他需要的人工智能和数据科学人才。“这更像是一门艺术，而不是一门科学，”他说。这门艺术最好的从业者是非常昂贵的。

在未来的几年里，大学将会赶上深度学习革命，培养出比现在多得多的人才。Udacity和Coursera等在线课程也传出了福音。但最大的互联网公司需要一个更迅速的解决方案。

放眼未来

42岁的拉里则尼克（LarryZitnick）象征着人工智能技术的快速发展，以及深度学习天赋的价值。在微软，他花了10年的时间努力打造能和人类一样智能的系统。然后，在2012年，深度学习技术在短短几个月的时间里就超越了他十年的研究成果。

从本质上说，像泽尼克（Zitnick）这样的研究人员的工作，是构建机器视觉这种简单的技术，并且将这些特定的技术应用到问题的特定部分。但是，像杰夫辛顿（GeoffHinton）这样的学者表明，一个简单的神经网络可以实现更大的成就。辛顿（Hinton）和公司建立了一种神经网络，可以通过分析大量的数据来进行学习任务，而不是通过手工编码一个系统。泽尼克（Zitnick）说：“我们看到了这一巨大的进步，这是一场深度学习的革命。一切都开始好转。”

对泽尼克（Zitnick）来说，他个人的转折点是在2013年秋天的一个下午。他坐在加州大学伯克利分校的一个演讲大厅里，听着一位名叫罗斯吉士克（RossGirshick）的博士生描述了一个深度学习系统，该系统可以学会识别照片中的物体。例如，给它提供数百万张猫的照片，它就能在众照片中将人们需要的照片识别出并找出来。在吉士克（Girshick）描述他的系统背后使用的数学知识时，泽尼克（Zitnick）就已经明白这位博士研究生的研究方向了。他想听到的只是这个系统的运行情况。他一直在小声说：“请告诉我们这些相关数据。”最后，吉士克（Girshick）给出了这些数据。泽尼克（Zitnick）说：“很明显，这将是未来的发展趋势。”

几周后，他在微软公司的深度学习研究中雇佣了吉士克（Girshick），因为他和其他公司的计算机视觉团队重新组织了他们在深度学习方面的工作。这就需要在思维上有一个相当大的转变。正如一位顶级研究人员曾经告诉我的那样，创建这些深度学习系统更像是当教练，而不是运动员。你不是在自己的程序上构建一个软件，而是在一段时间内，从信息的海洋中获取一个结果。

但吉士克（Girshick）在微软公司工作并不太长。而且，泽尼克（Zitnick）也没有。很快，Facebook就把他们挖走了，几乎是团队里的所有人都被挖走了。

这种对人才的需求也是泽尼克（Zitnick）现在会在Facebook公司教一个深度学习班的原因。和硅谷其他许多工程师和数据科学家一样，Facebook也很清楚这一趋势。当泽尼克（Zitnick）在秋天宣布开办第一个班级的时候，60个名额在10分钟内就被占满了。他在今年冬天又宣布开了一个更大的班级，同样很快就被报满了。供求双方都有对这些课程的需求。

科技记者也有需求。我自己也参加了最新的课程，尽管Facebook不允许我参加研讨会。该公司相信教育，但只在一定程度上。归根结底，这一切都要走向商业化。

走进深度学习

深度学习这门课始于一个基本的想法：神经网络，这是弗兰克罗森布莱特（FrankRosenblatt）这样的研究人员在20世纪50年代末就开始探索的。他们的目标是，开发神经网络模仿大脑中的神经元网络。从某种程度上来说，的确如此。它的作用是在神经元的处理单元或节点之间发送信息。但这些节点实际上只是线性代数和微积分，可以识别数据模式。

即使是在50年代，它也起了不少作用。罗森布莱特（Rosenblatt）是康奈尔大学的心理学教授，他向纽约客和纽约时报展示了他的系统，该系统可以识别在IBM704大型计算机中输入的卡片信息的变化。但从根本上来说，这个效果是很有限的，它只能解决非常小的问题。在60年代末，当麻省理工学院的马文明斯基（MarvinMinsky）出版了一本书，证明了该系统的限制后，人工智能社区几乎放弃了这个想法。在像辛顿（Hinton)和勒恩(LeCun）这样的学者扩大了这些系统的功能后，它才重新回到了前台，这样他们就可以在多个节点上操作神经网络。这就是所谓深度学习的“深度”。

正如泽尼克（Zitnick）解释的那样，每一阶段都要进行计算，并将其传递到下一个阶段。然后，还要使用一种被称为“反向传播”的技术，层层将这些信息作为一种纠正错误的方式发送回链接中。随着时间的流逝和技术的进步，神经网络可以用更强大的计算能力来提取大量的数据。事实证明它们非常有用。泽尼克（Zitnick）在他的课堂上说：“有史以来第一次，我们可以用音频和图像等方式输入原始数据，而且可以理解它们。”

随着课程的进展和节奏的加快，泽尼克（Zitnick）也进一步解释了这些技术如何演变为更复杂的系统。他探索的是卷积神经网络，这种方法受到大脑视觉皮层的启发，将神经元排列成“接收场”，就像重叠的瓷砖一样。他的老板扬科恩（YannLeCun）在90年代早期就曾用这些技术来识别手写字迹。然后，这门课会逐步发展到LSTMs神经网络，其中包括短期记忆能力，这是一种在保留信息的同时还会检测接下来的内容的方式。这将有助于人工智能识别你在Android手机上说出的指令。

最后，所有这些方法都要归于数学。但是要想理解它们是如何工作的，学生们必须想象他们是如何穿越时间和空间的。正如泽尼克（Zitnick）的学生在研讨会上所说的那样，把这些方法应用到实际问题上，是一种不断尝试、发现错误和解决错误的过程，就像在录音工作室里操纵混合控制台一样，需要不断去微调。但你不是在物理控制台上。你是在一台笔记本电脑上，把指令发送到遍布互联网的Facebook数据中心的机器上，在那里，神经网络进行了训练。但你需要花时间调整各种各样的虚拟数据，比如数据集的大小、训练的速度、每个节点的相对影响力，直到你找到合适的组合。“很多事情都是通过经验来建立的，”22岁的安吉拉范（AngelaFan）说，她参加了泽尼克（Zitnick）秋天的课程。

一个新群体

范（Fan）在哈佛读本科时学习统计学和计算机科学，去年春天刚毕业。她参加了一些人工智能课程，但很多最新的技术对她来说仍然是新颖的，特别是在实际操作的时候。“我可以从与代码库的互动中学习，”她说，她指的是Facebook为这类工作建立的软件工具。

对她来说，这门课只是一个广大教育的一部分。她在大学教授的要求下，申请了Facebook的“人工智能浸入程序”研究。她在接下来的一到两年里作为一名实习生，和泽尼克（Zitnick）及其他研究人员一起工作。本月早些时候，她的团队发表了一篇新的研究报告，描述了一个系统，该系统采用卷积神经网络，通常用于分析照片，并用它们构建更好的人工智能模型来理解自然语言，也就是了解人类如何相互交流。

这种语言研究是深入学习的下一个前沿学科。在重塑了图像识别、语音识别和机器翻译之后，研究人员正在向能够真正理解人类说的话和做出的回应的机器推进。在近期，范的文章中描述的技术可以帮助改进智能手机上的服务，这项服务可以推测你接下来会输入什么。她设想在你的手机上覆盖着一个小小的神经网络，学习你如何与他人交谈。

对于Facebook来说，他们的目标是培养一群安吉拉范（AngelaFans）这样的研究人员，这些研究人员不仅要研究神经网络，还会学习一系列相关技术，包括强化学习。在面对围棋这款历史悠久的游戏时，强化学习可以破解DeepMind公司的AlphaGo系统的棋局。泽尼克（Zitnick）研究的相关技术的课程即将结束。为此，当泽尼克（Zitnick）在今年冬天重新上课时，范和其他人工智能实验室的实习生们成为了班级的助教，在研讨会上工作，并回答了六周的讲座中学生提出的所有问题。

Facebook不仅仅是在试图强化它的核心人工智能实验室，它还希望将这些技术传播到整个公司。深度学习并不是一个小众的追求。这是一种通用的技术，可能会改变Facebook的任何产品，从Messenger到公司的中央广告引擎。索尔蒂（Solti）考虑到神经网络也有艺术天赋，甚至会把它应用到视频的创作上。任何Facebook工程师或数据科学家都将从学习人工智能中受益。这就是拉里泽尼克（LarryZitnick）要开设这门课的原因。这就是索尔蒂（Solti）放弃了他吃了一半的午餐的原因。< < <