前金山软件CEO张宏江：AI是中国创业公司的机会

猎云网 • 6年前扫码分享

近日，在36氪主办的商业新生态峰会——“智能商业时代大会”上，源码资本投资合伙人、前金山软件CEO张宏江、饿了么CTO张雪峰、AWS跨国企业部、市场和业务拓展总监林家伟、旷视科技联合创始人兼CEO印奇、出门问问创始人兼CEO李志飞等嘉宾，结合各自行业的现状，分享了对当下人工智能发展的思考和心得。

源码资本投资合伙人、前金山CEO张宏江认为，

旷视科技CEO印奇认为，

AWS跨国企业部、市场和业务拓展总监林家伟指出，亚马逊把企业或将用到的“能力”平台化。基于深度学习，亚马逊开放了三方面人工智能服务，包括人脸识别、亚马逊Polly（语音转文字技术）、亚马逊Lex（语音沟通的技术）。这些技术综合起来与垂直领域的应用能碰撞些火花。

此外，碳云智能联合创始人兼首席信息官黎浩从数据的维度分享了“人工智能与数字生命”的观点。他表示，从生物医学角度，生命是可以被数字化的，而数字生命则可以被人工智能化，从而被网络化。这样可以有效的帮助个人进行健康管理，管理自己的生命数据，从“对症下药”的精准医疗变成“提前预防”的精准健康。

如果我们看下这一波人工智能跟此前人工智能火热有什么区别，我觉得中国的发展势头来的比世界上任何地方都猛。原因到底在哪儿？也许是因为AlphaGo，它第一次在围棋上，在中国传统的3000年的艺术上战胜了人类，使得我们对人工智能刮目相看。

但回顾人工智能过去60年来的发展，我们今天谈的人工智能是人工智能的一个分支，也就是机器学习的这部分，更具体的是机器学习里面的用神经网络进行机器学习的技术，或者说跟过去20多年前的那拨神经网络浪潮比起来，是深度学习的技术。

基于数据驱动，这一波浪潮令人信心倍增

这波人工智能的浪潮会比以前让我们更加有信心，上个世纪80年代中期到90年代初，AI的第二拨浪潮迅速兴起又消失，以至于我们都不好意思说自己是学人工智能的。当中很重要的一点是，尽管当时也是神经网络非常非常热，但那个时候的神经网络没有深度的核心，即没有大数据的支持。

另外一个很重要的原因，就是没有大数据支持的同时，也没有如此巨大的资源的支持。所以今天，我们不光有深度学习的非常新的算法，更重要的是我们有了大数据，我们有了非常非常强的计算资源，所以这是这波AI浪潮非常重要的核心。

从技术上来看，今天的深度学习跟以前的研究人工智能的方法，尤其是跟专家系统的方法有非常根本的区别。今天的算法实际上是基于数据的驱动，而不是仅是依赖于经验，学习能力比以前要强太多。

这波浪潮三个大的特点，第一是计算资源过去30年的突飞猛进对AI的支撑。另外一个重要的支撑，就是数据的爆炸。根据IDC的调查，在2013年到2020年，整人类所创造的数据在这几年内会有十倍的增长，相当于每年增长40%。

每一天，我们所产生的数据会超过10的19次方。这是一个什么概念？这些数据放在一个标准的iPad里面存储一下，把iPad摞到一起可以从地球到月球走九趟半，这就是我们每天产生的数据量。

和以前产生的数据不一样的地方在于，今天的数据是大量由互联网产生的，这些数据不光是质量好、数据量大，而且是被标记过的。

或许你觉得自己每天产生的数据并没有进行标记，但是今天在拍照片的时候手机把你的时间、地点，把你是谁的这些资料都标记到每张照片上了。正是因为这些数据的爆炸，使得我们今天能够为人工智能提供更多更好的训练数据。

给大家举个例子，这是1997年我在美国惠普实验室申请的一个专利。这个专利的图很简单，当你的移动设备拍照片以后，会把照片里面的人脸摘出来，和你背后的数据库进行比较，从而识别出来这个人是谁。

这是20年前的一个想法，它申请了专利，但这个专利正好今年作废。经过了20年的发展，我们今天已经可以在手机上完成这件事情。当手机拍了大量的照片之后会发现，真正寻找这些照片的时候会出现一些问题，要么就是根据地点、要么就是根据时间，但是很多情况下记不住地点，也记住不时间，但是你知道跟谁在拍照片，所以用人脸识别是最好的方法。

另外一张照片是我们大家的合影，识别出认识的人和不认识的人，因为这些人对我来是也是第一次见面的，所以它会问你这些人是谁，一旦你告诉这个人是谁，以后这个人再出现在你的照片中就会自动的识别。所以这是我20年前的一个专利，今天在智能手机上实现了。

为什么20年前是个梦想，今天能实现？恰恰是我刚才说到的两点，计算资源和大数据。

90年代开始做这个题目的时候，整个的数据库只有几百张照片，100多个人。经过十年以后依然是几千张照片，直到五年前当Google、Facebook、微软，这些工业的巨头开始利用上百万张、上亿张照片开始训练深层的神经网络的时候，用这种深度学习的方法来进行识别，我们才真正的把识别率提高了。

所以我想强调的是，当你的训练数据规模开始呈现增长的时候，你的学习精度也开始有非常非常大的成长，比如说这块我们可以很清晰的看到，当我们用260万张照片进行训练的时候，你可以看到你的精度到了76%，你把它提高一个数量级的时候，你可以发现你的精度又有10%的提高，所以这块可以很清晰的看到它对于数据的依赖。同样的算法、同样的数据，你发现你训练所用的资源越大的话，训练的精度也同样得到线性的提高。

当技术本身，深度学习的算法经过多年的改善后，加上大数据的驱动，加上计算资源的驱动，到了2015年时，这个技术就有一个质的提高。

今天许多公司所做的产品，其背后所用的训练数据已经不是再几千了，而是几亿，所标注过的人就是上亿的人。这时候你所见到的不同的场景、不同的环境、不同的侧面，数据的覆盖面非常非常广。

这也是今天为什么像旷视，今天不光是中国的做人脸识别的巨头，很多程度上也是世界做人脸识别的巨头，正是因为中国遍布全国各地的机场、火车站、交通路口的摄像头，每天抓拍这么多人脸的照片，使得我们的这些技术能够在这些数据的驱动下获得最好的精度。

如果你今天在中国的任何一个城市，只要是有摄像头覆盖的地方，做了任何一件坏事，基本上通过中国今天的人脸识别技术你是插翅难逃。

所以我想在这儿总结一下，这次的人工智能的技术的核心在于机器学习，而机器学习在过去的几年的发展中间，今天到了一个槛，这个槛就是说我们已经不再完全依赖于建模，而是从建模往大数据转移。

对于同样的算法当你的训练数据增加的时候，你可以看到特性曲线在提高。更重要的一点在于，当你的这数据开始增加的时候，对于模型的依赖很大程度上也减轻了，尤其是当你有一个深度的神经网络之后，通过大量的数据的推动，它其实能把你的问题或者样本的空间能够覆盖得非常非常好。

这时候我们知道它对于任何一种模型的依赖就不像以前那么重要了，这是我们说的大数据的核心点。

对于人类未来的产业、生活有什么影响？

在人类的科技发展史里面，或者在我们技术发展史里面总是有一些先知者，今天我想跟大家提到一点，原来微软研究院的一个杰出的学者Jim，他十年前提出一个概念，人类科学研究的四个范式，从一开始纯粹的观察，到牛顿的数学理论方式描述整个世界，到五六年前开始用计算方法模拟世界，到今天用数据来驱动整体对于这个世界的描述。

正是因为这些技术的发展，大数据的普及，使得我们今天看到在全球各地的公司里面，60%以上的欧美的IT公司已经有很大一部分公司开始把他们的业务建在大数据的基础上。

我们看到在传统的业务上，包括制造公司，都已经以很大的比例开始把他们的业务迁移到大数据的平台上。这就是为什么我们说数据成为了我们一个新的宗教，这也是为什么像Intel这样做芯片的公司，在过去大手笔的并购做人工智能的公司，很重要的一条在于他们很清楚的相信，数据是一个新的能量。

比如说去年收购了以色列的一家公司做智能驾驶的公司，很重要的一条在于，如果我们今天看人工智能驾驶车的话，它每天都能创造超过4ZB的数据，如果你一定掌握了这些数据，自然就掌握了驱动未来新的技术发展的燃料。只有你掌握了这种新的技术，才能够让你的芯片更好的为这些技术服务，为这些应用服务，这是背后Intel并购逻辑。

今天刚刚谈到了AI这拨的发展背后的两大驱动力，计算和数据，尤其是大数据的驱动力。我们今天跟大家分享一下AI的未来对于我们产业、对于我们生活到底有什么影响，我想从两个角度来看。

人类能不能像AlphaGo一样下一百万盘棋，这是不可能的。

再一个就是人类能否瞬间比较出所有摄像头拍出的人脸的数据，显然我们也不如机器。所以无论从速度上，从群体学习的能力上，还是从规模上，我们都比不上制造出来的机器。所以机器在这点上，人工智能的机器在未来不光是能够辅助人，而且能够代替人或者超越人，我们对这点不应该怀疑。

我们原来说机器在有逻辑的，有数学表达的应用上可能会很快超过人，代替人。是不是在人类能够做，但是人类不能够描述出来，比如说怎么开车、怎么骑自行车、怎么画画，今天我们从AlphaGo的表现已经很清楚的看到，正是在这些无法用数学明确的描述的场景下，机器也开始超过人了。

所以，机器无论是在自动驾驶这块还是在画画这块，都已经表现出非常出色的能力，而且柯杰在和AlphaGo下棋之后说了一句话，人类的发展我们只看到了冰山一角，而AlphaGo是上帝的视角。

我们如果用爬山来看的话，只是看到了周围，这是我们过去3000年看到的。AlphaGo经过了这么几年的训练，它爬的山比我们高得过，所以它看到整个的布局比我们广泛得多，而我们人类只看到了中间很小一部分，相当于它具备了上帝的视角。

未来，显然有很多行业会被AI所取代。翻译、新闻记者的写作、投行的分析师、出租车等。今天，美国政府已经在组织一个团队来处理未来十年中，当自动驾驶取代了卡车司机这一行以后，会对美国就业率的冲击。

大家千万不要小看卡车司机的行业，美国有350万卡车司机，周围为他服务的还有500万人。就是说有800多万人的工作和卡车相关。当自动驾驶卡车开始出现的时候，差不多有800万的职业差不多消失掉，整个美国的就业人口是1.2亿，800万就相当于7%。当7%的就业人口消失以后，会对社会产生多大的影响。

如何判断这一波浪潮的创业和投资机会？

未来，我们希望是从人工智能变成智能辅助，这是我们人类的一厢情愿，我们希望造出一个机器能辅助我们，而不是代替我们。实际上我们未来看到的是AI在很多很多场景下会取代我们的工作。过去技术的发展，我们到了一个所谓的出发点，在以前的话因为人类创造技术，技术的发展我们人类总觉得我们能够把握，所以当新的技术开始出现的时候，人类的适应程度就赶上它，能够适应这种新的技术。

今天，技术发展的速度超过了人的适应速度，这种情况下其实我们就开始有些危机感了，技术发展超过我们人类平均的适应的程度，那么这时候我们就知道有很多工作会被机器取代，肯定有很多人会失去工作。

《未来简史》有一个观点，就是说未来AI的发展可能给我们带来的是这个世界上只有两种人，一种叫神人，一种叫闲人。可怕的是神人可能只有1%，99%的闲人，就是当这个世界上90%的工作被计算机所取代的时候，这时候才会带来一系列的社会问题。

当然也有人说有三种人可以替代AI的冲击，一个是资本家，做投资、做VC的，显然大家不用担心，你只要能够融到钱，投准项目就没错。此外就是明星和手艺人。

我们想想这三种人都不会占人口超过1%的比例，所以技术进步的加速给我们带来的不光是对工作的影响，更深层次的是对文化、价值、伦理，整个社会，包括地缘政治，这些所带来的影响我们其实今天很难预测。

两个星期前我去日内瓦联合国第一次关于AI的大会，讲的全都是针对AI未来发展我们人类应该制定什么样的政策法规，保证AI健康发展，保证它是给人类带来益处的。当然总是有一些非常乐观的人，包括写《世界是平的》这本书的作者，一个月之前我在北京见他，我问他关于AI的问题，他有一个很好的解释，是非常乐观的预测：如果你看人类几千年的发展，一开始靠的是自己的一双手。到了工业革命之后，到了计算机革命之后，人们开始靠自己的脑袋，谁的大脑比较聪明就能获得更多的价值。而未来，则是靠你的艺术、你的心里创造的东西。

但我其实想反问他一个问题，就是说靠心创造出来的东西有多少是能够供其他人消费的？这个世界的艺术家我们需要有多少？这个世界上的心理学家我们需要多少？这个世界上的文学家我们需要多少？所以我想依然没有能回答我们所说的“神人”和“闲人”的问题，所以这次AI所带来的革命可能是我们一开始想象不到的这种深刻。

今天我们谈到很多很多关于AI能够取代我们的方面，或者说今天我们看中国的市场上大家对于AI充满了幻想，投资方面有很多的泡沫。根本的一点就是人们没有认清楚到底AI今天能够做的很强的地方在于哪儿，做不到的地方在哪儿。

我想告诉大家，凡是跟感知相关的语音识别、图像识别，这两个很典型的，今天的AI已经超过了人类。凡是跟理解认知相关的，今天AI还是有很长的路要走。也就是说强AI，这种通用的AI，今天依然有非常漫长的道路，所以有任何人跟你说他做出一个模拟人类思维的体系的话，基本上你就可以打一个非常大的折扣了。

既然这波AI的浪潮跟以前不一样，能够改变我们的未来。那么我们作为从业人员、作为投资人，我们应该怎么来判断AI这个机会，判断投资机会呢？

我最近看到互联网女王Mary的报告，她总结的非常好的一点，就是说在18世纪之前农耕社会的时候人们是靠种植收割来生存的，靠手工做的；到19世纪、20世纪工业革命的时候人们靠机器，靠工业；21世纪，人们靠的是计算机的能力和人的能力的这种结合，或者人的潜力的结合。

我们投资的时候一定要想的是，AI这个领域哪些能够让人的潜力得到更高的发挥，我们看一下过去的这几波科技的浪潮，每波科技浪潮过来的时候总会出现平台的公司，无论是最高的PC，微软、苹果、Intel，或者互联网这拨，雅虎、Google，移动这拨，中国的微信。

智能这块的平台是什么，我想我们应该注意到应用层，尤其是我们要看到哪些应用规模特别大，而它又能够产生大量的数据，当你有数据，规模又大的时候，自然这个时候人工智能就能够被引进来改善它的整体的效率，从而使得生产率有进一步的提高，从而创造出新的应用出来，从而能够产生一些新的有规模的企业。

我们在判断AI投资的时候有一点要想清楚，就是AI这波新的浪潮，跟上一拨互联网的浪潮有很大的不一样。

互联网重点在于商业模式的驱动，互联网的新的商业模式怎么更好的应用在我们的生活和工作场景的时候，出现了一大批新的公司。而且在to C的方面基本上都是公司，今天的AI特征非常不一样，

如果我们说今天是互联网+的时代，而智能AI从一开始就应该进入到智能+的时代。所以判断一下今天，如果大家是做投资的话很清楚，任何一家公司都说自己的是AI的公司，所以泡沫非常非常严重，尤其在图像识别、机器人的自动驾驶推广方面，恨不得你去一个产业园有三家都是做自动驾驶的公司。

这块我们有几点要把握住，如果说这个公司只有算法，只有几个牛人，没有数据、没有应用场景，或者说他未来依然很难拿到数据的话，这样的公司做不大，很难持久。做AI芯片这块我们也要非常非常小心，因为做芯片本身是一个非常耗资源的事。总之在你看这些企业的时候，大家要想清楚这家公司今天有没有数据，而且能不能够持续的生产、获取、控制数据，能不能对数据的占有程度比别人高，这些都是最根本的。我们想说的是技术本身并不一定能形成护城河，只有当技术和获取数据的能力结合的时候，它才有一个非常强的护城河。

我这儿举个例子，大家知道今日头条过去五年迅速的成长，背后的原因在哪儿？其实背后的原因就是解决了人们非常非常根本的需求，就是把人和信息连在一块。

创业的时候要记住三点：

，这点是毫无疑问的。

，一个是自主开发，一个是凭技术，凭人力给别人做咨询，今天我们看到太多的公司属于第二类，基本上就是有技术，有几个人，这些人很强，但是没有数据，然后应用场景也不属于他，所以基本是做咨询服务，这不可能做非常大的规模。

，AI做线上服务，我们知道这些巨头，Google、微软、百度，核心的一点就是竞争门槛，我们都知道人是竞争门槛，但是大家可能没有意识到数据才是AI另外一个最重要的竞争门槛。

。世界上所有的刊物里面发表的关于机器学习的，尤其是深度学习，神经网络论文作者里面，中国的作者在2014年就超过了美国，所以中国的AI的人才至少在数量上我们是不缺的。这是我在网上抓到的一张图，每60秒钟在中国的互联网上所发生的事件，这些数字，所说明的一点就是每天、每小时、每分钟，在中国创造的已经标注的数据量在世界上是最大的，基数大、数据量大，这两个数据恰恰回应了我刚才说到的AI创业的门槛，数据+人才。