大数据时代,人类会被数据控制吗?

数据观  •  扫码分享

点击上方图片查看完整视频

7月27日,造就邀请到斯蒂芬·戈德史密斯(Stephen Goldsmith),来到造就“未来大会”中进行了演讲,他是哈佛大学肯尼迪政府管理学院教授,美国政府创新计划中心主任。

戈德史密斯曾担任纽约市副市长,为纽约建立第一个市长数据办公室,让纽约成为一个以数据为驱动的智能城市。我们正处于一个大数据时代,人工智能、城市管理和数据控制之间的问题该如何处理?

关于这些问题,香港科学园董事车品觉、造就创始人汤维维与戈德史密斯进行了一场深度交流,他会给大家什么样的答案呢?

   汤维维: 我的第一个问题是关于未来的,我认为在未来每个人都是一个是数据包,我们需要相互联系,寻找新的机会,所以未来的城市会是什么样子?

Goldsmith: 在未来,人们将会相互联系,思想将被连接,地点将被连接。

在过去的几十年里,政府还在用纸张办公,没有数据来解决些问题,如果我们考虑连通性和数据,意味着我们可以更早地发现问题,公民将能够更快地告诉我们他们看到的问题,政府将能够从这些机构中获得洞见。

物联网的数据,由人产生的数据,由政府产生的数据,假设我们能够正确地控制这些数据,我们就能够代表政府做出更好的决定。

谁有权力把数据连接起来?

车品觉:很多年前,当你做纽约首席运营官的时候,你会需要利用数据,你决定要做的第一件事是什么?

Goldsmith:这是五六年前的事情,那时我们刚刚开始做数据分析,我想在副市长办公室建立数据分析中心,帮助其他机构的运作。

那时候的机构都是各自独立运作的,比如:水务局、卫生部门、交通部门,在他们的机构里有很多数据可供他们使用,他们也有人去管理这些数据。

我们面临的挑战是,如何让他们意识到可以利用其他机构的数据,改善他们自己的工作。有很多方法可以帮助他们的员工,我们想让市长下令建立一个数据分析办公室,让这个办公室服务于其他机构,并记录他们的绩效。

车品觉、Goldsmith与汤维维在造就空间访谈

我们就这样创建了一个新的机构,通过行政命令规定,把负责开放数据和负责数据分析的人,放在一个机构内,这个机构归属于政府的运营部门。

这是白思豪市长所做的,这个部门将为其他机构提供服务,它就好像是个内部咨询小组,为其他机构提供咨询服务。

   车品觉: 是的,数据的隔离会导致团队的隔离。

   Goldsmith: 你问的这个问题,是有问题的,因为你对数据了解得更多。

所以挑战是,你可以根据你的经验,告诉我你的判断,如果你想把纽约的所有数据都放到一个地方,这需要10年的时间,因为系统之间都是不同的。

但城市建立了一个数据桥梁,我们可以在特定情况下获取需要的数据,比如发生龙卷风一样的灾难和紧急情况时,我们要去获取所需的数据,首先要弄清楚他们有什么数据,我们要创建一个数据端口,可以根据我们需要来挖掘数据。

这其中大部分工作是通过地理平台完成的,而不是一个很复杂的系统,纽约的模式是识别开放数据,而非把数据都集中在一个地方。

另一个不把它全部放在一个地方的原因是,这样很难保证数据的及时更新,由一个小组管理的联邦数据系统,并告诉其他机构,这是运行守则。

  车品觉: 我问这个问题的原因是,这方面我知道一些不好的经验,当数据分析团队不能控制数据源时,数据来源自己决定提供哪些数据时,数据分析团队就是在上层的,而数据是在底层的。

这样当用户要求我们解决问题时,就会比平时花更多的时间,这就是为什么你曾经说,开放数据的开发团队在一侧,其他团队在另一侧,你说过他们会趋向分开,在我的脑海中,有时也可以放在一起。

但当时我认为这个描述是准确的,因为它们都有不同的目标,导致效率低下,但当它们聚在一起出现时,困难就会减少,他们会有一个新的目标,数据开放。

有人想要开放数据,不仅仅是为了你,也是为了他人,那不可避免的,有人会想要专注于问题本身。

这就是我为什么要问这个问题,我认为你实际上比我更了解。

   Goldsmith: 白思豪市长通过了一项当地的法律,规定开放数据和数据分析小组合并在一起,这两个小组由不同的人管理,但他们向同一个人报告。很有趣的是,这些如果可视化做得好,将有助于一个机构解决另一个机构的问题,因为数据是可视化的。

我们在芝加哥发现,机构一很难从机构二那获取数据,我们通常说开放数据的可视化 ,是指一个机构从另一个机构获取数据,不止是考虑公众对数据的获取,我们要考虑的是机构如何获取数据。

如果你在卫生部门里工作,想找出流感爆发的原因,往往是社交媒体上发布的“我的孩子昨天得了流感”, 这类信息能帮助你更快地识别出正在发生的事情,所以我认为他们应该在一起,并直接向市长汇报。这些机构不会对数据本身有热情,我们需要激发他们的热情,让他们有通过使用数据解决问题的热情。

在纽约,我过去常召集会议,让主要机构的运营官员聚在一起,比如说我们会请YouTube的人,让他来讲故事,讲如何使用数据来改善商业运作,他们会讲故事,而那些听讲的官员会效仿这些好方法。所以你需要营造这种环境,当时的迈克尔·布隆伯格市长,和现在的白思豪市长也支持一理念,这是一种改对变工作方式的热情,我认为,把开放数据和数据分析放在一起是有益的。

   车品觉: 我认为,在城市这个情境下,我们需要成立数据联盟,因为其他机构没有动力去把数据提供出来,让其他人利用。因此,数据联盟或多或少是每个机构之间的智能契约,你会发现在机构间有一张智能契约的网络,数据在这些机构中传输的非常频繁,如果没有它,大家就会变的很自私。

   汤维维: 但是谁有权力把数据连接起来,谁有权力去从不同机构中获取公共数据?

   Goldsmith: 这在每个城市都不同,比如上海和纽约就不同,我觉得你需要非常清楚这些问题:

你的城市规则是什么?

谁拥有数据?

什么时候要保护数据隐私?

什么时候数据是个性化的?

数据存档了多久?谁有权限查阅?

在什么情况下有可以查阅?

我举个例子,洛杉矶现在试图建立移动管理系统,将所有数据连接起来,那么从哪里得到优步数据、摩托车数据、公交数据和税收数据呢?这些数据对管理交通非常重要,但些公司不会给他们所有的信息,这时就必须建立数据共享的规则和查看的权限。

我想说的是,我们需要明确规则、公开规则、执行规则。

   车品觉: 我记得有人问过你这个问题,我们是否应该成立包括第三方专家的委员会?在美国也是这样的吗?你们是如何组建委员会的?推动进程的成员有哪些呢?

   Goldsmith: 我不认为有任何美国的城市做到了尽善尽美。

你在阿里巴巴工作,你说愿意和政府分享一些信息,但不想让竞争对手知道这些,我们正确保自己有知识产权,政府会有一些关于数据所有权规定,或一套与知识产权相关的规则吗?

从城市角度来说,如果你正在收集数据,比如纽约市街边小亭子的数据,那么谁拥有些数据呢?是公司拥有它还是城市拥有它?

纽约街景

甚至在移动传输上,两家公司之间也会存在着大量的争论,有些是在城市和公司间,我们常常看到这样的争论,大多数都是公司一不想向公司二分享数据。

我认为最好的模式是建立一个小组,由城市官员、大学学者和专家组成,还会有来自各行业的代表出席,可以针对议题发表看法。我认为任何透明公开的委员会都是有益的,即使是争论的议题让大家明白,事情比他们想象的要复杂。

   车品觉: 在阿里更容易些,因为我们有数据委员会,我们让拥有数据的人加入委员会,并把他们的案例一个个发过去,由委员会发表意见,随后我们总结案例,把他们的案例公布给每个人,在案例里必须写明对数据的观点。

当其他人需要数据时,就可以说,我的情况和这个案例很像,可以让我也得到从其他部门获取这个数据的权限吗?

我们的工作模式就是这样的,各方自己持有数据,但当你谈论数据时,不应该说是我的数据,这实际上是公司的数据,在城市的情境中,你们也是这么做的吗?

   汤维维: 这样的模式很简单,城市的会更复杂吗?

   Goldsmith: 我们正在做这件事,但还没有做完,这里有数据工具、数据量和数据的质量原因,甚至还有行业的原因。

你仔细想想,如果我们在五年或六年前,在Airbnb和Uber出现前,制定了规则,那我们现在有这么多的数据,四五年前制定的规则都早已过时了。

因此,有些城市正在努力解决问题,在公平和公正方面,西雅图做的特别谨慎,从一个社区到另一个社区的服务质量如何?我们如何利用数据来展示呢?这些是在进程中的,我觉得还没有哪个美国的城市成功了。

  车品觉: 有关于代理数据的讨论,我总是试图说服一个又一个城市,让他们相信代理数据实际上更安全,而且使用起来也很方便,这不是从数据的角度,我是在说从运营的角度。

   Goldsmith: 我没有想过这个问题,直到你提起来,这绝对是个好问题。如果我们需要数据来解决问题,那么代理数据同样可以解决问题,它比实际数据更安全个人隐私也更少,政府机构更愿意这样做。

我认为你的想法非常好,这是非常重要的,我在回哈佛之后,会写一篇文章,我认为它将解决许多问题。

   车品觉: 我认为这很重要,戈德史密斯刚才提到了,因为当我在一家公司工作的时候,政府来找我想要数据,但我会说,我不能给你所有的数据,请详细说明你想解决的问题,看看我是否能帮助你。

因此我想到了代理数据,因为实际上你需要有这样的代理,也就是说只需要一些样本,你要的是代理的数据,甚至不是数据本身。例如如果你想知道城市的流动性,实际上你可以去找美团的数据,美团相当于美国的Yelp,它可以帮助你了解城市在夜间的活动,因为人们晚上要去吃晚饭。

   汤维维: 但我觉得还有一个大问题,就是人们会搞不清这是他们的数据还是公共数据,他们会不清楚哪里去找数据,分不清是公开还是私人数据。也许在未来,人们会被数据控制,你认为这是个大问题吗?

是很大的问题吗?它因城市而异,也需要加以解决,人们需要控制他们的数据,但与此同时,他们的行为也会影响其他人。

你需要了解广泛的数据,如果你说我完全控制了我的数据,这听起来不错,但是我们假设你生病了,你需要在一个地方接受治疗 ,不应该四处走动,理论上我们都可以控制我们的数据,但实际每个城市的政府都必须制定规则。

   车品觉: 正如我们录制这段视频的时候,我也可以问,谁拥有这段视频和数据?因为我们有三个人在交流,每一个人都拥有一部分信息,那么你怎么能说把它们分开,并分清所有权呢?

所以在业内我们尽量不提所有权的问题,但我们在问责方面做了很多尝试,你是如何使用些数据的?对于个人来说,如何控制我的数据?我有权知道我的数据是如何使用的,我也可以决定,是否授权你可以在以后使用我的数据。

我想也许在将来,谁有权使用这些数据更为重要。

城市该如何利用数据

   车品觉: 在中国经常有政府官员跟我说,他们想要一个可遵循的顶层设计,你认为顶层设计应该是什么样的?

  Goldsmith: 让城市利用数据,是有趣的问题,我认为它必须是自下而上和自上而下的。

在顶层,高级管理人员需要下决心使用数据,他们需要下决心改变政府的工作方式。因为我们今天所拥有的系统,不是围绕着技术系统设计的,这需要政府有一个数据分析中心的机构,里面的工作人员使用数据,来让政府工作做得更好。

它需要得到高级官员的认可并被充分利用,你可以把它看作是服务机构,与政府的其他部门合作,它就是来提供服务的。

当我是副市长的时候,我们去询问各个机构,我们怎样才能帮助你更好地工作?你是否有能用数据解决的问题?

这里有两个问题,一是架构,另一个是该架构如何帮助机构,让解决问题的速度更快,这两件事需要同时发生。

   车品觉: 也就是说,其实没有顶级设计,就像公司里一样,公司会有很多关于数据的问题, 但在城市里,我们应该向哪些机构提出问题?

   Goldsmith: 是的,我认为你的问题真的很好。我的意思是,两者都需要有设计、有策略、有领导的承诺,但官僚机构倾向于对行政命令的反应不及时。

所以我认为你需要设计和策略,需要数据设计,需要组织架构设计,所有些都是至关重要的,与此同时,数据分析小组是帮助机构解决问题,这样你就获得设计的支持。

   车品觉: 在纽约,当你在做副市长的时候,你有类似的顶层设计吗?

   Goldsmith: 在纽约副市长就像城市政府的运营总监,就像首席运营官一样,我们有众多工作人员来做运营,我们建议数据分析中心,由运营副市长领导,让市长掌握战略。

因此,我们设计了适用于每个机构的绩效指标,有数据组帮助该机构提升绩效,我们有了策略、组织和绩效标准,我让那些运营的工作人员去各个机构,看是否能解决那些对他们来说很重要的问题。

所以是自上而下和自下而上的,不完全是自下而上,而是自中而上地说服管理者,去应用这个模型。

   车品觉: 在公司,一个CEO可以去找部门领导,告诉他们今年的KPI,这应用在城市中是相似的还是不同的?

   Goldsmith: 我知道你在阿里巴巴有卓越的背景,但不论是阿里巴巴还是亚马逊,实际上,衡量利润比衡量城市的公共价值要容易得多,因为每个绩效指标都要对应一个事项。

我认为相似之处是你需要测量绩效,困难之处是如何定义。政府的绩效表现是更加复杂的,是办公效率?是客户服务吗?是公平、公正吗?

数据让你能够知道,哪些群体受到了良好的待遇,哪些机构响应得好,这是个连续的过程,我们称之为迭代,让政府工作不断改进。

另一个问题,因为我和很多私营公司合作过,我感受即使是市长下令,也并不意味着官僚们会去执行,他们会无视市长的指令。我们要做的是说服政府的机构,帮助你更好地做决定,会让你的工作更令人满意,人民的满意度会提升 ,这就是我所说的,自上而下和自下而上。

人工智能会取代政府雇员吗?

   车品觉: 接下来这个问题有点难回答,或者有人不想要回答这个问题,关于人工智能在城市中的应用,你对此有何看法?

   Goldsmith: 政府雇员担心自己的工作被人工智能取代,我所做的是让他们相信他们的工作会更好。

让我们以呼叫中心为例,上海的12345市民热线,在纽约市311热线,我们每年接到三千万个电话,有很多话务员会回答问题,他们的工作是超负荷的。如果你用AI和机器人去回答简单的问题,让那些话务员解放出来,解决更复杂的问题。

如果我们把人工智能的能力分类:一个是做枯燥的日常工作,解决重复的问题;另一个是向政府雇员提出建议,提供更好的方法来完成他们的工;第三种方法是我们可以使用人工智能来评估员工的结果 ,并告诉你哪些人需要培训。

我对人工智能的未来很乐观,现在几乎美国的所有城市都在试验和实践。

   车品觉: 一个紧接着的问题是,伴随着这些新工具的出现,我们可以犯更少的错误,或者防患于未然但正如你书中所说:“与此同时,使用人工智能也可能会犯更大的错误,因为我会依赖AI。”

   Goldsmith: 问题不是“如何不犯错”,问题是“如何尽量少犯错”。

我认为我们面临的挑战是:将人工智能正确定义,让它提升运营中的裁定,帮助政府雇员而不是取代他们。

我刚在Digital Twins上发表了一篇专栏文章,如果你做了一张上海的电子地图,在这个区域关掉路灯,或者我每天增加五千辆车,街上会发生什么?这时你可以通过这张电子地图来进行测试,它允许你对你的想法进行试验,这些想法是不可能在现实的城市实验的。

你不是在让AI做决定,你只是想告诉交通工程师和专家,如果你改变了这,结果是如何的。如果AI取代政府雇员,它就会成为问题,我认为将是严重的问题,但如果公职人员需要更多的信息,以更好的方式传递给他们,我认为AI是个良好的机遇。

   车品觉: 我想说,我们现在处在一个大数据时代,但我认为会有更多的数据出现,远超我们今天所有的,大数据实际上变成了小数据。当我们拥有了物联网,有了5G、6G后,世界会变成什么样子?我们的生活会更美好,还是变得前所未有的糟糕?

   汤维维: 你能向未来提出一个问题吗?

   Goldsmith: 我想我的问题是,数据如何在改善我们的生活质量的同时 ,不让我们失去对个性和身份的自主权和控制力?

责任编辑:张薇

随意打赏

大数据时代数据分析大数据时代的到来互联网大数据时代大数据时代与信息大数据时代的我们大数据时代的趋势大数据分析时代什么是大数据人类数据数据时代
提交建议
微信扫一扫,分享给好友吧。