中国科学院院士徐宗本:关于数据开放共享的若干思考

数据观  •  扫码分享

[数据观导读] 5月26日下午,2017数博会“数据开放共享技术自主协同创新高峰论坛”在贵阳国际生态会议中心举办,论坛聚焦政务大数据的挑战与问题、落实国家大数据战略的若干思考、燕云Daas助力政府数据共享开放 “贵阳速度”、API经济创新数据开放共享新模式、新型智慧城市大数据基础设施建设思考、数据共享开放与标准化建设等话题。中国科学院院士徐宗本作了主题为《关于数据开放共享的若干思考》的精彩演讲。

中国科学院院士徐宗本:关于数据开放共享的若干思考

徐宗本院士表示,为贵阳市率先在全国解决大家看起来都很难解决,而且是大数据发展中必须解决的问题喝采,徐宗本院士围绕“政务大数据的挑战与问题”分享了五个方面的干货内容:

中国科学院院士徐宗本:关于数据开放共享的若干思考

一、数据开放共享是大数据产生大价值的必要条件

首先,从科学角度来说,大数据炙手可热,数据具有价值,但真正实现在大数据中挖掘价值,需要遵循基本规律和原理,不可违背。大数据之所以有价值,原因在于获取数据比较容易,以致数据集载量非常大;大数据之所以有用,原因在于对于很多问题而言,数据量的积累超过了一定的量,可以看出背后的故事和规律。所以这个过程可以将其概括为量变、质变原理。

其次,需要分析出价值原理,如果仅仅是搜集数据,没有分析出价值原理,就如同买了米没有做饭是一样的道理。

第三,数据关联原理,大数据时代不一样的地方就在于懂得应用数据,过去与现在不一样,我们会把过去看起来根本不相关联,彼此之间不可能发生联系的数据连接在一起,这就是产生不一样价值的根本原理。大数据做得好不好,不是取决于量有多大,根本上是取决于分析水平的高低,取决于数据的关联与宽度,讲究数据的完整性及数据各方面的机动性才是数据的本质,从这个意义上来说,数据的开放共享是大数据产生价值的必要条件。

从国家战略需求的高度去认识,发展大数据是国家需求,不仅仅是大数据产生价值的需求,科学的需求,更重要是国家的需求,这是更为需要着重关注的。所以贵阳市重视并努力实践大数据,只要努力,就能做到;只要重视,总会成功。

关于数据开放共享,“不愿、不敢和不易”导致数据共享难是现实,但是贵阳市在政策、技术等方面是如何解决这些问题的呢?徐宗本院士认为一是应用驱动,人民的呼声、市场诉求导致了开放,倒逼法律、技术的诉求反而更多;二是政策支持,也是最基本的;三是技术创新,也是毋庸置疑的。

二、推动数据开放共享必须要有相应公共政策支持

首先,数据属性分类。泛泛讲数据共享开放只是口号,要解决数据该开放就开放、该共享就共享、该保护就保护是客观存在的需要去面对的问题。数据资源到底要不要开放、要怎么开放,可以授权使用、分级使用等等,大道理大家都知道,但是如何制定数据属性分类管理政策支撑则需要细化去解决。

其次,数据所有权界定。政府数据是国有资产,其实这是一种认识,国家政府数据到底是国有公司开放,还是民营公司开放?数据所有权到底属于谁,其中的关系要如何处理,也是需要去考虑的大问题。

第三,数据价值判断与定价。作为一项技术,定价是大问题,数据如何定价,值多少钱,徐宗本院士的基本观点是:这是很复杂的法律问题,但是毛数据、元数据和加工后的价值肯定不同,数据的真正价值是加工后所产生的价值。就相当于数据从来不用,达不到价值,埋在山里的宝石矿,只有经过工匠打磨之后才值钱,所以这其中有很多具体的政策、法律问题需要解决。

徐宗本院士就以上的问题表示很愿意到贵阳市进行相关调研。

第四,数据开放、开发、共享政策。徐宗本院士表示这肯定是先易后难,逐步开放,但一定要培育多元政策执行主体,不能只集中于政府一个主体,政府应与企业、中介机构齐心协力去实现,当然,这其中必然绕不开政策监管体系。

第五,数据质量标准。收集数据多,但是质量不高是很大的问题。徐宗本院士表示,希望贵阳市在的探索和实践过程中,对以上的五个问题,能给出一些好的答案,多多关注并收集相关解决方案,将来会大有裨益。

三、推动数据开放共享必须要有切实可行的技术

技术是拦路虎,过去的历史不同、系统不同、信息化发展程度不同,以及利益分割等各方面的问题决定了数据打通不是一蹴而就的事情。燕云DaaS系统另辟蹊径,打破信息孤岛,自适应数据总线+系统智能适配,一个月就将53家单位及315个系统全部打通,这很震惊,很多人称之为“大数据贵阳速度”,徐宗本院士感慨说:确实了不起。

四、互操作技术必须更加支撑综合分析与挖掘

打通数据只是第一步,达到互通、互调、互用,再到最终目的——分析,系统打通可以支撑之后的分析挖掘,这才是根本。但是系统能支持多大程度上更复杂的分析挖掘,技术并不能解决所有问题,这时候就需要做出一个标准,对于大数据可扩计算、并行计算、分布式计算、实时计算、跨媒体计算等做出评估标准,这些计算多大程度可以支撑。

技术与基础相关联,真正好的大数据分析和处理技术来源于基础,而这个基础现在绝大多数没有解决的,计算问题、数据问题等一些基础没有解决,又想大数据赚钱,难免会遭遇失望,所以解决基础问题是最基本的,解决这些问题要反复的迭代,打通的体系能不能解决,数据分析和处理能不能支持,在做技术层的时候,希望能将这些因素考虑进去。

五、应努力研发开放共享与隐私保护共存技术

隐私总是要有的,但是又特别好奇,那怎么办?能不能换一些方式?比如数据抽象,从技术上去解决,设计总体技术框架,能够帮助保护隐私,同时也能知道想知道的,这就是分布处理技术,该技术正在成型,正在发展,有待关注。

综上,数据开放共享是大数据产生大价值的必要条件;推动数据开放共享必须要有相应公共政策支持;推动数据开放共享必须要有切实可行的技术;互操作技术必须更加支撑综合分析与挖掘;应努力研发开放共享与隐私保护共存技术。以上内容就是徐宗本院士从独特的视角分享的关于数据开放共享的若干思考,深受启发,值得研究!

注:本文系数据观根据2017数博会“数据开放共享技术自主协同创新高峰论坛”图文直播整理而成,编辑/Fynlch(王培),转载请注明来源及作者信息。数据观微信公众号(ID:cbdioreview) ,欲了解更多大数据行业相关资讯,可搜索数据观(中国大数据产业观察网www.cbdio.com)进入查看。

责任编辑:王培

本文被转载1次

首发媒体 数据观 | 转发媒体

随意打赏

中国科学院院士
提交建议
微信扫一扫,分享给好友吧。