数字新基建:袋鼠云数栈助力企业搭建数据中心,实现数智化升级

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

“新基建”一词最近大热,不过它其实不是新概念,国家早已布局。早在2018年12月中央 经济 工作会议上,新型基础设施建设已被首次提出。而今年,在诸多内外因素共振,新基建再次被提到新高度。中央层面仅20天内4次提到新基建,自上而下的大力推动也让其成为近期备受资本市场关注的热词。

数字新基建:袋鼠云数栈助力企业搭建数据中心,实现数智化升级

图片来源:36氪

在中央电视台中文国际频道的定义中,新型基础设施建设是指发力于 科技 端的基础设施建设,主要包含 5G 基建、特高压、城际高速铁路和城际轨道交通、新能源 汽车 充电桩、大数据中心、人工智能、工业 互联网 等七大领域,涉及到通信、电力、交通、数字等多个社会民生重点行业。

数字新基建:袋鼠云数栈助力企业搭建数据中心,实现数智化升级

图片来源:中央电视台中文国际频道

新基建中首次提及的数据中心,尤其引人注目,不过这并不令人感到意外。随着数字化浪潮的奔涌而至,物联网、车联网、工业互联网的推广应用带来数据指数级增长,数据的增长速率已达到每秒约5TB。

数字新基建:袋鼠云数栈助力企业搭建数据中心,实现数智化升级

数字化技术在各个行业渗透,催生新产业新模式新业态,释放产业经济活力。在数字经济时代下,数据已成为“新能源”,被作为一种基础性和战略性资源,是提升企业能力的“富矿”。因此,对“数据新能源”的处理与分析需求旺盛,促使大数据中心产业逐渐形成规模。

数据中心产业链日趋完善

数据中心产业链简单来讲可以分为三层,上游是IaaS层,主要是硬件设备服务商。中游是PaaS层,基于硬件帮助企业建立软件基础设施,搭建数据加工厂。下游则是SaaS层,基于数据,并结合行业特性,提供具体的解决方案。

图片来源:艾瑞咨询

在“新基建”背景下,数据中心不只是传统意义上的存放计算、存储及网络设备的机房场所,海量的异构数据都将进入数据中心进行集中存储和处理,这对计算设施和数据中心都提出了更新更高的要求。数据中心PaaS层作为数据加工厂,承担着对原始数据进行清洗、处理,并产出数据资产供业务端使用的重要角色,是承接数据存储(即IaaS层)、与数据应用(即SaaS层)的桥梁,对数据中心建设的影响深远。

数据中心PaaS层建设的难点

随着数据爆炸式增长,数据中心建设迫在眉睫,但是如果还按传统的方式建设,以下问题只会愈演愈烈:

1、数据孤岛

企业发展到一定阶段,出现多个事业部,每个事业部都有各自数据,各自存储数据,各自定义。每个事业部的数据就像一个个孤岛一样无法(或者极其困难)和企业内部的其他数据进行连接互动。简单说就是数据间缺乏关联性,数据没有横向打通。

数据孤岛可以分为物理性和逻辑性两种。物理性的数据孤岛指的是,数据在不同部门相互独立存储,独立维护,彼此间相互孤立,形成了物理上的孤岛。逻辑性的数据孤岛指的是,不同部门站在自己的角度对数据进行理解和定义,使得一些相同的数据被赋予了不同的含义,无形中加大了跨部门数据合作的沟通成本。

2、数据重复开发和存储

系统之间缺少共享模型方法论和规范,指标口径不统一,每个项目的开发模块会重复开发,数据也会重复存储。比如A事业部提供在线购电影票服务自建了一个数据中心,B事业部提供外卖服务也自建了一个数据中心,两者虽业务方向不同,但数据中心架构类似,重复建设数据中心会造成很大的开发资源浪费。

3、数据集中管理困难

由于技术平台可扩展性限制以及业务系统分散,大量数据分散在不同平台,全域数据集中统一管理存在困难,数据资产管理没有做到自动化、在线化。例如,A部门的数据存在A的数据平台里,B部门的数据存在B的数据平台里,将两个数据平台里的数据集中管理也是个难题。

为了适应当下数据规模暴涨的趋势,数据中心PaaS需要一个更先进的方法论来指导,那就是数据中台。大数据想要发挥更大的作用,必须建设集各种数据信息于一体、开放共享、安全可靠的数据中台,数据中台就是信息化系统的新地基。

数据中台,帮助构建自底向上一体化企业数据中心

企业在数据应用的过程中,往往会面临数据孤岛、部门隔阂、数据面窄、系统不统一、重复开发等问题。而数据中台的意义就在于在最底层打通数据隔阂,把分布在不同部门、不同系统内的数据孤岛连接起来,进行统一地数据加工、萃取,从而形成数据资产,进而为政务、业务赋能。

袋鼠云就是致力于数据中心PaaS层建设,基于数据中台的先进方法论,帮助企业搭建大数据基础设施。

袋鼠云的数据中台落地产品叫“数栈DTinsight”,定义为“云原生一站式数据智能中台PaaS”,其中有三个关键词:云原生、一站式、PaaS。

云原生,是指一种分布式的云技术,它的好处是可以根据企业实际的数据量和计算量进行灵活的伸缩,既能适应小企业的规模,也能适应大企业的体量。云技术是弹性的,这也是云技术的最典型特点,它能够解决不同规模的企业数据在线化问题。

一站式,则是因为数据中台落地过程中,会涉及到各种不同阶段,比如,从数据采集到数据加工处理、从数据智能化到数据应用,链条非常长。数栈提供的是一体化、一站式的数据平台建设方案,而不是一个单独工具,它要解决不同数据开发的需求,覆盖整个企业数据业务的生命周期。概括来讲,数栈从“全、统、通”三个层次来帮助企业建设自己的数据中台并萃取沉淀数据资产。

“全”——全域数据,集中存储

袋鼠云帮助企业对全域数据进行盘点和集中,通过FlinkX批流一体化数据同步引擎将数据存入统一的数据平台。

“统”——统一规范,分层建模

构建全域数据模型,统一数据规范,实现数据统一调用。

“通”——智能萃取,连接打通

将清洗加工好的标准化数据共享给业务部门使用,避免重复造轮子、浪费企业资源。

数栈包含了9个不同产品,每个产品根据企业数据生命周期进行阶段性布局,已经研发并成功 商业 化包括离线开发平台BatchWorks、实时开发平台StreamWorks、算法开发平台AIWorks、数据质量DataValid、数据资产平台DataAssets、标签引擎TagEngine、数据共享服务DataAPI、数据可视化平台Easy[V]、运维管家EasyManager等一系列可以标准化输出的子产品,整个平台覆盖数据源输入、批处理、流计算、人工智能算法、数据治理、数据资产管理、数据服务输出等整个大数据生命周期。

数栈产品架构图

最后一个关键词叫PaaS,也就是平台即服务。数栈的定位是面向数据开发的专业生产力工具,相关从业人员能够使用该工具,可以提高开发效率,降低开发成本,解决来自业务部门的数字化需求,做到业务数据化、数据业务化。

数据中台PaaS就像操作系统和App Store,数栈产品的首要任务是要建设好数据基础设施,让客户和生态伙伴能够在这个基础设施上搭建和操作各种数据应用。袋鼠云愿意完全开放数栈的平台能力和数据中台方法论,与更多的行业数据应用服务商合作,结合各自的优势共创面向行业的数据智能解决方案,共同服务于客户。

成立至今,袋鼠云已服务过零售、 金融 、数字政府、能源和旅游等行业,包括李宁、赫基、飞鹤乳业、蒙牛、绿城、富力、华夏银行、中原银行、新网银行、张家口银行、杭银消费金融、招商证券、太平洋证券、长江证券、上投摩根、天弘基金、浙江金融资产交易中心、甜橙金融、宁波舟山港、山西商务厅、国 家电 网、安徽电力、良渚古城遗址公园、西溪国家湿地公园、杭州西湖风景名胜区、浙江大学、中山大学等知名客户。

随意打赏

提交建议
微信扫一扫,分享给好友吧。