1.6 数据治理的5类问题
伴随着大数据时代的来临,人们对数据的重视达到了前所未有的高度。
全球知名咨询公司麦肯锡称:“数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产要素。人们对于海量数据的挖掘和运用预示着新一波生产率增长和消费者盈余浪潮的到来。”
世界经济论坛报告认为:“大数据为新财富,价值堪比石油。”
维克托·迈尔-舍恩伯格在《大数据时代》一书中提到:“虽然数据还没有被列入企业的资产负债表,但这只是一个时间问题。”
“数据是企业的重要资产”已经成为各行各业的共识,但是拥有了数据就等于拥有了数据资产吗?事实上,并非如此。
企业数据的管理和使用还存在很多问题,致使数据不能很好地利用起来,从而让企业的数据没能成为数据资产,反而变成了拖累企业的包袱。
企业数据管理的问题主要有以下5类,如图1-4所示。
图1-4 企业数据管理的5类问题
1. 黑暗数据
黑暗数据也叫睡眠数据,是指被收集和处理但又不用于任何用途的数据。有数据而不用,甚至业务部门和领导都不知道其存在,这些数据可能永远被埋没。很多企业其实除了黑暗数据问题,还有数据尾气问题。数据尾气是指那些针对单一目标而收集的数据,通常用过之后就被归档闲置,其真正价值未能被充分挖掘。
之所以会产生黑暗数据和数据尾气,主要是因为企业内很多系统的设计对于业务人员不够友好,操作功能复杂,可视化效果差,甚至系统采集的数据指标与业务需求脱节,并不能为业务分析提供有效的数据,或者不能及时提供数据,这就不可能驱动业务人员使用数据。部分IT人员虽然知道有哪些数据,但是由于缺乏业务需求的驱动,也不去用或不会用。
据统计,企业的数据中有50%~80%可能是睡眠数据,始终无人知晓。
数据是具备复用性的资源,我们不应用完即舍弃,它的再利用价值也许你现在不清楚,但在未来的某一刻,它会迸发出来,变“废”为宝。
2. 数据孤岛
很多企业在信息化建设的早期,由于缺乏信息化的整体规划,业务系统都是基于业务部门需求建设的,各业务部门都有自己的信息系统,这些系统都是各自定义、各自存储的,彼此间相互独立,数据之间没有关联,而形成了一个个数据孤岛。所谓数据孤岛,简单来说,就是企业发展到一定阶段时,各个部门各自存储数据,部门之间的数据无法共通,这导致数据像一个个孤岛一样缺乏关联性。
企业想利用好数据,就必须打通数据孤岛。然而打通数据孤岛是一项复杂的工程,其困难不仅在于技术,还来自业务。数据本身是因业务和流程而产生的,只有对企业业务和流程进行细致梳理和深度理解,才能真正实现数据的打通。由于打通数据孤岛的成本高,难度大,周期长,众多企业望而却步。
3. 数据“巴别塔”
巴别塔是《圣经》中的一个故事。这个故事有很多隐喻,其中一个是在协作的过程中顺畅沟通的重要性。顺畅沟通的前提是彼此之间有一套共同认可的对话标准。
在很多企业中存在着数据“巴别塔”。不同部门、不同员工之间因为数据定义不清、口径不同、缺乏规范而无法顺畅交流和沟通。例如:某个大型集团对于“在职员工”指标的定义五花八门,有的部门是按照是否与企业签订劳务合同来统计的,有的部门是按照企业发放工资的人数来统计的,还有的部门是按照在本单位的人数进行统计的,等等。不同部门对“在职员工”的定义和统计口径都不一样,这种情况下,谁也不知道集团到底有多少员工。
4. 糟糕的数据质量
数据对企业来说是一个“福音”,然而,糟糕的数据质量可能是一个大问题。数据的可信性是影响数据分析和管理决策的重要因素,然而企业数据普遍存在着不一致、不完整、不准确、不正确、不及时等问题。数据质量问题得不到有效解决,数据价值化、数据业务化就无从谈起了。
如果说数据是“石油”,那么原始数据也只能算“原油”,其本身没有太大的价值。原油只有经过加热、催化、蒸馏、分馏等一系列淬炼、提纯的过程,才能产出不同型号、规格的产品。数据其实也一样。原始数据并没有什么作用,只有经过采集、存储、处理、清洗等一系列加工处理过程,才能形成可信的、高质量的、可被利用的数据资产。
5. 数据的安全风险
数据的应用与数据的安全密切相关。数据收集和提取的合法性、数据隐私的保护与数据隐私应用之间的权衡正成为当前制约大数据发展和应用的一大瓶颈。没有人不重视数据安全,但是数据缺乏有效管理,一定会产生数据安全问题。比如缺少数据的采集、存储、访问和传输的规范制度,没有设定必要的数据使用权限,这就必然会导致数据遗失、篡改与泄密。
可见,只有管得住、用得好,数据才是企业的资产,否则就会成为拖累企业的包袱。