数据资产评估指南
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.3.1 数据标准不统一

1.数据资产类型多样、分散复杂

21世纪以来,全球数据呈爆发式指数增长。国际数据中心(IDC)发布的《数据时代2025》报告显示,到2025年全球每年产生的数据将从2018年的33ZB增长到175ZB,相当于每天产生491EB的数据。单一机构的数据规模由以前的GB级上升到TB级,甚至PB级、EB级。各国政府、不同行业领域的企业除了可采集内部业务数据,还可利用手机终端、传感器、机器设备、网站网络、日志等技术获得大量的外部第三方数据。

数据作为一种资产呈现出数据对象海量、多样、多元化等特点。各行业(如电信、金融、政府、医疗、工业等)存在海量的数据资产,根据用户关注点不同,可以分成不同维度的资产类型,如按照数据来源,可将数据分为互联网数据、科研数据、感知数据和大数据。数据格式种类也日益丰富,文本数据、图像数据、语音数据、视频数据等半结构化数据或非结构化数据占比越来越大。但目前,数据资产还没有权威的分类标准。此外,不同类型数据的处理、存储、管理方式也不同。多来源、不同格式、不同种类的数据资产为其治理和价值评估带来一系列难题。

2.管理部门分割自治,数据壁垒现象严重

政府数据管理部门分割自治。在大数据时代,要最大限度地挖掘和释放数据的价值,根本在于促进数据自由、安全地流动。在政务数据方面,2018年国务院印发了《关于加快推进全国一体化在线政务服务平台建设的指导意见》,以加快推进构建统一高效、互联互通、安全高效的国家数据开放共享交换平台,使“让数据跑路,不让群众跑腿”成为可能。但是,当前我国政府信息化建设仍然处于初级阶段,仍然面临着各机构各自为政、管理部门分割自治、各部门沟通困难、“数据壁垒”现象严重等问题。主要原因包含两点,第一,出于观念、利益和安全等诸多因素的考虑,很多政府单位将数据资产当作本部门追求政治利益和经济利益的手段,对数据开放共享持抵触或推诿现象,导致出现“数据烟囱”的不利局面;第二,数据资产是在机构各部门长期信息化发展的基础上产生的,由于较长时期内各部门间信息化建设各自为政,数据元、数据类型、数据标准和数据质量等各不相同,使得数据资源横向传播受阻,各部门之间数据共享困难,加重了“数据孤岛”的现象。例如,医院、社保、保险、公安、银行和运营商等不同机构分别掌握着公民个人的不同信息,但各个部门实现数据融合共享却是很困难的事情。

数据壁垒现象不仅存在于政府部门之间,企业间此现象也相当严重。为维持本企业的竞争优势,在数据资源方面具有市场支配地位的经营者,可能采取限制措施妨碍竞争对手收集数据。例如,在2019年年初的腾讯与抖音、多闪之争中,腾讯表示,腾讯用户在注册账号时同意的《用户协议》中就有约定,微信、QQ头像、昵称、好友关系等数据的所有权归属腾讯,因此没有腾讯授权,即使用户同意,也不能使用微信、QQ账号直接登录抖音或多闪。当前,阿里巴巴、腾讯和百度几乎垄断着我国大多数的消费数据、社交数据和搜索数据,通过数据垄断的形式,使自身发展更加强大,不断扩张商业版图。但是,互联网市场中的其他中小型企业对巨头所掌握的数据望尘莫及,因此也很难在现有市场中取得突破,这也进一步加剧了“数据垄断”的现象,导致跨行业间数据流通和共享不畅,一些有价值的公共数据资源和大量的商业数据资源基本处于锁死状态,降低了资源利用率和数据的可得性。

3.数据组织标准不一,数据质量参差不齐

当前,我国政府和主管部门对数据描述标准的制定仍处于初级阶段。地方政府数据资源的组织发展都具有各自的独立性,仅有少数如贵州、广东、北京等省市制定了数据标准方案。这些标准对数据资产的组织和标准化具有一定的参考性,但并没有按照资产属性对数据资产进行不同维度的资产分级分类,缺乏对数据资产元数据目录的制定,在元素取值范围、元数据文件格式等方面都尚未建立标准规范,且内容差异性较大、标准并不统一,无法在更大的地区乃至全国范围内推行。

数据组织标准不统一导致数据资产治理和数据资产评估困难。在大数据时代,原生数据不能被直接利用,需要对原生数据进行加工处理,其价值才能显现,就像翡翠原石的开采,如若不加工成饰品,其价值与石头并无二致。政府、企业追逐的数据价值也基本都体现在衍生数据上,而衍生数据价值的高低则取决于原生数据到衍生数据的聚合、加工、计算的准确程度。但是,由于各企业、机构的信息系统完全由设计人决定,数据分类标准和组织方式可能不同,则不同信息系统产生的数据及结构可能完全异构。这也使得当前无论是政府还是企业,他们的大部分数据资源都被束之高阁。要实现信息系统之间的互联互通,就必须转变数据结构方式,这是一项专业性强、难度大的技术活,国内大部分企业和政府部门的数据基础比较薄弱,很多数据主体不具备数据资源的整合和加工能力,更不必说数据资产的流通和治理。此外,数据标准的混乱,也导致数据质量参差不齐,糟糕的数据质量将直接导致数据统计分析不准确、监管业务难、高层领导难以决策等问题。根据数据质量专家Larry English的统计,不良的数据质量会使企业额外花费15%~25%的成本。因此,若要将数据资源转化为资产,并充分发挥其经济价值,前提是制定统一、规范化的数据描述和组织标准,规避错误数据,保证数据质量。