银行业信息安全攻防与风险管控
上QQ阅读APP看书,第一时间看更新

1.2 金融大数据发展及安全

1.2.1 金融大数据

随着数据时代的到来,率先引起全球高度关注的行业之一就是金融业。由于国内银行业的信息资产占整个金融业资产90%以上,因此金融业具有显著的IT属性,每次通信技术的革新都会给金融业带来变革,金融业在IT基础设施、数据掌控力和人才集中度方面相较其他产业具有明显的优势,具体体现在以下几个方面:

一是传统银行交易系统每天会产生海量的交易流水信息,这些信息主要是结构化形式的数据;

二是业务中后台处理过程中,银行采集了大量用于集中作业、集中授权、集中监控的影像、视频、录音等非结构化数据;

三是银行网站、各类移动应用产生每天巨大的点击量,这些数据隐含了大量客户需求或产品偏好信息;

四是在各类媒体、社交网站中发布的涉及客户投诉和产品评价信息数据;

五是金融业相比其他行业,具有相对充裕和相对高质量的IT技术和人才储备。

同时金融大数据的分析应用将提高金融业的整体生产力,同物质资本、人力资本一样,大数据将成为经济活动一个重要的生产要素,它也可以转变成为生产力,创造巨大的经济价值。开放的、数字化的银行随着大数据的应用可实现更高的生产力,主要体现在以下几个方面。

一是大数据的发展及部分金融产品交易的虚拟化,使金融供应链下沉并延伸到各个行业终端客户外延,降低了全社会的融资成本和财务费用,提高了整个市场的生产效率。

二是大数据的积累使得商业银行可以通过全面分析内部数据和外部的社会化数据获得更为完整的客户全貌,避免因客户信息不全面导致错误认知,使得销售更具有精准性;此外,银行能够通过现有客户及其人际社会网络或业务网络发现更多具有价值的潜在客户,并对其展开精准营销。

三是通过整合结构化和半结构化的交易数据、非结构化数据及交互数据进行全面的模式识别、分析,能够帮助银行实现事前风险预警、事中风险控制,建立动态的、可靠的信用系统,并对各种交易风险进行识别,有效地防范和控制金融风险,同时深度挖掘高价值的目标客户。

四是促进银行进行产品创新。银行可以通过科学分析技术对海量结构化与非结构化数据进行分析和挖掘,更好地了解客户的财务状况、消费习惯、行为特征、使用偏好、群体特征及个体网络行为模式,银行业可以充分利用这些信息为客户制定个性化、智能化的服务模式,设计开发出更贴近用户需求的新产品。

1.2.2 大数据安全应用

数据的生命周期一般可以分为生成、变换、传输、存储、使用、归档、销毁7个阶段,根据大数据特点及应用需求的特点,对上述阶段进行合并与精简,可以将大数据应用过程划分为采集、存储、挖掘、发布和感知5个环节。

1. 数据采集安全

银行业海量大数据的存储需求催生了大规模分布式采集及存储模式。在数据采集过程中,可能存在数据损坏、数据丢失、数据泄露、数据窃取等安全威胁,因此需要使用身份认证、数据加密、完整性保护等安全机制来保证采集过程的安全性。在数据的采集和收集中我们必须要保证数据传输安全,一般来说传输安全主要包括机密性、完整性、真实性、抗抵赖性,采用VPN、SSL等技术可以达到安全传输效果。

2. 数据存储安全

大数据关键在于数据的分析和利用,因此数据存储的安全风险不可避免地增加了。相对于传统的数据,大数据还具有生命周期长、多次访问、频繁使用的特征,在大数据环境下,也增加了用户隐私数据泄露、企业机密数据泄露、数据被窃取的风险;另外黑客也会想方设法窃取平台中存储的数据,以牟取利益,大数据的泄露将会给企业和用户带来无法估量的后果。在数据的存储中我们应更加注意数据的隐私保护、数据加密、数据的备份和恢复。

3. 数据挖掘安全

数据挖掘是大数据应用的核心手段,是发掘大数据价值的过程,即从海量的数据中自动抽取、智能分析隐藏在其中有用的信息,对高维度的信息进行降维分析,从而找出关联规律。数据挖掘融合了数据库、人工智能、机器学习、统计学、高性能计算、模式识别、神经网络、数据可视化、信息检索和空间数据分析等多个领域。数据挖掘中可能会引入第三方机构,如何保证第三方在进行数据挖掘的过程中不植入恶意程序,不窃取系统数据,这是大数据所面临的问题,我们可以通过身份认证、访问控制、关系型数据库安全策略等技术来进行防护。

4. 数据发布安全

数据发布是指大数据在经过挖掘分析后,向数据应用实体输出挖掘结果的环节,也就是数据“出门”的环节,其安全性尤为重要。数据发布前必须对输出的数据进行全面的审查,确保输出的数据符合“不泄密、无隐私、合规性”等要求。通常会采取数据安全审计、数据溯源等技术来保证数据发布的安全。

5. 基于大数据的态势感知

在获取数据之后,由于网络数据的体量巨大、内容复杂、难从原始数据中得到有用的信息。这些网络流量数据必须经过分析形成简明的、能够理解的形式,进而反映当前的安全状态,即通过各类设备的海量日志进行智能分析,判断网络、应用、终端、数据流的状态正常与否,异常情况在什么时间和位置发生。通常使用建立统一的态势感知平台,形成统一、直观的管理视图进行异常情况的快速响应。