自序
在工作上,我更希望别人称呼我为“李工”,这个“工”是工程师的缩写,对应的英文单词是Engineer。这样的称呼其实与我的具体职务或职位无关,而仅仅代表我是一个具备专业技能的IT从业者。
尽管我在这个行业中已经工作了十几年,但仍然算是一个晚辈。幸运的是,这些年来我经历了比较大的角色转变,从一个相对单纯的数据开发人员转变为一个相对单纯的应用开发人员。虽然这种转变让我在一段时间内感到非常痛苦,但也让我对企业数据架构及应用架构有了更加全面的理解。
正如有一首歌的歌词所说:“What doesn’t kill you makes you stronger.”两种角色,让我有了两种思考问题的视角:数据架构及数据开发人员的视角和企业应用架构及应用开发人员的视角。我逐渐对“数据孤岛”“数据荒漠”背后的原因有了更加深刻的认知。
当前数字化浪潮已经席卷各个行业,各种数据概念层出不穷。企业数字化转型、迈向数字化的需求此起彼伏,数据湖、数据中台、流批一体化、湖仓一体等各种架构或解决方案应运而生,数据治理、数据资产等各种要求随之出现,DataOps等各种探索也逐步展开。以上种种无疑对从业者提出了更高的要求。
然而,我发现很多从业者对于他们的工作内容在企业数据版图中所处的位置或所起的作用并不清楚,对于新时代背景下的数据技能的要求也有些困惑,甚至连很多与数据相关的基础概念都不太了解。这些都表明企业对于数据相关人才的诉求与数据从业者之间存在一些错配。
为了解决这个问题,我根据自己的理解,提炼出了一些相对重要的内容(由于个人能力有限,可能存在一些疏漏),无论企业数字化进程处于哪个阶段,这些内容都是构成企业数据架构的基础,并且可能会随着数字化进程的加深而变得越来越重要。
近几年企业数据建设发展迅速,我与很多行业的从业者对此进行了深入的探讨。探讨过程中得到了很多优秀人员的无私帮助,他们是我的良师益友。张忠梅、何淼两位分别深入阐述了各自领域中企业数字化的诉求,例如金融创新应用场景下的数据资产管理实践等。袁在敏、张铮作为非常资深的数据从业者以及优秀的项目管理者,始终奋斗在企业数字化转型的一线,他们让我了解了不同行业的企业在数字化转型中所处的具体阶段以及遇到的一些问题。杨菲作为我10多年前的老领导,是我进入数据行业的引路人,在一起工作的日子里,我深刻体会到了他的专业以及对于数据体系的独到见解,大受裨益。没有他们的帮助和支持,我将无法完成这本书。
最后要感谢我的朋友和家人。为了写这本书,我经常在咖啡厅中度过周末,而我的女儿Shiry会坐在我面前写作业。每当抬头看到她可爱的脸庞时,我都会获得坚持写下去的动力。写作的这两年多来,我经常从晚上写到凌晨,感谢我的太太理解和支持我,给我营造一个温柔的环境,让我可以安心地创作下去。感谢她们一直以来对我的鼓励和陪伴。