前言
FOREWORD
当前,全球已经进入“数字经济”时代,数据的价值愈发凸显,大数据作为一个新兴的技术产业正逐步融入我国经济发展的各个领域。近年来,数字化趋势下的新一代信息技术与实体经济深度融合,成为推动经济发展的新引擎,数据成为驱动经济发展的重要新型生产要素,对整个社会产生显著、深刻的影响。2020年,《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》将数据作为一种新型生产要素,与传统生产要素并列,明确提出加快培育数据要素市场,主要措施包括推进政府数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护。近年来,越来越多的行业决策开始从业务驱动向数据驱动转变,要促进行业的发展需要大量的掌握数据分析处理技术的人员。
为加快推进党的二十大精神进教材、进课堂、进头脑,编写本书时编者将“立德树人”有机融入其中,丰富本书内容。党的二十大报告指出:“坚持创新在我国现代化建设全局中的核心地位。”本书是“中国特色高水平高职学校和专业建设计划”项目中软件技术(软件与大数据技术)专业群教材建设成果之一,依托已建成的在线共享课程“大数据分析处理”数字化资源,构建书证融通、立体化新形态教材。编写本书时根据《数据应用开发与服务(Python)职业技能等级标准》,将大数据分析处理行业的新技术、新规范、新标准融入教材;参考企业对大数据分析处理相关岗位人员的任职要求规划教材内容。本书采用理论与实践相结合的方式讲解大数据分析处理的基础知识和实现技术。全书共13个单元,内容包括大数据分析概述、numpy科学计算基础、pandas统计分析基础、数据读取与写入、数据质量与数据清洗、数据合并与数据转换、数据分组与数据聚合、scikit-learn机器学习、使用统计图表展示数据、某地区电力公司用户付费行为预测、《你好,旧时光》文本挖掘分析、基于大数据可视化的城市通勤特征分析研究、上市公司新闻情感与股票价格的关系。单元1~单元9由学习目标、相关知识、任务实现、素养拓展、单元小结、课后习题组成,单元10~单元13是4个综合案例,由项目目标、相关背景知识、任务实现、项目总结、项目实践组成。本书内容有机融入大数据分析处理知识点和技能点,由浅入深、循序渐进,通过课后习题检测学生所学知识,通过课堂实践和项目实践进一步提升学生实践技能。
本书编写组成员具有丰富的课程建设经验和教材编写经验。郭永洪和贺萌是本书的主编,负责编写、统稿、审稿和定稿,贺宁、曹昊、丁慧、许秋熹参与本书编写。具体编写分工为:单元1、单元2、单元9、单元10和单元11由贺萌编写,单元3由贺宁编写,单元4、单元12和单元13由郭永洪编写,单元5和单元7由曹昊编写,单元6由丁慧编写,单元8由许秋熹编写。
本书编写时得到南京青橙科技有限公司的大力支持,高级工程师解冰和张金君对本书中的任务设计及技术实现给予充分的指导,提出许多宝贵意见,在此表示衷心感谢。此外,由于编者水平有限,书中难免有疏漏和不足之处,恳请广大读者批评指正。
编者
2023年9月