社会远观:人文社科的大数据视野
上QQ阅读APP看书,第一时间看更新

导言

大数据的应运而生,为人类理解社会提供了前所未有的透镜。

这把透镜,能够深入大历史纵深、大空间跨度的宏观社会过程中去。因此,它带给我们的,不只是人文社科学界知识生产、传播模式、研究方法和基础的变化与重构,同时也为每一位社会公众观察、记录和思考社会现象与社会过程,提供了过去只有专业人员才可能拥有的视野,甚至是传统社会分析者无法拥有的强大工具。

社会包罗万象,相关议题的呈现和研究的广度、深度,均伴随着海量数据的整合而得到极大的拓展与创新。利用大数据来进行人文社科领域的研究,逐渐成为当代学科交叉的前沿和热门领域,成为新文科的重要学术增长点。但基于科学逻辑、量化方法和宏观意识的大数据思维,只有在全社会范围内被理解和普及时,才能真正发挥出其所蕴藏的巨大威力。同时,大数据也必然会从社会大众望而生畏的专业领域的工具,逐步发展和嬗变为被公众熟知甚至可被公众驾驭的思维利器。大数据被社会大众理解和使用的过程,是我们的时代中最了不起却又最悄然无声的社会演化进程之一。

本书的宗旨,就是在人文社科领域,为当前大数据研究的专业积累进程和大数据知识的大众化、普及化进程,起到牵线搭桥与催化促进的作用。这一努力对于人文社科领域来说,有着比对于自然科学领域更为重大和迫切的意义。这是因为,和传统数据相比,大数据本身更有和人文道统相通之处。这种相通之处,可以使传统的人文传习者更为透彻、直接地了解到数据底层的逻辑和时空的力量。

文化的积累、精神的习得、情操的体悟,乃至社会现象的涌现,其实都依赖于大数据式的海量知识的叠加、发酵和进化。书法养成的肌肉记忆,熟读诗律后的推敲苦吟,甚至老神医望闻问切经验的形成,无不来自巨量的信息。当人文社科领域研究者从大数据的远读、远观和直觉中真正意识到数据的价值,就不会再因为门户之见而对科学量化的范式产生更多的误解。更重要的是,当越来越多的社会公众熟悉了大数据、见证了大数据的力量后,社会对大数据的隔膜和学界对量化范式在人文社科领域内应用的误解与偏见,就会得到越来越快的消解。

本书的数据分析案例,全部来自我和团队近年来的各类正式完成或进行中的研究项目。团队的成员来自五湖四海,以南京大学社会学系青年教师和研究生为主干,同时还有清华大学、复旦大学、武汉大学等国内顶尖高校的社会科学青年学者。团队的大数据分析源不一而足:从千万书籍、千亿词汇、万亿字节的大规模书籍文本语料库到汇聚全球新闻站点十亿条信息的新闻数据库,从谷歌、百度等各类搜索引擎到微博、微信、脸书、推特等各类自媒体平台,从哈佛大学中国历代人物传记资料库(CBDB)到互联网电影资料库IMDb,甚至还包括各类网络电子文本信息。团队的研究内容海纳百川,从500年来城市社会文化的知名度到100年来美国的社会分层流动,从当代跨国投资到互联网空间和社会治理,从学术合作网络到中美博弈外交战略……这一系列跨学科、多角度、交叉性的实证分析,源于团队的学术发表和项目,旨在通过对大数据信息维度、思维方式和分析思路的提炼与展示,尽最大可能向社会公众传播大数据思维。

也因此,本书的读者,既可以是对计算社会科学和大数据感兴趣的人文社科学者,也可以是希望了解学术前沿和提升社会分析能力的社会大众。本书试图以非学术化的语言,系统介绍大数据的人文社科应用领域与价值,展示大数据何以能从社会、经济、文化、政治、历史等多种角度实现所谓的“社会远观”功能。“社会远观”,也即从大历史纵深、大空间跨度的视野,通过海量数据来观察、展示和分析宏观社会过程与人文现象。“远观”的获得,来自对大数据关键属性的充分挖掘:通过计算机编程,从大数据或云平台中提取出传统人文社科分析无法获取、无法测量或无法发现的关键性信息、指标和过程,进而通过可视化、数量化以及计量分析的渠道进行相关社会机制的剖析,从而为观察、展示和研究宏观层面的社会文化现象与过程提供全新的视野与思维方式。

“社会远观”在方法上,与人文知识和道统的传统思辨与传播方式以及与利用样本调查问卷数据进行的微观层面社会科学研究,均形成了分析层次和观察距离上的巨大反差。因此,本书的内容,既是对人文社科研究对象与方法的重建,也是对长期以来基于个体层面的定量研究理论意识弱化、宏观思路缺乏的反思和修正,更为当代公众提供了一个以往无法想象的思考和了解宏观时空尺度上的社会现象与文化过程的重要平台。