计算社会科学关心的问题
至今,关于人类互动的研究还主要依赖于某一特定时段个人填答的调查数据。而技术发展带来的海量数据(1),能够极大的改善这一现象。例如,往来的电子邮件数据中展示了不同的时间段里人们之间互动关系的结构和内容,据此我们可以研究人们之间的关系如何随时间而变化,帮助我们思考一系列人类互动行为的问题:一个团体内部之间的关系究竟是怎么样的,是已经达到了稳态很少出现变化,还是他们之间的关系一直发生着剧烈的波动?优秀的团队和个人具备怎样的互动模式(2)/(3)?同样,我们还能够考察宏观的社会网络(4),观察它如何随着时间演变。移动电话公司,大型互联网公司Google、Yahoo拥有大量的用户交流信息数据,这些数据能不能描绘出一张社会通信模式的复杂图景,而这张图景又如何影响经济生产力和公共健康?手机使得追踪人类活动变得方便快捷(5,6),同时人类活动数据可以帮助我们研究流行病如何通过个体传播等重要问题。总之,互联网提供了一个全新的途径理解人们之间的连接(7)。仔细思考一下,在刚刚过去的政治选举时期,如果能够追踪被火热传播的论点、谣言、政治立场或者博客圈中的一些谈论(8)以及网络上的“冲浪”行为(9),每一个选民最关心的问题将会变得显而易见。
互联网所营造的虚拟世界,自然而又轻松的捕获了个体行为的完整记录,这为原本不可能实现的研究提供了丰富的数据基础(10)。例如,这些完整的个人记录帮助我们了解一个人在社交网络中的位置是如何影响他们的喜好、心情、甚至是身心健康(11)。自然语言处理技术的发展(NLP)也大大提高了我们分析大量文本数据的能力(12)。未来,我们希望,对社会的认知不再通过手动记录面对面交流者的信息来实现,而是通过各种各样的电子设备自动生成和记录社交信息。总而言之,计算社会科学正在以前所未有的广度、深度以及规模搜集与分析数据,但与此同时,计算社会科学的兴起与发展却遭遇着重重阻碍。