计算社会科学研究障碍
在研究范式上,现有的解释人类行为的理论和范式是在无法获取和处理几千万兆的人类交互信息数据的时候发展和建立起来的。比如说,基于几十个人某一时刻的数据而建构的社会网络理论如何能解释上百万人之间的相互关系呢?关于人们如何互动的大量新兴数据可以为研究人类的集体行为提供新的视角,但我们目前社会科学的研究范式并不一定会接受。
推进计算社会科学还存在着很多制度性障碍。计算社会科学与物理和生物学的研究问题不同,在观察与干预研究对象过程中也存在着不同的挑战。在物理学和生物学实验中,夸克和细胞不像人类一样,会因为别人的观察而不自觉或者刻意的掩盖自己的行为,它们乖乖的听从人类的干预而不会反抗。就基础条件而言,从社会科学到计算社会科学所要解决的困难要比从生物学到计算生物学之间克服的困难大得多,究竟为什么会这样呢?主要是从社会科学到计算社会科学的发展需要解决分布式监控、数据使用许可权获取和加密等问题,在社会科学领域中这些资源都较为缺乏。
也许最令人头疼的问题还是数据的获取和保护,目前很多研究所需数据都涉及到个人隐私。以美国AOL公司事件为例(13),在2006年8月,AOL公司公布了2006年3月1号到5月31号这3个月用户的真实搜索记录,包括1900万搜索,1080多万不一样的搜索词,还有65万8000个用户ID(美国AOL公司是一家在线信息服务公司,可提供电子邮件、新闻组、教育和娱乐服务,并支持对因特网访问,2015年被威瑞森通信(Verizon Communications)收购)。虽然用户的ID是匿名的,但如果你足够细心认真的话,还是可能从这8000多个用户中发现足够多的信息。有一位记者就从搜索的地址和姓名中快速找到了一位62岁的老太太,并且老太太证实了那些罗列出来的搜索词确实是她的。你还可以从搜索词中看到这样一些关键词
(来源:https://www.seozac.com/other-se/aol-data/)
1、怎样炸掉一栋楼
2、怎样给别人下药
3、怎样制造炮弹
4、怎样攻入别人的电脑
5、怎样杀死太太
6、怎样杀人能够不留痕迹
7、......
AOL公司做出的这件蠢事给社会带来了一场大混乱,虽然该网页几个小时之后就被撤下,但数据却被网友们在互联网上广泛传播,这也为私人公司擅自分享私人数据敲了警钟。
设想现在,如果谷歌、百度、天猫、腾讯、京东等互联网巨头突然公布了所有人的搜索记录、聊天记录、购物记录等,更不幸的是,如果你浏览器的登录昵称是你的真实名字,同时你多次在浏览器中搜索你家附近的加油站、超市等信息,并且在天猫购物平台中多次输入你的地址,那么你可能很快就被定位。根据你的搜索记录,你将被贴上各种各样的标签,“房奴”、“彩妆迷”以及“二次元”等。更可怕的是,你的电话可能会被各种销售公司打爆,生活将变得一塌糊涂。
因此,为了保护个人的数据隐私和企业的利益,为了能让这些数据发挥作用从而促进科学研究的进步,企业和科学家之间建立起合作共赢的数据分享模式是非常有必要的。总体来说,妥当地处理隐私问题是非常必要的。最近美国国家研究委员会有关地理信息系统的报告就特别指出,即使是非常仔细地匿名化数据,还是有可能重新分析出个体的隐私数据(14)。去年,美国国家健康局和惠康信托基金会突然停止了一些基因数据库的在线获取功能(15)。尽管这些数据只是非常简单地报告了某些特定的遗传标记的总频率,根本没有包含个人信息,一些研究者仍然认为,基于数据库中每个个体的大量数据,依照现有的统计技术,依旧能够重新定位到个体(16)。
因为一次偶然的违背个人隐私事故的发生,就可能使得社会对信息共享深恶痛绝,甚至会颁布一些扼杀计算社会科学发展的法律条文。此时我们迫切需要制定合理的规章制度,既能够降低信息泄露风险,又可以保留数据的研究价值。作为学术界自我管理的核心制度,美国机构审查委员会(IRB)需要加强他们的科技知识以了解新技术对于个体的潜在侵权和伤害,因为他们目前的规定中有关伤害的定义已经难以评估这些新型的伤害。IRB的审查员们现有的技术也很难判断数据有没有“真正的匿名化”。除了上述问题外,IRB可能有必要建立起一个处理数据安全问题的部门。目前,已经有很多私人企业手中握有大量的数据,但却没有一个统一的标准来保护数据安全。如果科学家们要用这些数据做研究,就需要考虑到数据的隐私问题,开发技术保护个人数据的隐私,这些技术将会反过来帮助政府和公司保护数据安全和客户的隐私(17)。
与其他新兴交叉学科一样(如:可持续发展科学),若要发展新兴的计算社会科学,就需要建立新的范式培养新的学者。大学中终身教职评定委员会和各个期刊的编辑部需要积极地鼓励新兴学者在跨学科建设方面做出的努力。最开始,计算社会科学的发需要社会科学和计算机科学的学者组成团队一起努力,但来自不同学科的学者努力是远远不够的,计算社会科学的发展最终还是取决于学术界愿不愿意培养计算社会科学家、具有计算相关知识的社会科学家或者是具有社会科学知识的计算机科学家团队。好在认知科学的出现为计算社会学的发展提供了一个很好的范例。认知科学的研究涉及从神经生物学到哲学到计算机科学等各个领域。它吸引了大量资源投入来创建一个共同领域,并在上一代为公共事业创造了巨大的进步。我们认为计算社会科学具有类似的潜力,值得进行类似的投入。