第三节 大数据的社会—技术系统
在组织管理理论、演化经济学、新制度主义等社会研究中,解释个体行为往往是分析的起点,这个研究趋势也被称为方法学个人主义(Methodological Individualism)(Arrow,1994)。从这一视角出发,人类的所有行为都可以被认为是解决问题的活动(Mantzavinos,2004)。问题解决是一个手段—目的(Means-End)的过程,包括确定议程、设定目标和设计行动(Simon et al.,1987)。对于一个定义良好的问题,存在初始和目标两种状态。初始状态指现在的状态,目标状态则指期望达到的状态,或者说是一个解决方案。问题空间就是这两种状态之间的差距。解决问题就是在这个问题空间中寻找从初始状态到达目标状态的路径,而对所有可能路径方案进行评估和选择则进一步涉及了决策(Newell & Simon,1972;Simon,1978;Simon et al.,1987)。
一 大数据分析的社会基础
通过模仿和利用人类心智模型并构建大数据心智模型,大数据范式能够更精确地感知人类需求并推动智能管理、决策优化,并最终推动人类问题解决(徐鹏、徐向艺,2020)。然而,将大数据与管理组织理论实践结合不仅在于理解大数据如何在流程上成为决策支持,而且要求必须知道数据在通过加工“流水线”时是怎样被组织分析的,这就要求应用者在面对大数据系统时不仅能够回答“how”的问题,还要回答“why”的问题(Lugmayr et al.,2017)。
目前,大数据技术已经与人工智能技术深度结合。在大数据出现之前,一切问题解决和决策过程都发生在人类有限的工作记忆中,而大数据等计算技术的出现则部分取代了人类智力活动和问题解决过程(Pearl,1984)。大数据和人类可以被视为两个相应的实体,两者都在构建观察、理解和解决客观世界问题的模型,这一模型被称为心智模型(Mental Model)。大数据通过构建根植于数据符号空间的相关系统作为其心智模型来丰富自身数据空间(Chandler,2015)。它们可以处理复杂系统的计算模型,或者利用因果关系的数学模型迭代地优化数据空间以提高预测能力(Grimmer,2015)。因此,有研究者将大数据影响定义为人类通过应用大数据的“心智模型”,达成更高效的问题解决和决策效率(Provost & Fawcett,2013),并撬动个体、组织和社会的改变(Chen et al.,2012;McAfee et al.,2012)。
二 大数据分析的人机认知冲突
虽然大数据通过提高人类问题的解决和决策效率为组织带来了潜在的发展机会(Clarke,2016),但更广泛的批评质疑组织在利用大数据获取经济利益时兼顾社会价值和伦理道德的能力(Richterich,2018)。例如,记录用户信息的大数据能够赋予广告商和受众平台更精确的推送能力和更高的数字营销价值(Dempster & Lee,2015),而对数据以及数据潜在价值的渴望往往驱使大数据企业将目光投向用户隐私,典型的如脸书(Facebook)侵犯用户隐私的丑闻等伦理问题(Hull,2015)。因此,大数据在加强了组织问题解决能力的同时,也同样招致了很多社会舆论的批评。
Weber和Simon的理性选择理论为比较数据与人类的心智模型提供了一个通用的理论框架。Weber(2019)将理性分为对立的两个维度,即实质理性(Substantive Rationality)和形式理性(Formal Rationality)。根据Weber(2019)的定义,经济活动的形式理性可以被描述为该活动在技术上可能实现的计算(Calculation)程度,以及实际应用的程度;而经济活动的实质理性则更关注经济导向的社会行动受到特定社会人群评价主张(Evaluative Postulates)的影响程度。这些主张通常非常模棱两可。Lindebaum、Vesa和den Hond(2020)在数字背景下进一步澄清了两者的概念:以形式理性为前提的决策遵循抽象的形式的程序、规则或者规律,以在手段—目的(Means-end)框架下达到特定的合法目标;而以实质理性为前提的决策则更关注人类价值性的思考和行动的能力(Follesdal,1982)。
Simon(2000)则将理性定义为预先设定的目的和达到目的的方法之间的一致性关系,以过程理性(Procedural Rationality)指代形式理性,强调了形式理性取决于产生行为的过程而非目的,并指出了组织管理理论从实质理性向过程理性过渡的必然性(Simon,1976),以及以计算机技术支持组织管理的可能(Simon,1960,1979)。然而,这一观点的批判者认为极端的程序理性会压迫决策者进行价值判断和选择,甚至独立进行问题解决的能力(Lindebaum et al.,2020),大数据系统作为形式理性的载体因而对人类基于实质理性的监管有着固有的要求(Hoc,2001;Konar,2018)。
通过将形式理性固化为算法,不受限制的大数据发展将会导致两类可能的社会影响:它既可以通过形式理性强化对实质理性的抑制,也可以通过形式化将实质理性转化为形式理性。一方面,价值取向的形式化必然将资源和注意聚焦于程序所代表的价值,而会将其他理性同时边缘化,抑制实质理性。例如,Simon(1976)批评的传统实质理性取向的经济学家过度地将目光投向了经济因素,反而忽视了作为形式化结果的形式理性。Lindebaum等(2020)则更进一步地指出,当某一组特定的价值通过形式化成为“显性”规则时,它们会自然挤压其他价值的生存空间。另一方面,形式理性是实质理性形式化的结果(Kalberg,1980),团体就一组可识别的价值观达成一致能够为其理性化提供方向,这一过程也可以被认为是实质理性的“制度化”过程(Mintzberg,1994)。通过形式化,特定价值凌驾于其他未形式化价值之上,实质理性将失去其多样性和模糊性,并作为主流价值观进一步对其他价值实施边缘化。因此,在一个封闭系统内,完全基于形式理性的大数据驱动的自动化决策在上述两方面构成了自我强化反馈循环,营造了适合仅形式化成长和数字技术极权生态,消弭了基于价值观选择的决策的必要性(Simon,1976),最终威胁作为形式理性基础的实质理性,并最终导致理性的消亡(Lindebaum et al.,2020)。因而,大数据与人类心智模型的冲突实则是大数据范式背后的形式理性与人类社会广泛存在的实质理性的人机二元冲突。
三 大数据分析的二元认知调协
有学者认为,大数据的社会应用并非仅仅是数据的加工。作为社会—技术系统的大数据依赖于大数据技术系统与人类社会经验系统的协同,这一二元模型也可被称为认知大数据。认知大数据指以人类可理解的数据为基础,以知识管理为目的,在合适的应用背景和合适的细粒度下,支持个体心智能力发展的社会技术系统(Lugmayr et al.,2017)。这一系统的实现除了依赖传统的监督学习等方法(Bostrom & Yudkowsky,2014),同样也依赖于对大数据心智模型和人类心智模型的协调和统一。
认知大数据的本体论暗含着人类和机器的双元心智模型:一方面,它支持人类从数据中获取信息、知识、洞察和情报等,并接手程序性的决策过程,解放人类认知;另一方面,它还涉及将人类的经验价值等实质理性反向输入大数据系统,使大数据系统能够感知更多人类价值、意图和观念。信息系统研究和社会科学研究需要考虑这些趋势,并通过支持公司内部的知识创造过程来增加这种可能性。例如,通过关注数据分析和数据可视化等形式理性程序,减轻人类理解数据的认知负担;同时利用主流的实质理性作为指导,引导大数据发展方向。最终实现大数据系统与人类认知系统在客观世界的认知上达成一致,或者说允许决策者根据价值观等进行选择的大数据系统。
随着人机交互,关联模型与控制系统的因果模型之间不断转换。从人类的角度来看,大数据系统提供的感知表征提供了可被人类接收的信息。而人类的反馈则通过编码、规则、程序或数据的形式重构机器的心智模型。机器智能程度越高,两种模型的操作方式就越接近。此交互的结果减少了人类所需的认知负载,并使数据更易于受过培训的数据分析人员以外的用户访问。
在每个循环中,模型将过滤背景信息,并通过大数据分析转义为其他形式。通过创建感官表征(例如可视化),相关模型将从它所基于的数据中删除。只有原始数据的一小部分被传递给经验空间。通常,这些数据以摘要和更高级别的概念的形式呈现。当人类感知可视化时,它们被变成人类经验空间的记忆,通过记忆和经验网络验证数据中所呈现的抽象模式,并成为经验空间中的因果模型。
如果两个模型不匹配,则必须重新调整模型或者重构数据空间。在后一种情况下,因果模型从其人类经验背景中剥离出来,并通过编码转化为相关模型。当因果模型等于编译后的相关模型时,两者的平衡就达成了。也就是一个模型通过编码或表征不再改变任一模型的任何部分时。由于新数据、经验、需求和问题的出现,大数据的社会—技术知识空间处在持续地平衡破坏和再平衡过程中,这种过程创造了新的知识和应用。人类经验空间和机器数据空间是同步的,并且以人机可用的形式包含知识,进而成为可能的社会技术应用系统。
对这一再平衡过程的探讨同样见诸传统决策理论的文献中。Lindebaum等(2020)指出,极端形式化的社会技术系统会按照手段—目的框架进行决策。换而言之,当决策目的被决定时,对方案的选择就拥有了抽象而统一的黄金标准,因而算法实质是通过一种必然产生一个结果的可重复的程序性演算来运行的,所以它们排除了根据信念、价值观等的“选择”阶段,而是自动化的比较和“优化”。Lindebaum等(2020)同样借此批评Simon(1976,1979)提出的管理学界应当更多地将注意投向程序理性和认知过程这一主张,认为过度关注利用计算机强化形式理性会自然导致人类理性的退化和进一步的“习得性无助”;实质理性必然是在事后反馈,尤其是对错误的反馈中,获得发展机会的。虽然目前社会已经广泛地利用以数据驱动决策为代表的大数据决策范式作为管理决策的重要组成(Brynjolfsson & McElheran,2016),数据支持的决策系统,例如商业情报,在维持人类实质理性上具有更显著的积极作用(Larson & Chang,2016)。然而,Simon(1979)的理论虽然强调程序理性的重要,但是其同样认为计算机虽然增强了人类问题解决能力,然而这仅仅代表赋予人类更多可选择的方案,而决策阶段最终的选择,则仍然依赖人类经验参与(Simon et al.,1987)。