第3章 预测机器的魔力
哈利·波特、白雪公主和麦克白这三个人物有什么共同点吗?他们都被预言或者预测所驱动。就连《黑客帝国》这部看似讲智能机器的电影里,人类对预测的信念也是剧情的推力。不管是宗教还是童话,有关未来的知识都会产生重大结果。预测影响行为。预测影响决策。
古希腊人敬奉的许多神谕宣示所都有着了不起的预言能力。有时候,这些预言中的谜语会捉弄提问人。举个例子,吕底亚国王克罗伊斯打算冒险攻打波斯帝国。国王不信任何特定的神谕,于是决定在寻求攻打波斯的建议之前逐一检验这些神谕。他向每一座神谕宣示所派去了使者。在第100天,信使们被派去询问克罗伊斯此刻正在做什么。来自德尔斐的神谕最为准确,于是国王请它降示有关攻打波斯的预言,并对此深信不疑。
跟克罗伊斯的例子一样,预测可以是关于当下的。我们预测当前的信用卡交易是合法还是欺诈,医学影像中的肿瘤是恶性还是良性,以及出现在苹果手机摄像头里的是不是它的主人。尽管“预测”的拉丁语词源“praedicere”的意思是“事先知道”,但我们对预测的文化解读强调的是看到本来看不见的信息,不管这信息是来自过去、现在还是未来。水晶球也许是人们最熟悉的魔法预言的象征了。我们常把水晶球跟“算命师预测某人将来的财运或爱情”联系起来,但在《绿野仙踪》里,水晶球让多萝西看到了当下的爱姆婶婶。这给我们带来了预测的定义:
预测是填补缺失信息的过程。
预测将运用你现在掌握的信息(通常称为“数据”),
来生成你尚未掌握的信息。
预测的魔力
几年前,阿维(本书作者之一)注意到自己的信用卡在拉斯维加斯赌场产生了一笔大得异乎寻常的交易。他本人并不在拉斯维加斯。他只去过那儿一次,而且是很久以前;赌博注定要输,以他的经济学家世界观而言,这毫无吸引力。他跟信用卡服务商展开了漫长而艰难的拉锯式对话,终于,服务商取消了交易,给他换了卡。
最近,又出现了一次类似的情形。有人用阿维的信用卡买了东西。但这一次,阿维没有在对账单里看到这笔交易,也没大费口舌地跟礼貌但立场坚定的客户代表解释。相反,他接到了服务商事后主动打来的电话,对方说他的卡遭到盗用,新卡片已经在寄来的路上了。
信用卡服务商根据阿维的消费习惯和其他大量数据准确地推断出涉事交易属于欺诈。信用卡公司很有信心,调查期间甚至没有冻结他的信用卡。而且,就像变戏法一样,他用不着做任何事,公司就为他发放了替换的卡。当然,信用卡服务商并没有水晶球。它拥有的是数据和良好的预测模型——一台预测机器。万事达信用卡公司的企业风险和安全部门总裁阿杰伊·巴拉(Ajay Bhalla)表示,更好的预测可以减少盗刷,“解决消费者遭到误拒的重大痛点”。
商业应用场景完全符合我们对预测的定义,即填补缺失信息的过程。信用卡网络发现,(要判断盗刷)了解前一笔信用卡交易是否盗刷是很有用的。信用卡网络运用过去盗刷(和非盗刷)交易的信息来预测最近一笔交易是不是盗刷。如果的确是盗刷,那么,信用卡服务商可以冻结该卡之后的交易,如果预测来得足够及时,甚至当前这一笔交易也可以冻结。
这一概念(将一种信息转化为另一种信息)是人工智能近期取得的一大进步——翻译的核心。翻译语音是遍布于所有人类文明的一个目标,连流传了数千年的巴别塔故事里也有它的身影。从古至今,要实现自动化翻译语言就得雇用一位语言学家(精通语言规则的专家)来解析规则,并将其转换成可编程的形式。比方说一条西班牙短语,除了逐字替换,你还需要理解如何调整名词和形容词的顺序,这样才能让它成为能被读懂的英文句子。
然而,人工智能的最新进展使我们可以把翻译问题转换为预测问题。我们可以从谷歌翻译质量的突飞猛进中看到预测应用于翻译领域后体现出的神奇特质。欧内斯特·海明威的《乞力马扎罗的雪》(The Snows of Kilimanjaro)一文的开头十分优美:
乞力马扎罗是一座海拔19710英尺、常年积雪的高山,据说它是非洲最高的一座山。(Kilimanjaro is a snow-covered mountain 19,710 feet high, and is said to be the highest mountain in Africa.)
2016年11月的一天,东京大学计算机科学系教授历本纯一(Jun Rekimoto)通过谷歌把海明威这篇经典小说的日文版翻译成英文,内容如下:
乞力马扎罗是19710英尺山被雪覆盖的,据说是非洲最高山。(Kilimanjaro is 19,710 feet of the mountain covered with snow, and it is said that the highest mountain in Africa.)
第二天,谷歌的译文变成了:
乞力马扎罗是一座19710英尺的山,常年积雪,据说是非洲最高的山。(Kilimanjaro is a mountain of 19,710 feet covered with snow and is said to be the highest mountain in Africa.)
差异很明显。一夜之间,谷歌的译文就从一看就知道是机器翻译的笨拙文本,变成了一句连贯的话,如同一个人前一天还只能拿着字典磕磕巴巴地讲话,第二天就能流利地运用两种语言了。
诚然,谷歌的译文并未达到海明威的高度,但进步也很了不起。巴别塔仿佛重新建起来了。而且,这一改变不是出于偶然或者碰运气。谷歌利用我们这里重点介绍的人工智能的最新进步,更新了自家翻译产品背后的引擎。具体而言,谷歌的翻译服务现在依靠深度学习来提高预测效率。
把英语翻译成日语,其实就是要预测日语里哪些词汇和短语与英语相匹配。有待预测的缺失信息是,日语单词的集合及其正确的顺序。从一门外语获取数据,然后按照你熟悉的语言中的正确顺序来预测单词的集合,这样你就能够理解另一门语言了。要是整个过程做得足够好,你兴许根本就意识不到这是翻译过来的话。
企业马不停蹄地将这一神奇的技术付诸商业用途。例如,中国已有五亿多人使用科大讯飞开发的深度学习服务,使用自然语言进行翻译、转录和交流。房东用它跟使用其他语言的租客沟通,医院的患者用它跟机器人沟通以寻求指示,医生用它指导患者服药,司机用它跟其他车辆联络。人工智能被用得越多,收集的数据也越多,学习得越多,它的效果也就越好。有了如此多的用户,人工智能将突飞猛进。
预测比过去好了多少
谷歌翻译的变化说明了机器学习(深度学习是其子领域)怎样显著降低了质量调整的预测成本。从运算能力的角度来看,谷歌现在可以用相同的成本提供更高质量的翻译。生成相同质量的预测所需的成本大幅下降。
预测技术的创新正对传统的预测领域产生影响,比如盗刷检测。信用卡盗刷检测已经得到了很大改善,在用户注意到问题之前,信用卡公司就检测并解决盗刷了。不过,这种改善仍然是渐进式的。20世纪90年代后期,当时最先进的方法能抓住大约80%的盗刷交易。这一比值在2000年提高到了90%~95%,如今提高到了98%~99.9%。最后一步跨越来自机器学习,从98%到99.9%的变化意味着天翻地覆的转变。
从98%到99.9%的变化看似渐进,但如果犯错代价高昂,哪怕是小小的变化也有重要意义。准确率从85%提高到90%,意味着失误率降低了1/3。从98%提高到99.9%,意味着失误率降到了从前的1/20。20倍的改进似乎已经不算是渐进式的了。
预测成本的下降让人类的许多活动发生了巨大的变化。正如人们将第一批运算首先应用于解决普查表、弹道表等熟悉的数学问题上,在机器学习带来的廉价预测上,其第一批应用中有不少被用来解决经典的预测问题。除了盗刷检测,还包括信用评级、健康保险和库存管理。信用评级涉及预测某人偿还贷款的可能性。健康保险涉及预测某人会花多少钱在医疗保健上。库存管理涉及预测仓库在某一天存有多少物品。
最近,一类全新的预测问题浮出水面。在智能机器技术取得最新的进展前,许多事几乎不可能做到,包括物体识别、翻译和药物研发。例如,ImageNet挑战赛是一项高度曝光的年度赛事,比赛内容是让机器预测图像中物体的名称。哪怕是人类,预测图像中的物体也并非易事。ImageNet的数据包含了1000个类别的物体,其中包括各种狗及其他外形相似的图像。有时候很难辨别藏獒与伯恩山犬,或保险柜与密码锁之间的区别,哪怕是人类,犯错的概率也在5%左右。
图3-1
从2010年赛事举办的第一年到2017年的最后一场竞赛,预测以极快的速度进步。图3-1显示了每年比赛获胜者的准确率。纵轴衡量的是错误率,因此数值越低的表现越好。2010年,最出色的预测机器也会有28%的犯错率。2012年,参赛者首次使用了深度学习,错误率降至16%。如普林斯顿大学的教授兼计算机学家奥尔加·鲁萨科夫斯基(Olga Russakovsky)所言:“2012年实际上是准确率实现重大突破的一年,但它同时也对已经出现数十年的深度学习模型的概念做了证明。”算法继续迅速改进。到2015年,一支参赛队伍首次超越了人类。到2017年,38支队伍里的绝大多数表现都比人类好了,而且最优秀的队伍犯错率还不到人类的一半。机器能够比人类更好地识别这类图像了。
廉价预测带来的结果
目前这一代人工智能与科幻小说里的智能机器相去甚远。预测并没有带给我们《2001太空漫游》里的哈尔、《终结者》里的天网或是《星球大战》里的C-3PO。如果现代人工智能仅仅是预测,为什么人们还这么大惊小怪呢?原因在于,预测是一项十分基本的生产资料。你兴许并未意识到,但预测是无所不在的。我们的商业活动和个人生活里充满了预测。我们的预测往往化身为决策的输入条件。更好的预测意味着更好的信息,更好的信息意味着更好的决策。
用谍报活动的层面来表达,预测即情报,即“得到有用的信息”。机器预测就是人工生成有用信息。智能(情报)很重要,我们用信用卡盗刷的例子说明更好的预测会带来更好的结果。随着预测成本的不断下降,我们发现它对更大范围的额外活动大有用处。在这个过程中,它使各种各样从前难以想象的事情成为可能,比如机器翻译。
本章要点Prediction Machines
※预测是填补缺失信息的过程。预测将运用你现在掌握的信息(通常称为“数据”),生成你尚未掌握的信息。除了生成关于未来的信息,预测还可以生成关于现在和过去的信息。比如,将信用卡交易归为盗刷,将医学影像中的肿瘤分类为恶性,或是判断握着苹果手机的人是不是机主,这些都是预测的用武之地。
※预测准确度的小幅提高带来的影响,可能具有迷惑性。例如,准确度从85%提高到90%,其幅度乍看起来是从98%提高到99.9%的两倍(前者提高了五个百分点,后者只提高了两个百分点不到)。然而,前者意味着错误率从15%降到了10%(降到了从前的2/3),后者意味着错误率从2%降到了0.1%(降到了从前的1/20)。在某些情况下,错误率降到了从前的1/20意味着发生了天翻地覆的变化。
※填补缺失信息,表面上看起来是一个平淡无奇的过程,却让预测机器变得神奇起来。这在机器视觉(物体识别)、导航(无人驾驶)和翻译领域已经得到实现。