SCIENCE 科学
美好的沟通
最近又重温了一遍《雪崩》,感觉依然惊艳。和其他许多赛伯朋克小说类似,《雪崩》也同样发生在诸多经济体钩心斗角的混乱世界,其中的黑客恍如西部开拓时代的传奇牛仔或者江湖传说中的游侠,只是拥有更多能力,甚至如同创世神一般。他们建立了虚拟的世界并在其中当家做主,仅仅通过对话来指挥虚拟世界的化身为自己工作,在由原子构建的真实世界和字节搭建的虚拟世界里纵横往来,纵马(当然,在这部小说中是摩托车)飞驰,快意人生。
《雪崩》中描述的一些产品已经成真,它们可能和斯蒂芬森最初的设想并不一致,却已经开始用另一种方式永久地改变了我们的生活。虽然这本书已经出版了十八年,足以让一个婴儿走进大学,让一棵树苗结出累累果实,但书中的一些场景在今天看来依然是幻想。这些幻想,正是我们今天努力让之成真的东西。
用Kinnect玩游戏
比如,我们和计算机沟通的方式。
◤按回车键
回车键。这个键在任何键盘上都能找到,有时候它会被写成“Return”,有时候只是“Enter”。在某些语境下,这两个词表达了同样的含义。而这个可以追溯到一个多世纪之前的按键,从打字机时代一直到现在,还依然顽强地占据着我们电脑键盘的一隅,也依然会吸引大多数人习惯性地大力敲击——虽然早已不再伴随着打字机换行时的清脆铃声。
在计算机历史的早期,回车键有着相当重要的地位,其使用频率之高,也许只有空格键能够与之相比。一个命令结束时总是以回车键结尾,让计算机知道它应该开始工作。而在今天,回车键的作用已经被大大弱化,终于回到它最初的用途:敲击一次,换下一行。
而对那些出生于鼠标普及时代的人来说,回车键愈发变成了可有可无的东西。鼠标的单击和双击会让回车键被用力敲击的机会大大减少,灵活地在屏幕上游弋的鼠标指针,甚至可以让人们准确地选择任何一个像素。然而,也许是因为习惯的力量,回车键依然存在于每一块标准键盘上,占据着大得不合理的空间。
皮肤触摸屏-1
皮肤触摸屏-2
超声波触摸屏
电容触摸屏原理
这种情况可能会改变。也许回车键会消失,而随之消失的将会是键盘这种被我们视之为计算机标准配件的东西。虽然这一天不会很快到来——目前的确没有其他方式,能够在输入文字方面比键盘更快更准确——但是我们已经有了其他选择,能够让键盘变成可供选择的附件而非必备品。
看起来,触摸屏像是最有可能的选择之一。这种设备出现的时间甚至比鼠标还要早二十年,但却从来没有像鼠标那样普及过。即使到了今天,我们最常看到触摸屏的地方还是公共设备、智能手机和笔记本电脑上那方寸之地:前两者只需要几次简单的点击而非复杂的输入,而后者则一贯地将体积视为最重要的指标之一。
事实上,和鼠标类似,触摸屏这种定位设备也只是需要能够确定每次触摸发生的位置而已。上世纪40年代发明的电阻触摸屏就已经有了现在同类产品的雏形,它的原理和今天广泛使用的薄膜式键盘很像。当触摸屏表面被按下时,两层本来绝缘的通电薄膜会挤压在一起,预设的程序会根据屏幕四边电线上的电压来判断触摸的位置。其他的触摸屏原理也都类似,电容屏通过导体吸走一点电流,电磁屏通过磁通量的变化,而超声和红外线屏则是探测阻挡物的存在——究其种种,无非是通过探知发生异常反应的位置,再以其横坐标和纵坐标作为判断的依据而已。
随着触摸屏手机和公共查询设备越来越多地出现在生活中,触摸屏看起来好像在蚕食更多的地盘。自最早发明的电阻、电磁感应屏到红外、超声波和电容屏,无论对精度、压力感应级别还有多点触摸提出什么样的要求,触摸屏似乎都可以满足。苹果公司已经申请了一项带有如同键盘般提供力反馈功能的触摸屏专利;葡萄牙的一家公司开发出了柔软而尺寸巨大的多点触摸屏;纽约大学开发的低成本触摸屏使用塑料薄膜和电阻会随压力变化的高分子油墨作为材料,成本低到即使用来贴满整个墙面也丝毫不会感到心痛。如果想的话,《阿凡达》中那种透明的触摸屏显示器在目前的技术条件下,也并非不可能实现的目标。
然而,即便如此,我们依然无法期待触摸屏会成为我们和计算机日常对话的主要方式。眼睛最适合向前方平视,而手更适合垂下来,触摸屏却需要将这两者集合到相同的位置,像画画或者写字一样。无论让手去迁就眼睛,还是让眼睛来迁就手,都不能算是最舒服的姿势——虽然我们已经用这种姿势工作了数千年。触摸屏也许更适合偶尔一次的点击,但是它绝对不会占领现在由鼠标和键盘所盘踞的桌面。
电阻触摸屏
皮肤触摸屏的传感器
◤小帮手
键盘鼠标也好,触摸屏也罢,它们都只是我们的翻译帮手,将我们的指令翻译成信号,再传递给计算机知道。理论上,任何可以明确分割和可以重复的信号都能用来对计算机发号施令,转化成计算机能够理解的行为。吹口哨、用手掌拍出节奏,或者更简单一点的,打个响指,都可以。
我们讨论的不是声控灯这样的简单东西。就在几个月前,卡耐基梅隆大学的研究人员开发出了一种新的控制设备,连接在MP3上的时候,只需要打个响指,就能换一首歌听。研究者们甚至还在这种设备上安装了一个小投影仪,能够将菜单投影在手臂上,让手臂变成触摸屏。而且,操作的准确率能达到95%。
使用电磁屏的数位板
这套控制装置看起来很简单,主要部分是一根臂带,以及安装在臂带上的10个震动传感器,用来分别接收不同频率的震动。当我们用手指敲打另一只手掌时,皮肤、肌肉和骨骼的震动会传遍全身,虽然我们自己可能很少意识到,但是会被传感器忠实地记录下来。通过柔软皮肤传导的横波会先到达传感器,而通过骨骼传导的震动将会稍后到达,并且由内而外传递到皮肤时会形成纵波。通过对强度和时间差的判断,可以得到震动源头的位置,整个过程和探测地震强度时的方法有些相似。
这种产品可能会出现在几年后的音乐播放器上,略显笨重的投影仪可能只是个可选配件。而对应复杂选项的时候,这种皮肤触摸屏就显得有些力不从心,传感器并不能准确地判断每厘米皮肤之间的区别。也许通过更加灵活的方式来控制才是好办法,比方说,让视线的焦点取代鼠标的光标。
眼动仪可以完成这样的工作。早在19世纪,人们就已经开始了相关的尝试,试图用机器来判断人们视线所及之处。五花八门的方法轮番上阵,甚至曾经出现过将金属片覆盖在眼球表面的设计——这更像是某种酷刑而非研究。
幸亏有了精度更高的摄像机。从20世纪90年代开始,无接触式的眼动仪已经开始广泛用于各种分析手段,从测谎到软件设计。最简单的眼动仪只需要摄像头和软件就可以实现,通过分析出用户瞳孔的位置和角度,再算上眼睛和屏幕之间的距离,就可以判断当前视线的落点。现在市场上已经有了便宜的软件,搭配上家用的摄像头,能够将视线落点精确到厘米级别的范围内。
但是这种方式不够稳定。人们坐在椅子上的时候并非总是稳定不动,位置的偏移会导致软件判断的失误。如果要提高准确度就需要更多的摄像头,多角度的拍摄能够更精确地判断方向和距离,就像我们需要两只眼睛才能产生立体感那样。2009年5月,英国德蒙特福德大学制作了一套视线控制装置,使用两个分别放在屏幕左右的摄像头来获取图像,测试结果让人相当满意。四肢瘫痪者可以使用这种方式操作计算机,甚至能还能玩诸如《魔兽世界》这样复杂的游戏。德国夫琅和费光电微系统研究所正在尝试将摄像头与显示器集成在一起,将显示单元和摄像单元交错放置,整面显示器同时也会是个巨大的摄像机。
虽然这种设计的产品化还需要几年的努力,但是现在有些研究者已经开始考虑它的各种用途,而且已经有了不错
Text 2.0技术
德蒙特福德大学的眼动控制游戏
◤我和我的影子
自从计算机被发明以来,我们一直在扮演着发号施令的角色,而计算机只会严格地执行,亦步亦趋,从来不会做得更多一点。现在这种情况改变了。在新技术的帮助下,计算机已经变得更加善解人意。
Kinnect
在今年6月的E3大展上,微软公司为XBOX 360游戏主机推出了新的控制装置。这种过去一直被叫做Project Natal的设备现在改名为Kinnect,让你不再需要游戏手柄。
或者说,你自己就是游戏手柄。只需假装生活在游戏里,你的一举一动就会反映在游戏中的主角身上。当你挥起网球拍的时候,你的游戏化身也会这样做,几乎没有任何延迟。游戏中的化身就像是你的影子。你甚至可以和朋友们一起组队在游戏里探索,Kinnect会自动分辨出每个人的动作和声音。
这套设备由两个摄像头、红外线感应器、麦克风,还有相关的软件组成,它通过你身上的热能来判断距离,用两个摄像头实现立体视觉,再通过语音识别来判断简单的语音指令。这套东西当然远远称不上智能,但是它也同样展示了一种可能性——并非只有让我们去适应计算机才是最好的沟通方式。
也许在不久的将来,我们就会看到这类设备出现在台式计算机上。微软试图用这种方式将计算机变成另外一种东西,计算机会时时刻刻关注你的一举一动,并且做出最恰当的反应。现在,我们的计算机设备已经足够便宜,计算能力已经足够强大,足以让这种随时监控的操作方式成为现实。不应该再让我们去学习计算机的规则,而应由我们自己来制定规则。和这种方式相比,手势识别这样的技术看起来更像是中世纪的做法。
对于一件还没有任何智能可言的工具来说,这样可能已经够好了,好到能够让《钢铁侠》中的场景成真。但是真正的革命还没有来到,让计算机具有智能依然是一个遥远的梦想,我们还没有找到任何办法,能够让计算机真正理解哪怕是一个含义明显的举动。计算机依然没有足够的理解力来理解我们的意图,哪怕它看起来像是具有一定程度的智能。
正是出于同样的原因,今天的计算机也无法实现真正的语音识别,《雪崩》中的对话也只能依然存在于小说当中。只有拥有智力的对象才能够真正听懂语言,而计算机远远达不到这种程度。虽然现在的语音识别技术能够达到95%的准确率,但是这需要相当苛刻的环境,离实用依然有很远的距离。
让没有智能的计算机看起来像是有智能一样,就是今天的人机交互研究者们在做的事情。我们希望人和计算机能够
【责任编辑:杨枫】