3.5 注意力_以人为本的智能汽车交互设计（HMI）-QQ阅读男生历史网

上QQ阅读APP看书，第一时间看更新

3.5 注意力

在安全驾驶中，驾驶员的注意力是非常关键的一个因素。来自美国的一份调查表明，每年有40000人丧生于交通事故，其中有一半以上是由于分心［17］造成的。在驾驶过程中，驾驶员必须将注意力集中在道路上和车辆内，从中选择并关注与安全性最相关的事物。环境的某些诱因可以吸引注意力并将其有效地引导至需要关注的正确的对象上，例如警告灯或交通标志。另一方面，环境中的其他诱因也可能无意间吸引我们的注意力，并将其引导至不需要的、不相关的事物上，从而妨碍我们将注意力集中在驾驶任务上，例如，后座争吵的孩子、路边的广告牌等。驾驶员还必须在各种信息源之间分配注意力。例如，驾驶员从导航显示上注意到前方需要转弯时，必须了解沿道路转弯的相关地标，同时还要监视交通情况，并保持以一定的速度行驶在车道线内。在长途驾驶时，驾驶员必须长时间保持注意力和警觉性，尤其是当出现驾驶疲劳时，保持注意力更是一件困难的事情。在汽车交互设计中，对驾驶员注意力特点的认知，是非常基础的知识。

注意力又细分成不同种类。如果我们用类似舞台上的追光柱来形容人的注意力，那么选择性注意力（selective attention）贯穿了整个驾驶过程，就好像在驾驶过程中追光柱不停地晃动，照亮车内车外不同的需要引起注意的地方。而集中注意力（focused attention）则表明了追光柱的大小。当追光柱缩小并集中到某个点上时，就可以避免其他周边的不重要的信息的干扰。而分化注意力（divided attention）则正好相反，它把追光柱分成了若干根，同时照在了不同的地方。还有一个概念是持续性注意力（sustained attention），顾名思义，它就好比是提供追光柱的电池，维持了追光柱的亮度和持久性。从图3-1人的信息处理过程模型中我们知道，注意力影响到信息处理的很多环节，因此，下面就针对不同的环节，来讨论关于注意力的问题。

1.选择性视觉注意力（selective visual attention）

（1）选择性视觉注意力参与的任务

在视觉能够达到的区域内，选择性视觉注意力可以参与以下六种不同的任务［9］。

1）在视觉区域内来回扫描寻找相关的信息，比如，驾驶员不停地观看汽车的正前方、侧方、后视镜、仪表板和中控屏等。

2）视线在特定路径上来回扫描，监督控制，以确保某些动态变量控制在一定范围。如果不在一定范围，驾驶员就会进行某种形式的手动控制以使其恢复原状，例如，驾驶中的车道线保持，这项任务是高度目标导向的。

3）关注，包括监视，特别是对某些意外事件的响应（此类任务不包括需要在监督控制下的任务。）

4）搜索特定的通常是预定义的目标。比如，一边驾驶一边在指定的位置寻找需要接的人。

5）阅读。

6）确认已采取了某些控制措施，例如处理反馈。

许多任务显然是上述某些任务的混合。例如，遵循说明操作设备时，阅读图表或地图通常涉及搜索和阅读的某种组合。

（2）关注区域和信息捕获努力度

在提及视觉注意力时，需要引入一个新的概念：关注区域（Area of Interest，AOI）。AOI是指外在的一个物理区域，在这个区域里，人们能够找到与相应任务相关联的信息。随着眼动追踪技术的发展，人们对视觉注意力的研究也越来越深入。眼睛的扫描看似很容易，其实也是有能量消耗的。一个人的视觉注意力从一个AOI转移到另一个AOI是需要付出努力和消耗能量的。有付出，就必定会有疲劳。两个AOI之间的距离决定了付出努力的多少，这个付出也称为信息捕获努力度（Information Access Effort，IAE）。

眼球中的中间凹（图3-2）能看见的视角是0°~4°（眼球不动）。如果AOI小于4°，那么IAE最小。当两个AOI的视角大于4°、小于30°，且处在眼球的视线范围，也就是，人可以通过转动眼球就可以清晰地看见时，IAE会大于眼球中间凹时的IAE。但如果AOI大于30°，就需要辅助头部的转动；如果大于90°，则需要辅助身体的转动才能看得清。由此可见，两个AOI距离越远，视觉扫描需要消耗的能量就越大。驾驶员在捕捉道路信息的同时，还需要了解中控屏和仪表板的信息。由于道路上的AOI和仪表板上的AOI距离几乎在视角30°之内，所以驾驶员只需要转动眼球就可以看到；而中控屏上的AOI，需要辅助头部的转动，中控屏越大，道路上的AOI与中控屏不同区域的AOI距离越远，头部转动的幅度就会越大，甚至可能还需要辅助身体的转动。因此，从道路到中控屏视觉的扫描和信息捕获消耗的能量也更多，视线在两者之间移动需要的时间也更长。抬头显示（Head-up Display，HUD）的优势就是缩短道路AOI与中控屏AOI的距离。

（3）吸引视觉注意力和改变盲点

吸引视觉注意力（或者说抓住视线）有4个因素［9］：1）显著性（salience）：指AOI的背景或环境，相对于其他AOI脱颖而出的程度，它自身的大小、颜色、强度或对比度等。2）努力需求（effort）：即IAE。3）期望值（expectation）：人们倾向于更多地关注那些有很多动作的地方。4）价值（value）：它表示信息的有用性和重要性，即AOI与任务的相关性，以任务的相对重要性加权。

既然有吸引视觉的可能性，就会有应该引起视觉注意但却因为各种原因而错过的可能性，这就是所谓的改变盲点（change blindness）［9］。改变盲点用于描述那些环境发生变化却没有被发现的情况，例如眨眼，这一点在驾驶员执行驾驶任务时经常会发生。交通事故的产生往往是因为驾驶员有改变盲点，没有注意到道路上的相关信息，导致错误的操作。

（4）视觉搜索（visual search）

通过视觉的选择性注意力去寻找我们的目标就是视觉搜索。一般来说，被搜索的对象、目标物都是事前预定的。人类视觉的这种搜索功能是我们日常生活不可或缺的，在20世纪末及21世纪初对此做过大量研究，尤其是在驾驶领域［18］。视觉搜索通常是通过眼睛移动在搜索区域内或多或少系统地进行的。UFOV的大小会影响视觉搜索的效果。一般来讲，经验丰富的驾驶员的UFOV会比新手驾驶员大［19］。这也从另外一个角度证明，UFOV是可以训练的。

提到视觉搜索，就会涉及搜索效率和速度问题。其中的影响因素我们在这里不一一细述。有一个众所周知的因素，会直接影响搜索效率，那就是被搜索目标的布局和展示方式。一般来讲，把相关的和类似的信息集中，会提高视觉搜索效率。图3-11是一个典型的案例，图3-11a把类似的信息集中在一起，进行了分组，而图3-11b则是分散了。从中可以看出，视觉搜索图3-11a要比图3-11b更容易。

图3-11 信息展示的布局与视觉搜索的关系

2.并行且分化的注意力（parallel processing and divided attention）

我们的视野所及通常都是很复杂的，包含了很多元素，当我们需要从这些多元世界中找出感兴趣的信息时，我们的视觉通常会有两个并行的过程：自动把外部环境中相似的内容分组，同时用选择性注意力把我们要关注的信息从中找出来，而这个过程是会占用工作记忆资源的［9］。这两个过程是并行的。因此，在展示信息时，相关信息有机组合对更有效的视觉搜索是很重要的。

关于视觉注意力有两个理论，一个是基于空间的理论（space-based attention theory）［20］，另一个是基于目标物的理论（object-based attention）［21］。基于空间的理论把人的视觉比喻成从眼睛里发出的一道光柱，它照到哪里，人的视线就在哪里。汽车的抬头显示就是期望把重要的信息放在眼睛最容易看到的地方。但是这个理论不足以解释所有现象，因此就有了基于目标物的理论。人们的眼睛会去注意那些从周边环境中比较能凸显出来的物体，或者相对于周边环境正在运动的物体，或者是人们熟悉的物体。

我们常说：“耳听为虚，眼见为实”。可实际上，在视觉显示中，我们可以有多种方式和手段去操控和“欺骗”视觉，在这里，我们就不再一一展开。运用好这些技巧，对视觉显示的设计非常重要。

3.听觉注意力（auditory attention）

听觉与视觉有很大的不同，表现在以下三方面：1）听觉是全方位的，声音可以从任何一个角度传入耳朵，它没有类似视觉的扫描作用;2）听觉是全时段的，它不像眼睛，眼睛闭上就看不见东西了，而耳朵不会关闭；3）听觉输入是瞬时的，一句话、一个声音，随着时间来，也随着时间走，是留不住的，不像视觉，可以保留。虽然环境的声音都会通过耳朵被我们的感官接收，但我们不可能把所有的声音都“听进去”。对声音的感知受两种注意力的支配：一个是分化注意力，比如一个人同时听不同的声音；另一个是选择性注意力，比如我们把注意力集中在某个声音上。试想，如果我们同时听两个人讲话，还希望同时能够抓住他们讲话的重点，这会是一件很难的事情，但如果这两个人一个在你的左边，另一个在你的右边，而且一个是男的，另一个是女的，这样，你能从两个人的声音中捕捉到重要信息就会比这两个人都是男的且站在一起要容易得多［22］。

如果同时有多种不同的声音，那么我们的声音注意力会在几种声音间调换。没有意义的声音，会被当成背景音，在听觉感官中停留大约3~6s。这时人会产生一种感觉，觉得听到了另外一个声音的最后几个字。不过，不被注意的声音不一定就被遗忘，它有可能直接与人的长期记忆产生关系，并被分析。当这种不被注意的声音出现多了，达到了某个具有意义的水平，就会被关注。

前面讲过，人们一般通过几个不同的声音元素来区别（识别）声音，包括音节、音高、音色空间位置和时机［23］。这些特性为声音的交互设计提供了很好的依据。当有两个不同音节的声音同时出现时，这两个声音在音高和音节频率上有些区别，如果这种区别足够大，我们就能听出是两个不同的声音。如果改变两个声音的音节频率，也会听成是两个声音［9］。

视觉也好，听觉也罢，如果设计者并不希望用户同时处理两个或两个以上的信息，那么，除了主要的信息，其他的都可以看成是干扰。当然，在人们的生活中，都不会是单一模态的接受信息，听觉和视觉会常常一起工作。比如驾驶时，驾驶员的眼睛看着道路的前方，而电子地图却用语言给以道路提示。这种多模态的交互，我们会在后面的章节中做详细的讨论。