智能优化算法与涌现计算
上QQ阅读APP看书,第一时间看更新

第20章 集体决策优化算法

集体决策优化算法是模拟人类集体决策社会行为的元启发算法。集体决策特征包括决策者的个人经验、成员互动、集体思考、领导者决策和创新阶段。该算法基于群体的搜索技术,随机生成候选解群体并将其放置在全局最优解周围。在每次迭代时,由先前移动产生的新位置作为下一步由另一个位置引导搜索的开始点。随机游走稍微改变其位置作为局部搜索,对全局搜索是有益的。本章介绍集体决策优化的基本思想、数学描述及算法的实现。

20.1 集体决策优化算法的提出

集体决策优化算法(Collective Decision Optimization Algorithm,CDOA)是2016年由Qingyang Zhang等提出的,用于训练人工神经网络的一种元启发算法[64]。集体决策特征包括决策者的个人经验、成员互动、集体思考、领导者决策和创新阶段。

CDOA是一种基于群体的搜索方法,使用候选解群体进行全局最优化。在每次迭代时,由不同的位置引导,个体在多步的位置选择方案中产生几个有前途的解,其涉及由先前移动产生的新位置将被定义为下一步由另一个位置引导运动的开始点。通过随机游走稍微改变其位置作为局部搜索,对于全局搜索是有益的。在这种情况下,随机生成几个候选解,并放置在全局最优解中。因此,增加每个个体的可比较解的数量,有利于系统地对搜索空间进行抽样,并通过不断地优选直到搜索到全局最优解。

对基准函数和两个非线性函数的仿真结果表明,CDOA相对于现有的其他优化算法具有一定的竞争力。

20.2 集体决策优化的基本思想

以群体为基础的算法都是基于它们的适应度值(搜索空间的信息)来更新候选解的。毫无疑问,准确的空间信息对于找到全局最优的粗略近似是非常有益的。然而,绝大多数以群体为基础的算法往往具有共同的特征,每个个体在每次迭代中只产生一个新的个体。因为缺乏足够的新解来引导搜索,所以搜索空间不能被系统地利用或勘探。

Qingyang Zhang等认为,可以通过组合新的向量生成策略和利用宝贵的空间消息,改进候选解的数量来设计新的启发式算法。换句话说,可以通过增加可选择解的数量来系统地对每个个体周围的搜索空间进行采样。

集体决策优化方法设计的主要灵感源于人类的决策行为。在人们的生活中,典型的决策行动是举行一次会议,如图20.1所示。会议的每个成员称为决策者,他们对应一个思想或计划。在会议的讨论过程中,每个人都会表达和交换自己的想法或计划。选择方案中最好的一个作为最终结果。

事实上,制订一个好的计划并不是一个简单的过程,因为这个过程通常涉及一些影响因素。例如,一些研究者坚定地认为群体思维是研究集体决策行为的一个重要概念,贯穿整个集体决策的整个过程,在一定程度上影响决策行为。从众行为是集体思维的典型形式之一。其他影响因素包括经验、领导、其他决策者的观点和创新。这些因素在决策过程中也起着重要的作用。值得一提的是,这些因素可以任意组合。5个因素中的任何一个或多个都能产生好的结果。因此,可采用多步定位搜索方案设计操作算子。20.3节将详细介绍集体决策优化算法的数学描述模型。优化过程和集体决策过程之间的对应关系如表20.1所示。

图20.1 举行会议决策问题

表20.1 优化过程与集体决策过程之间的对应关系

20.3 集体决策优化算法的数学描述

1. 初始群体的生成

为了明确地模拟决策行为,假设从可行解空间中随机抽样N个成员组成初始群体。

Pop(t)=(X1t),X2t),…,XNt))

其中,N为种群大小;D为优化问题的维数;t为当前生成数;r为0~1的随机数;LB和UB分别为变量的下限和上限。

2. 基于个人经验阶段

在会议中,对于一个问题,决策者的第一反应是根据从日常生活中积累的个人经验来思考和制订初步计划。在CDOA中,把个人经验定义为个人φP迄今为止的最佳位置,表示为

其中,τ0为每个成员在(0,1)范围中的随机向量;stepsiset)为当前迭代的步长;d0为移动方向。

3. 成员互动阶段

在体验阶段之后,决策者已经有了自己的想法或计划。他们会在会议中随机与其他成员互动。如果其他决策者在讨论和沟通的帮助下有比他(或她)更好的想法,那么这个决策者可以得到新的东西。在CDOA模型中,从群体中随机选择一个个体Xjt),使得其适应度值优于当前成员Xit)。计算公式为

其中,j表示范围[1,N]中的随机整数;τ1为每个数字均匀分布在区间(0,1)中的随机向量;stepsizet)为当前迭代的步长;d1为新的移动方向;β1β11是分别在(-1,1)和(0,2)范围内的随机数。

个人搜索及成员之间的互动搜索轨迹如图20.2所示。

图20.2 个人搜索及成员之间互动搜索轨迹

4. 集体思考阶段

在会议中,每个人都可以表明自己的立场。那么,每个决策者的决定也可能受到集体思考的趋势的影响。从统计学的角度来看,几何中心是一个重要的数字特征,代表了一定程度上群体的变化趋势。在提出的模型中,为了简单起见,可以认为所有个体的几何中心φG被定义为群体思维的位置:

然后,使用下式计算个体的新位置为

其中,τ2为一个随机向量,每个数字在区间(0,1)中均匀生成;stepsizet)为当前迭代的步长;d2为新的移动方向;β2β22是分别在(-1,1)和(0,2)范围中的随机数。

5. 领导者决策阶段

作为主要决策者之一,领导者在整体决策程序中发挥着重要作用。他不仅对其他政策制订者产生不同的影响,而且决定了决策的方向和最终结果。在CDOA模型中,领导者φL被认为是群体中最好的个体(最优元素)。

其中,τ3为在间隔(0,1)中均匀生成的每个数字的随机向量;stepsizet)为当前迭代的步长;d3为新的移动方向,β3β33是分别在(-1,1)和(0,2)范围内的随机数。

此外,为了方便,假设领导的思想或方案只能由自己任意改变。在CDOA模型中,使用作为本地搜索的随机游走策略稍微改变其位置是有利的。在这种情况下,可以围绕最佳解随机生成一些邻居。

其中,Wq为每个数字均在范围(0,1)内取值的一个随机向量。

6. 创新阶段

众所周知,创新不仅打破了旧的框框,而且拓宽了人们的视野。一些学者认为,这也是在决策过程中产生好方案的另一个有效途径。在CDOA模型中,创新是指在变量之间进行小的变化。这相当于进化方法中的一维变异算子。该运算形式可以描述为

其中,r1r2为在区间(0,1)中分布的两个随机值;p为在范围[1,D]中生成的随机数;MF为创新(突变)因子,用于改善群体多样性,以防止算法过早收敛。

另外一个问题是更新迭代步长。大的搜索步长可以使生成的向量在搜索空间中广泛分布,并且可以在进化的初始阶段有效地勘探搜索空间。在其余的迭代中,小的步长使得搜索集中在解的邻域内进行,从而可以加快收敛速度。因此,CDOA采用一种自适应机制的形式为

其中,T为迭代的最大数目。

20.4 集体决策优化算法的实现

CDOA算法的主伪码描述如下。