基于机器学习的工作流活动推荐
上QQ阅读APP看书,第一时间看更新

前言

随着互联网应用的日益普及和信息化的快速发展,人们对服务的需求越来越多样化,对服务质量的要求越来越高,特别是对流程服务的要求越来越高。这就要求流程管理系统提供的流程服务在具有规范性的同时,也必须具有一定的灵活性。另外,经济的不断发展和各项政策法规的不断完善,使政府、企事业单位的业务不断变化,进而导致它们的流程管理系统产生一些非标准业务执行记录,这些记录违反预定义的业务模型。事实上,业务流程长期固定不变几乎是不可能的。非标准业务是流程管理系统设计前没有考虑到的情况,它们脱离了流程管理系统的管理,只能依靠人工管理。为避免这种情况的发生,一种方法是重新设计流程管理系统,将这些非标准业务考虑进来。但是,事先完全掌控流程是不可能的,非标准业务总会出现。

另外,传统流程管理系统面对的是强流程领域,传统信息管理系统面对的是纯信息的管理,在这二者之间的中间地带存在着这样的应用需求:这类业务流程具有很强的可变性和柔性,它不仅需要一定的流程管理,也需要相关的信息管理,待相关的信息明确后业务流程的下一步才能被动态确定。近年来,流程管理研究领域将一些信息融合进来以使流程管理动态化和自适应,信息管理研究领域将一些流程信息融合进来以解放人工就反映了这种需求的存在。与此同时,推荐系统研究领域异常活跃,其中的推荐思想和技术为本书活动推荐提供了理论支持和实践基础。

为解决上述应用领域中非标准业务出现带来的一些问题,避免流程管理方面过多的人工活动,增强流程管理系统的流程执行智能化、动态性和柔性,本书提出了几种工作流活动推荐方法。这些方法利用流程管理系统积累下来的业务流程执行日志,向当前正在执行的业务流程推荐其下一项可能执行的活动。业务流程执行日志既包含正常业务执行日志,也包含非标准业务的执行日志。随着业务流程管理系统的长期执行,非标准业务执行日志的数量就越积越多,推荐方法的效果也就越来越好。先前靠人工建立的非标准业务执行信息得以重用,避免了后来的非标准业务执行的人工管理。

具体来说,本书主要包括以下内容。

(1)提出了基于用户类别近邻的活动推荐算法。该算法分为离线计算和在线推荐两部分,离线计算部分计算业务执行日志中的最终用户的类别相似性;在线推荐部分利用业务执行日志信息,计算与当前执行业务用户类别近邻的那些完整的业务执行日志,然后再利用这些用户类别近邻的日志计算出推荐列表。该算法的重点是用户类别相似性的计算和活动序列的匹配。

(2)将推荐系统领域中用来度量用户相似性的Pearson相关系数引入活动推荐中来,提出了基于Pearson相关系数的活动推荐算法。由于每个工作流实例是一个活动名称的序列,它们不能直接参与数值运算,所以,本算法先将序列中每个活动出现的顺序以数值的形式提取出来,列成矩阵,类似于推荐系统中的User-Item矩阵,以便计算实例间的相似性。

(3)在基于Pearson相关系数的活动推荐算法的基础上,提出基于协同过滤的活动推荐算法。该方法假定每个工作流实例都关联一个最终用户,同一个用户可以关联多个不同的实例。该算法采用特定方法由实例库构造出一个用户对实例的打分矩阵。在该矩阵的基础上,利用协同过滤的方法对矩阵中的未知值进行填充,最后,利用填充后的矩阵向当前不完整实例推荐下一项可能的活动。

(4)为给本书提出的活动推荐算法提供一个可视化平台,并便于底层推荐算法对流程信息操作处理,我们设计了一种用来表示业务流程信息的XML格式,并提出了相应的可视化算法,实现了一个可视化原型系统。

为检验上述方法,我们构造了相应的仿真数据集。实验结果和相应的对比分析表明,本书提出的推荐算法是有效的和可行的。工作流活动推荐的关键是实例间相似度的计算,我们从理论方面拓展了相似度的计算方法。这些推荐算法在实践中有利于增强流程管理系统随机应变的能力,提高最终用户的满意度。