上QQ阅读APP看书,第一时间看更新
第1章 关联规则
关联规则挖掘算法是数据挖掘中最活跃的方法之一,是一种从项目数据表中找到频繁出现的项目集合并找到该集合中项目的相互关系的技术,已被广泛应用于商业、科学等领域中。Apriori算法是一个重要而经典的关联规则算法,但因多次扫描数据表而复杂度较高;FP-growth则采用了频繁模式树(Frequent Pattern Tree)的数据结构从而提高了速度,因此在某些应用中的性能表现优于Apriori算法。本章不仅介绍了Apriori和FP-growth算法的原理,还介绍了算法的优化策略以及基于并行计算的大数据关联规则挖掘算法。另外,通过地学领域应用和极端天气应用展示了关联规则技术广阔的应用前景。