apriori关联规则算法

www.zhiqu.org     时间: 2024-06-01

Apriori算法是种挖掘关联规则的频繁项集算法,一种最有影响的挖掘布尔关联规则频繁项集的算法。

它利用逐层搜索的迭代方法找出数据库中项集的关系,以形成规则,其过程由连接(类矩阵运算)与剪枝(去掉那些没必要的中间结果)组成。该算法中项集的概念即为项的集合。包含K个项的集合为k项集。项集出现的频率是包含项集的事务数,称为项集的频率。如果某项集满足最小支持度,则称它为频繁项集。Apriori算法是第一个关联规则挖掘算法,也是最经典的算法。

关联规则挖掘是数据挖掘中最活跃的研究方法之一 。最早是由 Agrawal 等人提出的1993最初提出的动机是针对购物篮分析问题提出的,其目的是为了发现交易数据库中不同商品之间的联系规则。这些规则刻画了顾客购买行为模式,可以用来指导商家科学地安排进货,库存以及货架设计等。之后诸多的研究人员对关联规则的挖掘问题进行了大量的研究。

apriori关联规则算法的应用

Apriori算法广泛应用于商业中,应用于消费市场价格分析中,它能够很快的求出各种产品之间的价格关系和它们之间的影响。

通过数据挖掘,市场商人可以瞄准目标客户,采用个人股票行市、最新信息、特殊的市场推广活动或其他一些特殊的信息手段,从而极大地减少广告预算和增加收入。百货商场、超市和一些老字型大小的零售店也在进行数据挖掘,以便猜测这些年来顾客的消费习惯。

Apriori算法应用于网络安全领域,比如网络入侵检测技术中。早期中大型的电脑系统中都收集审计信息来建立跟踪档,这些审计跟踪的目的多是为了性能测试或计费,因此对攻击检测提供的有用信息比较少。

它通过模式的学习和训练可以发现网络用户的异常行为模式。采用作用度的Apriori算法削弱了Apriori算法的挖掘结果规则,是网络入侵检测系统可以快速的发现用户的行为模式,能够快速的锁定攻击者,提高了基于关联规则的入侵检测系统的检测性。

以上内容参考:百度百科-APRIORI



~


#史颖奚# weka里Apriori关联规则挖掘,我希望得到的结论是与最后一列目标属性的关系,可是总是得到的都是前边条件属 -
(18230822422): weka里面的apriori算法,先生成所有的频繁项集,然后生成规则,根据最小支持度和置信度都满足的情况,选出强规则输出. 举个例子,比如有个长度为3的频繁项集ABC 那么你生成规则时候是: A->BC AB->C AC->B B->AC BC->A C->AB 然后分别对上述产生的规则计算置信度,如果不满足,就不输出 那么你所说的问题,很可能是因为你的最后一列在->右边时的规则不满足置信度. 所以没有那样的规则输出. weka默认的最小支持度是0.1,最小置信度是0.9,你可以通过命令行进行调整,适当降低 置信度,可能就能看到你想要的规则了.

#史颖奚# 如何提高apriori算法的效率 -
(18230822422): Apriori算法是关联规则挖掘中的经典算法.在Apriori算法中,使用频繁项集的先验知识,逐层搜索的迭代方法,通过扫描数据库,累积每个项的计数,并收集满足最小支持度的项,找每个Lk都需要扫描一次数据库.算法的效率随着数据量的增大,频繁项集的增多,算法的效率就非常的低,本文通过对Apriori算法分析,应用散列、事务压缩、划分、抽样等方法,最大可能的减少数据库扫描的次数,快速发现频繁项集,提高Apriori算法的效率.

#史颖奚# Clementine关联规则Apriori算法事务模式怎么使用 -
(18230822422): 用Clemetine做Apriori关联规则的时候,采用事务模式,总是提示我找不到规则是怎么回事呢,我用的是Clementine自带的BASKETS1n数据转换为事务模式(因为我有个其他数据是事务模式) http://bbs.pinggu.org/thread-3160839-1-1.html

#史颖奚# apriori算法中满足什么条件的数据会可能得到更多的关联规则 -
(18230822422): apriori算法有支持度和置信度两个概念,都是在执行算法之前自己设定的,在每一次迭代过程后,大于支持度的项集被保留为频繁项集,最后生成的规则由最终的频繁项集组成,简单说也就是支持度越小,频繁项集越多,置信度越小,由频繁项集生成的规则也就越多.希望能帮到你~

#史颖奚# 多维关联规则挖掘算法r语言能实现吗 -
(18230822422): 一下自己学习关联规则经典算法Apriori的笔记. 1、概述 Apriori算法是用一种称为逐层搜索的迭代方法,从项集长度k=1开始,选出频繁的k=1项集,根据先验性质:频繁项集的子集一定是频繁的(逆否命题:非频繁项集的超集一定是非频繁的,...

#史颖奚# 如何进行空间数据挖掘 -
(18230822422): 1. 基于概率论的方法.这是一种通过计算不确定性属性的概率来挖掘空间知识的方法,所发现的知识通常被表示成给定条件下某一假设为真的条件概率.在用误差矩阵描述遥感分类结果的不确定性时,可以用这种条件概率作为背景知识来表示不...

#史颖奚# 用Matlab实现apriori算法关联规则的挖掘程序,完整有详细注解 -
(18230822422): 下面这段是apriori算法中由2频繁项集找k频繁项集的程序,程序中有两个问题: 1、似乎while循环的K永远都是固定的,也就是都是频繁2项集的个数.得到频繁3项集后K的个数不是要变吗?如何体现呢? 2、程序中有两个for的大循环,但是发...

#史颖奚# apriori算法和fp - growth算法提取频繁项集的结果一样吗 -
(18230822422): 应该是一样的结果,如果结果不一样,肯定是那个算法提取的有问题了

#史颖奚# Apriori算法如何让计算最小置信度 -
(18230822422): 最小置信度是自己定制的哈,可以在不同的置信度下测这个算法挖掘关联规则的效率..