论文总结(negFIN: An efficient algorithm for fast mining frequent itemsets)
一、论文整体思路:
SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。作者提出了一种基于前缀树的数据结构,NegNodeset,其实是对之前前缀树的一种改进,主要区别在于采用了位图编码,通过这种数据结构产生的算法称为negFIN。
negFIN算法高效有三个原因
二、问题定义
I= {i1,i2,…, init} 表示事务数据库所有项的集合,T表示每个事务,T⊆I ,DB = {T1,T2,…, Tnt} 是所有事务的集合
P称为k-项集,如果P⊆T ,那么事务T包含了项集P,support(P)是DB中包含P的百分比,如果support(P)大于min-support
我们就称P为频繁项集,频繁项集是2的nit 次方,nit = |I| 。
三、之前贡献
主要对前缀树的研究,结构1)Node-list,2)N-list,3)Nodeset,4)DisffNodeset
***先理解下前缀树和哈希树

更多精彩