数据挖掘、关联规则、FP-Tree、哈希函数
关联规则数据挖掘中FP-Tree算法的改进
指导老师:胡虚怀 学生:曾佑文 林昌华
(湖南理工学院计算机与信息工程系)
摘要:目前数据挖掘采用关联规则的算法可根据是否产生候选项集的作法分为FP-Tree与Apriroi。这两种算法最主要的差异在于前者并不产生候选项集,它将数据库压缩在FP-Tree的结构中,避免多次的高成本的数据库扫描;而后者是需要产生候选项集的方法。本文在传统的FP-Tree算法基础上建立了FP-Tree_hash算法,此算法是通过哈希函数计算出每个结点所在位置的方式来建立FP-Tree,同时在构造模式树的数据结构中增加了一个尾链域,经过改进的这一算法比传统的FP-Tree算法效率提高了数十倍。
关键词:数据挖掘、关联规则、FP-Tree、哈希函数
Keywords: Data mining, Association rules, FP-Tree, hash function.
可以帮忙的话请加QQ:546828347
谢谢!