用mahout运行fpgrowth | 小鹏闲话

用mahout运行fpgrowth

发表于 2014-09-28 分类于技术阅读次数：
本文字数： 381 阅读时长 ≈ 1 分钟

将文件put到hdfs
hadoop fs -put fp.txt ./czp
运行
mahout fpg -i ./czp/fp.txt -o ./czp/fp –method mapreduce -regex ‘[\ ]’ 成功运行后在./czp/fp文件夹里会出现四个文件或者文件夹

fList: 记录了每个item出现的次数的序列文件
frequentpatterns: 记录了包含每个item的频繁项的序列文件
fpGrowth
parallelcounting

查看结果
mahout seqdumper -i ./czp/fp/fList -o /czp/fprs.txt
mahout seqdumper -i ./czp/fp/frequentpatterns/part-r-00000 -o /czp/fp_guanxi.txt

公众号：数据Man

本文作者： 小鹏
本文链接： https://blog.luckypeng.com/2014/09/28/daynote_20140928/
版权声明： 本博客所有文章除特别声明外，均采用 BY-NC-SA 许可协议。转载请注明出处！

0%