用mahout运行fpgrowth

  1. 将文件put到hdfs
    hadoop fs -put fp.txt ./czp
  2. 运行
    mahout fpg -i ./czp/fp.txt -o ./czp/fp –method mapreduce -regex ‘[\ ]’ 成功运行后在./czp/fp文件夹里会出现四个文件或者文件夹
  • fList: 记录了每个item出现的次数的序列文件
  • frequentpatterns: 记录了包含每个item的频繁项的序列文件
  • fpGrowth
  • parallelcounting
  1. 查看结果
    mahout seqdumper -i ./czp/fp/fList -o /czp/fprs.txt
    mahout seqdumper -i ./czp/fp/frequentpatterns/part-r-00000 -o /czp/fp_guanxi.txt
小鹏 wechat
公众号:数据Man
0%