hadoop mahout 算法和API说明

2022-09-04 17:06:27

org.apache.mahout.cf.taste.hadoop.item.RecommenderJob.main(args)
--input	偏好数据路径，文本文件。格式 userid\t itemid\t preference
--output	推荐结果路径
-- numRecommendations	推荐个数
--usersFile	需要做出推荐的user，默认全部做推荐
--itemsFile	需要做出推荐的item，默认全部做推荐
--filterFile	文件格式文本，userid\itemid 。目的是给userid的用户不要推荐itemid的item
--booleanData	是否是布尔数据
--maxPrefsPerUser	最大偏好值
--minPrefsPerUser	最小偏好值
--maxSimilaritiesPerItem	给每一个Item计算最多的相似item数目
--maxPrefsPerUserIn ItemSimilarity	ItemSimilarity估计item相似度时，对每一个user最多偏好数目
--similarityClassname	SIMILARITY_PEARSON_CORRELATION、 SIMILARITY_COOCCURRENCE、SIMILARITY_LOGLIKELIHOOD、 SIMILARITY_TANIMOTO_COEFFICIENT、SIMILARITY_CITY_BLOCK、SIMILARITY_COSINE、 SIMILARITY_EUCLIDEAN_DISTANCE
--threshold	删除低于该阈值的item对
--outputPathForSimilarityMatrix	指定生成的item相似矩阵路径,文本文件，格式为 itemA \t itemB \t 相似值

码农公寓