解压安装包
编辑环境变量
sudo vim /etc/profile
123456#MAHOUTexport MAHOUT_HOME=/home/ubuntu/cloud/mahout-0.10.1export MAHOUT_CONF_DIR=$MAHOUT_HOME/confexport HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoopexport PATH=$PATH:${JAVA_HOME}/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$MAHOUT_HOME/conf:$MAHOUT_HOME/bin:
更新配置
source /etc/profile
输入mahout测试 出现许多算法
进行kmeans算法简单运行
- 下载测试数据集synthetic_control.data
http://archive.ics.uci.edu/ml/databases/synthetic_control/ - 在hdfs上创建目录
/user/ubuntu/testdata
- 上传测试数据
hadoop fs -put synthetic_control.data /user/ubuntu/testdata
- 运行
mahout org.apache.mahout.clustering.syntheticcontrol.kmeans.Job
参考