トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS

Mahout:環境構築 のバックアップソース(No.1)

[[Hadoopをセットアップ]]

*Mahout:環境構築 [#u71bfc25]

Mahout in Actionを読んで勉強し始めました。

まずは環境構築から。

Mahout本ではMaven使えって書いてあったけど、使用するライブラリの依存関係が明確に見えないのがいやだったので(ちゃんと見れば見えるけどw)、必要な資材をDLして環境構築しました。

なお、Mahout本の最初の方ではHadoopはいらないけど、Hadoop上で実行するところまでやりたいので、Hadoopも合わせて構築してます。

***環境 [#n00f0fe5]
-OS:Win7上に構築したCentOS6.1
-メモリ:2G

***Hadoopのセットアップ [#j49b707f]
HadoopはCDH3u6の0.20.2をインストールしてます。以下のURLよりtarballをDL。
-http://www.cloudera.com/content/cloudera-content/cloudera-docs/CDHTarballs/3.25.2013/CDH3-Downloadable-Tarballs/CDH3-Downloadable-Tarballs.html

DLしたtarballを適当なディレクトリに展開。
あとは以下の記事を参照しつつ、開発端末用にパラメータを調整。

-[[Hadoopをセットアップ]]

■個の環境用に調整したパラメータ
:hadoop-env.sh|export HADOOP_HEAPSIZE=256

※VMのメモリが少ないので、少なめに設定

***Mahoutのセットアップ [#kd638f48]
MahoutはDLして展開して、必要なJarをビルドパスに追加するだけですw

Mahoutは0.7を以下のURLよりDL。
-http://ftp.jaist.ac.jp/pub/apache/mahout/0.7/

tar.gzをDLして展開し、exlipseのプロジェクトの中へ「mahout-lib」にリネームして移動。

して、ビルドパスに以下のjarを追加します。
-mahout-core-0.7-job.jar
-mahout-core-0.7.jar
-mahout-integration-0.7.jar
-mahout-math-0.7.jar
-libディレクトリに格納されているすべてのjarファイル

まあ、「何だかんだ言って、全部パス通してんじゃん!」ってツッコミはなしってことでw

さて、サンプル実行は以下のページを参照のこと
-[[Mahout:サンプル1:はじめてのレコメンド]]