トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS

Mahout:環境構築

Last-modified: 2013-08-24 (土) 02:14:21 (3898d)
Top / Mahout:環境構築

Hadoopをセットアップ

Mahout:環境構築

Mahout in Actionを読んで勉強し始めました。

まずは環境構築から。

Mahout本ではMaven使えって書いてあったけど、使用するライブラリの依存関係が明確に見えないのがいやだったので(ちゃんと見れば見えるけどw)、必要な資材をDLして環境構築しました。

なお、Mahout本の最初の方ではHadoopはいらないけど、Hadoop上で実行するところまでやりたいので、Hadoopも合わせて構築してます。

環境

  • OS:Win7上に構築したCentOS6.1
  • メモリ:2G

Hadoopのセットアップ

HadoopはCDH3u6の0.20.2をインストールしてます。以下のURLよりtarballをDL。

DLしたtarballを適当なディレクトリに展開。 あとは以下の記事を参照しつつ、開発端末用にパラメータを調整。

■個の環境用に調整したパラメータ

hadoop-env.sh
export HADOOP_HEAPSIZE=256

※VMのメモリが少ないので、少なめに設定

Mahoutのセットアップ

MahoutはDLして展開して、必要なJarをビルドパスに追加するだけですw

Mahoutは0.7を以下のURLよりDL。

tar.gzをDLして展開し、exlipseのプロジェクトの中へ「mahout-lib」にリネームして移動。

して、ビルドパスに以下のjarを追加します。

  • mahout-core-0.7-job.jar
  • mahout-core-0.7.jar
  • mahout-integration-0.7.jar
  • mahout-math-0.7.jar
  • libディレクトリに格納されているすべてのjarファイル

まあ、「何だかんだ言って、全部パス通してんじゃん!」ってツッコミはなしってことでw

走行確認。

さて、サンプル実行は以下のページを参照のこと