본문 바로가기

카테고리 없음

ubuntu 12.10에 maven과 mahout 설치하기



이전에 하둡설치에 대해서는 포스팅을 했었다.(http://abipictures.tistory.com/791)

이번에는 우분투 12.1에 메이븐(maven)과 머하웃(mahout)을 설치하는 방법을 포스팅하려고 한다.


1. 메이븐 설치

- 우분투 소프트웨어 센터에서 쉽게 설치하자. 'maven'으로 검색하면 다음과 같이 뜨는데, 첫번째 프로그램을 설치하면 된다.


'Java software project management and comprehension tool'



메이븐에 대해서 설명하면, 의존성관리나 코드 컴파일, 패키지 릴리즈, 문서 생성과 공식 릴리즈를 처리하는 명령행 도구이다.


2. 머하웃 설치

- mahout은 직접 다운로드 받아서 설치해야 한다. 아래와 같이 입력한다.

- 참고로 머하웃은 scalable machine learning and data mining 알고리즘 라이브러리이다. 하둡과 연동되어 빅데이터 분석에 쓰일수 있다.

- 본인은 mahout을 /usr/local/ 하위에 설치하려고 한다. 현재 가장 최신버젼이 0.7버젼이다.


> cd /usr/local

> sudo wget http://apache.tt.co.kr/mahout/0.7/mahout-distribution-0.7.tar.gz ./

> sudo tar -zxvf mahout-distribution-0.7.tar.gz


3. Path 설정

- .bashrc 파일에 path를 설정해준다.

- 본인의 내용을 옮겨두면 아래와 같다.


 ...<생략>..

export JAVA_HOME="/usr/lib/jvm/java-8-oracle"

export HADOOP_HOME="/usr/local/hadoop-1.0.4"

export ECLIPSE_HOME="/usr/local/eclipse"

export MAVEN_HOME="/usr/share/maven"

export MAHOUT_HOME="/usr/local/mahout-distribution-0.7"

export MAHOUT_JAVA_HOME="/usr/lib/jvm/java-8-oracle"


export PATH="$JAVA_HOME/bin:$PATH"

export PATH="$HADOOP_HOME/bin:$PATH"

export CLASSPATH=":$JAVA_HOME/lib/*"

export PATH="$ECLIPSE_HOME:$PATH"

export PATH="$MAVEN_HOME/bin:$PATH"

export PATH="$MAHOUT_HOME/bin:$PATH"

export PATH="$MAHOUT_JAVA_HOME/bin:$PATH"


처음에 Path를 설정할 때 export가 제대로 안되면 mahout을 실행했을때 아래와 같은 에러 메세지를 띄운다.


> mahout

Error: JAVA_HOME is not set. 


vim으로 mahout 파일을 열어보면 이 에러가 어디서 나는지 알 수 있다.


...<생략>...
# some Java parameters
if [ "$MAHOUT_JAVA_HOME" != "" ]; then
  #echo "run java in $MAHOUT_JAVA_HOME"
  JAVA_HOME=$MAHOUT_JAVA_HOME
fi

if [ "$JAVA_HOME" = "" ]; then
  echo "Error: JAVA_HOME is not set."
  exit 1 

fi 

...<생략>...


JAVA_HOME 이라는 Path가 설정되지 않아서 나는 에러인데, 이것은 bashrc파일에서 'export' 빼먹으면 그렇다. 주의하자.


이렇게 설정하고 난뒤에 mahout 을 이용하면 될 것같다.