Hadoop 2.X 설치

1. 사전 준비 (both Master and Slaves)

Install openssh-server

$ sudo apt-get install openssh-server

Install java

$ sudo add-apt-repository ppa:webupd8team/java

$ sudo apt-get update

$ sudo apt-get install oracle-java7-installer

$ cd /usr/lib/jvm

$ ln -s java-7-oracle jdk

Add hadoop group and user

$ sudo addgroup hadoop

$ usermod -a -G hadoop hduser

Configure SSH

$ ssh-keygen -t rsa -P ""

$ ssh-copy-id -i ~/.ssh/id_rsa.pub hduser@[slave_ip]

Disable IPv6 - it creates problems in Hadoop

$ sudo gedit /etc/sysctl.conf

add the following lines to the end of the file

# disable ipv6

net.ipv6.conf.all.disable_ipv6 = 1

net.ipv6.conf.default.disable_ipv6 = 1

net.ipv6.conf.lo.disable_ipv6 = 1

Download and extract Hadoop

download Hadoop (http://apache.tt.co.kr/hadoop/common/)

$ cd ~/Downloads

$ sudo tar xvzf hadoop-2.2.0.tar.gz -C /usr/local

$ cd /usr/local

$ sudo mv hadoop-2.2.0 hadoop

$ sudo chown -R hduser:hadoop hadoop

2. Hadoop 설정 (both Master and Slaves)

Configure .bashrc

$ sudo gedit ~/.bashrc

add the following lines to the end of the file

#Hadoop variables

export JAVA_HOME=/usr/lib/jvm/jdk/

export HADOOP_INSTALL=/usr/local/hadoop

export PATH=$PATH:$HADOOP_INSTALL/bin

export PATH=$PATH:$HADOOP_INSTALL/sbin

export HADOOP_MAPRED_HOME=$HADOOP_INSTALL

export HADOOP_COMMON_HOME=$HADOOP_INSTALL

export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native

export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib"

export HADOOP_HDFS_HOME=$HADOOP_INSTALL

export YARN_HOME=$HADOOP_INSTALL

#end of paste

Modify hadoop-env.sh

$ gedit /usr/local/hadoop/etc/hadoop/hadoop-env.sh

modify the JAVA_HOME

export JAVA_HOME=/usr/lib/jvm/jdk/

save and restart the system

$ hadoop version

Create folder for tmp

$ mkdir -p $HADOOP_INSTALL/tmp

core-site.xml

$ gedit /usr/local/hadoop/etc/hadoop/core-site.xml

add the following lines between <configuration>

<name>fs.default.name</name>

<value>hdfs://master:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/usr/local/hadoop/tmp</value>

</property>

hdfs-site.xml

$ cd ~

$ mkdir -p mydata/hdfs/namenode

$ mkdir -p mydata/hdfs/datanode

$ gedit /usr/local/hadoop/etc/hadoop/hdfs-site.xml

add the following lines between <configuration>

<name>dfs.replication</name>

</property>

<name>dfs.permissions</name>

<value>false</value>

</property>

<name>dfs.namenode.name.dir</name>

<value>file:/home/hduser/mydata/hdfs/namenode</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>file:/home/hduser/mydata/hdfs/datanode</value>

</property>

mapred-site.xml

$ gedit /usr/local/hadoop/etc/hadoop/mapred-site.xml

add the following lines between <configuration>

<name>mapreduce.framework.name</name>

</property>

yarn-site.xml

$ gedit /usr/local/hadoop/etc/hadoop/yarn-site.xml

add the following lines between <configuration>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<name>yarn.resourcemanager.scheduler.address</name>

<value>master:8030</value>

</property>

<name>yarn.resourcemanager.resource- tracker.address</name>

<value>master:8031</value>

</property>

<name>yarn.resourcemanager.address</name>

<value>master:8032</value>

</property>

format the namenode (master only)

$ hadoop namenode -format

$ hdfs namenode -format

3. Hadoop 실행 및 중지 (only at Master)

start-dfs.sh

to start namenode and data node
$ start-dfs.sh
$ jps - master

Jps
SecondaryNameNode
NameNode

$ jps - slave

Jps
DataNode

start-yarn.sh

to start resourcemanager and nodemanager
$ start-yarn.sh
$ jps - master

Jps
ResourceManager

$ jps - slave

Jps
NodeManager

stop-dfs.sh
stop-yarn.sh

start-all.sh (deprecated)
stop-all.sh (deprecated)

4. Hadoop 동작 (only at Master)

$ hadoop jar hadoop-examples.jar randomwriter out

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Hadoop 2.X 설치

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역