[ Hadoop ] Hadoop?

Hadoop이란?

- 빅데이터 저장 분석을 위한 분산 컴퓨팅 프로그램을 지원하는 프리웨어 자바 소프트웨어 프레임워크이다. 2006년 구글의 분산 파일 시스템(GFS) 논문이 계기가 되어 만들어지게 되었다.
- 현재는 수많은 하둡 서포트 프로그램들이 존재한다.
- 하둡은 Linux 또는 Unix라는 운영체제 상에서 설치할 수 있다.



환경구축

1. VirtualBox 설치
  - https://www.virtualbox.org/에서 Host Machine의 OS에 맞게 설치

2. Guest Machine의 OS 구하기
  - Linux - Ubuntu 배포판(https://www.ubuntu.com/) 설치



Linux 기본
  • Linux 명령어(Terminal 상에서)
    • 해당 명령어 --help : 해당 명령어에 대한 옵션들을 볼 수 있다.
    • File System 관련 명령어
      • ls : list. 현재 디렉토리 조회 (cmd에서 dir)
        • ls -l : 리스트로 조회
        • ls -a : 숨김파일 포함 조회
        • ls -al : 옵션 조합 가능
      • clear : 화면 지우기(cmd에서 cls)
      • pwd : print working directory
      • cd : change directory
      • touch : make file
      • mkdir : make directory
      • rm : remove(file / directory)
      • mv : move(rename / move)
      • cp : copy(file / directory)
    • 텍스트 편집기
      • vi
      • nano
      • gedit
      ※ Linux의 모든 명령어는 권한에 따라 사용할 수 있는 명령어들이 제한되어 있다.
      ※ 파일명 앞에 .이 붙으면 숨김파일




3. 패키지 설치
  • apt(advenced package tool)를 이용해서 설치하는 방식 - sudo 권한부여해야함
    • sudo apt update : 최신리스트가 아닐 수도 있기 때문에 리스트 갱신하는 명령어
    • Java 설치
      • sudo apt install default-jdk
        • jre도 함께 설치됨
      • 환경변수 설정
        • sudo nano /etc/profile을 열어서 소스 맨 마지막에 JAVA_HOME = /usr/lib/jvm/java-8-openjdk-amd64
          입력 후 Write Out 해주고 끝내기!
          • source /etc/profile 입력 후 echo $JAVA_HOME을 했을 때, 경로가 뜨면 된다.


  • 설치파일을 직접 다운받아서 수동으로 설치하는 방식

4. SSH Server 설치
  • sudo apt install openssh-server




댓글

이 블로그의 인기 게시물

[SPRING] log4j2.xml 설정

[ Javascript ] 프로토타입 이해하기

[JWT] 토큰(Token) 기반 인증에 대한 소개