본문 바로가기
컴퓨터/공부

하둡 파일 데이터 읽기

by 싱판다 2017. 7. 26.
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;

import java.io.InputStream;
import java.net.URI;

public class FileSystemCat{
public static void main(String[] args) throws Exception {
String uri = args[0];
Configuration conf = new Configuration();
// 클라이언트나 서버의 환경 설정 포함.
// core-site.xml과 같은 설정 파일에서 관련 설정을 읽어 들인다.
FileSystem fs = FileSystem.get(URI.create(uri), conf);
// 주어진 URI 스킴과 권한으로 파일시스템을 결정하며, URI에 스킴을 명시하지 않으면 기본 파일시스템으로 간주한다.
InputStream in = null;
try{
in = fs.open(new Path(uri)); // 파일에 대한 입력 스트림을 엶 4KB의 기본 버퍼 크기를 사용.
//FileSystem의 open()메서드는 표준 java.io 클래스를 반환하는 것이 아니라, FSDataInputStream 클래스를 반환한다.
IOUtils.copyBytes(in, System.out, 4096, false);
} finally {
IOUtils.closeStream(in);
}
}
}

파일을 읽는 방법에는 하둡 URL로 데이터를 읽거나 파일 시스템 API로 읽을 수 있다.

'컴퓨터 > 공부' 카테고리의 다른 글

우분투 16.04 버전 설치  (0) 2017.10.26
정규표현식 사이트  (0) 2017.08.07
우분투 파이썬 설치  (0) 2017.07.24
7/23  (0) 2017.07.23
하둡 - 이클립스 메이븐 설치  (0) 2017.07.21

댓글