Notice
Recent Posts
Recent Comments
Link
반응형
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 클린아키텍처
- 자바
- Effective Java
- 알고리즘
- 이차전지관련주
- 이펙티브 자바
- 이펙티브자바
- 스프링
- k8s
- kubernetes
- java
- 스프링 핵심원리
- ElasticSearch
- 김영한
- 카카오
- 스프링부트
- Spring
- 예제로 배우는 스프링 입문
- 자바스크립트
- 카카오 면접
- effectivejava
- JavaScript
- 스프링핵심원리
- 코딩테스트
- Sort
- Effective Java 3
- 오블완
- 알고리즘정렬
- 티스토리챌린지
- 엘라스틱서치
Archives
- Today
- Total
Kim-Baek 개발자 이야기
HDFS (Hadoop Distributed File System) 본문
HDFS
HDFS(Hadoop Distributed File System)
는 수십 테라바이트 또는 페타파이트 이상의 대용량 파일을 분산된 서버에 저장하고, 많은 클라이언트가 저장된 데이터를 빠르게 처리할 수 있게 설계된 파일 시스템이다.HDFS
를 이용하면 수십 혹은 수백 대의 웹 서버급 서버를 묶어서 하나의 스토리지처럼 사용할 수 있다. 즉 기존 대용량 파일 시스템과의 차이점은 저사양 서버를 이요해 스토리지를 구성할 수 있다.- 물리적으로 분산된 서버 디스크에 저장된 데이터들은
HDFS
에서 제공하는 API를 이용하여 파일의 읽기 및 저장과 같은 제어가 가능하다. - 은행이나 전자상거래처럼 트랜잭션이 중요한 경우는
HDFS
가 적합하지 않으며, 대규모 데이터를 저장하거나 배치로 처리하는 경우 유용하다.
HDFS의 네 가지 목표
-
장애 복구
HDFS
는 분산 서버에 장애가 발생하면 빠르게 처리할 수 있도록 처리하였다. HDFS에 데이터를 저장하면 복제 데이터도 함께 저장하여 데이터 유실을 방지하고, 분산 서버 간의 주기적인 상태 체크로 빠르게 장애를 인지하고 처리한다.
-
스트리밍 방식의 데이터 접근
HDFS
는 클라이언트의 요청을 빠른 시간 내에 처리하는 것보다는 동일한 시간 내에 더 많은 데이터를 처리하는 것이 목표이다. HDFS는 랜덤 접근 방식 대신 스트리밍 방식으로 데이터에 접근하도록 설계하였다. 그래서 클라이언트는 끊김 없는 연속된 데이터에 접근가능하다.
-
대용량 데이터 저장
HDFS
는 하나의 파일일 테라바이트 이상의 크기도 저장가능하다.
-
데이터 무결성
- 데이터베이스에 저장되는 데이터의 일관성을 의미하는 것이 데이터 무결성이다. 즉, 데이터의 입력이나 변경 등을 제한해 데이터의 안저엉을 저해하는 요소들을 막는다.
반응형
Comments