맵리듀스(MapReduce)란 맵리듀스(MapReduce)는 대용량 데이터를 처리하는 데 사용되는 병렬 프로그래밍 모델 및 처리 방식으로, 2004에 구글에 의해 발표되었다. 주로 분산 처리 환경에서 사용되며, 대용량의 데이터를 효율적으로 처리하기 위한 목적이다. 맵리듀스는 크게 Map과 Reduce 단계로 구성이 된다. 맵(Map)은 입력된 데이터를 분할하고, 매핑하여 가공하는 단계이다. 리듀스(Reduce)는 맵(Map)으로 가공된 데이터의 중복을 제거하고 축소하는 역할을 한다. 맵리듀스는 이렇게 대용량의 데이터를 분산처리 환경에서 분할 및 가공 후 축소 하며 데이터를 가공하는 과정이다. 맵리듀스(MapReduce)의 처리 과정 맵리듀스의 처리과정을 살펴보면 기존의 맵과 리듀스의 과정을 조금 세분화 ..