Apache Hadoop – это платформа для распределенной обработки больших наборов данных на кластерах компьютеров с использованием простых моделей программирования. В этой книге вы познакомитесь с общей архитектурой платформы, компонентами стека, такими как HDFS и MapReduce, приложениями Hadoop. Это и многое другое вы найдете в книге Технология хранения и обработки больших данных Hadoop (Тимур Машнин)