Hadoop
Autoren
Mehr zum Buch
Hadoop ist ein freies, Java-basiertes Open Source Framework für die verteilte Verarbeitung großer Datenmengen innerhalb eines Netzwerks. Mittlerweile ist Hadoop bei namhaften Firmen im Einsatz, die viele Petabyte an Daten zu verarbeiten haben, wie zum Beispiel Facebook, Yahoo!, Twitter, Apple, IBM oder Amazon. Dieses Buch richtet sich an alle, die praktisch wie akademisch am Thema Big Data interessiert sind. Da Hadoop in weiten Teilen auf Java von Oracle (vormals Sun Microsystems) basiert, ist für einen tieferen Einstieg solides Grundwissen in dieser Programmiersprache nützlich. Neben administrativen Themen wie Installation, Konfiguration und Einsatz von Hadoop werden viele praktische Beispiele ausgeführt, die Ihnen die Entwicklung von MapReduce-Anwendungen Schritt für Schritt erläutern. Dabei erhalten Sie sowohl Einblick in den Einsatz geeigneter Werkzeuge als auch Tipps für die Fehlersuche und die Optimierung von MapReduce-Jobs. Eigene Kapitel über das „Ökosystem“ von Hadoop mit der Beschreibung vieler Anwendungen und deren Praxiseinsatz im deutschsprachigen Raum runden das Buch ab.