Das Seminar "Big Data – Einführung in das Thema" wurde abgekündigt. Wir können Ihnen diese Schulung in Form eines Workshops in Ihrem Unternehmen anbieten.
Ziele
Die Schulung „Big Data – eine Einführung in das Thema“ gibt einen Überblick, warum das Thema in aller Munde ist. Jenseits des damit verbundenen Marketing-Spektakels werden die einzelnen Komponenten und ihr Zusammenwirken vorgestellt und mögliche Einsatzszenarien skizziert.
Agenda
Überblick
In diesem Abschnitt erfährt der Teilnehmer etwas über die riesigen Datenmengen, die durch die Welt bewegt werden und darüber, dass nicht das Speichern, sondern das Suchen nach und Analysieren von Informationen das Problem ist.
Hadoop-Bestandteile
„Big Data“ wird zumeist mit Hadoop gleich gesetzt. Das ist zwar nicht ganz exakt, wird aber in diesem Seminar ebenso gehandhabt. In diesem Abschnitt erhält der Teilnehmer einen allerersten Überblick zu Hadoop. Es wird die Nutzung einer Hadoop-Sandbox demonstriert.
Was ist anders
Personen, die im Umgang mit Datenbanken und strukturierten Daten vertraut sind, tun sich schwer mit dem Ansatz für „Big Data“, denn Hadoop „tickt“ gänzlich anders als die vertraute relationale Welt. In diesem Abschnitt erfahren Teilnehmer das Wichtigste darüber, was Hadoop von dem klassischen Ansatz unterscheidet.
Hadoop Distributed File System (HDFS)
Das Kernstück von Hadoop ist ein leistungsstarkes, robustes und extrem skalierbares Dateisystem. In diesem Abschnitt erfahren Teilnehmer das Wichtigste über HDFS.
Es wird die Kommunikation von und mit HDFS demonstriert.
MapReduce
Die Java-basierte Klassenbibliothek für MapReduce ist der Maschinenraum von Hadoop. In diesem Abschnitt lernen die Teilnehmer das von Google eingeführte Programmiermodell für nebenläufige Berechnungen näher kennen.
Es wird die Anwendung von MapReduce demonstriert.
Hive
Mit Hive steht eine Schnittstelle zur Verfügung, die den Zugang zu strukturierten Daten in Hadoop mit einer SQL-ähnlichen Syntax erlaubt. In diesem Abschnitt lernen die Teilnehmer die Möglichkeiten und Grenzen von Hive kennen.
Es wird die Anwendung von Hive demonstriert.
Die Hardware für Hadoop
Hadoop stellt keine „besonderen“ Hardware-Anforderungen. Das stimmt und stimmt wiederum auch nicht. In diesem Abschnitt wird der scheinbare Widerspruch aufgeklärt.
Anwendungsbeispiele für Hadoop
Und wozu der ganze Aufwand? In diesem abschließenden Abschnitt lernen die Teilnehmer mögliche Anwendungsfälle für „Big Data“ kennen.
Schulungsunterlagen
nach Absprache