Das Seminar "Big Data – Einführung in das Thema" wurde abgekündigt. Wir können Ihnen diese Schulung in Form eines Workshops in Ihrem Unternehmen anbieten.
Die Schulung „Big Data – eine Einführung in das Thema“ gibt einen Überblick, warum das Thema in aller Munde ist. Jenseits des damit verbundenen Marketing-Spektakels werden die einzelnen Komponenten und ihr Zusammenwirken vorgestellt und mögliche Einsatzszenarien skizziert.
IT-Grundkenntnisse; darüber hinaus werden keine Anforderungen gestellt.
Die Schulung bietet Ihnen eine ausgewogene Mischung aus Theorie und Praxis in einer erstklassigen Lernumgebung. Profitieren Sie vom direkten Austausch mit unseren projekterfahrenen Trainern und anderen Teilnehmern, um Ihren Lernerfolg zu maximieren.
In diesem Abschnitt erfährt der Teilnehmer etwas über die riesigen Datenmengen, die durch die Welt bewegt werden und darüber, dass nicht das Speichern, sondern das Suchen nach und Analysieren von Informationen das Problem ist.
„Big Data“ wird zumeist mit Hadoop gleich gesetzt. Das ist zwar nicht ganz exakt, wird aber in diesem Seminar ebenso gehandhabt. In diesem Abschnitt erhält der Teilnehmer einen allerersten Überblick zu Hadoop. Es wird die Nutzung einer Hadoop-Sandbox demonstriert.
Personen, die im Umgang mit Datenbanken und strukturierten Daten vertraut sind, tun sich schwer mit dem Ansatz für „Big Data“, denn Hadoop „tickt“ gänzlich anders als die vertraute relationale Welt. In diesem Abschnitt erfahren Teilnehmer das Wichtigste darüber, was Hadoop von dem klassischen Ansatz unterscheidet.
Das Kernstück von Hadoop ist ein leistungsstarkes, robustes und extrem skalierbares Dateisystem. In diesem Abschnitt erfahren Teilnehmer das Wichtigste über HDFS.
Es wird die Kommunikation von und mit HDFS demonstriert.
Die Java-basierte Klassenbibliothek für MapReduce ist der Maschinenraum von Hadoop. In diesem Abschnitt lernen die Teilnehmer das von Google eingeführte Programmiermodell für nebenläufige Berechnungen näher kennen.
Es wird die Anwendung von MapReduce demonstriert.
Mit Hive steht eine Schnittstelle zur Verfügung, die den Zugang zu strukturierten Daten in Hadoop mit einer SQL-ähnlichen Syntax erlaubt. In diesem Abschnitt lernen die Teilnehmer die Möglichkeiten und Grenzen von Hive kennen.
Es wird die Anwendung von Hive demonstriert.
Hadoop stellt keine „besonderen“ Hardware-Anforderungen. Das stimmt und stimmt wiederum auch nicht. In diesem Abschnitt wird der scheinbare Widerspruch aufgeklärt.
Und wozu der ganze Aufwand? In diesem abschließenden Abschnitt lernen die Teilnehmer mögliche Anwendungsfälle für „Big Data“ kennen.