Big Data - Hands On für Data Analytics
Ziele
In dieser 3-tägigen Schulung "Big Data - Hands On für Data Analytics" steht die praxisorientierte Lösungsfindung und Umsetzung im Vordergrund. Die Teilnehmer werden anhand praktischer Aufgabenstellungen verschiedene Möglichkeiten der Bearbeitung diskutieren und dabei wertvolle Erfahrungen in der Umsetzung sammeln. Die erzielten Ergebnisse und gewonnenen Erfahrungen werden anschließend verallgemeinert, um einen ganzheitlichen Einblick in die Big Data Analytics zu ermöglichen.
Zielgruppe
- (IT-)Architekten
- (IT-)Entwickler
Voraussetzungen
- Praktische Erfahrung in der IT-Informationsverarbeitung
- Grundkenntnisse zu Hadoop sowie
- Grundkenntnisse in der Anwendung von Programmiersprachen
Lernmethodik
Die Schulung bietet Ihnen eine ausgewogene Mischung aus Theorie und Praxis in einer erstklassigen Lernumgebung. Profitieren Sie vom direkten Austausch mit unseren projekterfahrenen Trainern und anderen Teilnehmern, um Ihren Lernerfolg zu maximieren.
Agenda
Hadoop-Sandbox
In dem ersten Modul wird die Hadoop-Sandbox vorgestellt und gemeinsam evaluiert.
Überblick Hadoop Distributed File System (HDFS)
Das Kernstück von Hadoop ist ein leistungsstarkes, robustes und extrem skalierbares Dateisystem. In diesem Abschnitt werden die wichtigsten Elemente für den Datenaustausch mit HDFS evaluiert.
Überblick Sqoop
Sqoop ist ein Werkzeug, um Daten für Hadoop aus einer relationalen Quelle zu entladen oder aus hadoop in ein RDBMS zu laden. In diesem Abschnitt erhalten die Teilnehmer einen Überblick zu sqoop.
Import in und Export aus HDFS von Daten unter Verwendung von Sqoop
In diesem Abschnitt evaluieren die Teilnehmer den Import sowie den Export von Daten aus der Shell sowie den Einsatz von Sqoop für den Datenaustausch mit einer relationalen Datenbank.
Überblick MapReduce
Die Java-basierte Klassenbibliothek für MapReduce ist der Maschinenraum von Hadoop. In diesem Abschnitt erhalten die Teilnehmer einen Überblick über das von Google eingeführte Programmier-modell für nebenläufige Berechnungen.
Transformation von Logdateien unter Anwendung von MapReduce
In diesem Abschnitt evaluieren die Teilnehmer die Anwendung von MapReduce, um Logdateien aufzubereiten.
Überblick Pig
Pig ist ein Mechanismus, um stapelorientierte Datenfluss-Operationen in Hadoop auszuführen. In diesem Abschnitt erhalten die Teilnehmer eine Übersicht.
Filtern und Sortieren von Logdaten unter Anwendung von Pig
In diesem Abschnitt evaluieren die Teilnehmer die Anwendung von Pig, um beispielsweise den bot-Traffic aus den Logdateien zu entfernen und die Daten chronologisch zu sortieren.
Überblick Hive
Mit Hive steht eine Schnittstelle zur Verfügung, die den Zugang zu strukturierten Daten in Hadoop mit einer SQL-ähnlichen Syntax erlaubt. In diesem Abschnitt erhalten die Teilnehmer einen Überblick zu hive.
Anwendung von Hive und anderen Tools für verschiedene Fragestellungen
In diesem Abschnitt evaluieren die Teilnehmer verschiedene praktische Fragestellungen wie beispielsweise die Verknüpfung mit externen Tabellen oder das Zusammensetzen von Strings.
Überblick Verknüpfung von Daten in Hadoop
Häufig besteht die Anforderung, eine Analyse über unterschiedliche Datenquellen durchzuführen. In diesem Abschnitt lernen die Teilnehmer verschiedene Möglichkeiten kennen, wie man das in Hadoop realisieren kann.
Anwendung von MapReduce, Pig und Hive zur Verknüpfung von Daten
Basierend auf den Ausführungen des vorhergehenden Abschnittes evaluieren die Teilnehmer, wie man verschiedene Datensets in Hadoop miteinander verknüpft.
Anwendung von MapReduce, Pig und Hive zur Analyse von Daten
In diesem Abschnitt setzen die Teilnehmer die Werkzeuge von Hadoop ein, um verschiedene praktische Fragestellungen zu beantworten.
Überblick Test und Optimierung der Lösung in Hadoop
Es wird ein Überblick zum Testen und Optimieren in Hadoop gegeben und welche Werkzeuge dafür zur Verfügung stehen.
Testen und Optimieren der Lösung in Hadoop
In diesem Abschnitt sammeln die Teilnehmer erste Erfahrungen im Testen und Optimieren der erstellten Lösungen.
Zusammenfassung und Verallgemeinerung
Zum Abschluss werden die Ergebnisse zusammengefasst und die durchgeführten Übungen auf ihre Praxistauglichkeit untersucht sowie ein Vorgehensmodell für die Datenanalyse mit Hadoop abgeleitet.
Open Badge - Ihr digitaler Kompetenznachweis
Durch die erfolgreiche Teilnahme an einem Kurs bei IT-Schulungen.com erlangen Sie nicht nur Fachkenntnisse und Fähigkeiten, sondern bekommen zusätzlich zu Ihrem Teilnahmezertifikat ein Open Badge als digitalen Nachweis Ihrer Kompetenz.
Sie können diesen in Ihrem persönlichen und kostenfreien Mein IT-Schulungen.com Konto abrufen. Ihre verdienten Badges lassen sich problemlos in sozialen Netzwerken integrieren und weitergeben.
Kurz vor Durchführung
Termin | Standort | Aktion |
---|---|---|
22.10. - 24.10.2024 | Hamburg | |
25.11. - 27.11.2024 | München | |
10.12. - 12.12.2024 | Köln | |
08.01. - 10.01.2025 | Nürnberg |