Header Background

PL-400T00 Microsoft Power Platform Developer

Garantietermin 12. - 16.06.2023

CODING BOOTCAMPS

Starten Sie Ihre Entwickler-Karriere!

Gesicherter Termin

Weiterbildung für Ihre Zukunft!

Über 800 Garantie-Termine

Image not available
 
 
 

Big Data - Hands On für Data Analytics

Seminardauer: 3 Tage

Ziele

In diesem Hands On Workshop steht die Lösungsfindung und ihre Umsetzung im Vordergrund. Anhand praktischer Aufgabenstellungen diskutieren die Teilnehmer Möglichkeiten ihrer Bearbeitung und sammeln Erfahrungen in der Umsetzung. Die erzielten Ergebnisse und gewonnenen Erfahrungen werden verallgemeinert.

Zielgruppe

  • (IT-)Architekten
  • (IT-)Entwickler

Voraussetzungen

Praktische Erfahrung in der IT-Informationsverarbeitung erforderlich. Grundkenntnisse zu Hadoop sowie in der Anwendung von Programmiersprachen werden vorausgesetzt.

Agenda

Hadoop-Sandbox

In dem ersten Modul wird die Hadoop-Sandbox vorgestellt und gemeinsam evaluiert.

Überblick Hadoop Distributed File System (HDFS)

Das Kernstück von Hadoop ist ein leistungsstarkes, robustes und extrem skalierbares Dateisystem. In diesem Abschnitt werden die wichtigsten Elemente für den Datenaustausch mit HDFS evaluiert.

Überblick Sqoop

Sqoop ist ein Werkzeug, um Daten für Hadoop aus einer relationalen Quelle zu entladen oder aus hadoop in ein RDBMS zu laden. In diesem Abschnitt erhalten die Teilnehmer einen Überblick zu sqoop.

Import in und Export aus HDFS von Daten unter Verwendung von Sqoop

In diesem Abschnitt evaluieren die Teilnehmer den Import sowie den Export von Daten aus der Shell sowie den Einsatz von Sqoop für den Datenaustausch mit einer relationalen Datenbank.

Überblick MapReduce

Die Java-basierte Klassenbibliothek für MapReduce ist der Maschinenraum von Hadoop. In diesem Abschnitt erhalten die Teilnehmer einen Überblick über das von Google eingeführte Programmier-modell für nebenläufige Berechnungen.

Transformation von Logdateien unter Anwendung von MapReduce

In diesem Abschnitt evaluieren die Teilnehmer die Anwendung von MapReduce, um Logdateien aufzubereiten.

Überblick Pig

Pig ist ein Mechanismus, um stapelorientierte Datenfluss-Operationen in Hadoop auszuführen. In diesem Abschnitt erhalten die Teilnehmer eine Übersicht.

Filtern und Sortieren von Logdaten unter Anwendung von Pig

In diesem Abschnitt evaluieren die Teilnehmer die Anwendung von Pig, um beispielsweise den bot-Traffic aus den Logdateien zu entfernen und die Daten chronologisch zu sortieren.

Überblick Hive

Mit Hive steht eine Schnittstelle zur Verfügung, die den Zugang zu strukturierten Daten in Hadoop mit einer SQL-ähnlichen Syntax erlaubt. In diesem Abschnitt erhalten die Teilnehmer einen Überblick zu hive.

Anwendung von Hive und anderen Tools für verschiedene Fragestellungen

In diesem Abschnitt evaluieren die Teilnehmer verschiedene praktische Fragestellungen wie beispielsweise die Verknüpfung mit externen Tabellen oder das Zusammensetzen von Strings.

Überblick Verknüpfung von Daten in Hadoop

Häufig besteht die Anforderung, eine Analyse über unterschiedliche Datenquellen durchzuführen. In diesem Abschnitt lernen die Teilnehmer verschiedene Möglichkeiten kennen, wie man das in Hadoop realisieren kann.

Anwendung von MapReduce, Pig und Hive zur Verknüpfung von Daten

Basierend auf den Ausführungen des vorhergehenden Abschnittes evaluieren die Teilnehmer, wie man verschiedene Datensets in Hadoop miteinander verknüpft.

Anwendung von MapReduce, Pig und Hive zur Analyse von Daten

In diesem Abschnitt setzen die Teilnehmer die Werkzeuge von Hadoop ein, um verschiedene praktische Fragestellungen zu beantworten.

Überblick Test und Optimierung der Lösung in Hadoop

Es wird ein Überblick zum Testen und Optimieren in Hadoop gegeben und welche Werkzeuge dafür zur Verfügung stehen.

Testen und Optimieren der Lösung in Hadoop

In diesem Abschnitt sammeln die Teilnehmer erste Erfahrungen im Testen und Optimieren der erstellten Lösungen.

Zusammenfassung und Verallgemeinerung

Zum Abschluss werden die Ergebnisse zusammengefasst und die durchgeführten Übungen auf ihre Praxistauglichkeit untersucht sowie ein Vorgehensmodell für die Datenanalyse mit Hadoop abgeleitet.

Schulungsunterlagen

nach Absprache

Open Badge - Ihr digitaler Kompetenznachweis

Digital Skills Open Badges

Mit einer erfolgreichen Teilnahme an einer Schulung bei IT-Schulungen.com erwerben Sie nicht nur Wissen und Kompetenz, sondern erhalten auch zusätzlich zum Teilnahmezertifikat Ihr Open Badge als digitalen Kompetenznachweis.

Diesen erhalten Sie in Ihrem persönlichen und kostenlosen Mein IT-Schulungen.com Account. Ihre erworbenen Badges können Sie anschließend in sozialen Medien einbinden und teilen.

Infos zu den Vorteilen unter Badges

 
Anmeldungen vorhanden

1.) Wählen Sie den Seminartyp:




2.) Wählen Sie Ort und Datum:

1.695,00 € Preis pro Person

spacing line2.017,05 € inkl. 19% MwSt
Verpflegung zzgl.
Seminarunterlagen zzgl.

Seminar jetzt anfragen Auf den Merkzettel
PDF IconPDF Icon

Digitale Zertifikate

Digital Skills Open Badge

Digitales Wissen & Kompetenzen erwerben & zeigen.

Mit Badges von IT-Schulungen erhalten Sie - neben dem Teilnahmezertifikat als PDF - ein Open Badge als Nachweis Ihrer Fertigkeiten mit Echtheitszertifikat.

Zeigen Sie Ihre Digital Skills mit Zertifikaten auf Plattformen wie LinkedIn, XING & Facebook, auf Ihrer Website und in E-Mail-Signaturen.

Mehr Infos zu Badges

 

Diese Seite weiterempfehlen:

0
Merkzettel öffnen
0
Besuchsverlauf ansehen
IT-Schulungen.com Control Panel
Warnung Icon Sie haben in Ihrem Browser Javascript deaktiviert! Bitte aktivieren Sie Javascript um eine korrekte Darstellung und Funktionsweise von IT-Schulungen zu gewährleisten. Warnung Icon