Warnung Icon Sie haben in Ihrem Browser Javascript deaktiviert! Bitte aktivieren Sie Javascript um eine korrekte Darstellung und Funktionsweise von IT-Schulungen zu gewährleisten. Warnung Icon
Header Background
Header Image
 
 
 

Programmierung mit Pig

Seminardauer: 3 Tage

Das Seminar "Programmierung mit Pig" wurde abgekündigt. Wir können Ihnen diese Schulung in Form eines Workshops in Ihrem Unternehmen anbieten.

zur unverbindlichen Anfrage

Ziele

Pig ist ein Bestandteil des Hadoop-Frameworks. Mit der neu entwickelten Programmiersprache Pig Latin können große Datenmengen im Hadoop-Cluster manipuliert werden. Als Quelldaten sind in erster Linie textdateibasierte Datenbestände geeignet wie z.B. csv- oder json-Dateien oder auch zeilenbasierte Logdateien. Somit ist Pig hervorragend geeignet für die Filterung, Analyse, Gruppierung und Aggregation von großen Datenmengen. Die Ergebnisdaten können dann auf verschiedenste Arten formatiert und exportiert und z.B. als Grundlage für ein Data Warehouse verwendet werden.

In dieser Schulung werden fundierte, tiefgreifende Kenntnisse über die Hadoop-Komponente Pig vermittelt. Die TeilnehmerInnen lernen, wie und wo sich Pig sinnvoll einsetzen lässt und wie sich verschiedenste praktische Problemstellungen mit Pig lösen lassen. Es werden wichtige Aspekte wie die Arbeit mit unterschiedlichen Datenquellen sowie Möglichkeiten der Datenverarbeitung und -umstrukturierung ausgeleuchtet. Ferner werden Mittel und Wege der Performance-Optimierung und der effizienten Fehlersuche aufgezeigt. Anschließend setzen die TeilnehmerInnen ein komplexes, praxisnahes Beispielprojekt mit Pig um. Zum Abschluss der Schulung werden die gelernten Inhalte zusammengefasst und die TeilnehmerInnen haben die Möglichkeit, spezifische Fragestellungen anzusprechen.

Nach Abschluss der Schulung sind die TeilnehmerInnen in der Lage, Scripts in Pig Latin zu erstellen und damit große Datenmengen zu verarbeiten. Mit den Kenntnissen über die Möglichkeiten des Datenimports und -exports können die Teilnehmer Pig-Scripts in bestehende Hadoop-Lösungen integrieren oder externe Programme anbinden.

Zielgruppe

  • Softwareentwickler
  • Datenbankentwickler

Voraussetzungen

  • IT-Grundkenntnisse
  • Grundkenntnisse in mindestens einer Programmiersprache (idealerweise Java)
  • Grundkenntnisse in Hadoop (siehe z.B. "Entwicklung mit Hadoop")

Agenda

Theoretischer Teil

  • Einordnung von Pig innerhalb der Hadoop-Frameworks
  • Sinnvolle Einsatzbereiche für Pig
  • Grundlagen vom Pig Latin

Praktischer Teil

  • Einlesen von Daten aus verschiedenen Datenquellen
  • Verarbeitung von numerischen Werten, Datumwerten und Texten
  • Ausgabe der verarbeiteten Daten
  • Komplexe Relationale Operationen und Umstrukturierung der Daten
  • Verwendung von UDFs
  • Verwendung von Shell-Befehlen in Pig
  • Zusammenarbeit von Pig mit anderen Hadoop-Komponenten wie Oozie, Hive oder HBase
  • Performance-Tuning und professionelles Debugging von Pig-Programmen
  • Umsetzung eines eigenes praxisnahen Projektes mit Pig

Abschluss

  • Zusammenfassung
  • Ausblick
  • Fragen und Antworten

Schulungsunterlagen

nach Absprache
 
 

Europaweit unter den Besten
Unser Education Center wird seit 2012 beim jährlichen Leistungsaudit für das ITCR - International Training Center Rating® jeweils in der höchsten Leistungsstufe mit 5 von 5 Sternen ausgezeichnet.
Das bestätigt unseren langjährigen Premium-Status als Bildungsanbieter und beweist gleichzeitig, dass wir zu den besten Schulungshäusern in Europa gehören.

IT-Schulungen.com 5 Sterne

 Microsoft Learning Partner

Linux Foundation Training Partner

LPI Gold Approved Training Partner

 
 

Diese Seite weiterempfehlen:

Merkzettel Icon
0
Merkzettel öffnen
0
Besuchsverlauf ansehen
IT-Schulungen.com Control Panel

Zuletzt angesehen