Apache Spark SQL (Modul 4 und 5)
Ziele der Schulung
In dieser 2-tägigen Schulung "Apache Spark SQL (Modul 4 und 5)" lernen Sie die Grundlagen von Spark SQL kennen, um strukturierte Daten effizient mit der Sprache SQL zu verarbeiten. Anschließend werden die Teilnehmer in die Grundprinzipien der Implementierung von GraphX eingeführt und lösen exemplarische Aufgabenstellungen mit Hilfe von Python.
Zielgruppe Seminar
- (IT-)Architekt
- (IT-)Entwickler
Voraussetzungen
- Praktische Erfahrung in der IT-Informationsverarbeitung
- Kenntnisse in einer Programmiersprache, vorzugsweise Java, Scala oder Python
- Kenntnisse über Hadoop werden vorausgesetzt
Lernmethodik
Die Schulung bietet Ihnen eine ausgewogene Mischung aus Theorie und Praxis in einer erstklassigen Lernumgebung. Profitieren Sie vom direkten Austausch mit unseren projekterfahrenen Trainern und anderen Teilnehmern, um Ihren Lernerfolg zu maximieren.
Seminarinhalt
Wiederholung Einführung Spark
In dieser kurzen, einführenden Wiederholung werden die für die weiteren Ausführungen wichtigen Begriffe und Zusammenhänge aufgefrischt.
Modul 4: Spark SQL
Der Durchbruch für Spark SQL erfolgte mit der Einführung von Datasets und DataFrames, die die performante verteilte Verarbeitung von strukturierten Daten möglich machte. Spark SQL ist heute eine der am häufigsten eingesetzten Komponenten und ermöglicht eine SQL-basierte Verarbeitung von verteilten Daten.
Die Teilnehmer lernen die Konzepte von Spark SQL kennen und lösen unterschiedlichste Aufgabenstellungen zum Persistieren, Selektieren und Aggregieren strukturierter Daten ein einer verteilten Umgebung mit Hilfe von Scala.
Modul 5: Spark GraphX
GraphX ist eine Komponente in Spark, die speziell auf die Verarbeitung von Graphen ausgelegt ist. Jeder Graph besteht aus Knoten und Kanten, die wiederum durch Eigenschaften beschrieben sind. GraphX definiert sogenannte Eigenschafts-Graphen, über denen typische Graphen-Operationen ausgeführt werden können.
Open Badge für dieses Seminar - Ihr digitaler Kompetenznachweis

Durch die erfolgreiche Teilnahme an einem Kurs bei IT-Schulungen.com erhalten Sie zusätzlich zu Ihrem Teilnehmerzertifikat ein digitales Open Badge (Zertifikat) – Ihren modernen Nachweis für erworbene Kompetenzen.
Ihr Open Badge ist jederzeit in Ihrem persönlichen und kostenfreien Mein IT-Schulungen.com-Konto verfügbar. Mit wenigen Klicks können Sie diesen digitalen Nachweis in sozialen Netzwerken teilen, um Ihre Expertise sichtbar zu machen und Ihr berufliches Profil gezielt zu stärken.
Übersicht: Apache Spark Schulungen Portfolio
Seminare kurz vor der Durchführung
Termin | Standort | Aktion |
---|---|---|
22.05. - 23.05.2025 | Hamburg | |
23.06. - 24.06.2025 | München | |
08.07. - 09.07.2025 | Köln | |
25.08. - 26.08.2025 | Nürnberg |