
Apache Spark Grundlagen – Architektur, Datenverarbeitung und Praxis
Ziele der Schulung
In diesem 3-tägigen Kurs „Apache Spark Grundlagen – Architektur, Datenverarbeitung und Praxis“ lernen Sie, die Architektur von Spark zu verstehen und verteilte Daten effizient zu verarbeiten. Sie lernen den Umgang mit RDDs, DataFrames und Datasets, grundlegende Transformationen und Aktionen sowie die Erstellung und Ausführung einfacher Spark-Anwendungen. Außerdem erwerben Sie erste Kenntnisse in Fehlerbehandlung und Logging, um Spark-Anwendungen zuverlässig zu betreiben.
Zielgruppe Seminar
- Software/Data Architects
- Software Developers
- Data Scientists
Voraussetzungen
- Grundkenntnisse in Java, Scala oder Python
- Grundverständnis von Datenbanken und SQL
- Keine Spark-Vorkenntnisse erforderlich
Lernmethodik
Die Schulung bietet Ihnen eine ausgewogene Mischung aus Theorie und Praxis in einer erstklassigen Lernumgebung. Profitieren Sie vom direkten Austausch mit unseren projekterfahrenen Trainern und anderen Teilnehmern, um Ihren Lernerfolg zu maximieren.
Seminarinhalt
Einführung in Big Data und Spark
- Motivation und typische Big-Data-Anwendungsfälle
- Überblick über Spark-Komponenten und Ökosystem
Spark-Architektur, Cluster-Setup und Deployment
- Treiber, Executor, Tasks und Jobs
- Lokaler Betrieb vs. Clusterbetrieb
RDDs, DataFrames, Datasets
- Erstellung und Transformationen von RDDs
- Unterschiede und Einsatzmöglichkeiten von DataFrames und Datasets
Transformationen und Aktionen
- Typische Transformationen (map, filter, join, groupBy)
- Aktionen und deren Ausführung (collect, count, show)
Spark SQL-Grundlagen
- Einfache SQL-Abfragen auf DataFrames
- Erstellung und Nutzung von Views
Fehlerbehandlung und Logging
- Typische Fehlerquellen in Spark-Anwendungen
- Logging und Monitoring einfacher Jobs
Praktische Übungen mit realen Daten
- Aufbau einfacher Spark-Anwendungen
Open Badge für dieses Seminar - Ihr digitaler Kompetenznachweis

Durch die erfolgreiche Teilnahme an einem Kurs bei IT-Schulungen.com erhalten Sie zusätzlich zu Ihrem Teilnehmerzertifikat ein digitales Open Badge (Zertifikat) – Ihren modernen Nachweis für erworbene Kompetenzen.
Ihr Open Badge ist jederzeit in Ihrem persönlichen und kostenfreien Mein IT-Schulungen.com-Konto verfügbar. Mit wenigen Klicks können Sie diesen digitalen Nachweis in sozialen Netzwerken teilen, um Ihre Expertise sichtbar zu machen und Ihr berufliches Profil gezielt zu stärken.
Übersicht: Apache Spark Schulungen Portfolio
Gesicherte Kurstermine
| 17.06. - 19.06.2026 | Nürnberg | ||
| 17.06. - 19.06.2026 | Virtual Classroom (online) | ||
| 02.09. - 04.09.2026 | Nürnberg | ||
| 02.09. - 04.09.2026 | Virtual Classroom (online) |
Seminare kurz vor der Durchführung
| 29.04. - 01.05.2026 | Hamburg | ||
| 11.05. - 13.05.2026 | Köln | ||
| 10.06. - 12.06.2026 | München | ||
| 15.07. - 17.07.2026 | Hamburg |



