Header Background

CODING BOOTCAMPS

Starten Sie Ihre Entwickler-Karriere!

Praxisorientierte Predictive Analytics - Datenbasierte Prognose mit KI und Vorhersagemodelle

Gesicherter Termin 11.- 13.03.2024

Certified Kubernetes Administrator (CKA)

Gesicherter Termin 22. - 25.04.2024

Netzwerktechnik Kompaktkurs

Gesicherter Termin: 11. - 15.03.2024

EC-Council Certified Ethical Hacker v12 (CEH)

Gesicherter Termin 18. - 22.03.2024

Architecting on AWS

Gesicherter Termin 03. - 05.04.2024

Linux-LPI - Komplettausbildung zur LPIC-1 (101 und 102: Administrator) 10 Tage

Gesicherter Termin: 11.-22.03.2024

(Certified) Penetration Testing Specialist (PTS)

Gesicherte Termine: 11. -15.03.2024

MD-102 Microsoft 365 Endpoint Administrator

Gesicherter Termin 22. - 26.04.2024

MOC 55238 SharePoint Online for Administrators

Gesicherter Termin 17. - 19.04.2024

Seminare zu Künstlicher Intelligenz, ChatGPT und Copiltot

Python Einführungskurs

Gesicherter Termin: 04. - 08.03.2024

Oracle Programmierung mit PL/SQL - Kompakt

Gesicherter Termin 11. - 15.03.2024

PL-400 Microsoft Power Platform Developer (PL-400T00)

Gesicherter Termin 11. - 15.03.2024

Gesicherter Termin

Weiterbildung für Ihre Zukunft!

Über 800 Garantie-Termine

Image not available
 
 
 

Apache Spark Grundlagen (Module 1, 2 und 3)

Seminardauer: 3 Tage

Ziele

In dieser 3-tägigen Schulung "Apache Spark Grundlagen (Module 1, 2 und 3)" lernen Sie die zentralen Prinzipien von Spark und seine Integration in das Hadoop-Ökosystem kennen. Sie erwerben praktische Fähigkeiten zur Spark-Programmierung in Java, Scala oder Python. Zudem entdecken Sie die Vielfalt der Spark-Tools, von interaktiven Shells bis zur leistungsstarken Databricks-Plattform. Der Kurs richtet sich an Softwareentwickler und Datenanalysten mit grundlegenden Programmierkenntnissen und Interesse an Big Data Verarbeitung. Nach Abschluss erhalten Sie ein Zertifikat und sind bereit, Spark effizient einzusetzen, um komplexe Berechnungen durchzuführen und Datenherausforderungen zu meistern.

Zielgruppe

  • (IT-)Architekt
  • (IT-)Entwickler
  • Data Scientist und ETL Experte

Voraussetzungen

  • Praktische Erfahrung in der IT-Informationsverarbeitung
  • Kenntnisse in einer Programmiersprache, vorzugsweise Java, Scala oder Python
  • Kenntnisse über Hadoop werden vorausgesetzt

Lernmethodik

Die Schulung bietet Ihnen eine ausgewogene Mischung aus Theorie und Praxis in einer erstklassigen Lernumgebung. Profitieren Sie vom direkten Austausch mit unseren projekterfahrenen Trainern und anderen Teilnehmern, um Ihren Lernerfolg zu maximieren.

Agenda

Modul 1: Spark Grundlagen

Spark wurde im universitären AMPLab in Berkeley ersonnen und entwickelt sich seit 2013 unter dem Dach der Apache Software Foundation als defacto-Standard für nebenläufige Berechnungen rasant weiter.

Kern von Spark ist eine Engine, die Daten in sogenannte RDDs (Resilient Distributed Datasets) aufspaltet, dass diese über mehrere Knoten verteilt und parallel bearbeitet werden können, bis sie wieder zusammengeführt und erforderlichenfalls erneut aufgeteilt werden. Dieses Aufteilen und Zusammenführen wird größtmöglich im Hauptspeicher durchgeführt, weshalb die Performance von Spark deutlich höher ist als vergleichsweise in MapReduce.

In diesem einführenden Modul lernen die Teilnehmer die grundlegenden Prinzipien von Spark und ihre Integration in das Hadoop-Ökosystem kennen.

Modul 2: Spark Programmierung

Jedes Spark-Programm besteht aus einem zentralen Driver Programm sowie zahlreichen Executor Programs, die auf den einzelnen Knoten ausgeführt werden. Es stehen verschiedene Schnittstellen zur Verfügung, um Spark-Programme in Java, Scala oder Python erstellen zu können.

Aufbauend auf dem Grundkonzept, welches für alle Sprachen gleich ist, wird ein Überblick zu den einzelnen Sprachvarianten gegeben und auf Unterschiede eingegangen. Die Teilnehmer setzen eigenständig Aufgabenstellungen mit der Sprache ihrer Wahl um. Abschließend werden die Realisierungen mit verschiedenen Sprachen diskutiert.

Modul 3: Spark Tools

Die Liste der verfügbaren Werkzeuge für die Entwicklung und Ausführung von Spark-Programmen ist lang und reicht von (interaktiven) Shell-Tools bis zur mächtigen Spark-Plattform von Databricks.

In diesem Modul lernen die Teilnehmer die interaktiven Shells in Hadoop für Scala und Python kennen, wenden webbasierte Notebooks wie Zeppelin und Jupyter an, und werde die unterschiedliche Datentypen wie Parquet, ORC, Avro kennen lernen und die Vorteile von Partitionierung messen. Zudem werden die Teilnehmer einen Überblick zur Spark-Plattform von Databrick bekommen und auch diese in ein Tutorial einsetzen.

Open Badge - Ihr digitaler Kompetenznachweis

IT-Schulungen Badge: Apache Spark Grundlagen (Module 1, 2 und 3)

Durch die erfolgreiche Teilnahme an einem Kurs bei IT-Schulungen.com erlangen Sie nicht nur Fachkenntnisse und Fähigkeiten, sondern bekommen zusätzlich zu Ihrem Teilnahmezertifikat ein Open Badge als digitalen Nachweis Ihrer Kompetenz.

Sie können diesen in Ihrem persönlichen und kostenfreien Mein IT-Schulungen.com Konto abrufen. Ihre verdienten Badges lassen sich problemlos in sozialen Netzwerken integrieren und weitergeben.

Mehr zu den Vorteilen von Badges

Kundenbewertungen

5,00

2 Teilnehmende
 
100%
 
0%
 
0%
 
0%
 
0%

Kurz vor Durchführung

TerminStandortAktion
25.03. - 27.03.2024 Hamburg Seminar jetzt anfragen
10.04. - 12.04.2024 München Seminar jetzt anfragen
21.05. - 23.05.2024 Köln Seminar jetzt anfragen
17.06. - 19.06.2024 Nürnberg Seminar jetzt anfragen
 
Anmeldungen vorhanden

1.) Wählen Sie den Seminartyp:




2.) Wählen Sie Ort und Datum:

1.495,00 € Preis pro Person

spacing line1.779,05 € inkl. 19% MwSt
Seminarunterlagen zzgl.
Verpflegung zzgl.

Seminar jetzt anfragen Auf den Merkzettel
PDF IconPDF Icon
 

Diese Seite weiterempfehlen:

0
Merkzettel öffnen
0
Besuchsverlauf ansehen
IT-Schulungen.com Control Panel
Warnung Icon Sie haben in Ihrem Browser Javascript deaktiviert! Bitte aktivieren Sie Javascript um eine korrekte Darstellung und Funktionsweise von IT-Schulungen zu gewährleisten. Warnung Icon