Header Background

Netzwerktechnik Kompaktkurs

Gesicherter Termin: 20. - 24.11.2023

Microsoft Intune / Microsoft Endpoint Manager

Gesicherter Termin 19. - 20.10.2023

Python Einführungskurs

Gesicherter Termin: 06. - 10.11.2023

Linux-LPI - Komplettausbildung zur LPIC-1 (101 und 102: Administrator)

Gesicherter Termin: 06.-17.11.2023

ChatGPT für Entwickler - Maximiere das Potenzial von Conversational AI

Gesicherter Termin: 23.-24.10.2023

PL-600 Power Platform Solution Architect

Gesicherter Termin 06. - 08.11.2023

Agile PM® Foundation

Gesicherter Termin: 12 - 13.10.2023

Architecting on AWS

Gesicherter Termin 09. - 11.10.2023

Microservices mit dem Spring Framework

Gesicherter Termin 27. - 29.11.2023

PostgreSQL für Administratoren - Kompakturs

Gesicherter Termin 06. - 10.11.2023

MOC 55238 SharePoint Online for Administrators

Gesicherter Termin 25. - 27.10.2023

EC-Council Certified Ethical Hacker v12 (CEH)

Gesicherter Termin 13. - 17.11.2023

Gesicherter Termin

Weiterbildung für Ihre Zukunft!

Über 800 Garantie-Termine

Image not available

Python und Machine Learning

Gesicherter Termin 06. - 10.11.2023

(Certified) Penetration Testing Specialist (PTS)

Gesicherter Termin: 13. - 17.11.2023

CODING BOOTCAMPS

Starten Sie Ihre Entwickler-Karriere!

 
 
 

Big Data Einstieg

Seminardauer: 2 Tage

Ziele

In dieser 2-tägigen Schulung "Big Data Einstieg" erhalten Sie einen umfassenden Überblick zu einem Thema, das in der aktuellen IT-Landschaft von großer Bedeutung ist. Das Seminar präsentiert verschiedene Lösungsansätze und stellt das quelloffene Software-Framework Hadoop in den Fokus.

Sie lernen die einzelnen Komponenten von Hadoop und deren Zusammenwirken kennen, während mögliche Einsatzszenarien skizziert werden. Besonderes Augenmerk liegt auf aktuellen Entwicklungsständen und sich abzeichnenden Trends, da die Entwickler-Szene sehr dynamisch ist.

Im Gegensatz zum Seminar "Big Data Technologien, Strategien und Trends", das sich auf aktuelle Technologien und Trends konzentriert, liegt der Schwerpunkt dieses Seminars auf der Vorstellung und Demonstration von Hadoop.

Zielgruppe

  • Entscheider
  • (IT-)Architekt
  • Projektmanager
  • (Fach-)Anwender
  • Data Science
  • Data Analytiker

Voraussetzungen

  • Praktische Erfahrung in der IT-Informationsverarbeitung

Agenda

Einführung

In diesem Abschnitt erfährt der Teilnehmer etwas über die riesigen Datenmengen, die durch die Welt bewegt werden und darüber, dass nicht das Speichern, sondern das Suchen nach und Analysieren von Informationen das Problem ist und wie die Lösung für das Problem ausschaut.

Big Data – Supercomputer oder “Commodity Hardware”?

Die Lösung des Problems heißt verteilte Verarbeitung. Dafür gibt es unterschiedliche Ansätze, die sich in Leistungsfähigkeit und Kosten unterscheiden. Mit dem quelloffenen Ansatz für ein verteiltes Software-System auf Standard-Hardwarekomponenten hat sich Hadoop innerhalb weniger Jahre zum defacto-Standard entwickelt. Hier erhalten die Teilnehmer einen allerersten Überblick zu Hadoop.

Hadoop Distributed File System (HDFS)

Das Kernstück von Hadoop ist ein leistungsstarkes, robustes und extrem skalierbares Dateisystem. In diesem Abschnitt erfahren Teilnehmer das Wichtigste über HDFS.

Es wird die Kommunikation von und mit HDFS demonstriert.

YARN

Die massive Parallelisierung in Hadoop erfordert eine leistungsfähige Steuerung. Diese war in der ersten Version limitiert und primär auf MapReduce fokussiert. Die aktuelle Version weist deutliche Verbesserungen auf, die in diesem Abschnitt vorgestellt werden.

MapReduce

Die Java-basierte Klassenbibliothek für MapReduce ist der Maschinenraum von Hadoop. In diesem Abschnitt lernen die Teilnehmer das von Google eingeführte Programmiermodell für nebenläufige Berechnungen näher kennen.

Es wird die Anwendung von MapReduce demonstriert.

Hive

Mit Hive steht eine Schnittstelle zur Verfügung, die den Zugang zu strukturierten Daten in Hadoop mit einer SQL-ähnlichen Syntax erlaubt. In diesem Abschnitt lernen die Teilnehmer die Möglichkeiten und Grenzen von Hive kennen.

Es wird die Anwendung von Hive demonstriert.

Pig

Pig ist ein Mechanismus, um stapelorientierte Datenfluss-Operationen in Hadoop auszuführen und wird oft in Verbindung mit Hive eingesetzt. In diesem Abschnitt lernen die Teilnehmer die Möglichkeiten von Pig kennen.

Es wird die Anwendung von Pig demonstriert.

HBase

HBase ist eine Datenbank für Hadoop, allerdings keine im klassisch relationalen Sinne. In diesem Abschnitt erfahren die Teilnehmer Wissenswertes über HBase und die möglichen Stolperfallen, die dem in der relationalen Welt erfahrenen Anwender begegnen können.

Es wird die Anwendung von HBase demonstriert.

Spark

Spark ist eine universelle und leistungsfähige Umgebung für die verteilte Verarbeitung. Mit Hilfe von Spark können sowohl strukturierte Daten mit SQL-Kommandos abgefragt, Auswertungen nahe Echtzeit durchgeführt und Aufgabenstellungen für das Data Mining gelöst werden.

Es wird die Anwendung von Spark, Spark SQL und Spark MLLib demonstriert.

Weitere Komponenten

Hadoop ist ein Framework und unter dem Schirm der Apache Foundation existieren eine Vielzahl von Projekten mit zum Teil konkurrierenden Lösungen. In diesem Abschnitt erhalten die Teilnehmer einen Überblick über weitere interessante Komponenten wie beispielsweise Kafka, Storm, Kudu, Impala und andere.

Es wird die Anwendung weiterer Komponenten demonstriert .

Hard- und Software für Hadoop

Hadoop stellt keine „besonderen“ Hardware-Anforderungen. Das stimmt und stimmt wiederum auch nicht. In diesem Abschnitt wird der scheinbare Widerspruch aufgeklärt. Darüber hinaus werden die beiden wichtigsten Hadoop-Distributionen übersichtlich vorgestellt und die Unterschiede beleuchtet.

Es wird eine der beiden Verwaltungskonsolen Ambari (Hortonworks) und Cloudera Manager (Cloudera) demonstriert.

Anwendungsbeispiele für Hadoop

Und wozu der ganze Aufwand? In diesem abschließenden Abschnitt lernen die Teilnehmer mögliche Anwendungsfälle für Big Data kennen.

Schulungsunterlagen

nach Absprache

Open Badge - Ihr digitaler Kompetenznachweis

IT-Schulungen Badge: Big Data Einstieg

Durch die erfolgreiche Teilnahme an einem Kurs bei IT-Schulungen.com erlangen Sie nicht nur Fachkenntnisse und Fähigkeiten, sondern bekommen zusätzlich zu Ihrem Teilnahmezertifikat ein Open Badge als digitalen Nachweis Ihrer Kompetenz.

Sie können diesen in Ihrem persönlichen und kostenfreien Mein IT-Schulungen.com Konto abrufen. Ihre verdienten Badges lassen sich problemlos in sozialen Netzwerken integrieren und weitergeben.

Mehr zu den Vorteilen von Badges

 
Anmeldungen vorhanden

1.) Wählen Sie den Seminartyp:




2.) Wählen Sie Ort und Datum:

1.495,00 € Preis pro Person

spacing line1.779,05 € inkl. 19% MwSt
Seminarunterlagen zzgl.
Verpflegung zzgl.

Seminar jetzt anfragen Auf den Merkzettel
PDF IconPDF Icon
 

Diese Seite weiterempfehlen:

0
Merkzettel öffnen
0
Besuchsverlauf ansehen
IT-Schulungen.com Control Panel
Warnung Icon Sie haben in Ihrem Browser Javascript deaktiviert! Bitte aktivieren Sie Javascript um eine korrekte Darstellung und Funktionsweise von IT-Schulungen zu gewährleisten. Warnung Icon