Header Background

Certified Kubernetes Administrator (CKA)

Gesicherter Termin 22. - 25.04.2024

Oracle Programmierung mit PL/SQL - Kompakt

Gesicherter Termin 11. - 15.03.2024

Python Einführungskurs

Gesicherter Termin: 04. - 08.03.2024

Gesicherter Termin

Weiterbildung für Ihre Zukunft!

Über 800 Garantie-Termine

Image not available

PL-400 Microsoft Power Platform Developer (PL-400T00)

Gesicherter Termin 11. - 15.03.2024

Architecting on AWS

Gesicherter Termin 03. - 05.04.2024

EC-Council Certified Ethical Hacker v12 (CEH)

Gesicherter Termin 18. - 22.03.2024

Praxisorientierte Predictive Analytics - Datenbasierte Prognose mit KI und Vorhersagemodelle

Gesicherter Termin 11.- 13.03.2024

Netzwerktechnik Kompaktkurs

Gesicherter Termin: 11. - 15.03.2024

MOC 55238 SharePoint Online for Administrators

Gesicherter Termin 17. - 19.04.2024

Linux-LPI - Komplettausbildung zur LPIC-1 (101 und 102: Administrator) 10 Tage

Gesicherter Termin: 11.-22.03.2024

CODING BOOTCAMPS

Starten Sie Ihre Entwickler-Karriere!

(Certified) Penetration Testing Specialist (PTS)

Gesicherte Termine: 11. -15.03.2024

MD-102 Microsoft 365 Endpoint Administrator

Gesicherter Termin 22. - 26.0.2024

Seminare zu Künstlicher Intelligenz, ChatGPT und Copiltot

 
 
 

Cloudera CDH Vertiefung

Seminardauer: 4 Tage

Ziele

In dieser 4-tägigen Schulung "Cloudera CDH Vertiefung" erhalten Sie einen fundierten Einblick in Cloudera, einem der führenden Anbieter von Hadoop Distributionen. Die Distribution zeichnet sich durch die Verwendung von teilweise proprietären Komponenten für das Management und Data Governance aus. Beachten Sie, dass die vollständige Enterprise-Version kostenpflichtig lizenziert werden muss, jedoch gibt es auch eine eingeschränkt frei verfügbare Variante.

Während des Kurses werden die Teilnehmer einen Hadoop-Cluster mit vier Knoten installieren, der als Basis für praktische Übungen dient. Diese Übungen decken sämtliche Aspekte des Betriebs eines Hadoop-Clusters ab, einschließlich Erweiterung, Überwachung, Analyse und Optimierung.

Zielgruppe

  • (IT-)Architekt
  • (IT-)Entwickler
  • Administratoren

Voraussetzungen

  • Kenntnisse über Big Data und Hadoop
  • Es wird auf dem Kenntnisstand des Kurses „Cloudera Einstieg“ bzw. „Hadoop im Rechenzentrum Überblick“ aufgesetzt

Lernmethodik

Die Schulung bietet Ihnen eine ausgewogene Mischung aus Theorie und Praxis in einer erstklassigen Lernumgebung. Profitieren Sie vom direkten Austausch mit unseren projekterfahrenen Trainern und anderen Teilnehmern, um Ihren Lernerfolg zu maximieren.

Agenda

Überblick zur Hadoop-Distribution HDP von Cloudera

Es wird die aktuelle Version 5.12 von Cloudera (CDH) vorgestellt und ein Überblick über die Bestandteile der Hadoop-Distribution gegeben und demonstriert. Dabei wird auch auf die Unterschiede zur Vorgängerversion 5.11 eingegangen und ausgeführt, ob und unter welchen Bedingungen sich ein Umstieg lohnt.

Planung und Sizing einer Cloudera-Distribution

Der Schwerpunkt dieses Moduls liegt auf der Planung und dem Sizing eines zu installierenden Hadoop-Clusters. Auf der Grundlage der jeweiligen Einsatzszenarien sind die grundsätzlichen Hardware-Anforderungen herauszuarbeiten.

Das Sizing eines Hadoop-Clusters wird im Wesentlichen von der Menge der zu speichernden Daten und des für die einzelnen Komponenten benötigten Hauptspeichers bestimmt. Daraus lässt sich die Zahl der benötigten Data Nodes und die Größe ihres nichtflüchtigen Speichers ableiten. Die Verteilung weiterer Komponenten des Frameworks auf diese und/oder zusätzliche Nodes gestattet eine Abschätzung des benötigten Hauptspeichers.

Die Teilnehmer führen ein Sizing beispielhaft anhand eines Template durch.

Installation einer Cloudera-Distribution mit Cloudera Manager

Cloudera bietet verschiedene Installationspfade an. Die zugrundeliegende Systematik wird zunächst vorgestellt.

Die zentrale Verwaltungskomponente einer Cloudera-Distribution ist der proprietäre Cloudera Manager. Dieses besteht aus einer zentralen Komponente sowie aus Agenten, die zunächst auf den künftigen Clusterknoten installiert werden.

Nach der erfolgreichen Präparation der künftigen Clusterknoten wird Hadoop schrittweise unter der Steuerung von Cloudera Manager installiert. Nach Abschluss der Installation kann der Cluster in Betrieb genommen werden.

Anschließend wird die Installation getestet. Dazu stehen in Hadoop eine Reihe von Testmodulen zur Verfügung, um die ordnungsgemäße Funktion sowie die Leistungsfähigkeit des installierten Clusters einzuschätzen.

Die Teilnehmer planen und installieren die Cloudera-Distribution CDH 5.11 mit ausgewählten Komponenten auf einem Cluster mit vier virtuellen Knoten und nehmen die installierte Hadoop-Umgebung in Betrieb und testen diese.

Upgrade-Aktivitäten mit Cloudera Manager

In einem CDH-Cluster können eine oder mehrere der nachfolgend aufgeführten Upgrade-Aktivitäten anstehen:

  • Upgrade des einem Clusterknotens zugrundeliegenden Betriebssystems
  • Upgrade der Verwaltungs-Komponente Cloudera Manager
  • Upgrade der Cloudera-Distribution

Es werden die für die einzelnen Aktivitäten erforderlichen Schritte vorgestellt und erläutert.

Die Teilnehmer planen und migrieren den Versionstand der Cloudera-Distribution auf die Version 5.12.

Erweitern einer Cloudera-Distribution mit Cloudera Manager

Die Verwaltungs-Komponente Cloudera Manager kann genutzt werden, um weitere Dienste und/oder weitere Hardware-Komponenten einzufügen.

Die Teilnehmer fügen dem Hadoop-Cluster einen neuen Knoten hinzu und aktivieren weitere Komponenten.

Alternativ: Installation, Upgrade oder Erweitern einer Cloudera-Distribution mit der Konsole

Alternativ zur Installation, zum Upgrade oder zum Erweitern einer Cloudera-Distribution mit Cloudera Manager kann die entsprechende Aktivität auch manuell auf der Konsole ausgeführt werden. Die Vorgehensweise wird in diesem Modul erläutert und demonstriert.

Verwaltung einer Cloudera-Distribution mit Cloudera Manager

Der Betrieb eines Hadoop-Clusters erfordert vielfältige Aktivitäten. Neben den klassischen administrativen Aufgaben wie beispielsweise das Backup wichtiger Daten, die Verwaltung von Berechtigungen sowie die Beseitigung von Engpässen ist zusätzliches Augenmerk auf den Ersatz oder Neustart ausgefallener Komponenten, die Vergrößerung des Clusters sowie eine hohe generelle Verfügbarkeit zu richten.

In diesem Modul liegt der Schwerpunkt auf den laufenden Aktivitäten in einem Hadoop-Cluster. Die Teilnehmer sammeln praktische Erfahrungen zu Aktivitäten auf Cluster-Ebene, auf Dienst-Ebene, auf Knoten-Ebene sowie auf Dateisystem-Ebene und lernen die erforderlichen Werkzeuge in der Cloudera-Distribution kennen.

Sichern und Schützen einer Cloudera-Distribution

Das Sichern und Schützen einer Cloudera-Distribution ist eine umfangreiche Thematik, woraus einige wichtige Themen ausgewählt, vorgestellt, demonstriert und praktisch angewendet werden. Dazu gehören

  • Das Einrichten von Hochverfügbarkeit für Komponenten in CDH 5.12
  • Das Generieren von Snapshots in CDH 5.12
  • Notwendige BackUps in CDH 5.12
  • Die Replikation wichtiger Inhalte in CDH 5.12
  • Das Einrichten und die Anwendung der Komponente Navigator in CDH 5.12

Die Teilnehmer richten die Hochverfügbarkeit für den Name Node ihres Clusters ein, generieren Snapshots aus HDFS-Verzeichnissen, richten die Replikation von Daten für HBase ein und aktivieren die Komponente Navigator.

Überwachen und Analysieren einer Cloudera-Distribution

Jede Hadoop-Distribution generiert eine Vielzahl von Informationen, die in verschiedenen Log-Dateien gespeichert werden. Darüber hinaus werden sowohl vom Betriebssystem als auch von den Komponenten der Distribution permanent Messwerte bereitgestellt.

Zentrale Komponente für die Persistierung und Visualisierung dieser Messwerte ist der Cloudera Manager, die in diesem Modul vorgestellt und von den Teilnehmern genutzt wird. Darüber hinaus lernen die Teilnehmer Möglichkeiten zu nutzen, um mit Hadoop-eigenen Bordmitteln die Daten zu analysieren und Logdateien auszuwerten.

Optimieren einer Cloudera-Distribution

Der Betrieb eines Hadoop-Clusters wird durch Hunderte von Parametern definiert. Die meisten dieser Parameter haben signifikanten Einfluss auf die Leistungsfähigkeit des Systems. Die bei der Installation gewählten Standard-Einstellungen sind für den initialen Start des Clusters hilfreich, in der Regel aber für die Betriebsphase mit individuellen Anforderungen suboptimal.

Die Teilnehmer lernen, die Betriebswerte für ausgewählte Komponenten zu interpretieren und eine Strategie zu entwickeln, um die Parametereinstellungen zu optimieren.

Open Badge - Ihr digitaler Kompetenznachweis

IT-Schulungen Badge: Cloudera CDH Vertiefung

Durch die erfolgreiche Teilnahme an einem Kurs bei IT-Schulungen.com erlangen Sie nicht nur Fachkenntnisse und Fähigkeiten, sondern bekommen zusätzlich zu Ihrem Teilnahmezertifikat ein Open Badge als digitalen Nachweis Ihrer Kompetenz.

Sie können diesen in Ihrem persönlichen und kostenfreien Mein IT-Schulungen.com Konto abrufen. Ihre verdienten Badges lassen sich problemlos in sozialen Netzwerken integrieren und weitergeben.

Mehr zu den Vorteilen von Badges

Kurz vor Durchführung

TerminStandortAktion
27.02. - 01.03.2024 Hamburg Seminar jetzt anfragen
04.03. - 07.03.2024 Köln Seminar jetzt anfragen
16.04. - 19.04.2024 Köln Seminar jetzt anfragen
21.05. - 24.05.2024 Nürnberg Seminar jetzt anfragen
 
Anmeldungen vorhanden

1.) Wählen Sie den Seminartyp:




2.) Wählen Sie Ort und Datum:

2.295,00 € Preis pro Person

spacing line2.731,05 € inkl. 19% MwSt
Seminarunterlagen zzgl.
Verpflegung zzgl.

Seminar jetzt anfragen Auf den Merkzettel
PDF IconPDF Icon
 

Diese Seite weiterempfehlen:

0
Merkzettel öffnen
0
Besuchsverlauf ansehen
IT-Schulungen.com Control Panel
Warnung Icon Sie haben in Ihrem Browser Javascript deaktiviert! Bitte aktivieren Sie Javascript um eine korrekte Darstellung und Funktionsweise von IT-Schulungen zu gewährleisten. Warnung Icon