In dieser 1-tägigen Schulung "Hadoop in der Cloud" lernen Sie die Vorzüge und Möglichkeiten des Betriebs eines Hadoop Clusters in der Cloud kennen. Sie erfahren alles Wissenswerte über die Nutzung von Hadoop in der Cloud und die unterschiedlichen Angebote verschiedener Cloudbetreiber. Dabei werden sowohl die Vorteile wie geringere Kosten und Aufwände als auch die Herausforderungen wie der Verlust der vollen Kontrolle über Hardware, Software und Daten beleuchtet. Das Seminar vermittelt praxisnahes Wissen und bietet einen umfassenden Überblick über die Nutzung von Hadoop in der Cloud.
Die Schulung bietet Ihnen eine ausgewogene Mischung aus Theorie und Praxis in einer erstklassigen Lernumgebung. Profitieren Sie vom direkten Austausch mit unseren projekterfahrenen Trainern und anderen Teilnehmern, um Ihren Lernerfolg zu maximieren.
Das Seminar startet mit einem kurzen Überblick zu den einzelnen Komponenten des Hadoop-Frameworks, ihrem aktuellen Entwicklungsstand und Ihrem Status in den beiden wichtigsten Hadoop-Distributionen von Cloudera und Hortonworks.
In einer Übersicht werden die beiden Hadoop-Distributionen gegenübergestellt und herausgearbeitet, worin die Vor- und Nachteile der einzelnen Angebote bestehen.
Die großen Cloudanbieter wie Amazon und Microsoft bieten verschiedene Service-Modelle an. Hier sind insbesondere „Infrastructure as a Service (IaaS)“ und „Plattform as a Service (PaaS)“ zu nennen. In diesem Abschnitt werden die unterschiedlichen Modelle erläutert und gezeigt, wie sich diese für einen Hadoop-Cluster darstellen lassen.
Falls der Cluster in der Cloud eigenständig aufgesetzt werden soll, ist ein Sizing erforderlich.
Das Sizing eines Hadoop-Clusters wird im Wesentlichen von der Menge der zu speichernden Daten und des für die einzelnen Komponenten benötigten Hauptspeichers bestimmt. Daraus lässt sich die Zahl der benötigten Data Nodes und die Größe ihres nichtflüchtigen Speichers ableiten. Die Verteilung weiterer Komponenten des Frameworks auf diese und/oder zusätzliche Nodes gestattet eine Abschätzung des benötigten Hauptspeichers.
Das Sizing wird beispielhaft anhand eines Template demonstriert.
In diesem Abschnitt wird das Angebot von Amazon näher betrachtet und welche Möglichkeiten für die Nutzung der Distributionen von Cloudera und Hortonworks in der Amazon-Cloud bestehen (IaaS und PaaS).
Die Einrichtung und Nutzung eines Hadoop-Clusters in der Amazon-Cloud wird demonstriert. Dabei wird auch gezeigt, wie die Sizing-Informationen in entsprechende Maschinenklassen umgesetzt werden können.
In diesem Abschnitt wird das Angebot von Microsoft näher betrachtet und welche Möglichkeiten für die Nutzung der Distributionen von Cloudera und Hortonworks in der Microsoft-Cloud bestehen (IaaS und PaaS).
Die Einrichtung und Nutzung eines Hadoop-Clusters in der Microsoft-Cloud wird demonstriert. Dabei werden auch gezeigt, wie die Sizing-Informationen in entsprechende Maschinenklassen umgesetzt werden können.
Hadoop ist originär mit dem Fokus auf den Betrieb im Rechenzentrum entwickelt worden. Zwar kann ein Hadoop-Cluster mittlerweile mit passabler Performance in einer virtualisierten Umgebung betrieben werden, aber die Nutzung in der Cloud hat neben unbestreitbaren Vorteilen durchaus auch einige Schwachpunkte.
In diesem Abschnitt werden die Vor- und Nachteile der Nutzung in der Cloud im Vergleich zum Betrieb im Rechenzentrum gegenübergestellt.
Durch die erfolgreiche Teilnahme an einem Kurs bei IT-Schulungen.com erlangen Sie nicht nur Fachkenntnisse und Fähigkeiten, sondern bekommen zusätzlich zu Ihrem Teilnahmezertifikat ein Open Badge als digitalen Nachweis Ihrer Kompetenz.
Sie können diesen in Ihrem persönlichen und kostenfreien Mein IT-Schulungen.com Konto abrufen. Ihre verdienten Badges lassen sich problemlos in sozialen Netzwerken integrieren und weitergeben.