
Christine Röppenack
Seminarberaterin
Telefon: 0911 6500 8 222
Email: info@it-schulungen.com
Hortonworks ist einer der beiden wichtigsten Anbieter von Hadoop Distributionen. Die Besonderheit dieser Distribution liegt darin, dass sie vollständig auf quelloffener Software der Apache Software Foundation beruht. Entsprechend ist die Distribution frei verfügbar und kann kostenfrei installiert werden. Allerdings fallen für zusätzliche Dienstleistungen wie beispielsweise Support oder Trainings Kosten an.
Die Teilnehmer erhalten einen fundierten Überblick über die Bestandteile der aktuellen Distribution und lernen die Merkmale, die diese Distribution von der von Cloudera unterscheiden, kennen.
Weitere Seminarinfos:
Entscheider, (IT-)Architekt, Projektmanager, Administratoren
Praktische Erfahrung in der IT-Informationsverarbeitung sowie Grundkenntnisse über Big Data und Hadoop erforderlich.
Folgende Seminare und Kurse zur Auffrischung der Kenntnisse um Big Data können hilfreich sein:
a. Big Data Einstieg
b. Big Data Technologien, Strategien und Trends
Folgende Kurse können darüber hinaus dieses Angebot ergänzen:
a. Hadoop Datentechnologien Überblick
b. Big Data Architekturen Überblick
Es wird die aktuelle Version 2.6 der Hortonworks Data Platform (HDP) vorgestellt und ein Überblick über die Bestandteile der Hadoop-Distribution gegeben und demonstriert. Dabei wird auch auf die Unterschiede zur Vorgängerversion 2.5 eingegangen und ausgeführt, ob und unter welchen Bedingungen sich ein Umstieg lohnt.
Für HDP bietet Hortonworks mit der Komponente HDF (Hortonworks DataFlow) spezielle Unterstützung für die Präparation von Daten an. Die aktuelle Version 3.1 wird vorgestellt und demonstriert.
Die aktuelle Version 2.6 der Hadoop-Distribution von Hortonworks unterscheidet sich von der von Cloudera durch die offizielle Unterstützung von Spark 2.x sowie der Apache-Komponenten Phoenix (SQL Layer für die NoSQL-Datenbank HBase) und Tez (Framework für Hive-Anwendungen). Darüber hinaus bietet Hortonworks Unterstützung für die Query Engine HAWQ (ursprüngliche Entwicklung bei Pivotal) an.
Auf die Unterschiede in den Datenzugriffs-Komponenten wird detailliert eingegangen. Die vorgestellten Komponenten werden in einer Live-Demo präsentiert.
Hortonworks‘ aktuelle Hadoop Distribution unterscheidet sich von der von Cloudera im Bereich Datenintegration durch die Unterstützung der Apache-Komponente Storm für die Integration von Daten nahe Echtzeit.
Die vorgestellte Komponente wird in einer Live-Demo präsentiert.
Hortonworks‘ Konzept für Governance-relevante Aspekte unterscheidet sich deutlich von dem von Cloudera, indem vollständig auf Apache-Komponenten wie Atlas (Zentrales Metadaten-Management) und Ranger (Zentralisiertes Security-Management) gesetzt wird.
Auf die Unterschiede in den Governance-Komponenten wird detailliert eingegangen. Die vorgestellten Komponenten werden in einer Live-Demo präsentiert.
Hortonworks‘ Alleinstellungsmerkmale für operationale Komponenten
Die aktuelle Version 2.6 der Hadoop-Distribution von Hortonworks orientiert auf den Einsatz von Ambari in der Version 2.5. Die Möglichkeiten von Ambari werden demonstriert und Unterschiede gegenüber dem Cloudera Manager herausgearbeitet.
Hortonworks setzt im Unterschied zu Cloudera im Bereich der User-Interfaces auf Ambari für Data Engineers und auf Zeppelin für Data Scientists.
Auf die Unterschiede in den UI-Komponenten wird detailliert eingegangen. Die vorgestellten Komponenten werden in einer Live-Demo präsentiert.
Abschließend werden die Unterschiede zwischen Hortonworks und Cloudera zusammengefasst und die Umsetzung verschiedener Szenarien im Vergleich der beiden Distributionen dargestellt.
Anmeldungen vorhanden |