Apache Impala
Ziele
In dieser 3-tägigen Schulung "Apache Impala" lernen Sie eine SQL-basierte Query-Engine kennen, die tief in das Hadoop-Ökosystem integriert ist und eine verteilte Arbeitsweise unterstützt. Der Kurs vermittelt die Besonderheiten dieses mächtigen Werkzeugs und bereitet die Teilnehmer darauf vor, Impala erfolgreich einzusetzen. Die Schulung wird auf der Plattform Cloudera CDH angeboten, da unter Hortonworks HDP die Installation von Impala offiziell nicht unterstützt wird.
Zielgruppe
- (IT-)Architekt
- (IT-)Entwickler
Voraussetzungen
- Praktische Erfahrung in der IT-Informationsverarbeitung
- Kenntnisse im Einsatz relationaler Datenbanken
- Kenntnisse über Big Data
Lernmethodik
Die Schulung bietet Ihnen eine ausgewogene Mischung aus Theorie und Praxis in einer erstklassigen Lernumgebung. Profitieren Sie vom direkten Austausch mit unseren projekterfahrenen Trainern und anderen Teilnehmern, um Ihren Lernerfolg zu maximieren.
Agenda
Strukturen – Die Architektur von Impala
Apache Impala besitzt nicht die klassische Master-/Worker-Struktur wie viele andere Hadoop-Komponenten, sondern agiert mit dynamischen Koordinator-Strukturen.
Die Teilnehmer lernen die verschiedenen Rollen der Impala-Komponenten wie Query-Coordinator, Query-Executor, Statestore und Catalog Service kennen und wie man diese in einem Hadoop-Cluster konfiguriert.
Storage und Access – Metadaten und Datenzugriff mit Impala
Impala unterstützt verschiedene Formate wie Delimited Text, Parquet, Avro, SequenceFile oder RCFile im verteilten Dateisystem HDFS sowie den direkten Zugriff auf die Datenbanken HBase und Kudu. Darüber hinaus ist eine Interaktion mit Hive über den gemeinsamen Metastore möglich. Alternativ können Daten direkt aus der Cloud angesprochen werden.
Impala verwendet verschiedene Techniken zur Beschleunigung der Abfragen, die auf einer genauen Kenntnis der zugrundeliegenden Metadaten basieren, die für den schnellen Zugriff im Speicher vorgehalten werden.
In diesem Modul machen sich die Teilnehmer mit den grundsätzlichen Datenformaten vertraut, die mit Impala angesprochen werden können.
Praxis 1 – Der Zugriff auf Daten mit Impala
In diesem Abschnitt lernen die Teilnehmer verschiedene Möglichkeiten kennen, um die Query Engine von Impala zu aktivieren. Dazu wird der Zugriff über die Kommandozeile, über ein Browserbasiertes User Interface sowie über die ODBC-Schnittstelle evaluiert.
Praxis 2 – Die SQL-Abfragesprache in Impala
Die Teilnehmer loten die Möglichkeiten der SQL-Abfragesprache in Impala aus und lernen die Unterschiede zur SQL-ähnlichen Abfragesprache von Hive lernen. Die Besonderheiten im Umgang mit Tabellen aus Kudu oder HBase werden herausgearbeitet.
Impala kennt komplexe Datentypen wie ARRAY, MAP und STRUCT (vergleichbar zu Hive). Die Möglichkeiten dieser Datentypen werden von den Teilnehmern evaluiert.
Auf Grund der vielfältigen Besonderheiten stellt dieser Abschnitt den Schwerpunkt des dreitägigen Kurses dar.
Praxis 3 - Betrieb von Impala im Hadoop Cluster
Bei der Nutzung von Impala in einem Hadoop-Cluster sind nur wenige grundsätzliche Aspekte wie Datendurchsatz, Speicherquoten oder Timeout zu definieren. Die Teilnehmer machen sich anhand praktischer Beispiele mit den Möglichkeiten vertraut.
Als weiterer wichtiger Punkt wird die Authentifizierung und Autorisierung (mit Apacha Sentry) behandelt.
Praxis 4 – Performance-Optimierung für Impala im Hadoop Cluster
In diesem Praxisteil wird ausführlich auf die Möglichkeiten der Performance-Optimierung für Impala im Hadoop-Cluster eingegangen. Dies ist einerseits durch Wahl der geeigneten Hardware möglich, andererseits aber durch die Auswahl oder Anordnung der Daten beeinflussbar.
Die Teilnehmer machen sich mit den Möglichkeiten der Abschätzung der Hardware-Anforderungen für verschiedene Anwendungsszenarien vertraut und evaluieren, wie Daten optimal für eine hohe Abfragegeschwindigkeit anzuordnen sind.
Open Badge - Ihr digitaler Kompetenznachweis
Durch die erfolgreiche Teilnahme an einem Kurs bei IT-Schulungen.com erlangen Sie nicht nur Fachkenntnisse und Fähigkeiten, sondern bekommen zusätzlich zu Ihrem Teilnahmezertifikat ein Open Badge als digitalen Nachweis Ihrer Kompetenz.
Sie können diesen in Ihrem persönlichen und kostenfreien Mein IT-Schulungen.com Konto abrufen. Ihre verdienten Badges lassen sich problemlos in sozialen Netzwerken integrieren und weitergeben.
Kurz vor Durchführung
Termin | Standort | Aktion |
---|---|---|
27.11. - 29.11.2024 | Hamburg | |
09.12. - 11.12.2024 | München | |
20.01. - 22.01.2025 | Köln | |
12.02. - 14.02.2025 | Nürnberg |