Apache Impala

Seminardauer: 3 Tage

Übersicht
Ziele
Zielgruppe
Voraussetzungen
Lernmethodik
Agenda

Ziele

In dieser 3-tägigen Schulung "Apache Impala" lernen Sie eine SQL-basierte Query-Engine kennen, die tief in das Hadoop-Ökosystem integriert ist und eine verteilte Arbeitsweise unterstützt. Der Kurs vermittelt die Besonderheiten dieses mächtigen Werkzeugs und bereitet die Teilnehmer darauf vor, Impala erfolgreich einzusetzen. Die Schulung wird auf der Plattform Cloudera CDH angeboten, da unter Hortonworks HDP die Installation von Impala offiziell nicht unterstützt wird.

Zielgruppe

(IT-)Architekt
(IT-)Entwickler

Voraussetzungen

Praktische Erfahrung in der IT-Informationsverarbeitung
Kenntnisse im Einsatz relationaler Datenbanken
Kenntnisse über Big Data

Lernmethodik

Die Schulung bietet Ihnen eine ausgewogene Mischung aus Theorie und Praxis in einer erstklassigen Lernumgebung. Profitieren Sie vom direkten Austausch mit unseren projekterfahrenen Trainern und anderen Teilnehmern, um Ihren Lernerfolg zu maximieren.

Agenda

Strukturen – Die Architektur von Impala

Apache Impala besitzt nicht die klassische Master-/Worker-Struktur wie viele andere Hadoop-Komponenten, sondern agiert mit dynamischen Koordinator-Strukturen.

Die Teilnehmer lernen die verschiedenen Rollen der Impala-Komponenten wie Query-Coordinator, Query-Executor, Statestore und Catalog Service kennen und wie man diese in einem Hadoop-Cluster konfiguriert.

Storage und Access – Metadaten und Datenzugriff mit Impala

Impala unterstützt verschiedene Formate wie Delimited Text, Parquet, Avro, SequenceFile oder RCFile im verteilten Dateisystem HDFS sowie den direkten Zugriff auf die Datenbanken HBase und Kudu. Darüber hinaus ist eine Interaktion mit Hive über den gemeinsamen Metastore möglich. Alternativ können Daten direkt aus der Cloud angesprochen werden.

Impala verwendet verschiedene Techniken zur Beschleunigung der Abfragen, die auf einer genauen Kenntnis der zugrundeliegenden Metadaten basieren, die für den schnellen Zugriff im Speicher vorgehalten werden.

In diesem Modul machen sich die Teilnehmer mit den grundsätzlichen Datenformaten vertraut, die mit Impala angesprochen werden können.

Praxis 1 – Der Zugriff auf Daten mit Impala

In diesem Abschnitt lernen die Teilnehmer verschiedene Möglichkeiten kennen, um die Query Engine von Impala zu aktivieren. Dazu wird der Zugriff über die Kommandozeile, über ein Browserbasiertes User Interface sowie über die ODBC-Schnittstelle evaluiert.

Praxis 2 – Die SQL-Abfragesprache in Impala

Die Teilnehmer loten die Möglichkeiten der SQL-Abfragesprache in Impala aus und lernen die Unterschiede zur SQL-ähnlichen Abfragesprache von Hive lernen. Die Besonderheiten im Umgang mit Tabellen aus Kudu oder HBase werden herausgearbeitet.

Impala kennt komplexe Datentypen wie ARRAY, MAP und STRUCT (vergleichbar zu Hive). Die Möglichkeiten dieser Datentypen werden von den Teilnehmern evaluiert.

Auf Grund der vielfältigen Besonderheiten stellt dieser Abschnitt den Schwerpunkt des dreitägigen Kurses dar.

Praxis 3 - Betrieb von Impala im Hadoop Cluster

Bei der Nutzung von Impala in einem Hadoop-Cluster sind nur wenige grundsätzliche Aspekte wie Datendurchsatz, Speicherquoten oder Timeout zu definieren. Die Teilnehmer machen sich anhand praktischer Beispiele mit den Möglichkeiten vertraut.

Als weiterer wichtiger Punkt wird die Authentifizierung und Autorisierung (mit Apacha Sentry) behandelt.

Praxis 4 – Performance-Optimierung für Impala im Hadoop Cluster

In diesem Praxisteil wird ausführlich auf die Möglichkeiten der Performance-Optimierung für Impala im Hadoop-Cluster eingegangen. Dies ist einerseits durch Wahl der geeigneten Hardware möglich, andererseits aber durch die Auswahl oder Anordnung der Daten beeinflussbar.

Die Teilnehmer machen sich mit den Möglichkeiten der Abschätzung der Hardware-Anforderungen für verschiedene Anwendungsszenarien vertraut und evaluieren, wie Daten optimal für eine hohe Abfragegeschwindigkeit anzuordnen sind.

Open Badge - Ihr digitaler Kompetenznachweis

Durch die erfolgreiche Teilnahme an einem Kurs bei IT-Schulungen.com erlangen Sie nicht nur Fachkenntnisse und Fähigkeiten, sondern bekommen zusätzlich zu Ihrem Teilnahmezertifikat ein Open Badge als digitalen Nachweis Ihrer Kompetenz.

Sie können diesen in Ihrem persönlichen und kostenfreien Mein IT-Schulungen.com Konto abrufen. Ihre verdienten Badges lassen sich problemlos in sozialen Netzwerken integrieren und weitergeben.

Mehr zu den Vorteilen von Badges

Kurz vor Durchführung

Termin	Standort	Aktion
26.08. - 28.08.2024	Hamburg	Seminar jetzt anfragen
03.09. - 05.09.2024	München	Seminar jetzt anfragen
21.10. - 23.10.2024	Köln	Seminar jetzt anfragen
27.11. - 29.11.2024	Nürnberg	Seminar jetzt anfragen

Apache Impala

Ziele

Zielgruppe

Voraussetzungen

Lernmethodik

Agenda

Strukturen – Die Architektur von Impala

Storage und Access – Metadaten und Datenzugriff mit Impala

Praxis 1 – Der Zugriff auf Daten mit Impala

Praxis 2 – Die SQL-Abfragesprache in Impala

Praxis 3 - Betrieb von Impala im Hadoop Cluster

Praxis 4 – Performance-Optimierung für Impala im Hadoop Cluster

Open Badge - Ihr digitaler Kompetenznachweis

Kurz vor Durchführung

1.) Wählen Sie den Seminartyp:

2.) Wählen Sie Ort und Datum:

1.595,00 € Preis pro Person

Tagessatz:
1.695,00 €

Tagessatz:
1.525,50 €

Diese Seite weiterempfehlen:

Apache Impala

Ziele

Zielgruppe

Voraussetzungen

Lernmethodik

Agenda

Strukturen – Die Architektur von Impala

Storage und Access – Metadaten und Datenzugriff mit Impala

Praxis 1 – Der Zugriff auf Daten mit Impala

Praxis 2 – Die SQL-Abfragesprache in Impala

Praxis 3 - Betrieb von Impala im Hadoop Cluster

Praxis 4 – Performance-Optimierung für Impala im Hadoop Cluster

Open Badge - Ihr digitaler Kompetenznachweis

Kurz vor Durchführung

1.) Wählen Sie den Seminartyp:

2.) Wählen Sie Ort und Datum:

1.595,00 € Preis pro Person

Tagessatz:1.695,00 €

Tagessatz:1.525,50 €

Diese Seite weiterempfehlen:

Tagessatz:
1.695,00 €

Tagessatz:
1.525,50 €