Header Background
 
 
 

Apache Impala

Seminardauer: 3 Tage

Ziele

In dieser 3-tägigen Schulung "Apache Impala" lernen Sie eine SQL-basierte Query-Engine kennen, die tief in das Hadoop-Ökosystem integriert ist und eine verteilte Arbeitsweise unterstützt. Der Kurs vermittelt die Besonderheiten dieses mächtigen Werkzeugs und bereitet die Teilnehmer darauf vor, Impala erfolgreich einzusetzen. Die Schulung wird auf der Plattform Cloudera CDH angeboten, da unter Hortonworks HDP die Installation von Impala offiziell nicht unterstützt wird.

Zielgruppe

  • (IT-)Architekt
  • (IT-)Entwickler

Voraussetzungen

  • Praktische Erfahrung in der IT-Informationsverarbeitung
  • Kenntnisse im Einsatz relationaler Datenbanken
  • Kenntnisse über Big Data

Lernmethodik

Die Schulung bietet Ihnen eine ausgewogene Mischung aus Theorie und Praxis in einer erstklassigen Lernumgebung. Profitieren Sie vom direkten Austausch mit unseren projekterfahrenen Trainern und anderen Teilnehmern, um Ihren Lernerfolg zu maximieren.

Agenda

Strukturen – Die Architektur von Impala

Apache Impala besitzt nicht die klassische Master-/Worker-Struktur wie viele andere Hadoop-Komponenten, sondern agiert mit dynamischen Koordinator-Strukturen.

Die Teilnehmer lernen die verschiedenen Rollen der Impala-Komponenten wie Query-Coordinator, Query-Executor, Statestore und Catalog Service kennen und wie man diese in einem Hadoop-Cluster konfiguriert.

Storage und Access – Metadaten und Datenzugriff mit Impala

Impala unterstützt verschiedene Formate wie Delimited Text, Parquet, Avro, SequenceFile oder RCFile im verteilten Dateisystem HDFS sowie den direkten Zugriff auf die Datenbanken HBase und Kudu. Darüber hinaus ist eine Interaktion mit Hive über den gemeinsamen Metastore möglich. Alternativ können Daten direkt aus der Cloud angesprochen werden.

Impala verwendet verschiedene Techniken zur Beschleunigung der Abfragen, die auf einer genauen Kenntnis der zugrundeliegenden Metadaten basieren, die für den schnellen Zugriff im Speicher vorgehalten werden.

In diesem Modul machen sich die Teilnehmer mit den grundsätzlichen Datenformaten vertraut, die mit Impala angesprochen werden können.

Praxis 1 – Der Zugriff auf Daten mit Impala

In diesem Abschnitt lernen die Teilnehmer verschiedene Möglichkeiten kennen, um die Query Engine von Impala zu aktivieren. Dazu wird der Zugriff über die Kommandozeile, über ein Browserbasiertes User Interface sowie über die ODBC-Schnittstelle evaluiert.

Praxis 2 – Die SQL-Abfragesprache in Impala

Die Teilnehmer loten die Möglichkeiten der SQL-Abfragesprache in Impala aus und lernen die Unterschiede zur SQL-ähnlichen Abfragesprache von Hive lernen. Die Besonderheiten im Umgang mit Tabellen aus Kudu oder HBase werden herausgearbeitet.

Impala kennt komplexe Datentypen wie ARRAY, MAP und STRUCT (vergleichbar zu Hive). Die Möglichkeiten dieser Datentypen werden von den Teilnehmern evaluiert.

Auf Grund der vielfältigen Besonderheiten stellt dieser Abschnitt den Schwerpunkt des dreitägigen Kurses dar.

Praxis 3 - Betrieb von Impala im Hadoop Cluster

Bei der Nutzung von Impala in einem Hadoop-Cluster sind nur wenige grundsätzliche Aspekte wie Datendurchsatz, Speicherquoten oder Timeout zu definieren. Die Teilnehmer machen sich anhand praktischer Beispiele mit den Möglichkeiten vertraut.

Als weiterer wichtiger Punkt wird die Authentifizierung und Autorisierung (mit Apacha Sentry) behandelt.

Praxis 4 – Performance-Optimierung für Impala im Hadoop Cluster

In diesem Praxisteil wird ausführlich auf die Möglichkeiten der Performance-Optimierung für Impala im Hadoop-Cluster eingegangen. Dies ist einerseits durch Wahl der geeigneten Hardware möglich, andererseits aber durch die Auswahl oder Anordnung der Daten beeinflussbar.

Die Teilnehmer machen sich mit den Möglichkeiten der Abschätzung der Hardware-Anforderungen für verschiedene Anwendungsszenarien vertraut und evaluieren, wie Daten optimal für eine hohe Abfragegeschwindigkeit anzuordnen sind.

Open Badge - Ihr digitaler Kompetenznachweis

IT-Schulungen Badge: Apache Impala

Durch die erfolgreiche Teilnahme an einem Kurs bei IT-Schulungen.com erlangen Sie nicht nur Fachkenntnisse und Fähigkeiten, sondern bekommen zusätzlich zu Ihrem Teilnahmezertifikat ein Open Badge als digitalen Nachweis Ihrer Kompetenz.

Sie können diesen in Ihrem persönlichen und kostenfreien Mein IT-Schulungen.com Konto abrufen. Ihre verdienten Badges lassen sich problemlos in sozialen Netzwerken integrieren und weitergeben.

Mehr zu den Vorteilen von Badges

Kurz vor Durchführung

TerminStandortAktion
14.05. - 16.05.2024 Hamburg Seminar jetzt anfragen
03.06. - 05.06.2024 München Seminar jetzt anfragen
03.07. - 05.07.2024 Köln Seminar jetzt anfragen
26.08. - 28.08.2024 Nürnberg Seminar jetzt anfragen
 

1.) Wählen Sie den Seminartyp:




2.) Wählen Sie Ort und Datum:

1.595,00 € Preis pro Person

spacing line1.898,05 € inkl. 19% MwSt
Seminarunterlagen zzgl.
Verpflegung zzgl.

Seminar jetzt anfragen Auf den Merkzettel
PDF IconPDF Icon
 

Diese Seite weiterempfehlen:

0
Merkzettel öffnen
0
Besuchsverlauf ansehen
IT-Schulungen.com Control Panel
Warnung Icon Sie haben in Ihrem Browser Javascript deaktiviert! Bitte aktivieren Sie Javascript um eine korrekte Darstellung und Funktionsweise von IT-Schulungen zu gewährleisten. Warnung Icon