Microsoft Azure

Data Engineering on Microsoft Azure

Ihr Nutzen

Dieses Seminar richtet sich an Daten-Analysten, die mit HDInsight Cluster, Spark, Stream Analytics Big-Data Workflows implementieren möchten.

Zielgruppe

IT Professional

Voraussetzungen

Kenntnisse des Windows Betriebssystem von Datenanalyse und Statistik und Kenntnisse der Programmiersprache R.

Dauer und Investition

Seminardauer: 4 Tag(e)
€ 2.360,- pro Teilnehmer excl. MwSt.
Individuelle Firmenseminare
Frühbucher-Bonus möglich
Mehr Teilnehmer?
Punktekarte

Hinweis

DP203-T00,

Original-Seminar

DP203-T00 mit digitalen Seminarunterlagen.

InhalteAlle Details anzeigen

    1. Tag

    • Einführung in HDInsight
    • Was ist Big Data?
    • Einführung in Hadoop
    • Arbeiten mit der MapReduce Funktion
    • Einführung in HDInsight

    • Bereitstellen von HDInsight
    • HDInsight Cluster Types
    • Verwaltung über das Azure Portal und Azure PowerShell

    • Benutzer und Berechtigungen
    • Domain-Joined und Non-Domain Joined Clusters
    • Verwaltung über die Azure PowerShell
    • Das Ambari Management UI
    • Das Ranger Admin UI
    • Hive Polices

    • Daten in HDInsight laden
    • Speicher fpr HDInsight
    • Azure Blob und Azure Data Lake Storage
    • Verwenden der Data Loading Tools

    2. Tag

    • Troubleshooting und Logging in HDInsight
    • HDInsight Logs
    • YARN Logs
    • Heap Dumps
    • OMS

    • Batch Solutions
    • Apache Hive Storage
    • Data Queries mit Hive und Pig

    • Batch ETL Solutions mit Spark
    • Was ist Spark?
    • ETL mit Spark

    3. Tag

    • Daten mit Spark SQL analysieren
    • Interative und interaktive Abfragen
    • Verwenden von Zeppelin und Livy

    • Daten mit Hive und Phoenix analysieren
    • Interaktive Abfragen mit interactive hive
    • Interactive Processing mit Apache Phoenix

    4. Tag

    • Stream Analytics
    • Verarbeiten von Streaming Daten
    • Verwalten von Stream Analytics Jobs

    • Implmentierung von Streaming Solutions
    • Aufbau und Bereitstellung eines Kafka Clusters
    • Storm Cluster, Kafka Producer und Power BI Dashboards
    • Publizieren und Nutzen des Kafka Clusters
    • Verwenden von HBase für Storage und Abfrage

    5. Tag

    • Real Time Processing Solutions mit Apache Storm
    • Streaming von Daten mit Storm
    • Storm Topologies

    • Spark Streaming Applications erstellen
    • Arbeiten mit Spark Streaming
    • Spark Structured Streaming Applications
    • Erstellen einer Spark Streaming Pipeline
    • Verwenden von DStreams

    Beschreibung

    Microsoft Azure bietet eine Vielzahl von Daten-Analyse Lösungen in der Cloud an.

    Zertifizierungen
    • 70-775 Hadoop in the Cloud
    Achtung: Dieses Seminar wird in dieser Version nicht mehr offen angeboten. Bitte kontaktieren Sie Ihren Bildungsberater für eine aktualisierte Version.