IBM Information Server – Fortgeschrittene Techniken beherrschen ist keine Lotterie

Dieser Workshop richtet sich an erfahrene ETL-Entwickler, die mehr über die zugrundeliegenden Mechanismen in DataStage des IBM Information Server kennenlernen wollen.

Facts

Teilnehmerpreise:

Regulär: €1.620,- zzgl. MwSt. max. 8 Pers.
Studenten: auf Anfrage
Gruppenrabatt: 10% ab dem 3. Teilnehmer
Early Bird: 10% bis 10 Wochen vor Seminarstart
Seminardauer: 2 Tage
In-House Seminare: auf Anfrage ab 5 Teilnehmern

Im Falle einer Absage durch den Teilnehmer, 6 Wochen vor Kursbeginn, erfolgt keine Erstattung des Teilnehmerpreises. Es besteht jedoch die Möglichkeit, den ausgefallenen Teilnehmer durch eine andere Person zu ersetzten.

Die Termine 2020 stehen unter Vorbehalt und können durch den Veranstalter noch geändert werden.

Der Teilnehmerpreis beinhaltet sämtliche Unterrichtsmaterialien sowie die Verpflegung während des Seminares.

Zielgruppe

ETL-Entwickler und DataStage Administratoren

Voraussetzungen

Als Minimum werden ein Grundwissen in der Erstellung von ETL-Jobs auch erwartet; beispielsweise durch Besuch unserer „InfoSphere DataStage Beginner Class“.

Idealerweise hat der Teilnehmer bzw. die Teilnehmerin mindestens 1 Jahr praktische Erfahrung mit dem Erstellen und Pflegen von DataStage Jobs erlangt.

Insbesondere:

  • Nutzung des DataStage Designers und Directors
  • (Grund-)Kenntnisse der wichtigstes Stages, wie Row Generator, Copy, Sort, Transformer, Peek, SequentialFile, Databank-Stages
  • Lesen und Ändern von Projektvariablen

Weiterhin sollte jeder Teilnehmer praktische Erfahrung im Einsatz gesammelt haben.

Grundlegende Kenntnisse in der Nutzung einer Unix-Shell sind hilfreich.

Seminarinhalt

Übersicht des Workshops:

  • Das DataStage Parallel Framework
    • Parametrisierung des Parallel Framework durch die zentrale Konfigurationsdatei (APT_CONFIG-Datei) und Projekt- bzw. Umgebungsvariable.
    • OSH-Skript: Mapping Stage zu Operator
    • Score: Mapping auf Betriebssystemprozesse, Kombinieren von Operatoren
    • Prozessmodell eines DataStage Parallel-Jobs
  • Parallele Verarbeitung
    • Partitionieren
    • Collection
    • Fehlersituation bei Nutzung der Partitionierung
  • Buffering
    • Funktion des Pipelining in DataStage
    • Deadlock-Situation
    • Parametrisierung des Bufferings
  • Sort-Stage
    • Sortieren / Gruppieren
    • Einstellung „Don‘t Sort (Previously Sorted)“
    • Zusammenhang mit der Partitionierung
    • Generierte Spalten
    • Performance
  • Transformer
    • Gruppierungsfunktionen
    • Schleifen
    • Einsatz zusammen mit anderen Stages
  • Wiederverendung
    • Shared Container
    • Generic Stage
    • Modify Stage
    • Runtime Column Propagation

Anmeldung