O kurzu

Pojď si vyzkoušet, jak vypadá datové inženýrství (data engineering) v praxi. Na reálném projektu a na reálných datech.

Během kurzu se naučíš, jak řešit nejčastější výzvy při přípravě a čištění dat. Naučíš se základy datového inženýřství, jak se tvoří datový model, jak orchestrovat data, poznatky zakomponovat do struktury relační databáze a jakým způsobem celý projekt odevzdat. Kurz tě provede různorodými situacemi, které tě v kariéře datové inženýrky čekají.

Kurz je součástí vzdělávací cesty vedoucí k roli datové inženýrky a je vhodný pro ty, kdo například absolvovali Digitální akademii Data nebo se už nějakou dobu věnují datové analýze a mají základy Pythonu či SQL.

Nad rámec výuky s lektory (36 hodin) počítej se zhruba dalšími 2 hodinami týdně, které věnuješ domácím úkolům nebo projektu.

Pro koho je kurz určený

Pro absolventky kurzu Základy datové analýzy a zároveň Programování v Pythonu nebo pro ženy, které:

  • ovládají základy Pythonu,
  • mají aktivní znalost SQL, 
    • příkaz SELECT (FROM, WHERE, ORDER BY), DISTINCT, LIMIT
    • agregační funkce (SUM, MIN, MAX, COUNT, AVG), GROUP BY
    • spojování tabulek (JOINy)
  • ví, co jsou datové typy, 
  • znají základní modelovací techniky.

Co budeš na konci kurzu umět

  • Pochopíš základy práce datové inženýrky,
  • dokážeš si s klientem vyjednat zadání, které je realizovatelné,
  • umíš vytvořit datovou pipelinu, která aktualizuje data každý den, 
  • víš, jak používat technologie v Google Cloud Platform (BigQuery, Composeraj.),
  • rozumíš tomu, co je pro klienty důležité, 
  • víš, jaké jsou nejčastější chyby, které mohou pokazit tvoje datové výstupy.


Obsah kurzu

1. a 2. lekce – Úvod do datového inženýrství
3. lekce – Opakování Pythonu
4. lekce – Jak pracovat s gitem
5. lekce – Datové modelování
6. lekce – Vrstvy datového skladu a co se v nich odehrává
7. lekce – Tvoříme první vrstvu skladu
8. lekce – Orchestrace, data governance, data quality, data lineage
9. lekce – Orchestrace v praxi (praxe Python)
10. lekce – Druhá vrstva skladu
11. lekce – Třetí vrstva skladu
12. lekce – Q&A lekce – Jaké můžou být další kroky v kariéře datové inženýrky a diskuze nad projektem či tématy, které se možá do kurzu nevešly 🙂

Podmínkou ukončení kurzu je odevzdání domácích úkolů a projektu: 

  • Nakreslený datový model pro projekt
  • High level design architektury projektu (zdroje dat, vrstvy, tech stack)
  • Odevzdané skripty

Jak kurz úspěšně zakončíš


Obdržíš certifikát, pokud:

  • zúčastníš se alespoň 10 z 12 lekcí,
  • předáš domácí úkoly a projekt, na kterém budeš pracovat během kurzu.

Související kurzy

Kurz navazuje na Základy datové analýzy a Programování v Pythonu. je vhodný také pro absolventky Digitální akademie Data.

O čem to celé bude?

Přihlásit se na termín:

2
.
4
.
18
.
6
.

Online

No items found.
17:30
20:30
Hlavní lektor
Anžela Macháčková
Lektor
Kontaktní osoba