Kdo jsme
Popis role
Popis projektu
- integrace nových zdrojů dat, API, různých databází a streamovacích platforem (Kafka)
- vývoj a správa datových toků v Azure Data Lake ve vrstvách Bronze, Silver a Gold
- práce s metadatovým frameworkem a navrhování metadatově řízených řešení
- nastavování a správa CI/CD pipelines a účast při uvolňovacím procesu
- vývoj a údržba DWH tabulek v Azure SQL, včetně implementace SCD2 a hvězdicového schématu
- tvorba a optimalizace ETL/ELT procesů v Pythonu/PySpark
- po onboardingu 2-3 dny na místě
Požadavky projektu
- alespoň 1 rok praktických zkušeností s daty v Azure Data Lake (Bronze, Silver, Gold)
- minimálně 1 rok zapojení do CI/CD procesů a uvolňování kódu
- alespoň 1 rok zkušeností s vývojem tabulek v Azure SQL
- nejméně 2 roky praxe s vývojem DWH tabulek (SCD2, hvězdicové schéma)
- praktické zkušenosti s Pythonem/PySpark v oblasti ETL, transformací a optimalizace výkonu
- schopnost pracovat s metadatovými frameworky a metadatově řízenými řešeními
- praktická zkušenost s integrací zdrojů (API databáze, Kafka)
- angličtina na úrovni min B2, pro komunikaci v mezinárodním týmu a tvorbu dokumentace
Očekáváme, že budete mít:
Omlouváme se! Při odesílání formuláře došlo k chybě.