Voor een klant zijn we op zoek naar een ervaren Big Data Engineer (Senior).
Startdatum: 05/01/2026
Duur: Lange termijn (145 dagen) met grote kans op verlenging
Locatie: Brussel
Verantwoordelijkheden:
- Ontwerpen en ontwikkelen van data pipelines en ETL-dataflows voor het verzamelen, verwerken en integreren van grote hoeveelheden data.
- Ontwikkeling in Python en (Py)Spark voor performante data-analyse en modellering.
- In productie brengen van AI- en ML-modellen, in nauwe samenwerking met data scientists.
- Ontwikkelen in een hybride- en cloudomgeving en implementeren van containerized oplossingen (Docker, Kubernetes).
- Zorgen voor productieklare code met aandacht voor betrouwbaarheid, schaalbaarheid en onderhoud.
- Opzetten van monitoring, logging en lineage via tools zoals Airflow, OpenLineage, Fluentd, Marquez en Collibra.
- Ondersteuning bij unit-, performantie- en systeemtesten van dataprocessen en modellen.
- Opleveren van technische en functionele documentatie en het beheren van metadata.
Vereiste Kwalificaties en Ervaring:
- Minimaal 5 jaar aantoonbare ervaring als Data Engineer.
- Ervaring met (Py)Spark, Python voor data-analyse en modellering.
- Ervaring met het in productie brengen van AI/ML-modellen en het automatiseren van dataprocessen.
- Ervaring met het opzetten en beheren van relationele en vector databases (bijv. PostgreSQL/pgvector).
- Ervaring met monitoring, logging, data lineage en governance-tools zoals Airflow, OpenLineage, Fluentd, Marquez, Collibra.
- Ervaring met programmeertalen zoals Python, Java of Scala voor het ontwikkelen van datastromen en ETL-processen.
- Nederlandstalig op Europees CEFR - niveau C2.
Gewenste Vaardigheden:
- Ervaring in het ontwerpen en implementeren van Extract, Transform, Load (ETL) processen.
- Ervaring met databanken.
- Ervaring met het implementeren van containerized oplossingen (Docker, Kubernetes).
- Ervaring met het ontwikkelen van schaalbare REST APIs in Python (FastAPI, Flask).
- Kritisch en oplossingsgericht denken om actief mee te bouwen aan schaalbare en duurzame data-oplossingen.
- Ervaring met werken in Cloud-omgevingen (AWS, Azure, GCP,…).
- Ervaring met werken in een Agile/DevOps-omgeving met versiebeheer (Git).