Mission freelance
Consultant Data Engineer GCP

Démarrage  
ASAP
T.J.M
Selon profil
Localisation
Lille
Télétravail
A discuter
Freelance
Postuler

Description de la mission

4. Description de la prestation et des missions attendues


Le/La Data Engineer sera intégré(e) à l'équipe produit TOPASE NLS et interviendra sur les missions suivantes :


🔹 Conception, développement et optimisation des pipelines de données (GCP)


  • Concevoir, développer et maintenir des pipelines robustes et performants pour la collecte, la transformation et le chargement des données depuis diverses sources (Oracle, fichiers, API, etc.) vers BigQuery et autres cibles.

  • Exploiter et orchestrer les services Google Cloud Platform (Dataflow, Dataproc, Cloud Composer/Airflow, Pub/Sub, Cloud Storage, BigQuery) afin de construire des architectures data scalables et fiables.

  • Automatiser les traitements, gérer les dépendances et orchestrer les jobs de données.

  • Optimiser les performances des pipelines ainsi que la consommation des ressources GCP.

🔹 Modélisation et gestion des données


  • Participer à la conception et à l'évolution des modèles de données dans BigQuery, en lien avec les Data Analysts et les équipes métiers.

  • Garantir la qualité, la cohérence et l'intégrité des données.

  • Mettre en œuvre des stratégies de versioning des schémas et de gestion du cycle de vie des données.

🔹 Run opérationnel, maintenance et support N2/N3


  • Assurer le support opérationnel de niveau 2/3 de la solution TOPASE (environnement GCP + solution éditeur).

  • Développer et maintenir des scripts Bash pour automatiser les tâches récurrentes (supervision, traitement de données, maintenance).

  • Rédiger, optimiser et exécuter des requêtes SQL complexes (BigQuery et Oracle) pour l'analyse, le diagnostic d'incidents et la restitution de données.

  • Gérer les incidents en collaboration avec les équipes internes et l'éditeur.

  • Participer à la qualification des livraisons de patchs éditeur impactant les flux de données.

  • Suivre les incidents via le CRM éditeur et contribuer aux comités de suivi.

🔹 Monitoring, logging et alerting


  • Mettre en place et maintenir des dispositifs de supervision des flux de données, de la qualité, des performances et de l'utilisation des ressources (Stackdriver, Grafana, Looker Studio).

  • Définir et implémenter des alertes permettant la détection proactive des anomalies.

  • Concevoir des tableaux de bord pour le suivi des KPI opérationnels et métier.

🔹 Infrastructure as Code (IaC)


  • Contribuer à la définition et à l'implémentation de l'infrastructure data via Terraform.

  • Garantir la reproductibilité et la traçabilité des environnements (Dev, Recette, Pré-prod, Prod).

🔹 Collaboration et conseil


  • Travailler en étroite collaboration avec les équipes Data (Data Scientists, Data Analysts), les Product Owners et les métiers.

  • Proposer des solutions techniques adaptées et conseiller sur les bonnes pratiques en Data Engineering.

  • Participer aux rituels Agile/Kanban de l'équipe produit.



5. Compétences et expériences requises


5.1 Expertise technique


  • Cloud GCP : Expertise confirmée des services data (BigQuery, Dataflow, Cloud Storage, Pub/Sub, Composer/Airflow, Stackdriver, Data Catalog).

  • Bases de données : Maîtrise avancée SQL (optimisation, requêtes complexes), expérience sur BigQuery et Oracle 19 (MySQL/PostgreSQL appréciés).

  • Scripting : Excellente maîtrise de Bash (indispensable pour le run).

  • Systèmes : Bonne maîtrise des environnements Linux (RedHat).

  • IaC : Solide expérience avec Terraform.

  • CI/CD : Maîtrise d'un outil comme GitLab CI.

  • Monitoring/Logging : Stackdriver, Grafana, ELK, Looker Studio.

  • Versioning : Git (GitLab).

  • Réseaux : Connaissances solides (TCP/IP, HTTP/S, DNS, load balancing, firewall).

  • Data Engineering : Maîtrise des concepts ETL/ELT, Data Warehouse, Data Lake et streaming.

5.2 Environnement technique TOPASE NLS


  • OS : RedHat Enterprise 9.4

  • Cloud : Azure (solution éditeur) & GCP (data, monitoring, pipelines)

  • CI/CD : GitLab CI

  • IaC : Terraform

  • Monitoring : Looker Studio, GANTI, Grafana, ELK

  • Bases : Oracle, BigQuery

  • Langage : Bash

5.3 Méthodologies et soft skills


  • Expérience en environnement Agile (Scrum, Kanban).

  • Excellentes capacités d'analyse et de résolution de problèmes, notamment en situation d'incident.

  • Autonomie, proactivité et sens de l'amélioration continue.

  • Bonnes compétences de communication (français courant, anglais technique).

  • Esprit d'équipe et partage des connaissances.

  • Sens des responsabilités, notamment en environnement de production.

5.4 Expérience


  • Minimum 3 ans d'expérience en tant que Data Engineer, idéalement sur GCP.

  • Expérience sur des environnements à forte volumétrie, avec des enjeux de performance, fiabilité et disponibilité.