Mission freelance
Application Observability Engineer (H/F)

Démarrage  
ASAP
T.J.M
Max 450€ HT
Localisation
Paris
Télétravail
2 jours min.
Freelance
Postuler

Description de la mission

🎯 Contexte de mission

Dans le cadre d’un programme de transformation IT et d’industrialisation des pratiques d’observabilité, une organisation recherche un Application Observability Engineer afin de participer à la définition, au déploiement et à l’adoption des standards de monitoring applicatif à l’échelle du groupe.

La mission vise à structurer une approche homogène de l’observabilité autour d’une plateforme centralisée, en accompagnant les équipes techniques dans la mise en œuvre des bonnes pratiques de supervision, de gestion des incidents et de pilotage de la performance des applications en production.

Une expérience opérationnelle significative dans des environnements de production et une maîtrise avancée de Grafana Cloud sont indispensables.

🛠️ Missions principales et rôle

Définition et déploiement des standards d’observabilité

  • Participer à la définition des standards de supervision et de monitoring.
  • Concevoir et maintenir les dashboards, alertes et indicateurs de performance.
  • Définir les pratiques de gestion des SLO, SLI et alerting.
  • Mettre en place les mécanismes de collecte, stockage et exploitation des métriques, logs et traces.

Accompagnement des équipes métiers et techniques

  • Recueillir et analyser les besoins d’observabilité des différentes équipes.
  • Adapter les solutions de monitoring aux contraintes métiers, techniques et réglementaires.
  • Accompagner les équipes dans la mise en œuvre des bonnes pratiques d’observabilité.
  • Participer à la diffusion d’une culture commune autour de la supervision et de la fiabilité des applications.

Gouvernance et migration des outils

  • Réaliser un état des lieux des outils et pratiques existants.
  • Définir et piloter les plans de migration vers les standards du groupe.
  • Garantir la cohérence des configurations et des usages.
  • Assurer l’harmonisation des pratiques entre les différentes équipes.

Personnalisation et optimisation des plateformes

  • Adapter la plateforme d’observabilité aux besoins spécifiques des applications.
  • Concevoir des dashboards avancés pour les environnements applicatifs, bases de données et infrastructures.
  • Mettre en œuvre des scénarios de synthetic monitoring.
  • Optimiser les performances des mécanismes de collecte et d’analyse.

Collaboration avec les équipes Infrastructure et Cloud

  • Participer à l’évolution des infrastructures cloud permettant la collecte des données d’observabilité.
  • Assurer l’intégration des solutions avec les environnements Kubernetes et AWS.
  • Collaborer avec les équipes DevOps, Cloud et Production.
  • Contribuer à l’amélioration continue de la fiabilité des plateformes.

Formation et accompagnement au changement

  • Produire la documentation technique et les guides de bonnes pratiques.
  • Former les équipes Engineering aux concepts et outils d’observabilité.
  • Accompagner la mise en place des processus de gestion des incidents.
  • Favoriser l’autonomie des équipes dans l’exploitation des outils.

🎯 Objectifs

  • Déployer une stratégie d’observabilité homogène à l’échelle de l’organisation.
  • Industrialiser le monitoring des applications et des infrastructures.
  • Améliorer la détection, le diagnostic et la résolution des incidents.
  • Renforcer la fiabilité, la disponibilité et la performance des applications.
  • Accompagner les équipes dans l’adoption des pratiques SRE et Observability.
  • Mettre en place des indicateurs fiables de qualité de service et de performance.

💡 Compétences requises

Observabilité & Monitoring

  • Grafana Cloud (expertise impérative).
  • Dashboards avancés.
  • Alerting.
  • SLO / SLI.
  • Synthetic Monitoring.
  • Monitoring applicatif.
  • Monitoring infrastructure.
  • Gestion des logs, métriques et traces.

Outils d’Observabilité

  • Grafana Cloud.
  • Loki.
  • Tempo.
  • K6.
  • OpenTelemetry.
  • Prometheus.

Cloud & Infrastructure

  • AWS.
  • EC2.
  • EKS.
  • RDS.
  • Kubernetes.
  • Architecture Cloud Native.
  • Haute disponibilité.

Production & Exploitation

  • Gestion d’applications en production.
  • Gestion des incidents.
  • Observabilité orientée exploitation.
  • Analyse de performance.
  • Capacity Planning.
  • Troubleshooting avancé.

Automatisation & Infrastructure as Code

  • Terraform.
  • Automatisation des déploiements.
  • Gestion de configurations.

Outils complémentaires

  • ElasticSearch.
  • Solutions de centralisation et d’analyse des logs.

Gestion de projet

  • Recueil et analyse des besoins.
  • Définition de standards techniques.
  • Pilotage de projets techniques.
  • Accompagnement de la mise en production.

👤 Profil

  • Ingénieur ou expert IT avec au moins 5 ans d’expérience.
  • Expérience significative en environnement de production.
  • Parcours en tant que DevOps Engineer, SRE, Tech Lead Infrastructure, Expert Production ou Chef de Projet Technique.
  • Expertise démontrée sur Grafana Cloud dans un contexte opérationnel réel.
  • Solide expérience des environnements Kubernetes et AWS.
  • Maîtrise des concepts modernes d’observabilité et de monitoring distribué.
  • Expérience dans l’accompagnement des équipes de développement et d’exploitation.