Description de la mission

🎯 Contexte de mission

Dans le cadre d’un programme de transformation IT et d’industrialisation des pratiques d’observabilité, une organisation recherche un Application Observability Engineer afin de participer à la définition, au déploiement et à l’adoption des standards de monitoring applicatif à l’échelle du groupe.

La mission vise à structurer une approche homogène de l’observabilité autour d’une plateforme centralisée, en accompagnant les équipes techniques dans la mise en œuvre des bonnes pratiques de supervision, de gestion des incidents et de pilotage de la performance des applications en production.

Une expérience opérationnelle significative dans des environnements de production et une maîtrise avancée de Grafana Cloud sont indispensables.

🛠️ Missions principales et rôle

Définition et déploiement des standards d’observabilité

Participer à la définition des standards de supervision et de monitoring.
Concevoir et maintenir les dashboards, alertes et indicateurs de performance.
Définir les pratiques de gestion des SLO, SLI et alerting.
Mettre en place les mécanismes de collecte, stockage et exploitation des métriques, logs et traces.

Accompagnement des équipes métiers et techniques

Recueillir et analyser les besoins d’observabilité des différentes équipes.
Adapter les solutions de monitoring aux contraintes métiers, techniques et réglementaires.
Accompagner les équipes dans la mise en œuvre des bonnes pratiques d’observabilité.
Participer à la diffusion d’une culture commune autour de la supervision et de la fiabilité des applications.

Gouvernance et migration des outils

Réaliser un état des lieux des outils et pratiques existants.
Définir et piloter les plans de migration vers les standards du groupe.
Garantir la cohérence des configurations et des usages.
Assurer l’harmonisation des pratiques entre les différentes équipes.

Personnalisation et optimisation des plateformes

Adapter la plateforme d’observabilité aux besoins spécifiques des applications.
Concevoir des dashboards avancés pour les environnements applicatifs, bases de données et infrastructures.
Mettre en œuvre des scénarios de synthetic monitoring.
Optimiser les performances des mécanismes de collecte et d’analyse.

Collaboration avec les équipes Infrastructure et Cloud

Participer à l’évolution des infrastructures cloud permettant la collecte des données d’observabilité.
Assurer l’intégration des solutions avec les environnements Kubernetes et AWS.
Collaborer avec les équipes DevOps, Cloud et Production.
Contribuer à l’amélioration continue de la fiabilité des plateformes.

Formation et accompagnement au changement

Produire la documentation technique et les guides de bonnes pratiques.
Former les équipes Engineering aux concepts et outils d’observabilité.
Accompagner la mise en place des processus de gestion des incidents.
Favoriser l’autonomie des équipes dans l’exploitation des outils.

🎯 Objectifs

Déployer une stratégie d’observabilité homogène à l’échelle de l’organisation.
Industrialiser le monitoring des applications et des infrastructures.
Améliorer la détection, le diagnostic et la résolution des incidents.
Renforcer la fiabilité, la disponibilité et la performance des applications.
Accompagner les équipes dans l’adoption des pratiques SRE et Observability.
Mettre en place des indicateurs fiables de qualité de service et de performance.

💡 Compétences requises

Observabilité & Monitoring

Grafana Cloud (expertise impérative).
Dashboards avancés.
Alerting.
SLO / SLI.
Synthetic Monitoring.
Monitoring applicatif.
Monitoring infrastructure.
Gestion des logs, métriques et traces.

Outils d’Observabilité

Grafana Cloud.
Loki.
Tempo.
K6.
OpenTelemetry.
Prometheus.

Cloud & Infrastructure

AWS.
EC2.
EKS.
RDS.
Kubernetes.
Architecture Cloud Native.
Haute disponibilité.

Production & Exploitation

Gestion d’applications en production.
Gestion des incidents.
Observabilité orientée exploitation.
Analyse de performance.
Capacity Planning.
Troubleshooting avancé.

Automatisation & Infrastructure as Code

Terraform.
Automatisation des déploiements.
Gestion de configurations.

Outils complémentaires

ElasticSearch.
Solutions de centralisation et d’analyse des logs.

Gestion de projet

Recueil et analyse des besoins.
Définition de standards techniques.
Pilotage de projets techniques.
Accompagnement de la mise en production.

👤 Profil

Ingénieur ou expert IT avec au moins 5 ans d’expérience.
Expérience significative en environnement de production.
Parcours en tant que DevOps Engineer, SRE, Tech Lead Infrastructure, Expert Production ou Chef de Projet Technique.
Expertise démontrée sur Grafana Cloud dans un contexte opérationnel réel.
Solide expérience des environnements Kubernetes et AWS.
Maîtrise des concepts modernes d’observabilité et de monitoring distribué.
Expérience dans l’accompagnement des équipes de développement et d’exploitation.