Nous surveillons. Nous résolvons. Vous dormez.
Si ça tourne, ça doit être monitoré. Je conçois et déploie des stacks de monitoring et d’observabilité auto-hébergées — construites sur des outils que vous contrôlez, fonctionnant sur une infrastructure qui vous appartient.
Ce que cela représente concrètement :
- Déploiement de Zabbix pour la supervision de l’infrastructure et du réseau
- Prometheus et Grafana pour les métriques, les tableaux de bord et les alertes
- Pipelines d’agrégation et d’analyse de logs
- Conception des alertes et workflows d’escalade pour les astreintes
- Planification de capacité et établissement de baselines de performance
- Site reliability et observabilité en tant que service
- Gestion des incidents et rapports analytiques — pour savoir ce qui s’est passé, pourquoi c’est arrivé, et ce que nous faisons pour y remédier
À qui s’adresse ce service : À toute organisation souhaitant avoir une visibilité complète sur son infrastructure sans envoyer ses métriques à un fournisseur SaaS tiers.
Cette page est dédiée à mon activité de monitoring et d’observabilité. Je l’enrichis progressivement avec des études de cas et des descriptions détaillées des services. Tout ce qui précède est exact et à jour.