Axe 14 — DevOps & exploitation
🎯 Objectif global : construire une chaîne de livraison automatisée et savoir exploiter ce qu’on déploie — pipeline reproductible, infra versionnée, observabilité solide, et un plan quand ça part en vrille.
Prérequis
Section intitulée « Prérequis »Axes 4 (Docker), 8, 11.
Objectifs
Section intitulée « Objectifs »À l'issue de cet axe, tu sauras :
- Mettre en place un pipeline CI/CD complet sur GitHub Actions avec OIDC
- Versionner l'infrastructure avec Terraform / OpenTofu ou Pulumi
- Choisir entre PaaS, IaaS et VPS selon la charge et le budget
- Industrialiser des conteneurs (Dockerfile prod, K8s quand utile)
- Implémenter l'observabilité (logs, métriques, traces, SLO, alerting)
- Préparer la fiabilité : sauvegardes, runbooks, post-mortems, DR
Contenu de l’axe
Section intitulée « Contenu de l’axe » 14.1 — Pipelines CI/CD GitHub Actions multi-jobs, parallélisme, matrices, cache, OIDC pour secrets sans tokens long-lived, environnements éphémères par PR.
14.2 — Infrastructure as Code Terraform, OpenTofu, Pulumi — state distant verrouillé, structure par environnement, modules, drift detection, sécurité IaC.
14.3 — Hébergement Serverless / PaaS / IaaS / VPS — TCO réel, quand passer de Vercel à Hetzner, Caddy + systemd + UFW pour un VPS sain.
14.4 — Conteneurs en production Dockerfile multi-stage non-root, scan Trivy, signature cosign, briques K8s essentielles, Helm, Argo CD pour le GitOps.
14.5 — Observabilité Les 3 piliers (logs, métriques, traces), OpenTelemetry, Prometheus + Grafana + Loki + Tempo, Sentry, SLI/SLO/error budget, alerting raisonné.
14.6 — Fiabilité Sauvegardes 3-2-1 testées, runbooks à 3h du matin, post-mortems blameless, RPO/RTO, game days, chaos engineering, patterns de résilience.
Projet de l’axe
Section intitulée « Projet de l’axe »Déploiement complet de taskly-api — pipeline DevOps de bout en bout : Dockerfile multi-stage, CI GitHub Actions avec OIDC (zéro secret long-lived), OpenTofu pour Fly + Sentry, preview par PR, observabilité (Sentry + Prometheus + Better Stack), 2 SLO documentés avec multi-burn-rate, runbooks copy-pastables. Total free tier : ~10 €/mo.
Ressources clés
Section intitulée « Ressources clés »- Site Reliability Engineering + SRE Workbook — Google (gratuits en ligne)
- The DevOps Handbook — Gene Kim et al.
- Terraform Up & Running — Yevgeniy Brikman
- Observability Engineering — Charity Majors et al.
- Kubernetes Patterns — Bilgin Ibryam
- DORA reports — métriques équipes
- OpenTelemetry docs — opentelemetry.io
- Grafana OSS Stack — grafana.com/oss