Axe 14 — DevOps & exploitation

🎯 Objectif global : construire une chaîne de livraison automatisée et savoir exploiter ce qu’on déploie — pipeline reproductible, infra versionnée, observabilité solide, et un plan quand ça part en vrille.

Prérequis

Axes 4 (Docker), 8, 11.

Objectifs

À l'issue de cet axe, tu sauras :

Mettre en place un pipeline CI/CD complet sur GitHub Actions avec OIDC
Versionner l'infrastructure avec Terraform / OpenTofu ou Pulumi
Choisir entre PaaS, IaaS et VPS selon la charge et le budget
Industrialiser des conteneurs (Dockerfile prod, K8s quand utile)
Implémenter l'observabilité (logs, métriques, traces, SLO, alerting)
Préparer la fiabilité : sauvegardes, runbooks, post-mortems, DR

Contenu de l’axe

14.1 — Pipelines CI/CD GitHub Actions multi-jobs, parallélisme, matrices, cache, OIDC pour secrets sans tokens long-lived, environnements éphémères par PR.

14.2 — Infrastructure as Code Terraform, OpenTofu, Pulumi — state distant verrouillé, structure par environnement, modules, drift detection, sécurité IaC.

14.3 — Hébergement Serverless / PaaS / IaaS / VPS — TCO réel, quand passer de Vercel à Hetzner, Caddy + systemd + UFW pour un VPS sain.

14.4 — Conteneurs en production Dockerfile multi-stage non-root, scan Trivy, signature cosign, briques K8s essentielles, Helm, Argo CD pour le GitOps.

14.5 — Observabilité Les 3 piliers (logs, métriques, traces), OpenTelemetry, Prometheus + Grafana + Loki + Tempo, Sentry, SLI/SLO/error budget, alerting raisonné.

14.6 — Fiabilité Sauvegardes 3-2-1 testées, runbooks à 3h du matin, post-mortems blameless, RPO/RTO, game days, chaos engineering, patterns de résilience.

Projet de l’axe

Déploiement complet de taskly-api — pipeline DevOps de bout en bout : Dockerfile multi-stage, CI GitHub Actions avec OIDC (zéro secret long-lived), OpenTofu pour Fly + Sentry, preview par PR, observabilité (Sentry + Prometheus + Better Stack), 2 SLO documentés avec multi-burn-rate, runbooks copy-pastables. Total free tier : ~10 €/mo.

Exercice · Déploiement complet — taskly-api en prod

Pré-requis : compte Fly.io + Sentry + Better Stack (free tier) + flyctl + tofu. Tu transformes une API qui tourne en local en service ops-ready : containers, CI/CD avec OIDC, IaC, monitoring, SLO chiffrés, post-mortem blameless. La discipline qui distingue un dev d'un dev qui sait opérer.

Télécharger le canevas squelette à compléter — commence ici Télécharger la correction solution complète + walkthrough pédagogique

💡 Comment l'utiliser : dézippe le canevas, suis son README.md pour démarrer et tente l'exercice. Quand tu bloques (ou quand tu as fini pour comparer), télécharge la correction — son README.md contient un walkthrough détaillé qui t'explique chaque choix de la solution.

Ressources clés

Site Reliability Engineering + SRE Workbook — Google (gratuits en ligne)
The DevOps Handbook — Gene Kim et al.
Terraform Up & Running — Yevgeniy Brikman
Observability Engineering — Charity Majors et al.
Kubernetes Patterns — Bilgin Ibryam
DORA reports — métriques équipes
OpenTelemetry docs — opentelemetry.io
Grafana OSS Stack — grafana.com/oss