Python Data Science Program

Parte 4 — MLOps — Modelos en Producción

14 clases · ~4–5 semanas · ✅ completada (junio 2026)

Fuente principal: Huyen (Designing Machine Learning Systems) — el manual de cabecera para MLOps moderno.


🎯 ¿De qué trata esta parte?

La parte que convierte un notebook que entrena bien en un sistema que funciona en producción 24/7. Cubre versionado (de datos, modelos y experimentos), packaging (Docker), serving (FastAPI, Kubernetes, serverless), monitoreo (data drift, model drift) y los rituales que evitan que el modelo se degrade silenciosamente (reentrenamiento programado, shadow deployment, canary releases).

Incluye una unidad fuerte de interpretabilidad (SHAP, LIME, PDP, ICE) porque ningún modelo va a producción sin alguien preguntando "¿por qué dijo eso?", y otra de testing (datos con Great Expectations, modelos con tests de invariancia) porque en ML el bug habitual no es un crash sino un drift silencioso.

🧩 Problemas que resuelve

🎓 Resultados de aprendizaje

Al finalizar esta parte, el estudiante podrá:

🗺️ Estructura temática

🛡️ Las 6 capas de protección que dejás armadas

Al terminar P4, todo modelo en producción está cubierto por:

  1. Data tests (206) — validación de cada batch antes de entrar al pipeline.
  2. Model tests (207) — INV/DIR/MFT/slice tests como gate de CI.
  3. Monitoring (202) — PSI/KS/Wasserstein + CBPE sobre tráfico real.
  4. Shadow (204) — challenger predice sin afectar usuarios.
  5. Canary (204) — rollout 1% → 5% → 25% → 100% con sticky assignment.
  6. Rollback automático (204) — vuelta al champion ante degradación de guardrails.

📥 Material descargable — parte completa

Materiales consolidados con TODAS las clases de esta parte (útiles para revisar offline o imprimir el bloque entero):



📚 Ficha por clase

14 de 14 clases tienen contenido pedagógico ampliado (📖 Definiciones · ⚠️ Errores comunes · FAQ).

194 Versionado de datos con DVC📖⚠️195 Versionado de modelos y experimentos con MLflow📖⚠️196 Feature stores (Feast)📖⚠️197 CI/CD para ML con GitHub Actions📖⚠️198 Docker para empaquetar modelos📖⚠️199 APIs con FastAPI sirviendo modelos📖⚠️200 Kubernetes para servir modelos a escala📖⚠️201 Serverless ML: AWS Lambda, GCP Cloud Functions📖⚠️202 Monitoreo: data drift, model drift, alertas📖⚠️203 Reentrenamiento programado📖⚠️204 Shadow deployment y canary releases📖⚠️205 Interpretabilidad: SHAP, LIME, PDP, ICE📖⚠️206 Testing de datos: Great Expectations, Deequ📖⚠️207 Testing de modelos: invariance + behavioral tests📖⚠️