Parte 3 — Estadística Inferencial y Causal
19 clases · ~6 semanas (puede intercalarse con Parte 1) · ✅ Contenido completo (expansión 2026: effect size, BCa bootstrap, CUPED+sequential, DoubleML, Synthetic Controls, PyMC v5/NumPyro/ArviZ)
Fuente principal: ISLP (Statistical Learning with Python) — rigor matemático en tests, intervalos y diseño experimental. Complementado con Bruce & Bruce (Practical Statistics for Data Scientists, 2ª ed.), Pearl (Book of Why) para causalidad e Imbens & Rubin para inferencia causal moderna.
Cada clase tiene su README.md con objetivo, resultados de aprendizaje verificables, dataset recomendado, 5 ejercicios y homework con criterio de aceptación. Todas las 19 clases incluyen las tres secciones del patrón pedagógico v2.2.0:
- 📖 Definiciones y características — términos técnicos con explicación y características clave.
- ⚠️ Errores comunes — tabla de síntomas/mensajes con causa y solución concretas (las trampas que vienen de Parte 1 + las propias de inferencia).
- ❓ Preguntas frecuentes — FAQs auténticas que aparecen al estudiar cada tema.
📌 Cobertura moderna (audit 2026) — 6 clases dedicadas:
Todos los temas modernos ahora son clases independientes con patrón completo + ejercicios + homework:
- Clase 177 → Effect size dedicado (Cohen's d, Hedges' g, Cliff's δ, CLES) con pingouin.
- Clase 184 → BCa bootstrap y APIs modernas de scipy (
scipy.stats.bootstrap,permutation_test). - Clase 186 → CUPED, sequential testing y always-valid p-values (Deng 2013, Howard 2021).
- Clase 189 → DoubleML / EconML para ATE/CATE con ML como nuisance (Chernozhukov 2018).
- Clase 191 → Synthetic Control Method dedicado (pysyncon, SparseSC, Synthetic DiD).
- Clase 193 → Stack bayesiano moderno: PyMC v5, NumPyro, ArviZ.
🎯 ¿De qué trata esta parte?
La parte que separa al data scientist del "sklearn user". Cubre inferencia estadística (tests, intervalos, bootstrap), diseño de experimentos (A/B testing real, no solo p < 0.05) e inferencia causal (DAGs, confounders, instrumentos, DiD, uplift) — herramientas que se usan a diario para responder preguntas tipo "¿esto que cambiamos en el producto realmente movió la métrica?" o "¿este coeficiente significa lo que creo que significa?".
Se intercala bien con la Parte 1 porque la mayoría de los problemas de evaluación de modelos (comparar dos clasificadores, decidir si una mejora es real) son problemas estadísticos disfrazados. Incluye una introducción a estadística bayesiana con PyMC para abrir la puerta a inferencia con incertidumbre explícita.
🧩 Problemas que resuelve
- Decidir si una diferencia observada es estadísticamente significativa o ruido.
- Diseñar un A/B test con tamaño de muestra y poder estadístico correctos, no a ojo.
- Aplicar el test correcto según los supuestos del dato (paramétrico vs no paramétrico, pareado vs independiente).
- Corregir comparaciones múltiples (Bonferroni, FDR) para no inflar el falso positivo.
- Estimar incertidumbre con bootstrap cuando los supuestos clásicos no aplican.
- Identificar confounders en un DAG y elegir la estrategia causal correcta (control, IV, DiD, uplift).
- Hacer una inferencia bayesiana básica con MCMC en PyMC.
🎓 Resultados de aprendizaje
Al finalizar esta parte, el estudiante podrá:
- Diseñar y analizar un A/B test end-to-end, incluyendo poder estadístico y corrección por múltiples métricas.
- Aplicar bootstrap para construir intervalos de confianza no paramétricos sobre cualquier estimador.
- Dibujar el DAG de un problema de negocio y justificar qué variables controlar.
- Implementar un modelo bayesiano simple en PyMC e interpretar el posterior.
🗺️ Estructura temática
- Tests clásicos — clases 175–181 — distribuciones, t-test, chi-cuadrado, ANOVA, no paramétricos, comparaciones múltiples.
- Estimación e incertidumbre — clases 182–184 — intervalos de confianza, bootstrap, permutation tests.
- Experimentación y causalidad — clases 185–191 — A/B testing, diseño experimental, inferencia causal con DAGs, uplift / DiD.
- Inferencia bayesiana — clases 192–193 — priors, posterior, MCMC con PyMC.
📥 Material descargable — parte completa
Materiales consolidados con TODAS las clases de esta parte (útiles para revisar offline o imprimir el bloque entero):
- 📄 Guía PDF — parte completa — todas las clases concatenadas con headings demoteados.
- 🎞️ Presentación PPTX — parte completa — portada + TOC + slides de cada clase.
📚 Ficha por clase
✨ 19 de 19 clases tienen contenido pedagógico ampliado (📖 Definiciones · ⚠️ Errores comunes · ❓ FAQ).