Python Data Science Program

Parte 3 — Estadística Inferencial y Causal

19 clases · ~6 semanas (puede intercalarse con Parte 1) · ✅ Contenido completo (expansión 2026: effect size, BCa bootstrap, CUPED+sequential, DoubleML, Synthetic Controls, PyMC v5/NumPyro/ArviZ)

Fuente principal: ISLP (Statistical Learning with Python) — rigor matemático en tests, intervalos y diseño experimental. Complementado con Bruce & Bruce (Practical Statistics for Data Scientists, 2ª ed.), Pearl (Book of Why) para causalidad e Imbens & Rubin para inferencia causal moderna.

Cada clase tiene su README.md con objetivo, resultados de aprendizaje verificables, dataset recomendado, 5 ejercicios y homework con criterio de aceptación. Todas las 19 clases incluyen las tres secciones del patrón pedagógico v2.2.0:

📌 Cobertura moderna (audit 2026) — 6 clases dedicadas:

Todos los temas modernos ahora son clases independientes con patrón completo + ejercicios + homework:


🎯 ¿De qué trata esta parte?

La parte que separa al data scientist del "sklearn user". Cubre inferencia estadística (tests, intervalos, bootstrap), diseño de experimentos (A/B testing real, no solo p < 0.05) e inferencia causal (DAGs, confounders, instrumentos, DiD, uplift) — herramientas que se usan a diario para responder preguntas tipo "¿esto que cambiamos en el producto realmente movió la métrica?" o "¿este coeficiente significa lo que creo que significa?".

Se intercala bien con la Parte 1 porque la mayoría de los problemas de evaluación de modelos (comparar dos clasificadores, decidir si una mejora es real) son problemas estadísticos disfrazados. Incluye una introducción a estadística bayesiana con PyMC para abrir la puerta a inferencia con incertidumbre explícita.

🧩 Problemas que resuelve

🎓 Resultados de aprendizaje

Al finalizar esta parte, el estudiante podrá:

🗺️ Estructura temática

📥 Material descargable — parte completa

Materiales consolidados con TODAS las clases de esta parte (útiles para revisar offline o imprimir el bloque entero):



📚 Ficha por clase

19 de 19 clases tienen contenido pedagógico ampliado (📖 Definiciones · ⚠️ Errores comunes · FAQ).

175 Distribuciones: normal, binomial, Poisson, exponencial📖⚠️176 Test t (una muestra, dos muestras, pareado)📖⚠️177 Effect size dedicado: Cohen's d, Hedges' g, Cliff's δ con pingouin📖⚠️178 Test chi-cuadrado de independencia y bondad de ajuste📖⚠️179 ANOVA (one-way, two-way)📖⚠️180 Tests no paramétricos: Mann-Whitney, Wilcoxon, Kruskal-Wallis📖⚠️181 Corrección de comparaciones múltiples (Bonferroni, FDR)📖⚠️182 Intervalos de confianza📖⚠️183 Bootstrap y permutation tests📖⚠️184 BCa bootstrap y APIs modernas de scipy📖⚠️185 A/B testing: tamaño de muestra, poder estadístico📖⚠️186 CUPED, sequential testing, always-valid p-values📖⚠️187 Diseño experimental📖⚠️188 Inferencia causal: DAGs, confounders, instrumentos📖⚠️189 DoubleML / EconML: Machine Learning para causalidad📖⚠️190 Uplift modeling, DiD (difference-in-differences)📖⚠️191 Synthetic Control Method dedicado (pysyncon, SparseSC)📖⚠️192 Bayes intro: priors, posterior, MCMC con PyMC📖⚠️193 Stack bayesiano moderno: PyMC v5, NumPyro, ArviZ📖⚠️