Prerrequisitos
Entorno, Python aplicado, NumPy, pandas, visualización, SQL, NoSQL, APIs. La base sin la que nada del resto tiene sentido.
- 49 clases · 6 bloques temáticos
- Setup, Git, JupyterLab
- Datos tabulares, Polars, Parquet, async
📚 Portal oficial del alumno
Pauta avanzada de 232 clases en 9 partes (v3.8.0, expansión 2026): prerrequisitos, ML clásico, Deep Learning (PyTorch + LLMs + multimodal), estadística inferencial y causalidad moderna, MLOps, ingeniería de datos, recomendadores, ética y capstones. Derivada de Géron, VanderPlas, Huyen, ISLP, Barocas/Hardt/Narayanan + papers seminales 2024-2026 (Flash Attention, LoRA, DPO, ControlNet, MCP).
Temario completo
Pauta avanzada y completa: prerrequisitos (Python, NumPy, pandas, Polars/Arrow/DuckDB, viz, SQL, NoSQL, async), ML clásico (con Optuna, SHAP, calibración, Model Cards), Deep Learning (Keras + PyTorch + Lightning, CNN, Transformers, LLMs con LoRA/DPO/vLLM, multimodal CLIP/Whisper, MCP y agentes, SDXL/ControlNet, ONNX, JAX), estadística inferencial y causalidad moderna (DoubleML, Synthetic Controls, CUPED, PyMC v5), MLOps, ingeniería de datos, recomendadores, ética y capstones. Las 9 partes (232 clases) 100% completas y modernizadas 2024-2026.
Entorno, Python aplicado, NumPy, pandas, visualización, SQL, NoSQL, APIs. La base sin la que nada del resto tiene sentido.
Regresión, clasificación, ensembles (Random Forest, XGBoost, LightGBM, CatBoost), no supervisado, PCA, anomalías.
Keras + PyTorch + Lightning, CNN (SAM, YOLOv11), Transformers + Flash Attention/RoPE/GQA, LLMs (LoRA/QLoRA, DPO, vLLM), multimodal (CLIP, Whisper), MCP + agentes ReAct, GANs, difusión (SDXL+ControlNet), RL, despliegue (ONNX, JAX, Vertex AI).
Hipótesis con effect size (Cohen's d), BCa bootstrap, A/B testing moderno (CUPED + sequential), diseño experimental, causalidad (DAGs, DoubleML/EconML, Synthetic Controls, uplift, DiD), Bayes con PyMC v5 + NumPyro + ArviZ.
Docker, FastAPI, Kubernetes, MLflow, DVC, CI/CD, monitoreo de drift, interpretabilidad con SHAP, testing de datos.
Pipelines ETL/ELT con Airflow y Prefect, PySpark, Polars, data warehouses (BigQuery, Snowflake, DuckDB), streaming.
Filtrado colaborativo, factorización de matrices (SVD, ALS), content-based, híbridos, métricas MAP@k / NDCG.
Sesgos algorítmicos, métricas de equidad, privacidad diferencial, federated learning, GDPR / AI Act, reproducibilidad.
Tres proyectos end-to-end (tabular, NLP o series, visión) más portafolio público en GitHub Pages.
Metodología
Cada sesión sigue el mismo ciclo de cuatro pasos para que el aprendizaje sea sólido y no solo mecánico.
Se presenta el objetivo del bloque y por qué sirve en un problema real de datos.
Se trabaja con ejemplos cortos, ejercicios guiados y variaciones para fijar la lógica.
El resultado no se deja solo en código: se traduce a una conclusión clara y comunicable.
Se revisan errores comunes, se guarda evidencia y se deja una tarea breve o reto.
Recursos
Materiales, clases, datasets y estructura general del programa. Todo versionado y accesible.
Abrir repositorio →Casos sintéticos para trabajar Python, pandas, gráficos e interpretación en cada clase.
Ver datasets →Clases, notebooks, ejercicios y guías que el docente va liberando y usando en sala.
Ver clases →Resumen del producto educativo, implementación y hoja de ruta del programa.
Abrir presentación →App Windows portable (Qt nativa, 274 MB), APK Android debug (139 MB) y bundles PDF/PPTX del curso completo. Release del 19 de junio de 2026 con SHA256SUMS.
Ir al release v3.8.0 →Uso de tecnología
Las herramientas digitales ayudan. No reemplazan el razonamiento ni la práctica.
Antes de buscar una respuesta, intenta formular tu propia idea o hipótesis sobre el problema.
Usa herramientas digitales para comparar, aclarar o depurar, no para reemplazar todo el proceso.
Si una herramienta te entrega código o una explicación, revisa si responde al objetivo real del ejercicio.
Si no puedes explicar lo que hiciste con tus palabras, aún no está realmente aprendido.