📚 Portal oficial del alumno

Tu punto de entrada al bootcamp

31 clases de Python y Data Science: fundamentos, visualización, estadística, machine learning, NLP, series de tiempo, redes neuronales y despliegue. Accesible para cualquier edad y nivel.

Temario completo

Las 31 clases del bootcamp

Un programa completo de Data Science: desde los fundamentos de Python hasta machine learning avanzado, NLP, series de tiempo, redes neuronales, ética en IA y despliegue de modelos. Accesible para cualquier edad y nivel de entrada.

00
🧭

Diagnóstico inicial

Quiz de entrada para estimar el punto de partida del grupo y orientar el ritmo del bootcamp.

  • Quiz diagnóstico de 30 preguntas
  • Presentación del programa y herramientas
  • Configuración del entorno
01
🐍

Fundamentos de Python

Variables, tipos, estructuras de control y funciones aplicadas a datos desde el primer día.

  • Variables y tipos de dato
  • Listas, diccionarios, loops
  • Funciones básicas
02
🗂️

Pandas y limpieza de datos

Carga, inspección, limpieza y transformación de DataFrames con pandas.

  • DataFrames y Series
  • Valores nulos y duplicados
  • Filtros y selección de columnas
03
📊

Visualización exploratoria

Gráficos para entender distribuciones, relaciones y anomalías en los datos.

  • Histogramas y boxplots
  • Scatter plots
  • Interpretación visual de datos
04
📐

Estadística descriptiva

Media, mediana, desviación estándar, correlaciones y cómo leerlas correctamente.

  • Medidas de tendencia central
  • Dispersión y varianza
  • Correlación e interpretación
05
📈

Visualización con Matplotlib

Control preciso de gráficos: títulos, ejes, colores, múltiples subplots.

  • Figure y Axes
  • Personalización de gráficos
  • Subplots y layouts
06
🔤

Texto, fechas y transformaciones

Procesamiento de strings, manejo de fechas y transformaciones avanzadas de columnas.

  • Operaciones con strings
  • Parsing y cálculo de fechas
  • Apply y funciones lambda
07
🔬

Mini proyecto guiado

Análisis completo de un dataset real: desde carga hasta conclusiones documentadas.

  • Pipeline end-to-end
  • Limpieza, análisis y gráficos
  • Redacción de conclusiones
08
🎤

Presentación de hallazgos

Cómo comunicar resultados a audiencias no técnicas con claridad y evidencia.

  • Narrativa de datos
  • Selección de gráficos para presentar
  • Práctica de exposición
09
🤖

Machine Learning — Intro

Qué es ML, cómo dividir datos y entrenar un primer modelo de regresión lineal.

  • Conceptos: train/test split
  • LinearRegression con sklearn
  • Métricas: MAE, RMSE, R²
10
🌳

Modelos supervisados

Clasificación con árboles de decisión y regresión logística. Evaluación y métricas.

  • DecisionTree y LogisticRegression
  • Matriz de confusión
  • Precision, recall, F1
11
⚙️

Evaluación y Pipelines

Validación cruzada, Pipelines de sklearn y búsqueda de hiperparámetros con GridSearchCV.

  • cross_val_score
  • Pipeline: preproceso + modelo
  • GridSearchCV
12
🏁

Proyecto final y cierre

Análisis integrador con dataset real: exploración, modelo y presentación de resultados.

  • Dataset a elección del alumno
  • Pipeline completo end-to-end
  • Presentación y defensa
13
🧭

¿Qué es la Ciencia de Datos?

Contexto, metodología CRISP-DM, tipos de datos y preguntas que la Data Science puede responder.

  • Ciclo de vida del dato
  • Preguntas descriptivas, predictivas y prescriptivas
  • Herramientas del bootcamp
14
🔢

NumPy — Arrays y cálculo vectorizado

La base numérica de Python: operaciones sobre miles de datos sin bucles, rápido y claro.

  • Crear y operar arrays
  • Indexado, slicing y filtrado
  • Estadísticas con numpy
15
🗄️

SQL básico con Python

Consultar bases de datos relacionales desde Python: el lenguaje universal de los datos empresariales.

  • SELECT, WHERE, GROUP BY
  • sqlite3 + pd.read_sql()
  • SQL vs pandas: equivalencias
16
🎨

Seaborn — Visualización estadística

Gráficos estadísticos ricos con pocas líneas: distribuciones, correlaciones y segmentos.

  • histplot, boxplot, violinplot
  • Heatmap de correlación
  • Pairplot y scatterplot con hue
17
🔬

Estadística inferencial

Saber si una diferencia es real o producto del azar: hipótesis, p-valor y pruebas estadísticas.

  • H0, H1 y p-valor
  • t-test y chi-cuadrado
  • Intervalos de confianza
18
⚙️

Feature Engineering

Crear variables mejores para que los modelos aprendan más y mejor de los mismos datos.

  • Encoding y escalado
  • Binning e interacciones
  • Selección de variables
19
📉

Regresión lineal y múltiple

Predecir valores numéricos: la línea que mejor resume una relación entre variables.

  • LinearRegression con sklearn
  • Coeficientes e interpretación
  • R² y residuales
20
🌲

Árboles de decisión y Random Forest

Modelos basados en preguntas de sí/no: claros, potentes y con importancia de variables.

  • DecisionTreeClassifier
  • Overfitting y max_depth
  • RandomForest: votación de árboles
21

Gradient Boosting

El algoritmo más usado en competencias: cada árbol corrige los errores del anterior.

  • GradientBoostingClassifier
  • XGBoost introducción
  • Comparar 4 modelos
22
🔵

Clustering y segmentación

Agrupar datos similares sin etiquetas: encontrar segmentos naturales en cualquier dataset.

  • K-Means y método del codo
  • Silhouette score
  • DBSCAN y visualización
23
🗜️

Reducción de dimensionalidad — PCA

Comprimir muchas variables en pocas sin perder la información esencial.

  • Maldición de la dimensionalidad
  • PCA y varianza explicada
  • Biplot y visualización 2D
24
📅

Series de tiempo

Analizar datos que cambian con el tiempo: tendencias, estacionalidad y pronósticos simples.

  • resample y rolling mean
  • Tendencia y estacionalidad
  • seasonal_decompose
25
🎯

Ajuste de hiperparámetros

Calibrar los parámetros de un modelo para obtener el mejor rendimiento posible.

  • GridSearchCV y RandomizedSearchCV
  • Curvas de aprendizaje
  • Curvas de validación
26
💬

NLP — Texto como datos

Convertir palabras en números para clasificar opiniones, tickets y comentarios automáticamente.

  • CountVectorizer y TF-IDF
  • Clasificación de sentimientos
  • Palabras más importantes
27
🚨

Detección de anomalías

Encontrar los puntos que no siguen el patrón esperado: fraudes, fallos y eventos raros.

  • IQR y Z-score
  • Isolation Forest
  • Local Outlier Factor
28
🤝

Ética, sesgo y privacidad

El uso responsable de datos y modelos: por qué la ética no es opcional en Data Science.

  • Tipos de sesgo en datos
  • Privacidad y GDPR
  • IA responsable y SHAP
29
🧠

Redes neuronales — primera mirada

Cómo aprende una red neuronal: neuronas, capas, activación y comparación con modelos clásicos.

  • Neurona artificial y capas
  • MLPClassifier con sklearn
  • MLP vs Random Forest
30
🚀

Despliegue básico de modelos

Llevar un modelo del notebook a producción: guardarlo, cargarlo y exponerlo como API.

  • joblib: guardar y cargar modelos
  • Flask API con endpoint /predict
  • Prueba con requests

Metodología

Cómo trabajamos en cada clase

Cada sesión sigue el mismo ciclo de cuatro pasos para que el aprendizaje sea sólido y no solo mecánico.

01

Entender

Se presenta el objetivo del bloque y por qué sirve en un problema real de datos.

02

Practicar

Se trabaja con ejemplos cortos, ejercicios guiados y variaciones para fijar la lógica.

03

Interpretar

El resultado no se deja solo en código: se traduce a una conclusión clara y comunicable.

04

Consolidar

Se revisan errores comunes, se guarda evidencia y se deja una tarea breve o reto.

Recursos

Lo que debes tener a mano como alumno

📁

Repositorio del curso

Materiales, clases, datasets y estructura general del bootcamp. Todo versionado y accesible.

Abrir repositorio →
📦

Datasets de práctica

Casos sintéticos para trabajar Python, pandas, gráficos e interpretación en cada clase.

Ver datasets →
📓

Notebooks y clases

Clases, notebooks, ejercicios y guías que el docente va liberando y usando en sala.

Ver clases →
🏛️

Vista institucional

Resumen del producto educativo, implementación y hoja de ruta del bootcamp.

Abrir presentación →

Uso de tecnología

Cómo usar herramientas digitales sin perder aprendizaje

Las herramientas digitales ayudan. No reemplazan el razonamiento ni la práctica.

💭

Piensa primero

Antes de buscar una respuesta, intenta formular tu propia idea o hipótesis sobre el problema.

🔍

Consulta después

Usa herramientas digitales para comparar, aclarar o depurar, no para reemplazar todo el proceso.

Verifica siempre

Si una herramienta te entrega código o una explicación, revisa si responde al objetivo real del ejercicio.

🗣️

Explica al final

Si no puedes explicar lo que hiciste con tus palabras, aún no está realmente aprendido.