Parte 6 — Sistemas de Recomendación
7 clases · ~2–3 semanas · ✅ completada (junio 2026)
Fuente principal: Aggarwal Recommender Systems: The Textbook (Springer, 2016) + Koren/Bell/Volinsky 2009 (matrix factorization) + Hu/Koren/Volinsky 2008 (implicit feedback) + Burke 2002 (hybrids) + docs LightFM/Implicit/Surprise.
🎯 ¿De qué trata esta parte?
Una unidad especializada en una de las aplicaciones de ML con más impacto comercial directo: recomendar el siguiente producto, video, canción o contenido. Cubre los dos enfoques clásicos (filtrado colaborativo y content-based), su unión en sistemas híbridos, y la matemática detrás (factorización de matrices: SVD, ALS).
También cubre las métricas correctas (MAP@k, NDCG, recall@k — no accuracy) y el problema del cold-start (usuarios o items nuevos sin historial), que es donde mueren la mayoría de los recomendadores en su primer mes en producción. Termina con un tour por las librerías que se usan en la práctica (LightFM, Implicit, Surprise).
🧩 Problemas que resuelve
- Construir un recomendador user-based o item-based desde una matriz usuario-item dispersa.
- Aplicar factorización de matrices (SVD / ALS) para llegar a recomendaciones escalables.
- Combinar señales colaborativas y de contenido en un recomendador híbrido.
- Evaluar un recomendador con la métrica correcta (no con accuracy ni RMSE de rating).
- Mitigar el cold-start con estrategias basadas en contenido o popularidad.
🎓 Resultados de aprendizaje
Al finalizar esta parte, el estudiante podrá:
- Entrenar y evaluar un recomendador end-to-end con LightFM o Implicit sobre un dataset real (MovieLens o similar).
- Reportar la calidad del recomendador con MAP@k y NDCG, no con accuracy.
- Diseñar una estrategia explícita para usuarios y items nuevos.
🗺️ Estructura temática
- Filtrado colaborativo — clases 216–217 — user/item-based kNN, factorización de matrices (SVD truncado + ALS explicit/implicit).
- Content-based e híbridos — clases 218–219 — TF-IDF + sentence-transformers + FAISS, los 7 patrones de Burke + LightFM hybrid.
- Evaluación y cold-start — clases 220–221 — MAP@k / NDCG@k / recall@k + coverage + diversity, popularity Bayesiana + onboarding + bandits.
- Tooling — clase 222 — Surprise vs Implicit vs LightFM vs TF Recommenders, FAISS/Milvus para serving.
📥 Material descargable — parte completa
Materiales consolidados con TODAS las clases de esta parte (útiles para revisar offline o imprimir el bloque entero):
- 📄 Guía PDF — parte completa — todas las clases concatenadas con headings demoteados.
- 🎞️ Presentación PPTX — parte completa — portada + TOC + slides de cada clase.
📚 Ficha por clase
✨ 7 de 7 clases tienen contenido pedagógico ampliado (📖 Definiciones · ⚠️ Errores comunes · ❓ FAQ).