Mineria de Datos

Mineria de Datos

Mar 24, 2024 · 1 min read

Todas las diferentes clases se pueden encontrar aquí!

Este es el curso CC5205 de la Universidad de Chile. Lo reestructuré para que esté más adaptado a las técnicas actuales y más orientado al aprendizaje automático, ¡está fuertemente basado en scikit!

Aquí un resumen:

  1. Introducción general: Definiciones de Minería de Datos, Ciencia de Datos y contenido de la clase.
  2. Datos: Datos (des)estructurados, Representación, Normalización, Eliminación de ruido, …
  3. Exploración de datos: Estadística básica para la exploración de datos.
  4. Introducción al Aprendizaje Supervisado: Conceptos básicos de aprendizaje automático y aprendizaje supervisado.
  5. Introducción a la imparcialidad y los sesgos: Cómo evitar hacer modelos malos.
  6. Modelos lineales: Un modelo muy simple, ¡que es la base de las redes neuronales profundas!
  7. Clasificadores: KNN, Naive Bayes, Decision Tree, Boosting, Bagging, Random Forests.
  8. Reducción de dimensionalidad: Análisis de Componentes Principales, Análisis de Componentes Independientes, t-SNE, UMAP,…
  9. Métodos de clustering: Métodos de clustering y métricas asociadas.
  10. SVM, SVR: Pérdida bisagra, Lagrangiano, condiciones KKT, SVM no lineal, truco Kernel, SV Regressor
  11. Introducción a las Redes Neuronales: Fundamentos del aprendizaje profundo
  12. Introducción a la PNL (Ponente invitado: Juan José Alegría): Cómo tratar el lenguaje natural.