91 535 76 96 madrid@tridatalon.com

CURSO

MACHINE LEARNING

AVANZADO

Información

Descripción del curso    

El curso tiene como objetivo presentar los diferentes algoritmos de machine Learning desde un punto de vista matemático y estadístico.

 



Requisitos    

Conocimientos matemáticos y estadísticos.

Antes de comenzar con la materia del curso se realizará, dos sesiones una recordatorio de 3 horas de algebra y otra de 3 horas de estadísticas.

 

Objetivos

El alumno adquirirá los conocimientos necesarios para afrontar un problema de explotación de los datos basándose en Machine Learning, desarrollar o modificar algoritmos existentes para la mejor adecuación a la solución del problema.

Este curso cubre los principales algoritmos existentes dentro de Machine Learning explicando los principios matemáticos en los que se basan (matemáticos y estadísticos).

El curso tiene una duración de 23h.

Metodología

Se impartirá una metodología práctica, la filosofía es que cuando más se aprende es haciendo las cosas. Las clase comenzarán con una parte teórica que se extenderá un 80% de la clase, después 20% lo dedicaremos a ver ejemplos usando notebooks auto contenidos, se propondrán ejercicios para que el alumno aplique lo aprendido. La parte teórica cobra mayor importancia en este curso.

Cursos (dos formatos)

  • Semana: martes, miércoles y jueves de 19 a 22h. La primera semana no habrá clase el miércoles.
  • Fin de Semana: viernes de 17 a 22h, y sábado de 9 am a 14h. Habrá un descanso de 20 min. en el intermedio

 Comienzo de las clases:

Programa

El curso tiene una duración de 23h y en el programa cubriremos los siguientes contenidos:

Álgebra
  • Álgebra matricial.
  • Operaciones y propiedades.
  • Cálculo Matricial.
  • Álgebra Matricial.
Estadística
  • Conceptos generales.
  • Probabilidad condicionada.
  • Variables aleatorias (funciones de densidad).
  • Media, varianza, covarianza.
  • Distribuciones más comunes.
  • Probabilidad 2 variables aleatorias.
  • Probabilidad múltiples variables aleatorias.
Aprendizaje supervisado
  • Regresión lineal.
  • Regresión lógica.
  • GLM – Generalized linear models.
  • Algoritmos de aprendizaje generativos.
  • Naive Bayes.
  • Support Vector Machine.
Teoría del conocimiento
  • Underfitting / Overfitting.
  • Minimización del riesgo empírico.
  • Dimensión VC.
  • X-Validation, leave one out.
  • Métricas. ROC, matrices de confusión. Clases balanceadas.
  • Selección de características.
Regularización
No supervisado
  • K-mean.
  • Mix of gausians.
  • Algoritmos EM.
  • PCA.
Aprendizaje por refuerzo
  • Apache Hadoop, Amazon EMR + Cluster.
  • EMR: Hive, Pig y streamming.
  • EMR: Spark.
  • Comienza el trabajo en el proyecto.

Profesores

Licenciado en matemáticas por la Universidad de Sevilla y científico de datos.

Leer más...

Se incorpora a Strategy Big Data en el 2015 como científico de datos. Beca de investigación sobre Operadores de Perron-Frobenius para el Instituto de Matemáticas de la universidad de Sevilla.Ha impartido clases en la Escuela Superior de Ingenieros de Sevilla. Perito estadístico en Grupo Pericial. Especialización autónoma en Machine Learning, Time Series y programación en R y Python.

Guillermo Gonzalez Sánchez

Profesor

Contáctanos