Descripción
Curso Data Science Gratis
Objetivos:
Al finalizar este curso habrás adquirido el conocimiento y dominio en profundidad de las técnicas y tecnologías necesarias para definir y desarrollar modelos avanzados de Machine Learning (Aprendizaje Automático), enfocadas a la selección del modelo óptimo, para su posterior puesta en producción con la máxima precisión y calidad, pudiendo realizar modelos de Clustering, Predicciones y Clasificaciones a un nivel profesional.
Aptitudes obtenidas:
El curso de Ciencia de Datos se ha diseñado para que los asistentes al mismo adquieran un nivel profesional real, que les permita trabajar como Científico de Datos desde el primer día tras la finalización del curso. Bajo la premisa de aprender haciendo, se ha orientado el curso hacia personas interesadas en adquirir los conocimientos y habilidades necesarios para ejercer esta profesión con un nivel alto y estrictamente profesional.
Requisitos previos:
Conocimientos básicos de estadística.
Dirigido a:
Cualquier persona que quiera introducirse en la realización de modelos predictivos.
Contenidos:
Día 1 (5 horas)
Modelización No-Supervisada
Atendiendo a la progresividad del curso, comenzaremos por definir y desarrollar modelos en los que se prescinde del etiquetado o variable dependiente, centrándonos en las técnicas de Clustering y Reducción Dimensional.
Para ello, aprenderemos a implementar las principales técnicas y tecnologías que nos permitan alcanzar el objetivo planeado, referente a la modelización no-supervisada:
SKL-K Means.
- SKL-PCA (Principal Components Analysis).
- SKL-PLS (Partial Least Squares regression).
Día 2 (5 horas)
Clustering:
Desarrollaremos las principales técnicas de agrupamiento para identificar conjuntos de casos con diferencias significativas entre sí, lo que te permitirá identificar los patrones que determinan la pertenencia de cada uno de los casos a cada grupo.
Día 3 (5 horas)
Reducción Dimensional:
Aprenderás las técnicas para reducir las dimensiones de los datos de partida, centradas éstas en las variables independientes, lo que permitirá mantener o mejorar sus propiedades matemáticas de cara a la posterior modelización.
Modelización Supervisada
Una vez alcances soltura en la modelización no-supervisada, pasaremos a definir e implementar modelos en los que se dispone de la variable dependiente o etiquetado, guiándote en la modelización orientada a predicciones o clasificaciones.
Día 4 (5 horas)
Siendo las tecnologías que aprenderás para este tipo de modelización, de las que implementaremos de modo principal:
SKL-Linear Models.
- SKL-Linear SVM (Máquinas de Vector Soporte).
- SKL-Decission Tree (Árboles de Clasificación).
- SKL-Random Forest (Ensemble).
- SKL-MLP NN (Redes Neuronales).
Día 5 (5 horas)
Regresión
Desarrollarás modelos de Machine Learning para realizar predicciones a futuro de eventos basados en patrones implícitos en un conjunto de datos.
Día 6 (5 horas)
Clasificación
Implementarán modelos de Machine Learning para identificar patrones en el conjunto de datos a estudio que te permitirán inferir clasificaciones de casos con características similares.
Pre-procesado de Datos
Aprenderás técnicas enfocadas a la mejora de la calidad de los datos a tratar, como base fundamental para mejorar la precisión y calidad de los modelos.
Partiremos para ello de las siguientes tecnologías:
Día 7 (5 horas)
NumPy.
- Pandas.
- SKL-Preprocessing & Normatization.
- SKL-PipeLine (Estructuración avanzada de flujos de datos).
Día 8 (5 horas)
Depurado & Transformación
Comenzaremos por la limpieza de datos de partida, centrada en la eliminación o sustitución de datos faltantes y atípicos y su transformación dimensional, al objeto de conseguir la homogeneización de los datos como base fundamental para el cálculo.
Día 9 (5 horas)
Formación de Tuberías (PipeLines)
Aprenderás a implementar técnicas y tecnologías avanzadas para la definición de Data-Pipelines para generar flujos de datos estructurados que te facilitarán la modelización posterior.
Selección del Modelo Óptimo (GridSearchCV)
En este apartado, que cierra la fase del Machine Learning, aprenderás a definir e implementar técnicas avanzadas de optimización, al objeto de que encuentres el mejor modelo posible, de entre cientos, miles o millones de modelos (Big Data), que minimice el error matemático y, por ende, maximice su precisión.
Dominando las siguientes tecnologías implicadas:
Día 10 (5 horas)
SKL-Grid Search Cross-Validation (Técnicas de optimización Avanzada).
Día 11 (5 horas)
Tuneado de Hiper-parámetros
Aprenderás el modo de implementar técnicas avanzadas de combinatoria haciendo un barrido de hipótesis, entre cientos, miles o millones de combinaciones hasta alcanzar el óptimo.
Día 12 (5 horas)
Definir el Operador & Parametrización del Modelo Óptimo
Una vez asimilado todo este conocimiento, podrás determinar, mediante cómputo avanzado, cual es la estructura matemática que nos garantice el modelo óptimo para su posterior puesta en producción, es decir, sabrás cual es la mejor librería (tecnología) y cuales son los hiper-parámetros que te darán el mejor resultado posible para la precisión del modelo.
Este curso incluye:
- Manual del curso
- Certificado de asistencia
Formulario de preinscripción:
Proyecto 100% subvencionado por LABORA y financiado por la Unión Europea–Next Generation EU
FNOFOR/2022/80/46
Si necesita alguna información adicional sobre la formación 100% subvencionada de Labora, puede ponerse en contacto con nuestro equipo y le informaremos de forma detallada cualquier duda que pueda surgirle.
+34 963 694 964 – formacion@nextraining.es

