Preprocesamiento de datos en procesos industriales para machine learning: Claves para el éxito
El objetivo principal de este curso es proporcionar a los participantes las habilidades necesarias para realizar un análisis exploratorio y una preparación eficiente de datos mediante el lenguaje de programación python.
La metodología integrará aspectos teóricos y prácticos, con ejercicios específicos para consolidar el aprendizaje.
Se emplearán casos de estudio para ilustrar la aplicación en escenarios del mundo real, permitiendo a los participantes transferir sus conocimientos en procesos industriales.
Contenido
-
Introducción al entorno de desarrollo: Jupyter notebooks
-
Lectura y escritura de diferentes formatos de datos
-
Exploración y manipulación de datos: inspección, ordenación, subconjuntos y agregación
-
Introducción al análisis: Limpieza inicial, valores faltantes y valores atípicos
-
Preprocesado: Estandarización y normalización de los datos, manejo de variables categóricas
Requisitos
-
Conocimientos básicos de programación como: variables, tipos de datos, estructuras de control y funciones.
-
Familiaridad con Python: No se requiere experiencia extensa con Python pero se recomiendo conocer la sintaxis básica.
-
Conocer conceptos básicos estadísticos.