Skip to content

Examen Final de minería de datos concurso de kaggle

Notifications You must be signed in to change notification settings

valencig/final-mineria

Repository files navigation

Final-mineria

Archivo para que vayamos subiendo nuestro codigo y modelos y trabajemos más rapido.

Adicional El capítulo sobre el que se hará la pregunta es el 5.

https://christophm.github.io/interpretable-ml-book/

Instrucciones correo Marmol

Para el proyecto final se deberá resolver el problema descrito en https://www.kaggle.com/c/walmart-recruiting-trip-type-classification/data siguiendo la metodología CRISP-DM. Los entregables de cada etapa son:

Comprensión del negocio (R Markdown)

Antecedentes Determinación del objetivo Determinación de criterio de éxito (i.e. superar benchmark de modelos que utilizan datos sin preprocesar) Plan del proyecto

Comprensión de los datos (R - Bash)

Reporte reproducible de recolección de datos. Análisis exploratorio de datos (reporte reproducible) Univariado Bivariado Multivariado

Preparación de los datos (R - Bash)

Reporte reproducible de selección e integración de datos Reporte reproducible de limpieza de datos (incluyendo imputación) Reporte reproducible de ingeniería de características

Modelado (Python)

Diseño de prueba de modelo Selección de modelo (benchmark de modelos seleccionados) Ajuste de hiperparámetros óptimo

Evaluación (Python)

Evaluación del modelo final contra el conjunto de prueba Reentrenamiento final de modelo con datos de entrenamiento y prueba con hiperparámetros optimizados. Generación y carga de datos de prueba en Kaggle (reporte de posición final en tablero)

Implantación (Python)

Desarrollo de web service en flask para predecir resultados a partir de nuevos datos Reporte ejecutivo final con principales hallazgos e hitos del proyecto (5 minutos)

About

Examen Final de minería de datos concurso de kaggle

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •  

Languages