Archivo para que vayamos subiendo nuestro codigo y modelos y trabajemos más rapido.
Adicional El capítulo sobre el que se hará la pregunta es el 5.
https://christophm.github.io/interpretable-ml-book/
Para el proyecto final se deberá resolver el problema descrito en https://www.kaggle.com/c/walmart-recruiting-trip-type-classification/data siguiendo la metodología CRISP-DM. Los entregables de cada etapa son:
Antecedentes Determinación del objetivo Determinación de criterio de éxito (i.e. superar benchmark de modelos que utilizan datos sin preprocesar) Plan del proyecto
Reporte reproducible de recolección de datos. Análisis exploratorio de datos (reporte reproducible) Univariado Bivariado Multivariado
Reporte reproducible de selección e integración de datos Reporte reproducible de limpieza de datos (incluyendo imputación) Reporte reproducible de ingeniería de características
Diseño de prueba de modelo Selección de modelo (benchmark de modelos seleccionados) Ajuste de hiperparámetros óptimo
Evaluación del modelo final contra el conjunto de prueba Reentrenamiento final de modelo con datos de entrenamiento y prueba con hiperparámetros optimizados. Generación y carga de datos de prueba en Kaggle (reporte de posición final en tablero)
Desarrollo de web service en flask para predecir resultados a partir de nuevos datos Reporte ejecutivo final con principales hallazgos e hitos del proyecto (5 minutos)