Al finalizar el módulo podrás realizar análisis profundos, manipulación, transformación y extracción de información de bases de datos para responder preguntas a problemas reales. Podrás obtener insights y generar múltiples visualizaciones que permitan comunicar diferentes conclusiones sobre la naturaleza y comportamiento de los datos; tomar decisiones inteligentes basadas en data. Además, podrás aplicar modelos de regresión y clasificación con Pandas para estar listo y dar el siguiente paso hacia la aplicación de modelos de Machine Learning.
Utilizar Python y sus librerías para realizar análisis robustos de datos, aplicando modelos estadísticos y matemáticos que permitan encontrar patrones y relaciones en los datos con el fin de generar visualizaciones de análisis univariados, bivariados y multivariados con Seaborn y Matplotlib y aplicar modelos de regresión, clasificación y predicción.
💡 Nota:
Para acceder a las soluciones, clona la branch
master
en tu computadora. Las soluciones no son visibles desde Github.Hay Retos que tienen funciones de verificación para hacer tests del código escrito por los alumnos. Cuando un Reto mencione una función de verificación, puedes encontrarla en la misma carpeta donde está el Reto, en un archivo llamado
helpers.py
.
Sesion-01:
Estimados de Locación y VariabilidadSesion-02:
Introducción a la visualización de datos: DistribucionesSesion-03:
Exploración de Variables Categóricas y Análisis MultivariableSesion-04:
Correlaciones y Regresión Linear SimpleSesion-05:
Distribuciones muestrales y técnicas de evaluación de modelosSesion-06:
Visualización de Datos AvanzadaSesion-07:
Pruebas A/B y Procesamiento de Lenguaje NaturalSesion-08:
Introducción a Machine Learning: Clasificación No Supervisada y Supervisada