Diplomado en Ciencia de datos

Este repositorio está dirigido a las personas que quieran obtener algún tipo de conocimiento en ciencia de datos, y es uno de los insumos principales del diplomado en ciencia de datos de la Universidad Pedagógica y Tecnológica de Colombia sede de Tunja.

Profesores

Andrés Felipe Flórez Olivera
Nicolás Castillo Ojeda
Juan Felipe Contreras Alcívar
Alhim Adonai Vera González

Contenido

A continuación se presenta cada una de las secciones que componen el diplomado, así como sus temas.

Fundamentos de ciencia de datos

Fundamentos de computación y matemáticas

Bases de datos relacionales, proceso EDA y visualización de datos

Métodos supervisados

En esta sección se va a explorar la introducción al aprendizaje automático (Machine Learning), se definirán los conceptos del aprendizaje supervisado y no supervisado, así como varias de sus aplicaciones reales en diferentes industrias.

Introducción a Scikit-Learn

Regresión lineal

En la ciencia de datos, la Regresión Lineal emerge como una herramienta crucial para la predicción, la inferencia estadística y la explicación de fenómenos estadísticos. Este método se basa en la suposición de una relación lineal entre una variable dependiente y una o más variables independientes, buscando identificar el mejor ajuste lineal posible. Puedes acceder al material interactivo en el siguiente link:

Regresión logística

La regresión logística es una técnica estadística fundamentalmente utilizada para la modelización y predicción de variables categóricas. A diferencia de la regresión lineal, que se emplea para predecir valores continuos, la regresión logística estima la probabilidad de que un evento ocurra o no, en función de una o más variables predictoras. En este paradigma, el modelo logístico utiliza una función sigmoide para transformar la combinación lineal de las variables predictoras, lo que permite interpretar fácilmente las probabilidades resultantes y tomar decisiones informadas. Puedes acceder al material interactivo en el siguiente link:

K-vecinos-más-cercanos (KNN)

Máquinas de Soporte Vectorial (SVM)

Árboles de decisión

Métodos de ensamble

Series de tiempo

Métodos No Supervisados

En esta sección, exploraremos los fundamentos y aplicaciones de varios métodos no supervisados. Cada tema incluye una explicación teórica, ejercicios prácticos y un caso aplicado para consolidar el aprendizaje. Puedes acceder al material interactivo en el siguiente link:

Reducción de Dimensionalidad: PCA (3 horas)

La Reducción de Dimensionalidad es una técnica crucial para el análisis de datos de alta dimensión. A través del Análisis de Componentes Principales (PCA), aprenderemos cómo simplificar los conjuntos de datos manteniendo la esencia de la información. Este módulo incluye teoría sobre la reducción de dimensionalidad, ejercicios prácticos para implementar PCA y un estudio de caso para aplicar lo aprendido en un contexto real.

Clustering (2 horas)

El Clustering es una técnica fundamental en el aprendizaje no supervisado que permite agrupar datos basados en su similitud. En este módulo, cubriremos los conceptos básicos del clustering, seguidos de ejercicios prácticos para entender cómo agrupar datos efectivamente.

K-Means (2 horas)

Como una de las técnicas de clustering más populares, K-Means ofrece una manera eficiente de clasificar un conjunto de datos en varios grupos (o 'clusters'). Este segmento profundiza en el algoritmo K-Means, acompañado de ejercicios prácticos para aplicar K-Means en diferentes conjuntos de datos y un caso aplicado relevante.

DBScan (3 horas)

DBScan es un algoritmo de clustering que se destaca por su capacidad de identificar clusters de formas arbitrarias. Este módulo te guiará a través de los principios de DBScan, cómo implementarlo y aplicarlo a un caso de estudio para ilustrar su utilidad en situaciones del mundo real.

Reglas de Asociación (4 horas)

Las Reglas de Asociación son herramientas poderosas para descubrir relaciones entre variables en grandes bases de datos. Este tema se enfoca en explicar cómo generar y aplicar reglas de asociación, con ejercicios prácticos para ilustrar su implementación y un caso aplicado para mostrar su aplicación en análisis de datos.

Name		Name	Last commit message	Last commit date
Latest commit History 91 Commits
Algebra Lineal		Algebra Lineal
EDA		EDA
Fundamentos de Bases de datos		Fundamentos de Bases de datos
Fundamentos de Calculo		Fundamentos de Calculo
Fundamentos de Probabilidad		Fundamentos de Probabilidad
Grupo_1_Diplomado		Grupo_1_Diplomado
Introducción a Python		Introducción a Python
Manipulación de datos con Numpy y Pandas		Manipulación de datos con Numpy y Pandas
Visualización de datos con PowerBI		Visualización de datos con PowerBI
Visualización de datos en Python		Visualización de datos en Python
logo		logo
metodos_no_supervisados		metodos_no_supervisados
metodos_supervisados		metodos_supervisados
Brochure-DiplomadoDatos-Cohorte1-UPTC.pdf		Brochure-DiplomadoDatos-Cohorte1-UPTC.pdf
Brochure_DiplomadoDSFull_2024.pdf		Brochure_DiplomadoDSFull_2024.pdf
Presentacion-1-Cohorte2-.pdf		Presentacion-1-Cohorte2-.pdf
Presentación Cierre Diplomado-Cohorte1.pdf		Presentación Cierre Diplomado-Cohorte1.pdf
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Diplomado en Ciencia de datos

Profesores

Contenido

Fundamentos de ciencia de datos

Fundamentos de computación y matemáticas

Bases de datos relacionales, proceso EDA y visualización de datos

Métodos supervisados

Introducción a Scikit-Learn

Regresión lineal

Regresión logística

K-vecinos-más-cercanos (KNN)

Máquinas de Soporte Vectorial (SVM)

Árboles de decisión

Métodos de ensamble

Series de tiempo

Métodos No Supervisados

Reducción de Dimensionalidad: PCA (3 horas)

Clustering (2 horas)

K-Means (2 horas)

DBScan (3 horas)

Reglas de Asociación (4 horas)

Caso Practico metodos no supervisados

About

Releases

Packages

Contributors 3

Languages

contreras-juan/UPTC_Diplomado_Ciencia_de_Datos

Folders and files

Latest commit

History

Repository files navigation

Diplomado en Ciencia de datos

Profesores

Contenido

Fundamentos de ciencia de datos

Fundamentos de computación y matemáticas

Bases de datos relacionales, proceso EDA y visualización de datos

Métodos supervisados

Introducción a Scikit-Learn

Regresión lineal

Regresión logística

K-vecinos-más-cercanos (KNN)

Máquinas de Soporte Vectorial (SVM)

Árboles de decisión

Métodos de ensamble

Series de tiempo

Métodos No Supervisados

Reducción de Dimensionalidad: PCA (3 horas)

Clustering (2 horas)

K-Means (2 horas)

DBScan (3 horas)

Reglas de Asociación (4 horas)

Caso Practico metodos no supervisados

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages