Este repositorio contiene apuntes personales sobre estadística, bioestadística, machine learning y lenguaje de programación R. Para ver los documentos en formato web (html) visitar cienciadedatos.net o Rpubs.
-
Distributional Regression Forest: Random Forest probabilístico
-
Optimización con enjambre de partículas (Particle Swarm Optimization PSO)
-
Análisis farmacogenómico de paneles celulares: drug screening e identificación de biomarcadores
-
Análisis de Componentes Principales (Principal Component Analysis, PCA) y t-SNE
-
Árboles de predicción: bagging, random forest, boosting y C5.0
-
Métodos de regresión no lineal: Regresión Polinómica, Regression Splines, Smooth Splines y GAMs
-
Selección de predictores y mejor modelo: Subset selection, Ridge, Lasso y dimension reduction
-
Validación de modelos de regresion: Cross-validation, OneLeaveOut, Bootstrap
-
Comparación entre regresión logística, linear discriminant analisis (LDA) y K-NN
-
Linear Discriminant Analysis LDA y Quadratic Discriminant Analysis QDA
-
Ejemplo práctico de regresión lineal simple, múltiple, polinomial e interacción entre predictores
-
Resampling, Test de permutación, Simulación de Monte Carlo y Bootstrapping
-
Friedman test: alternativa no paramétrica al ANOVA de datos dependientes
-
Kruskal-Wallis test: alternativa no paramétrica al ANOVA independente
-
Inferencia para variables categóricas: proporciones, intervalos de confianza y test de hípótesis
-
Análisis de normalidad mediante gráficos y contrastes de hipótesis
This work by Joaquín Amat Rodrigo is licensed under a Creative Commons Attribution 4.0 International License.