From bf5e265fe644d4d3b6e7de0789346f0b4a89db6b Mon Sep 17 00:00:00 2001 From: Juan Gabriel Date: Wed, 26 Dec 2018 10:45:28 +0100 Subject: [PATCH] Tema 8 revisado. --- teoria/Tema8.Rmd | 12 ++++++------ teoria/Tema8.html | 16 ++++++++++------ 2 files changed, 16 insertions(+), 12 deletions(-) diff --git a/teoria/Tema8.Rmd b/teoria/Tema8.Rmd index 1ce402eb..3323db20 100644 --- a/teoria/Tema8.Rmd +++ b/teoria/Tema8.Rmd @@ -268,7 +268,7 @@ df.dado ```
-Si nos piden el cuantil $Q_{0.3}$, sabemos que este es el primer elemento de la lista cuya frecuencia relativa absoluta es mayor o igual a 0.3. Este se corresponde con la puntuación 1. +Si nos piden el cuantil $Q_{0.3}$, sabemos que este es el primer elemento de la lista cuya frecuencia relativa acumulada es mayor o igual a 0.3. Este se corresponde con la puntuación 1.
## Ejemplo 3 @@ -317,7 +317,7 @@ Las medidas de dispersión evalúan lo dispersos que - El rango o recorrido, que es la diferencia entre el máximo y el mínimo de las observaciones. -- El rango intercuantílico, que es la diferencia entre el tercer y primer cuartil, $Q_{0.75}-Q_{0.25}$. +- El rango intercuartílico, que es la diferencia entre el tercer y primer cuartil, $Q_{0.75}-Q_{0.25}$. - La varianza, a la que denotaremos por $s^2$, es la media aritmética de las diferencias al cuadrado entre los datos $x_i$ y la media aritmética de las observaciones, $\bar{x}$. $$s^2 = \frac{\sum_{j=1}^n(x_j-\bar{x})^2}{n}=\frac{\sum_{j=1}^kn_j(X_j-\bar{x})^2}{n}=\sum_{j=1}^kf_j(X_j-\bar{x})^2$$. @@ -334,7 +334,7 @@ $$\tilde{s}^2 = \frac{n}{n-1}s^2 = \frac{\sum_{j=1}^n(x_i-\bar{x})^2}{n-1}$$ Propiedades de la varianza. - $s^2\ge 0$. Esto se debe a que, por definición, es una suma de cuadrados de números reales. -- $s^2 = 0\Rightarrow(x_j-\bar{x})=0\ \forall j=,\dots,n$. En consecuencia, si $s^2=0$, entonces todos los datos son iguales. +- $s^2 = 0\Longrightarrow x_j-\bar{x}=0\ \forall j= 1,\dots,n$. En consecuencia, si $s^2=0$, entonces todos los datos son iguales. - $s^2 = \sum_{j=1}^nx_j^2-n\bar{x}^2=\frac{\sum_{j=1}^nx_j^2}{n}-\bar{x}^2$. Es decir, la varianza es la media de los cuadrados de los datos menos el cuadrado de la media aritmética de estos. ## Varianza y varianza muestral @@ -353,7 +353,7 @@ En cambio, si la muestra es relativamente pequeña (digamos $n<30$), entonces la La diferencia entre desviación típica y desviación típica muestral es análoga. -Con R, calcularemos la varianza y la desviación típica muestrales. Con lo cual, si queremos calcular las que no son muestrales, tendremos que multiplicarlas por $\frac{n-1}{n}$, donde $n$ es el tamaño de la muestra. Lo veremos a continuación. +Con `R`, calcularemos la varianza y la desviación típica **muestrales**. Con lo cual, si queremos calcular las que no son muestrales, tendremos que multiplicarlas por $\frac{n-1}{n}$, donde $n$ es el tamaño de la muestra. Lo veremos a continuación. ## Varianza y desviación típica @@ -365,7 +365,7 @@ Medida de dispersión | Instrucción --------------------|-------------------- Valores mínimo y máximo | `range(x)` Rango | `diff(range(x))` -Rango intercuantílico | `IQR(x, type = ...)` +Rango intercuartílico | `IQR(x, type = ...)` Varianza muestral | `var(x)` Desviación típica muestral | `sd(x)` Varianza | `var(x)*(length(x)-1)/length(x)` @@ -399,7 +399,7 @@ Al aplicar esta función a un data frame, esta se aplica a todas sus variables d ```{r} cangrejos = read.table("../data/datacrab.txt", header = TRUE) #Cargamos el data frame -cangrejos = cangrejos[-1] +cangrejos = cangrejos[-1] #Eliminamos la primera columna summary(cangrejos) #Aplicamos la función summary ``` diff --git a/teoria/Tema8.html b/teoria/Tema8.html index 74706951..be74d794 100644 --- a/teoria/Tema8.html +++ b/teoria/Tema8.html @@ -63,6 +63,10 @@ font-style: italic; } + summary { + display: list-item; + } + slides > slide { -webkit-transition: all 0.4s ease-in-out; -moz-transition: all 0.4s ease-in-out; @@ -414,7 +418,7 @@

4 4 8 0.16 50 1.00
-

Si nos piden el cuantil \(Q_{0.3}\), sabemos que este es el primer elemento de la lista cuya frecuencia relativa absoluta es mayor o igual a 0.3. Este se corresponde con la puntuación 1.

+

Si nos piden el cuantil \(Q_{0.3}\), sabemos que este es el primer elemento de la lista cuya frecuencia relativa acumulada es mayor o igual a 0.3. Este se corresponde con la puntuación 1.

Ejemplo 3

@@ -471,7 +475,7 @@

  • El rango o recorrido, que es la diferencia entre el máximo y el mínimo de las observaciones.

  • -
  • El rango intercuantílico, que es la diferencia entre el tercer y primer cuartil, \(Q_{0.75}-Q_{0.25}\).

  • +
  • El rango intercuartílico, que es la diferencia entre el tercer y primer cuartil, \(Q_{0.75}-Q_{0.25}\).

  • La varianza, a la que denotaremos por \(s^2\), es la media aritmética de las diferencias al cuadrado entre los datos \(x_i\) y la media aritmética de las observaciones, \(\bar{x}\). \[s^2 = \frac{\sum_{j=1}^n(x_j-\bar{x})^2}{n}=\frac{\sum_{j=1}^kn_j(X_j-\bar{x})^2}{n}=\sum_{j=1}^kf_j(X_j-\bar{x})^2\].

@@ -489,7 +493,7 @@

  • \(s^2\ge 0\). Esto se debe a que, por definición, es una suma de cuadrados de números reales.
  • -
  • \(s^2 = 0\Rightarrow(x_j-\bar{x})=0\ \forall j=,\dots,n\). En consecuencia, si \(s^2=0\), entonces todos los datos son iguales.
  • +
  • \(s^2 = 0\Longrightarrow x_j-\bar{x}=0\ \forall j= 1,\dots,n\). En consecuencia, si \(s^2=0\), entonces todos los datos son iguales.
  • \(s^2 = \sum_{j=1}^nx_j^2-n\bar{x}^2=\frac{\sum_{j=1}^nx_j^2}{n}-\bar{x}^2\). Es decir, la varianza es la media de los cuadrados de los datos menos el cuadrado de la media aritmética de estos.
@@ -509,7 +513,7 @@

La diferencia entre desviación típica y desviación típica muestral es análoga.

-

Con R, calcularemos la varianza y la desviación típica muestrales. Con lo cual, si queremos calcular las que no son muestrales, tendremos que multiplicarlas por \(\frac{n-1}{n}\), donde \(n\) es el tamaño de la muestra. Lo veremos a continuación.

+

Con R, calcularemos la varianza y la desviación típica muestrales. Con lo cual, si queremos calcular las que no son muestrales, tendremos que multiplicarlas por \(\frac{n-1}{n}\), donde \(n\) es el tamaño de la muestra. Lo veremos a continuación.

Varianza y desviación típica

@@ -531,7 +535,7 @@

diff(range(x)) -Rango intercuantílico +Rango intercuartílico IQR(x, type = ...) @@ -594,7 +598,7 @@

Ejemplo 5

cangrejos = read.table("../data/datacrab.txt", header = TRUE) #Cargamos el data frame
-cangrejos = cangrejos[-1] 
+cangrejos = cangrejos[-1] #Eliminamos la primera columna
 summary(cangrejos) #Aplicamos la función summary
     color           spine           width          satell