sábado, 12 de mayo de 2012

Tema 8.  Medidas de tendencia central, posición y dispersión.

  En este tema vimos, en primer lugar, dos grandes tipos de medidas estadísticas:
- Medidas de posición o tendencia central: dan idea de la magnitud de los datos.
- Medidas de dispersión o variabilidad: dan información acerca de la heterogeneidad de las observaciones.

Medidas de tendencia central
- Media. Es la suma de todos los valores de la variable entre el total de observaciones. Cuando los datos son agrupados, utilizamos como valor de referencia la marca de clase de cada intervalo.


- Mediana. Es el valor de la observación tal que un 50% de los datos es menor y otro 50% es mayor.
Si el valor de las observaciones es impar el valor de la mediana será la observación que ocupa la posición n+1/2.
Si el número de observaciones es par, el valor de la mediana es la media entre la observación n/2 y la observación n+1/2.
Tiene mejor comportamiento que la media cuando hay observaciones extremas.


- Moda. Es el valor que más se repite. Si los datos están agrupados se habla de clase modal y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud es mayor.

Después de ver esto hicimos un ejercicio práctico para aplicar estos conceptos.

MEDIDAS DE POSICIÓN
Cuantiles. Se calculan para variables cuantitativas y solo tienen en cuenta la posición de los valores de la muestra. Los cuantiles más utilizados son percentiles, deciles y cuartiles, según dividan la muestra ordenada en 100, 10 o 4 partes, respectivamente.

Percentiles. Para buscar la posición de un percentil es una serie de datos agrupados, buscamos el intervalo en el que la frecuencia relativa acumulada (Hi) sea superior al valor del percentil. El valor del P50 corresponde al valor de la mediana.


Deciles. El valor de D5 corresponde al valor de la mediana y, por tanto, al del P50.


Cuartiles. El Q2 conincide con el valor de D5, con el valor de la mediana y del P50.
Por ejemplo el Q1 indica el valor que ocupa una posición en la serie numérica de forma que el 25% de las observaciones son menores y que el 75% son mayores.

MEDIDAS DE DISPERSIÓN
Rango o recorrido. Diferencia entre el mayor y el menor valor de la muestra.
Desviación media. Media aritmética de las distancias de cada observación con respecto a la media de la muestra.
Desviación típica. Cuantifica el error que cometemos si representamos una muestra únicamente por su media.
Varianza. Expresa la misma información que la desviación típica en valores cuadráticos.
Coeficiente de variación. Es una medida de dispersión relativa (adimensional). Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medida.

A continuación realizamos un ejercicio donde se pedía calcular las medidas estadísticas estudiadas anteriormente. Era un ejercicio fácil de entender aunque había que fijarse bien en los cálculos para no cometer errores. 

 Después vimos las distribuciones normales. Estas son las que con más frecuencia aparece en fenómenos reales y siguen unos principios básicos. Analizamos la campana de Gauss.
Posteriormente estudiamos las asimetrías y curtosis. 
El coeficiente de asimetría de una variable es el grado de asimetría de la distribución de sus datos en torno a su media. 
El coeficiente de apuntamiento o curtosis de una variable sirve para medir el grado de concentración de los valores que toma en torno a su media. Se elige como referencia una variable con distribución normal, de modo que para ella el coeficiente de curtosis es 0. 
Estudiamos los resultados que se podían obtener y el tipo de distribución en función de éstos.
Asimetrías
g1 = 0  Distribución simétrica
g1 > 0  Distribución asimétrica positiva
g1 <0  Distribución asimétrica negativa

Curtosis
g2 = 0  Distribución mesocúrtica
g2 > 0  Distribución leptocúrtica
g2 < 0  Distribución platicúrtica

  Me ha parecido un tema entretenido y muy práctico, esencial en estadística.