Además de las tablas y gráficos podemos resumir una serie de observaciones mediante “estadísticos”: “Función de los datos observados”.
Hay tres grandes tipos de medidas estadísticas:
- Medidas de posición: dan idea de la magnitud, tamaño o
posición de la observaciones de los datos una vez que están ordenados de menor
a mayor.
- Tendencia central: dan idea del
comportamiento central mayoritario.
- Medidas de dispersión o variabilidad: dan información acerca de la heterogeneidad de
nuestras observaciones.
Por un lado, encontramos las medidas de tendencia central, en las cuales encontramos:
MEDIA ARITMÉTICA O MEDIA (VARIABLES CUANTITATIVAS)
Se calcula para variables cuantitativas y se trata del centro
geométrico o de gravedad de nuestros datos. Es la suma de todos los valores de
la variable observada entre el total de observaciones.
Cuando los datos están agrupados, para calcular la media
utilizamos como valor de referencia de cada intervalo su marca de clase: se
calcula una media aritmética estimada que se calcula sumando la marca de clase
por la frecuencia absoluta, entre N.
x= Ʃmcfi/n (multiplicamos la marca de clase
por la frecuencia absoluta y vamos sumndo, luego dividimos entre el numero de
sujetos)
MEDIANA
Valor de la observación tal que deja a un 50% de los
datos menor y otro 50% de los datos
mayor.
-
Si
el número de observaciones es impar el valor de la observación será justamente
la observación que ocupa la posición (n+1/2) Ejemplo: si son 75, pues 76 entre
2 = 38, la mediana seria la edad que tiene el sujeto 38.
-
Si
el número de observaciones es par, el valor de la mediana corresponde a la
media entre los dos valores centrales, es decir, la media entre la observación
n/2 y la observación (n/2)+1. Ejemplo: cuatro sujetos de edades, 10, 15, 20,
25, cogemos los dos sujetos centrales y hacemos la media aritmética entre
ambos.
Propiedad: robustez. Sólo tiene en cuenta la
posición de los valores en la muestra y por tanto tiene mucho mejor
comportamiento que la media cuando hay observaciones extremas.
MODA (VARIABLES CUALITATIVAS)
Valor con mayor frecuencia (que más veces se repite). Si se
repiten dos números, es dimodal o mas números multimodal.
Si hay más de una se dice que la muestra es bimodal (dos
modas) o multimodal (más de dos modas).
Se puede calcular para cualquier tipo de variable.
Si los datos están agrupados, se habla de clase modal y
corresponde al intervalo en el que el cociente entre la frecuencia relativa y
la amplitud es mayor (hi/ci). Donde la frecuencia
absoluta sea mayor.
Por otro lado, encontramos las medidas de posición , en las que se presentan:
Cuantiles:
Se calculan para variables cuantitativas y, al igual que la mediana, sólo tienen en cuenta la posición de los valores en la muestra.
Los cuantiles más usuales son los percentiles, los deciles y los cuartiles, según dividan la muestra ordenada en 100, 10 ó 4 partes, respectivamente.
-
Percentiles:
o
Dividen
la muestra ordenada en 100 partes.
o
El
percentil “i” (Pi), es aquél valor que, ordenadas las observaciones
en forma creciente, el i% de ellas son menores que él y el (100-i)% restante
son mayores.
o
Para
buscar la posición de un percentil en una serie de datos agrupados, buscamos el
intervalo en el que la frecuencia relativa acumulada (Hi) sea
superior al valor del percentil.
o
El
valor del P50 corresponde al valor de la mediana.
-
Deciles:
o
Dividen
la muestra ordenada en 10 partes.
o
El
decil “i” (Di), es aquél valor que, ordenadas las observaciones en
forma creciente, el i/10% de ellas son menores que él y el (100-i)/10% restante
son mayores.
o
El
valor del D5 corresponde al valor de la mediana y, por tanto, al del
P50.
-
Cuartil:
o
Dividen
la muestra ordenada en 4 partes.
o
El
Q1, primer cuartil indica el valor que ocupa una posición en la
serie numérica de forma que el 25% de las observaciones son menores y que el
75% son mayores.
o
El
Q2, segundo cuartil indica el valor que ocupa una posición en la
serie numérica de forma que el 50% de las observaciones son menores y que el
50% son mayores. Por tanto, el Q2 coincide con el valor del D5,
con el valor de la mediana P50.
o
El
Q3, tercer cuartil indica el valor que ocupa una posición en la
serie numérica de forma que el 75% de las observaciones son menores y que el
25% son mayores.
o
El
Q4, cuarto cuartil indica el valor mayor que se alcanza en la serie
numérica.
Por consiguiente, trataremos las medidas de dispersión, en la que la información aportada por las medidas de tendencia central es limitada. A raíz de aquí podemos encontrar:
No hay comentarios:
Publicar un comentario