Resumen numérico de una serie estadística: los
estadísticos son también llamados "función de datos observados". Existen 3 formas de medidas:
-Medida de tendencia central: los datos tienen tendencia a agruparse alrededor de unos valores.
-Medidas de dispersión/variabilidad: nos dan a entender si las observaciones son homogéneas o
heterogéneas.
-Medidas de posición: los conjuntos se dividen en grupos que tengan la misma cantidad de
individuos.
Medidas de tendencia central:
-Media aritmética (x̄): usado en variables cuantitativas y representa el centro de los datos. Es el
sumatorio de todos los valores que existen de la variable que se estudia.
-Mediana: los datos se dividen en 50%-50% pero uno de esos 2 grupos será mayor. Sólo observa la
posición de los datos.
-Moda: es el dato que más se repite. No tiene por qué haber solo 1 dato que sea más repetido. Se puede
aplicar a variables cualitativas y cuantitativas.
Medidas de posición: son variables numéricas.
-Cuantil: empleada para variables continuas y cuantitativas. Tienen en cuenta la posición.
Los más empleados son los percentiles, deciles y cuartiles.
-Percentil (i): divide a la muestra en 100 partes.
-Decil: divide a la muestra en 10 partes.
-Cuartil: divide a la muestra en 4 partes. Q1 representa una diferenciación 25%-75%
Q2 representa una diferenciación 50%-50%, Q3 muestra una diferenciación 75%-25% y Q4 muestra la serie numérica.
Medidas de dispersión: son medidas de variabilidad. Se calculan
porque éstas son menos limitantes que las de tendencia central y porque los valores son más homogéneos.
-Rango/recorrido: diferencia entre el valor mayor y el menor, su fórmula es Xn-X1.
-Desviación media: es la media artmética entre los valores extremos de la muestra y la
media. Su fórmula es dm=Σ|Xi-x̄ |/ln.
-Desviación típica/estándar: muestra el margen de error en datos numéricos que se comete
al representar los datos solo por su media, éste no puede ser superior a la media. Su fórmula es dt =√Σ(Xi-x̄)^2/n-1.
-Varianza: es el cuadrado de la desviación típica. Su fórmula es S^2=Σ(Xi-x̄)^2/n-1.
-Recorrido intercuartilítico: diferencia entre el 3º y el 1º cuartil. Su fórmula es Ri=|Q3-Q1|
-Cociente de variación: medida de dispersión relativa. Compara la heterogeinicidad que
hay entre 2 series numéricas que presentan independecia en las unidades de medida. Su fórmula es Cv=s/media.
Distribución normal: es la gaussiana, presenta una forma de campana y
es simétrica.
Ejemplo de gráfica con distribución normal/ gaussiana.
Las asimetrías/curtosis se dan cuando la parte baja de la gráfica se encuentra desplazada hacia
uno de los dos lados, causando como su nombre indica, asimetrías. El coeficiente de asimetría consiste en el grado de asimetría con respecto a la media. Si el grado de asimetría es 0 es una gráfica de en medio, si la asimería es >0 (la gráfica está desplazada hacia la izquierda) presenta asimetría positiva, si el grado de asimetría es <0 (la gráfica está desplazada hacia la derecha) presenta asimetría negativa
La curtosis/apuntamiento mide cómo se concentran los valores alrededor de la media. Si el grado
de curtosis es 0 presenta un grado de concentración medio y se llama distribución mesocúrtica, si el grado de curtosis es >0 presenta un grado alto de concentración y se llama distribución leptocúrtica y si el grado es <0 la concentración es reducida y se denomina distribución platicúrtica.
Ejemplo de gráfica leptocúrtica, mesocúrtica y platicúrtica.
No hay comentarios:
Publicar un comentario