mapas estadistica 3 corte

MEDIDAS DE DISPERSION

Los métodos numéricos que describen a los conjuntos de observaciones tienen como objetivo dar

una imagen mental de la distribución de frecuencias. Una vez localizado el centro de la

distribución de un conjunto de datos, lo que procede es buscar una medida de dispersión de los

datos. La dispersión o variación es una característica importante de un conjunto de datos porque

intenta dar una idea de cuán esparcidos se encuentran éstos.

RANGO

Datos no agrupados

El rango de un conjunto de

números es la diferencia

entre el mayor y el menor

de todos ellos.

Hay 2 maneras de expresar

ésta medida:

1) La diferencia entre el

valor mayor y menor

2) Los valores mayor y

menor del grupo

Datos agrupados

Hay dos formas para

determinar el rango para

datos agrupados:

1) Rango = punto medio de

la clase más alta – punto

medio de la más baja

2) Rango = límite superior

de la clase más alta – límite

inferior de la más baja

DESVIACIÓN ESTÁNDAR

La desviación estándar se

denota por s.

Datos no agrupados

Se define como

S=√∑ =𝑛𝑗 1(𝑋𝑗−𝑋)2

𝑛

Datos agrupados

Si x1, x2, …, xk ocurren con

frecuencias f1, f2, …, fk,

respectivamente, la

desviación típica se expresa

como:

S=√∑ =1𝑓𝑗(𝑋𝑗−𝑛

𝑗 𝑋)2

𝑛

VARIANZA

Se define como el cuadrado de

la desviación estándar y se

representa como 𝑆2

Datos no agrupados

𝑆2 =∑ = 1𝑛𝑗 (𝑋𝑗 − 𝑋)2

𝑛

Datos agrupados.

𝑆2 =∑ = 1𝑓𝑗(𝑋𝑗 − 𝑋)2𝑛𝑗

𝑛

COEFICIENTE DE VARIACIÓN

La variación o dispersión real, tal como

se determina de la desviación estándar

u otra medida de dispersión, se llama

dispersión absoluta.

La dispersión relativa es:

Ventajas

• Es relativamente sencilla

su obtención

• El significado de ésta

medida es fácil de

comprender

Limitaciones

• Considera sólo los valores

extremos de un conjunto, y

no proporciona

mayor información respecto

a los demás valores del

mismo

• Tiene una limitada utilidad

para los distintos tipos de

análisis estadísticos

Dispersión relativa=dispersión absoluta

Promedio

A la dispersión relativa se le llama coeficiente de variación o

coeficiente de dispersión si la dispersión absoluta es la

desviación estándar s y el promedio es la media x. Se define

como:

Coeficiente de variación (V)=𝑆

𝑋

La dispersión indica que tan cercanos o lejanos se encuentran los

valores unos de otros. Dichos valores pueden pertenecer a un

conjunto de datos agrupados (distribuciones de frecuencias) o no

agrupados (ordenados de acuerdo a su magnitud). Las medidas de

dispersión que son más comunes son: rango, desviación media,

desviación estándar, varianza. Las medidas de dispersión que

utilizan la media como referencia son: desviación media,

desviación estándar, varianza. Las medidas de dispersión vistas

fueron para datos muéstrales.

REGRESIONES.

Regresión lineal

Las observaciones se dispondrán en dos

columnas, de modo que en cada fila figuren

la abscisa x y su correspondiente ordenada

y. La importancia de las distribuciones

bidimensionales radica en investigar cómo

influye una variable sobre la otra. Esta puede

ser una dependencia causa efecto, por

ejemplo, la cantidad de lluvia (causa), da

lugar a un aumento de la producción agrícola

(efecto). O bien, el aumento del precio de un

bien, da lugar a una disminución de la

cantidad demandada del mismo.

Si utilizamos un sistema de coordenadas

cartesianas para representar la distribución

bidimensional, obtendremos un conjunto de

puntos conocido con el diagrama de

dispersión, cuyo análisis permite estudiar

cualitativamente, la relación entre ambas

variables tal como se ve en la figura.

El siguiente paso, es la determinación de la

dependencia funcional entre las dos

variables x e y que mejor ajusta a la

distribución bidimensional. Se denomina

regresión lineal cuando la función es lineal,

es decir, requiere la determinación de dos

parámetros: la pendiente y la ordenada en el

origen de la recta de regresión, y=ax+b.

MEDIDAS DE APUNTAMIENTO Y ASIMETRIA

Las medidas de asimetría son indicadores que

permiten establecer el grado de simetría (o

asimetría) que presenta una distribución de

probabilidad de una variable aleatoria sin tener que

hacer su representación gráfica.

Como eje de simetría consideramos una recta

paralela al eje de ordenadas que pasa por la media

de la distribución. Si una distribución es simétrica,

existe el mismo número de valores a la derecha que

a la izquierda de la media, por tanto, el mismo

número de desviaciones con signo positivo que con

signo negativo. Decimos que hay asimetría positiva

(o a la derecha) si la "cola" a la derecha de la media

es más larga que la de la izquierda, es decir, si hay

valores más separados de la media a la derecha.

Diremos que hay asimetría negativa (o a la

izquierda) si la "cola" a la izquierda de la media es

más larga que la de la derecha, es decir, si hay

valores más separados de la media a la izquierda.

Medidas de asimetría

Coeficiente de asimetría de Fisher.

En teoría de la probabilidad y estadística, la

medida de asimetría más utilizada parte del uso

del tercer momento estándar. La razón de esto es

que nos interesa mantener el signo de las

desviaciones con respecto a la media, para

obtener si son mayores las que ocurren a la

derecha de la media que las de la izquierda. Sin

embargo, no es buena idea tomar el momento

estándar con respecto a la media de orden 1.

Debido a que una simple suma de todas las

desviaciones siempre es cero. En efecto, si por

ejemplo, los datos están agrupados en clases, se

tiene que:

Sólo se puede utilizar en distribuciones uniformes, unimodales y

moderadamente asimétricas. Se basa en que en distribuciones simétricas la

media de la distribución es igual a la moda ente de asimetría de Pearson

Si la distribución es simétrica, y Ap =0 Si la distribución es asimétrica

positiva la media se sitúa por encima de la moda y, por tanto,

Apuntamiento

Se trata de visualizar

los datos en una

curva, chata, normal o

puntada.

Coeficiente de Gini

Mide la desigualdad de los ingresos pero puede

utilizarse para medir cualquier forma de

distribución desigual.

También puede medirse la desigualdad de la

riqueza, pero este uso requiere que nadie

disponga de una riqueza neta negativa.

Coeficiente de Gini.

Es un número comprendido entre 0 y 1.

Índice de Gini.

Es el coeficiente de Gini expresado en

porcentajes.

El cálculo del coeficiente Gini se puede realizar

de dos formas.

A través de la curva de Lorenz mediante la fórmula

de Brown la curva de Brown es un gráfico que se

puede utilizar para representar la distribución

relativa de una variable en un dominio

determinado.

l

Línea de igualdad perfecta.

Es la línea de 45° (recta y=x) y corresponde a una

distribución de ingresos perfectamente equitativa.

Línea de desigualdad perfecta

Función.

Y=0 para X <100

X=100 para X=100

Curva de Lorenz

En general se encuentra en la situación

intermedia e indica una mayor igualdad cuanto

más cercana este a la línea de igualdad

perfecta y viceversa.

Calculo del coeficiente Gini.

Siendo A el área entre la línea de la igualdad

perfecta y curva de Lorenz y B el área debajo de la

curva de Lorenz el coeficiente de Gini se define

como A/(A+B)

mapas estadistica 3 corte

Education