estadística económica 2007-2008. sara mateo. capítulo 6 distribuciones de frecuencias...
Post on 22-Jan-2016
240 Views
Preview:
TRANSCRIPT
Estadística Económica 2007-2008. Sara Mateo.
Capítulo 6Capítulo 6
Distribuciones de frecuencias bidimensionales
Contenidos:
Distribución bidimensional de frecuencias Representaciones gráficas Momentos en distribuciones bidimensionales Método reducido para el cálculo de varianzas y covarianzas Valor de la covarianza en caso de independencia estadística Coeficiente de correlación lineal Coeficientes de Asociación para variables nominales: Chi-Cuadrado y C de contingencia
Estadística Económica 2007-2008. Sara Mateo.
Tabla de Correlación o Contingencia (atributos) (al final del capítulo)(al final del capítulo)
Estadística Económica 2007-2008. Sara Mateo.
Tabla de Correlación o ContingenciaTabla de Correlación o Contingencia
Permite ayudarnos a determinar si existe relación de interdependencia interdependencia entre 2 variables, es decir, si se influyen mutuamente.
Así, una tabla de contingencia es una una tabla de doble entrada, donde en cada casilla figurará el número de casos
o individuos que poseen un nivel de una de las características analizadas y otro nivel de la otra
característica.
donde nij nij es el número de observaciones que presentan simultáneamente las características i, j de las variables A y B, respectivamente.
Estadística Económica 2007-2008. Sara Mateo.
Al analizar una distribución bidimensional, uno puede centrar su estudio en el comportamiento de una de las variables, con independencia de como se comporta la otra. Estaríamos así en el análisis de una distribución marginal.
Distribución marginal de A
Ai ni.
A1 n1.
A2 n2.
… …
An-1 nn-1.
An nn.
Distribución marginal de B
Bj n.j
B1 n.1
B2 n.2
… …
Bm-1 n.m-1
Bm n.m
Estadística Económica 2007-2008. Sara Mateo.
son las frecuencias absolutas marginales de las variables A y B, respectivamente.
Definimos:
son las frecuencias relativas marginales de las variables A y B, respectivamente.
Distribuciones marginalesDistribuciones marginales
J
j
iji n
nf
1
I
i
ijj n
nf
1
J
jiji nn
1
I
iijj nn
1
1 1 1 1
h k h k
i j iji j i j
n n n N
1 2 31
... ...k
i i i i ij ik ijj
n n n n n n n
1 2 3
1
... ...h
j j j j ij hj iji
n n n n n n n
Estadística Económica 2007-2008. Sara Mateo.
En las tablas de contingencia:
a) Distribuciones marginales
b) Distribuciones de frecuencias relativas
Estadística Económica 2007-2008. Sara Mateo.
c) Perfiles fila
d) Perfiles columna
Del total de individuos con la característica “A1” que porcentaje comparte a su vez la “B1”
Cómo es lógico, el porcentaje de individuos con “A1” que, o bien comparten B1 o B2 y hasta Bj será el 100% = 1
Estadística Económica 2007-2008. Sara Mateo.
Distribución de una de las variables siempre que la otra cumpla una condición específica.
xi ni.
(Frecuencia cuando y=valor específico)
x1 n1.
x2 n2.
… …
xn-1 nn-1.
xn nn.
X: Gasto en material escolar
Y: Número de hijos
Distrib. Condicionada: Por ejemplo, gasto en material escolar cuando el número de hijos es <3. También podría ser simplemente cuando y=número, sólo sería coger esa columna sin sumar nada.
0 5
50 8
100 5
150 8
200 4
Suma de frecuencias cuando y=0, y=1, y= 2. Que tienen un gasto de 50.
Estadística Económica 2007-2008. Sara Mateo.
Averias 0 1 2 3 Marginal de leves
0 0,2308 0,0385 0,0077 0,0000 0,27691 0,1692 0,0615 0,0231 0,0077 0,26152 0,0769 0,0385 0,0154 0,0154 0,14623 0,0923 0,0615 0,0077 0,0154 0,17694 0,0615 0,0308 0,0000 0,0077 0,10005 0,0308 0,0077 0,0000 0,0000 0,0385
0,6615 0,2385 0,0538 0,0462 1
Graves Y
Leves X
Marginal de Graves
ijn
N
.in
N
. jn
N
.. ji ijnSi i IndepjN
enn
dencian
N N
Representación gráfica: Nube de puntos o diagrama de dispersión
Estadística Económica 2007-2008. Sara Mateo.
2
21
( )( )
h
i ii
X
x x nVar X S
N
2
1 2
( )
( )
k
j jj
Y
y y n
Var Y SN
1 1
( )( )
( , )
h k
i j iji j
XY
x x y y n
Cov X Y SN
Varianza de X
Varianza de Y
Covarianza entre X e Y
Mide si existe asociación lineallineal entre X e Y. Positiva o negativa
pero no la intensidad
Estadística Económica 2007-2008. Sara Mateo.
1 1
h kr si j ij
i jrs
x y n
aN
1 1
( ) ( )h k
r si j ij
i jrs
x x y y n
mN
Momento rs con respecto origen:
Momento rs con respecto a las medias:
Estadística Económica 2007-2008. Sara Mateo.
1 1
2 2
'
'i i
j j
x c p x
y c p y
1 1
2 2
'
'
x c p x
y c p y
2 2 21
2 2 22
( ')
( ')
X X
Y Y
S p S
S p S
1 2'XY XYS p p S
Se efectúa la transformación:
Resultado de las Medias de las nuevas variables
De las nuevas varianzas:
De la nueva covarianza:
Estadística Económica 2007-2008. Sara Mateo.
Coeficiente de correlación lineal
xyr
El valor de la covarianza dependerá de los valores de las variables, por tanto de sus unidades. Para poder eliminar las unidades y tener una medida adimensional utilizamos el COEFICIENTE DE CORRELACIÓN LINEAL )( xyr
yx
xyxy SS
Sr
siendo invariante frente a transformaciones lineales (cambio de origen y escala) de las variable.
•Es un coeficiente adimensional• -1 r 1•Si hay relación lineal positiva r > 0 y próximo a 1•Si hay relación lineal negativa r < 0 y próximo a -1•Si no hay relación lineal r se aproxima a 0•Si X e Y son independientes Sxy = 0 y por tanto r = 0
Si las dos variables son independientes, su covarianza vale cero. No podemos asegurar lo mismo en sentido contrario. Si dos variables tienen covarianza cero, no significa que sean independientes. Linealmente NO tienen relación. Pero pueden pueden ser dependientes.
Importante:
Propiedades:
Estadística Económica 2007-2008. Sara Mateo.
1) Coeficiente de Asociación Chi-Cuadrado (χ2):
I
i
J
jij
ijij
e
en
1 1
22
Frecuencia observadaijn
n
nne
jiij
Frecuencia esperada
Si ≈ 0 no habrá asociación inexistencia de asociación
Problema:Problema: no tiene límite superior por lo que no permite conocer el grado de asociación.
2
Como solución:
VARIABLES CUALITATIVASVARIABLES CUALITATIVAS
Estadística Económica 2007-2008. Sara Mateo.
2) Coeficiente “C” de contingencia de Karl Pearson:
nC
2
2
),min(
11_
JImáximolímite
Si C ≈0 inexistencia de asociación Si C ≈1 perfecta asociación entre las variables
Nunca superior a uno
Estadística Económica 2007-2008. Sara Mateo.
Coeficiente de Correlación por Rangos de Spearman:
• El Coeficiente de Correlación por Rangos de Spearman permite determinar la correlación de datos de carácter ordinal midiendo la concordancia o discordancia entre las clasificaciones.
• Formulación: Si no hay empates
• Interpretación:
Si ρ= 1: Correlación por rangos perfecta y positiva. La concordancia entre los rangos es perfectaSi ρ = -1: Correlación por rangos perfecta y negativa. La concordancia entre los rangos es perfectaSi ρ = 0: Correlación por rangos nula. No hay concordancia entre los rangosSi 0 < ρ < 1: Correlación por rangos positiva y si -1 < ρ <0: Correlación por rangos negativa
D: diferencia de valores para las dos variables.
EJEMPLOS EN CLASEEJEMPLOS EN CLASE
top related