esta di stica
DESCRIPTION
cuadros bivariadosoTRANSCRIPT
-
Universidad Tcnica Federico Santa Mara
1
Universidad Tcnica Federico Santa Mara
Departamento de Informtica
ILI-280
Captulo 2Captulo 2Anlisis de datos (Anlisis de datos (BivariadosBivariados))
Estadstica ComputacionalEstadstica ComputacionalI Semestre 2006I Semestre 2006
Parte IIParte II
Profesores:
Carlos Valle ([email protected])
Pgina: www.inf.utfsm.cl/~cvalle
2Profesor C.Valle
Supongamos que se toma una muestra de tamao n de una poblacin y que se desea estudiar, dos caractersticas de un mismo objeto .
Sean estas caractersticas X e Y. Siguiendo los procedimientos habituales, la Muestra se divide en r clases Ai para la variable X
s clases Bj para la variables Y
Existirn elementos que pertenecern simultnea-mente a AiBj. Los datos los podemos ordenar en una tabla o matriz llamada Tabla de Contingencia
Estadstica Estadstica BivariadaBivariada
-
Universidad Tcnica Federico Santa Mara
2
3Profesor C.Valle
Y B1 B2 ..... Bj ..... Bs Total
A1 n11 n12 ..... n1j ..... n1s n1A2 n21 n22 ..... n2j ..... n2s n2
Ai ni1 ni2 ..... nij ..... nis ni
Ar nr1 nr2 ..... nrj ..... nrs nrTotal n
1 n2 ..... nj ..... ns n
X
n
= n_
Tabla de ContingenciaTabla de Contingencia
4Profesor C.Valle
Y B1 B2 ..... Bj ..... Bs Total
A1 f11 f12 ..... f1j ..... f1s f1A2 f21 f22 ..... f2j ..... f2s f2
Ai fi1 fi2 ..... fij ..... fis fi
Ar fr1 fr2 ..... frj ..... frs frTotal f
1 f2 ..... fj ..... fs f
X
f
= 1_
Tabla de ContingenciaTabla de Contingencia
-
Universidad Tcnica Federico Santa Mara
3
5Profesor C.Valle
=
=
s
j
iji nn1
Frecuencia Absoluta de la clase Ai; para i= 1, ,2, ... ,r(Independiente de la clases Bj a la que estn asociadas Suma de los valores de la fila i-sima )
=
=
r
i
ijj nn1
Frecuencia Absoluta de la clase Bj; para j= 1, ,2, ... ,s(Independiente de las clases Ai a la que estn asociadas. Suma de los valores de la columna j-sima)
nij = Frecuencia Absoluta de la clase conjunta AiBj.(Valor observado en la celda (i,j) de la Tabla de Contingencia)
fij =nijn
Frecuencia Relativaconjunta de la clase conjunta correspondiente a la interseccin de Ai y Bj.
=
s
j
ijf1
=
r
i 1
= 1
Tabla de ContingenciaTabla de Contingencia
6Profesor C.Valle
Frecuencia (relativa) marginal de la variable X, Conjunto de valores pertenecientes a la clase Ai, considerndola independientemente de la clase Bj
Frecuencia (relativa) marginal de la variable Y, Conjunto de valores pertenecientes a la clase Bj, considerndola independientemente de la clase Ai
Dado el experimento anterior, cuando slo interesa conocer la frecuencia de ocurrencia de cada una de las variables por separado se habla de Frecuencia Marginal de la variable X o Y
Frecuencias MarginalesFrecuencias Marginales
-
Universidad Tcnica Federico Santa Mara
4
7Profesor C.Valle
Notacin: Sean
fij := frecuencia relativa conjunta AiBj = fr(xi,yj)
fiiiii = = frec relativa marginal =
fiiii j = = frec. relativa marginal =
fi/j = = frec. relativa condicional=
j
ijf =j
iji xyx )(),( rr ff
i
ijf =i
jji yyx )(),( rr ff
j
ij
f
f
)(
),()/(
j
ji
jiy
yxyx
r
r
rf
ff =
Estadstica Estadstica BivariadaBivariada
8Profesor C.Valle
Para frecuencias relativas , i = 1,....,r se tiene:
(Suma de los valores de la columna j-simade la tabla de frecuencias conjuntas)
Adems se verifica que:
=
=
s
j
iji ff1
(Suma de los valores de la fila i-simade la tabla de frecuencias conjuntas)
=
=
r
i
ijj ff1
=
n
niif
=
n
n jjf
j
ij
n
n
==
j
ij
i/jf
ff
Tabla de ContingenciaTabla de Contingencia
-
Universidad Tcnica Federico Santa Mara
5
9Profesor C.Valle
Una tela se clasifica en tres categoras A, B y C segn cantidad y severidad de pequeas imperfecciones. La empresa tiene 5 telares, en un mes dado de produccin se registraron los siguientes datos.
# piezas de tela en la clasificacinTelar A B C Marginal
1 185 16 12 2132 190 24 21 2353 170 35 16 2214 158 22 7 1875 185 22 15 222
Marginal 888 119 71 1078
Ejemplo
Tabla de ContingenciaTabla de Contingencia
10Profesor C.Valle
ijn
jn=
=
j
i/jf
ijff
Cuando se pregunta por la frecuencia relativa de una de las variables, digamos X, restringida a los elementos observados de la clase Bj segn Y; esto es, estudiar el comportamiento de una variable dado un valor fijo de la otra. Se obtiene la frecuencia relativa condicional
Frecuencia (relativa) de la variable X en la clase conjunta AiBj, dado que slo nos interesa respecto a lo observado en la clase Bjde la variable Y; para i = 1, 2, .., r
f1/j, f2/j, f3/j, ... , fr/jConstituye la distribucin de frecuencia relativa condicional de la variable X dada la clase Bj de la variable Y.Ntese que se trabaja condicionado sobre un tamao de muestra reducido al nmero de observaciones de la clase Bj dada
Frecuencia CondicionalFrecuencia Condicional
-
Universidad Tcnica Federico Santa Mara
6
11Profesor C.Valle
Se dice que X es independiente de Y si las frecuencias condicionales de X/Y son todas iguales; es decir, no dependen de la clase condicionante, esto esfi/1 = fi/2 = fi/3 = = fi/s = fi
Ai = 1, 2, 3, ... , r
i1n
1n =i2
n
2n =i3
n
3n = =is
n
Sni1
n
1ni2
ni3
nis
n
2n 3n sn
+ +
+ +
+ +....
+ +....i
n
n= ....
....
= fi
= ii/j ff j= ffj/i
= ji/jij fff =ij if jff
Luego similarmente
=
ji/j f
ijffComo
Independencia EstadsticaIndependencia Estadstica
12Profesor C.Valle
Notacin:
Anlogamente, se tiene:
fj/i = = frecuencia condicional =
i
ij
f
f
)(
),()/(
i
ji
ijx
yxxy
r
r
rf
ff =
Independencia Estadstica
X e Y son variables estadsticamente independientes ssi:
)()/( jij yxy rr ff = )()/( iyi xyx rr ff =
= ii/j ff j= ffj/i
Estadstica Estadstica BivariadaBivariada
-
Universidad Tcnica Federico Santa Mara
7
13Profesor C.Valle
Independencia Estadstica
como
= ij/iij fff = ijij fff
Asociacin de Variables
Datos no agrupados Cov (x,y) =
Datos agrupados : Cov(x,y) =
Coeficiente de Correlacin = r =
))((1
yyxxn
ii ))(( yyxx ii if
Cov (x,y)Sx Sy
Estadstica Estadstica BivariadaBivariada
14Profesor C.Valle
Fallas Anuales
Temperatura 120 140 160 Marginal Averas
2 20 15 10 453 12 7 5 244 4 10 2 165 - 5 10 15
Marginal 36 37 27 100
Obtener :Distribuciones marginalesDistribuciones condicionales (4 averas), Mediay Varianza condicional
EjercicioEjercicio
-
Universidad Tcnica Federico Santa Mara
8
15Profesor C.Valle
Fallas Anuales
Temperatura 120 140 160 Marginal Averas
2 0,20 0,15 0,10 0,453 0,12 0,07 0,05 0,244 0,04 0,10 0,02 0,165 0 0,05 0,10 0,15
Marginal 0,36 0,37 0,27 1,00
fj/4 ={ 2/8; 5/8; 1/8} Xj/4 =137,5
Vj/4= 2/8(120-137,5)2 +5/8(140-137,5)2
+1//8(160-137,5)2 =
EjercicioEjercicio
16Profesor C.Valle
Modelo EstadsticoModelo Estadstico (Lineal)(Lineal)
x , y son variables independiente y dependiente
respectivamente. Adems una variable estadstica que representa el error.
Los parmetros 0 y 1 pueden ser estimados a partir de los datos {(xi , yi)}i=1,...,n mediante mtodo de
mnimos cuadrados.
Entonces
++= xy 10
iiiii xyyye 10 ==Sea ;
-
Universidad Tcnica Federico Santa Mara
9
17Profesor C.Valle
= =
=
n
i
n
i
iii xyminemin1 1
2
10
2)(
1010
=
=
n
i
iE eSC1
2
x
xy
SC
SC=1 xy 10 =
=
=
n
i
ix xxSC1
2)( ))(( yyxxSC i
n
i
ixy ==1
=
=
n
i
ieVNE1
2
18Profesor C.Valle
Curvas de Regresin
t 0 1 2 3 4 5 6
V(t) 30 60 46 32 10 4 17
20 40 26 14 8
20 12
V(t) 25 40 46 29 12 6 17
Sea xt = sen t yt = V(t)
Luego y(t) = a + b xt + t
=t
ttbaba
bxayminbaQmin 2,,
)(),(
-
Universidad Tcnica Federico Santa Mara
10
19Profesor C.Valle
325, == xbya 202 ==xS
yxb
),cov(
12762
=yS = 45222 ,)( tt yy
% de Ajuste del Modelo =
%%,
9810098012
2
==
y
t
S
e
20Profesor C.Valle
Sea yi = h ( xi ) con i = 1,...,n
1. Lineales yi = axi + b
y = ax + bSy = a Sx
2. No lineales yi = h( xi )
y = h(x) + h(x) SX2
Sy2 Sx
2 [[[[ h (x)]]]]2En particular h(x) = ln x y = ln x - ( Sx
2 / x2 )
Sy2 ( Sx
2 / x2 ) = CV 2
2
1
2
1
TransformacionesTransformaciones
-
Universidad Tcnica Federico Santa Mara
11
Universidad Tcnica Federico Santa Mara
Departamento de Informtica
ILI-280
Anlisis de una Anlisis de una BivariadaBivariadacomo muestra estratificadacomo muestra estratificada
22Profesor C.Valle
E2
n2 V2
2X
E1n1 V11X
Emnm
VmmX
=
=
m
h
h nn1
n
np hh =
Supongamos que la variable admite una clasificacin en k- clases, representadas por X1, X2,.....Xk.
m- estratos
Anlisis de una muestra estratificadaAnlisis de una muestra estratificada
-
Universidad Tcnica Federico Santa Mara
12
23Profesor C.Valle
nih = Cantidad de individuos de la submuestra del estrato h que pertenece a Ci.
h
ih
n
n=ihf
=
=
k
i 1
1ihf =
=
k
i
hih nn1
=
=
k
i
ih XX1
ihf =
=
k
i
hih XXV1
2)(ihf
=
=
m
h
hp1
ihi ff
Anlisis de una muestra estratificadaAnlisis de una muestra estratificada
24Profesor C.Valle
2
11
)(==
+=m
h
hh
m
h
hhT XXpVpV
Entonces:
=
=
m
h
nh XpX1
erraT VVV intint +=
Anlisis de una muestra estratificadaAnlisis de una muestra estratificada
-
Universidad Tcnica Federico Santa Mara
13
25Profesor C.Valle
EjemploEjemplo
Se tiene 3 criaderos de aves. En el criadero (1) se ponen 50 pollos recin nacidos; en el (2) 200 pollos y en el (3) 100 pollos. Al cabo de un cierto tiempo se pesan los 350 pollos, encontrndose que algunos estn muertos y los vivos pesan entre 1,00 [kg]. y 2,50 [kg]. Para los efectos del registro los pollos muertos se supondrn de peso cero, y el cero actuar como centro del supuesto intervalo. Los otros intervalos sern [[[[1,00 ; 1,50]]]] [[[[1,50 ; 2,00]]]] [[[[2,00 ; 2,50]]]].
Centros
0
1,25
1,75
2,25
Frecuencias Absolutas
(1) (2) (3)
5 10 10
10 20 30
30 150 50
5 20 10
Calcular
Note que existen 3 estratos y 4 clases
raer
Thh
VV
VXVX
intint ,
,,,
26Profesor C.Valle
FrecuenciaRelativa
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0 1,25 1,75 2,25
1,00 1,50 2,00 2,50
Peso
Criadero 1Criadero 2Criadero 3
Histograma Apilado por Peso
Anlisis Muestra EstratificadaAnlisis Muestra Estratificada
-
Universidad Tcnica Federico Santa Mara
14
27Profesor C.Valle
Criadero 1Criadero 2Criadero 3
1,00 1,50 2,00 2,50
FrecuenciaRelativa
0
0,1
0,2
0,3
0,4
0,5
0 1,25 1,75 2,25
Peso
Histograma por Estrato y por Peso
Anlisis Muestra EstratificadaAnlisis Muestra Estratificada
28Profesor C.Valle
Estrato (2) P2=4/7
fi2 fi2X1 Xi-X2 ( )2 fi2( )2
0 0,05 0 -1,662 2,76 0,1381,25 0,10 0,125 -0,412 0,17 0,0171,75 0,75 1,312 0,088 0, 01 0,0062,25 0,10 0,225 0,588 0,35 0,035
X2=1,662
V2=0,195
Estrato (3) P3=2/7
fi3 fi3X1 Xi-X3 ( )2 fi3( )2
0 0,10 0 -1,475 2,17 0,2181,25 0,30 0,375 -0,225 0,05 0,0151,75 0,50 0,875 0,275 0, 08 0,0392,25 0,10 0,225 0,775 0,60 0,060
X3=1,475
V3=0,331
Estrato (1) P1=1/7
Xi fi1 fi1X1 Xi-X1 ( )2 fi1( )2
0 0,1 0 -1,525 2,325 0,23251,25 0,2 0,250 -0,275 0,0756 0,01511,75 0,6 1,050 0,225 0,0501 0,03042,25 0,1 0,225 0,725 0,525 0,0526
X1=1,525
V1=0,331
-
Universidad Tcnica Federico Santa Mara
15
29Profesor C.Valle
Estratos Ph Media Varianza PhXh PhVh Xh-X (X-Xh)2 Ph( )
2
Xh Vh
(1) 1/7 1,525 0,331 0,218 0,047 -0,064 0,004 0,00058
(2) 4/7 1,662 0,195 0,950 0,111 0,073 0,005 0,00305
(3) 2/7 1,475 0,331 0,421 0,095 -0,114 0,013 0,00371
1,589 0,253 0,0073
30Profesor C.Valle
Se ha obtenido, entonces:
Media Total X = 1,589
Varianza promedio dentro de los estratos Vintra= 0,253
Varianza entre estratos Vinter= 0,0073
Varianza Total VT= 0,2606
ResultadosResultados