esta di stica

15
Universidad Técnica Federico Santa María 1 Universidad Técnica Federico Santa María Departamento de Informática ILI-280 Capítulo 2 Capítulo 2 Análisis de datos ( Análisis de datos ( Bivariados Bivariados) Estadística Computacional Estadística Computacional I Semestre 2006 I Semestre 2006 Parte II Parte II Profesores: Carlos Valle ([email protected] ) Página: www.inf.utfsm.cl/~cvalle 2 Profesor C.Valle Supongamos que se toma una muestra de tamaño n de una población y que se desea estudiar, dos características de un mismo objeto . Sean estas características X e Y. Siguiendo los procedimientos habituales, la Muestra se divide en r clases A i para la variable X s clases B j para la variables Y Existirán elementos que pertenecerán simultánea- mente a A i B j . Los datos los podemos ordenar en una tabla o matriz llamada Tabla de Contingencia Estadística Estadística Bivariada Bivariada

Upload: josephrojasleon

Post on 07-Nov-2015

216 views

Category:

Documents


0 download

DESCRIPTION

cuadros bivariadoso

TRANSCRIPT

  • Universidad Tcnica Federico Santa Mara

    1

    Universidad Tcnica Federico Santa Mara

    Departamento de Informtica

    ILI-280

    Captulo 2Captulo 2Anlisis de datos (Anlisis de datos (BivariadosBivariados))

    Estadstica ComputacionalEstadstica ComputacionalI Semestre 2006I Semestre 2006

    Parte IIParte II

    Profesores:

    Carlos Valle ([email protected])

    Pgina: www.inf.utfsm.cl/~cvalle

    2Profesor C.Valle

    Supongamos que se toma una muestra de tamao n de una poblacin y que se desea estudiar, dos caractersticas de un mismo objeto .

    Sean estas caractersticas X e Y. Siguiendo los procedimientos habituales, la Muestra se divide en r clases Ai para la variable X

    s clases Bj para la variables Y

    Existirn elementos que pertenecern simultnea-mente a AiBj. Los datos los podemos ordenar en una tabla o matriz llamada Tabla de Contingencia

    Estadstica Estadstica BivariadaBivariada

  • Universidad Tcnica Federico Santa Mara

    2

    3Profesor C.Valle

    Y B1 B2 ..... Bj ..... Bs Total

    A1 n11 n12 ..... n1j ..... n1s n1A2 n21 n22 ..... n2j ..... n2s n2

    Ai ni1 ni2 ..... nij ..... nis ni

    Ar nr1 nr2 ..... nrj ..... nrs nrTotal n

    1 n2 ..... nj ..... ns n

    X

    n

    = n_

    Tabla de ContingenciaTabla de Contingencia

    4Profesor C.Valle

    Y B1 B2 ..... Bj ..... Bs Total

    A1 f11 f12 ..... f1j ..... f1s f1A2 f21 f22 ..... f2j ..... f2s f2

    Ai fi1 fi2 ..... fij ..... fis fi

    Ar fr1 fr2 ..... frj ..... frs frTotal f

    1 f2 ..... fj ..... fs f

    X

    f

    = 1_

    Tabla de ContingenciaTabla de Contingencia

  • Universidad Tcnica Federico Santa Mara

    3

    5Profesor C.Valle

    =

    =

    s

    j

    iji nn1

    Frecuencia Absoluta de la clase Ai; para i= 1, ,2, ... ,r(Independiente de la clases Bj a la que estn asociadas Suma de los valores de la fila i-sima )

    =

    =

    r

    i

    ijj nn1

    Frecuencia Absoluta de la clase Bj; para j= 1, ,2, ... ,s(Independiente de las clases Ai a la que estn asociadas. Suma de los valores de la columna j-sima)

    nij = Frecuencia Absoluta de la clase conjunta AiBj.(Valor observado en la celda (i,j) de la Tabla de Contingencia)

    fij =nijn

    Frecuencia Relativaconjunta de la clase conjunta correspondiente a la interseccin de Ai y Bj.

    =

    s

    j

    ijf1

    =

    r

    i 1

    = 1

    Tabla de ContingenciaTabla de Contingencia

    6Profesor C.Valle

    Frecuencia (relativa) marginal de la variable X, Conjunto de valores pertenecientes a la clase Ai, considerndola independientemente de la clase Bj

    Frecuencia (relativa) marginal de la variable Y, Conjunto de valores pertenecientes a la clase Bj, considerndola independientemente de la clase Ai

    Dado el experimento anterior, cuando slo interesa conocer la frecuencia de ocurrencia de cada una de las variables por separado se habla de Frecuencia Marginal de la variable X o Y

    Frecuencias MarginalesFrecuencias Marginales

  • Universidad Tcnica Federico Santa Mara

    4

    7Profesor C.Valle

    Notacin: Sean

    fij := frecuencia relativa conjunta AiBj = fr(xi,yj)

    fiiiii = = frec relativa marginal =

    fiiii j = = frec. relativa marginal =

    fi/j = = frec. relativa condicional=

    j

    ijf =j

    iji xyx )(),( rr ff

    i

    ijf =i

    jji yyx )(),( rr ff

    j

    ij

    f

    f

    )(

    ),()/(

    j

    ji

    jiy

    yxyx

    r

    r

    rf

    ff =

    Estadstica Estadstica BivariadaBivariada

    8Profesor C.Valle

    Para frecuencias relativas , i = 1,....,r se tiene:

    (Suma de los valores de la columna j-simade la tabla de frecuencias conjuntas)

    Adems se verifica que:

    =

    =

    s

    j

    iji ff1

    (Suma de los valores de la fila i-simade la tabla de frecuencias conjuntas)

    =

    =

    r

    i

    ijj ff1

    =

    n

    niif

    =

    n

    n jjf

    j

    ij

    n

    n

    ==

    j

    ij

    i/jf

    ff

    Tabla de ContingenciaTabla de Contingencia

  • Universidad Tcnica Federico Santa Mara

    5

    9Profesor C.Valle

    Una tela se clasifica en tres categoras A, B y C segn cantidad y severidad de pequeas imperfecciones. La empresa tiene 5 telares, en un mes dado de produccin se registraron los siguientes datos.

    # piezas de tela en la clasificacinTelar A B C Marginal

    1 185 16 12 2132 190 24 21 2353 170 35 16 2214 158 22 7 1875 185 22 15 222

    Marginal 888 119 71 1078

    Ejemplo

    Tabla de ContingenciaTabla de Contingencia

    10Profesor C.Valle

    ijn

    jn=

    =

    j

    i/jf

    ijff

    Cuando se pregunta por la frecuencia relativa de una de las variables, digamos X, restringida a los elementos observados de la clase Bj segn Y; esto es, estudiar el comportamiento de una variable dado un valor fijo de la otra. Se obtiene la frecuencia relativa condicional

    Frecuencia (relativa) de la variable X en la clase conjunta AiBj, dado que slo nos interesa respecto a lo observado en la clase Bjde la variable Y; para i = 1, 2, .., r

    f1/j, f2/j, f3/j, ... , fr/jConstituye la distribucin de frecuencia relativa condicional de la variable X dada la clase Bj de la variable Y.Ntese que se trabaja condicionado sobre un tamao de muestra reducido al nmero de observaciones de la clase Bj dada

    Frecuencia CondicionalFrecuencia Condicional

  • Universidad Tcnica Federico Santa Mara

    6

    11Profesor C.Valle

    Se dice que X es independiente de Y si las frecuencias condicionales de X/Y son todas iguales; es decir, no dependen de la clase condicionante, esto esfi/1 = fi/2 = fi/3 = = fi/s = fi

    Ai = 1, 2, 3, ... , r

    i1n

    1n =i2

    n

    2n =i3

    n

    3n = =is

    n

    Sni1

    n

    1ni2

    ni3

    nis

    n

    2n 3n sn

    + +

    + +

    + +....

    + +....i

    n

    n= ....

    ....

    = fi

    = ii/j ff j= ffj/i

    = ji/jij fff =ij if jff

    Luego similarmente

    =

    ji/j f

    ijffComo

    Independencia EstadsticaIndependencia Estadstica

    12Profesor C.Valle

    Notacin:

    Anlogamente, se tiene:

    fj/i = = frecuencia condicional =

    i

    ij

    f

    f

    )(

    ),()/(

    i

    ji

    ijx

    yxxy

    r

    r

    rf

    ff =

    Independencia Estadstica

    X e Y son variables estadsticamente independientes ssi:

    )()/( jij yxy rr ff = )()/( iyi xyx rr ff =

    = ii/j ff j= ffj/i

    Estadstica Estadstica BivariadaBivariada

  • Universidad Tcnica Federico Santa Mara

    7

    13Profesor C.Valle

    Independencia Estadstica

    como

    = ij/iij fff = ijij fff

    Asociacin de Variables

    Datos no agrupados Cov (x,y) =

    Datos agrupados : Cov(x,y) =

    Coeficiente de Correlacin = r =

    ))((1

    yyxxn

    ii ))(( yyxx ii if

    Cov (x,y)Sx Sy

    Estadstica Estadstica BivariadaBivariada

    14Profesor C.Valle

    Fallas Anuales

    Temperatura 120 140 160 Marginal Averas

    2 20 15 10 453 12 7 5 244 4 10 2 165 - 5 10 15

    Marginal 36 37 27 100

    Obtener :Distribuciones marginalesDistribuciones condicionales (4 averas), Mediay Varianza condicional

    EjercicioEjercicio

  • Universidad Tcnica Federico Santa Mara

    8

    15Profesor C.Valle

    Fallas Anuales

    Temperatura 120 140 160 Marginal Averas

    2 0,20 0,15 0,10 0,453 0,12 0,07 0,05 0,244 0,04 0,10 0,02 0,165 0 0,05 0,10 0,15

    Marginal 0,36 0,37 0,27 1,00

    fj/4 ={ 2/8; 5/8; 1/8} Xj/4 =137,5

    Vj/4= 2/8(120-137,5)2 +5/8(140-137,5)2

    +1//8(160-137,5)2 =

    EjercicioEjercicio

    16Profesor C.Valle

    Modelo EstadsticoModelo Estadstico (Lineal)(Lineal)

    x , y son variables independiente y dependiente

    respectivamente. Adems una variable estadstica que representa el error.

    Los parmetros 0 y 1 pueden ser estimados a partir de los datos {(xi , yi)}i=1,...,n mediante mtodo de

    mnimos cuadrados.

    Entonces

    ++= xy 10

    iiiii xyyye 10 ==Sea ;

  • Universidad Tcnica Federico Santa Mara

    9

    17Profesor C.Valle

    = =

    =

    n

    i

    n

    i

    iii xyminemin1 1

    2

    10

    2)(

    1010

    =

    =

    n

    i

    iE eSC1

    2

    x

    xy

    SC

    SC=1 xy 10 =

    =

    =

    n

    i

    ix xxSC1

    2)( ))(( yyxxSC i

    n

    i

    ixy ==1

    =

    =

    n

    i

    ieVNE1

    2

    18Profesor C.Valle

    Curvas de Regresin

    t 0 1 2 3 4 5 6

    V(t) 30 60 46 32 10 4 17

    20 40 26 14 8

    20 12

    V(t) 25 40 46 29 12 6 17

    Sea xt = sen t yt = V(t)

    Luego y(t) = a + b xt + t

    =t

    ttbaba

    bxayminbaQmin 2,,

    )(),(

  • Universidad Tcnica Federico Santa Mara

    10

    19Profesor C.Valle

    325, == xbya 202 ==xS

    yxb

    ),cov(

    12762

    =yS = 45222 ,)( tt yy

    % de Ajuste del Modelo =

    %%,

    9810098012

    2

    ==

    y

    t

    S

    e

    20Profesor C.Valle

    Sea yi = h ( xi ) con i = 1,...,n

    1. Lineales yi = axi + b

    y = ax + bSy = a Sx

    2. No lineales yi = h( xi )

    y = h(x) + h(x) SX2

    Sy2 Sx

    2 [[[[ h (x)]]]]2En particular h(x) = ln x y = ln x - ( Sx

    2 / x2 )

    Sy2 ( Sx

    2 / x2 ) = CV 2

    2

    1

    2

    1

    TransformacionesTransformaciones

  • Universidad Tcnica Federico Santa Mara

    11

    Universidad Tcnica Federico Santa Mara

    Departamento de Informtica

    ILI-280

    Anlisis de una Anlisis de una BivariadaBivariadacomo muestra estratificadacomo muestra estratificada

    22Profesor C.Valle

    E2

    n2 V2

    2X

    E1n1 V11X

    Emnm

    VmmX

    =

    =

    m

    h

    h nn1

    n

    np hh =

    Supongamos que la variable admite una clasificacin en k- clases, representadas por X1, X2,.....Xk.

    m- estratos

    Anlisis de una muestra estratificadaAnlisis de una muestra estratificada

  • Universidad Tcnica Federico Santa Mara

    12

    23Profesor C.Valle

    nih = Cantidad de individuos de la submuestra del estrato h que pertenece a Ci.

    h

    ih

    n

    n=ihf

    =

    =

    k

    i 1

    1ihf =

    =

    k

    i

    hih nn1

    =

    =

    k

    i

    ih XX1

    ihf =

    =

    k

    i

    hih XXV1

    2)(ihf

    =

    =

    m

    h

    hp1

    ihi ff

    Anlisis de una muestra estratificadaAnlisis de una muestra estratificada

    24Profesor C.Valle

    2

    11

    )(==

    +=m

    h

    hh

    m

    h

    hhT XXpVpV

    Entonces:

    =

    =

    m

    h

    nh XpX1

    erraT VVV intint +=

    Anlisis de una muestra estratificadaAnlisis de una muestra estratificada

  • Universidad Tcnica Federico Santa Mara

    13

    25Profesor C.Valle

    EjemploEjemplo

    Se tiene 3 criaderos de aves. En el criadero (1) se ponen 50 pollos recin nacidos; en el (2) 200 pollos y en el (3) 100 pollos. Al cabo de un cierto tiempo se pesan los 350 pollos, encontrndose que algunos estn muertos y los vivos pesan entre 1,00 [kg]. y 2,50 [kg]. Para los efectos del registro los pollos muertos se supondrn de peso cero, y el cero actuar como centro del supuesto intervalo. Los otros intervalos sern [[[[1,00 ; 1,50]]]] [[[[1,50 ; 2,00]]]] [[[[2,00 ; 2,50]]]].

    Centros

    0

    1,25

    1,75

    2,25

    Frecuencias Absolutas

    (1) (2) (3)

    5 10 10

    10 20 30

    30 150 50

    5 20 10

    Calcular

    Note que existen 3 estratos y 4 clases

    raer

    Thh

    VV

    VXVX

    intint ,

    ,,,

    26Profesor C.Valle

    FrecuenciaRelativa

    0

    0,1

    0,2

    0,3

    0,4

    0,5

    0,6

    0,7

    0 1,25 1,75 2,25

    1,00 1,50 2,00 2,50

    Peso

    Criadero 1Criadero 2Criadero 3

    Histograma Apilado por Peso

    Anlisis Muestra EstratificadaAnlisis Muestra Estratificada

  • Universidad Tcnica Federico Santa Mara

    14

    27Profesor C.Valle

    Criadero 1Criadero 2Criadero 3

    1,00 1,50 2,00 2,50

    FrecuenciaRelativa

    0

    0,1

    0,2

    0,3

    0,4

    0,5

    0 1,25 1,75 2,25

    Peso

    Histograma por Estrato y por Peso

    Anlisis Muestra EstratificadaAnlisis Muestra Estratificada

    28Profesor C.Valle

    Estrato (2) P2=4/7

    fi2 fi2X1 Xi-X2 ( )2 fi2( )2

    0 0,05 0 -1,662 2,76 0,1381,25 0,10 0,125 -0,412 0,17 0,0171,75 0,75 1,312 0,088 0, 01 0,0062,25 0,10 0,225 0,588 0,35 0,035

    X2=1,662

    V2=0,195

    Estrato (3) P3=2/7

    fi3 fi3X1 Xi-X3 ( )2 fi3( )2

    0 0,10 0 -1,475 2,17 0,2181,25 0,30 0,375 -0,225 0,05 0,0151,75 0,50 0,875 0,275 0, 08 0,0392,25 0,10 0,225 0,775 0,60 0,060

    X3=1,475

    V3=0,331

    Estrato (1) P1=1/7

    Xi fi1 fi1X1 Xi-X1 ( )2 fi1( )2

    0 0,1 0 -1,525 2,325 0,23251,25 0,2 0,250 -0,275 0,0756 0,01511,75 0,6 1,050 0,225 0,0501 0,03042,25 0,1 0,225 0,725 0,525 0,0526

    X1=1,525

    V1=0,331

  • Universidad Tcnica Federico Santa Mara

    15

    29Profesor C.Valle

    Estratos Ph Media Varianza PhXh PhVh Xh-X (X-Xh)2 Ph( )

    2

    Xh Vh

    (1) 1/7 1,525 0,331 0,218 0,047 -0,064 0,004 0,00058

    (2) 4/7 1,662 0,195 0,950 0,111 0,073 0,005 0,00305

    (3) 2/7 1,475 0,331 0,421 0,095 -0,114 0,013 0,00371

    1,589 0,253 0,0073

    30Profesor C.Valle

    Se ha obtenido, entonces:

    Media Total X = 1,589

    Varianza promedio dentro de los estratos Vintra= 0,253

    Varianza entre estratos Vinter= 0,0073

    Varianza Total VT= 0,2606

    ResultadosResultados