tablas bivariadas

5
Estadística I Prof. Edmundo Peña Rozas 13/04/2015 1 Tablas de Frecuencias Bivariadas I.- OBJETIVOS DE LA SESIÓN: Construir tablas de frecuencia bivariadas. Calcular medidas de tendencia central, posición y dispersión II. TEMA Cuando se desea analizar dos variables a la vez, las tablas de contingencia son un método de agrupación de datos que puede resultar de mucha utilidad. Los criterios para construir las tablas de frecuencia pueden ser de ayuda también para la confección de tablas de contingencia. Ejemplo: Se analizó la distribución de la nota final en un curso de Estadística en una Universidad de la región. A los 72 alumnos, se les registró la nota final, y además el sexo. La información anterior se resume en la siguiente tabla: Género Intervalo de Clase Hombres Mujeres Total Nota Final [3,4 , 4[ 1 0,0139 0 0,0000 1 0,0139 [4 , 4,5[ 10 0,1389 4 0,0556 14 0,1944 [4,5 , 5[ 17 0,2361 8 0,1111 25 0,3472 [5 , 5,5[ 15 0,2083 3 0,0417 18 0,2500 [5,5 , 6[ 5 0,0694 1 0,0139 6 0,0833 [6 , 6,5[ 3 0,0417 4 0,0556 7 0,0972 [6,5 , 7] 1 0,0139 0 0,0000 1 0,0139 Total 52 0,7222 20 0,2778 72 1 Como se puede ver, en la tabla se presentan dos variables, una continua (Nota Final), y una cualitativa (Sexo) y se analizan de manera conjunta. Es decir, cada celda contiene la frecuencia absoluta correspondiente al intervalo de clase de nota final y a la clase correspondiente al sexo, en este caso hombre o mujer. Además, si se desea, se puede agregar a la derecha de cada frecuencia absoluta, la frecuencia relativa respectiva. Ejemplo: Una línea aérea realizó un estudio respecto de la edad de sus pasajeros, y el número de vuelos al año que realizan. Para ello se tomó una muestra de 50 personas. La información se resume en la siguiente tabla: Número de vuelos Edad 1-2 3-5 mayor que 5 Total [0 , 25[ 1 0,02 1 0,02 2 0,04 4 0,08 [25 , 40[ 2 0,04 8 0,16 10 0,2 20 0,4 [40 , 65[ 1 0,02 6 0,12 15 0,3 22 0,44 [65 , 100[ 1 0,02 2 0,04 1 0,02 4 0,08 Total 5 0,1 17 0,34 28 0,56 50 1 En relación a la tabla anterior, se puede concluir acerca de la relación entre ambas variables. Por ejemplo, se observa que las personas de entre 40 y 65 años son las que “más viajan” ya que tienen la mayor frecuencia correspondiente a 5 vuelos o más.

Upload: walter-h-arroyo-chavez

Post on 09-Nov-2015

58 views

Category:

Documents


4 download

DESCRIPTION

estadistica

TRANSCRIPT

  • Estadstica I

    Prof. Edmundo Pea Rozas

    13/04/2015

    1

    Tablas de Frecuencias Bivariadas

    I.- OBJETIVOS DE LA SESIN:

    Construir tablas de frecuencia bivariadas.

    Calcular medidas de tendencia central, posicin y dispersin II. TEMA Cuando se desea analizar dos variables a la vez, las tablas de contingencia son un mtodo de agrupacin de datos que puede resultar de mucha utilidad. Los criterios para construir las tablas de frecuencia pueden ser de ayuda tambin para la confeccin de tablas de contingencia. Ejemplo: Se analiz la distribucin de la nota final en un curso de Estadstica en una Universidad de la regin. A los 72 alumnos, se les registr la nota final, y adems el sexo. La informacin anterior se resume en la siguiente tabla:

    Gnero

    Intervalo de Clase Hombres

    Mujeres Total

    Nota Final

    [3,4 , 4[ 1 0,0139 0 0,0000 1 0,0139

    [4 , 4,5[ 10 0,1389 4 0,0556 14 0,1944

    [4,5 , 5[ 17 0,2361 8 0,1111 25 0,3472

    [5 , 5,5[ 15 0,2083 3 0,0417 18 0,2500

    [5,5 , 6[ 5 0,0694 1 0,0139 6 0,0833

    [6 , 6,5[ 3 0,0417 4 0,0556 7 0,0972

    [6,5 , 7] 1 0,0139 0 0,0000 1 0,0139

    Total 52 0,7222 20 0,2778 72 1

    Como se puede ver, en la tabla se presentan dos variables, una continua (Nota Final), y una cualitativa (Sexo) y se analizan de manera conjunta. Es decir, cada celda contiene la frecuencia absoluta correspondiente al intervalo de clase de nota final y a la clase correspondiente al sexo, en este caso hombre o mujer. Adems, si se desea, se puede agregar a la derecha de cada frecuencia absoluta, la frecuencia relativa respectiva. Ejemplo: Una lnea area realiz un estudio respecto de la edad de sus pasajeros, y el nmero de vuelos al ao que realizan. Para ello se tom una muestra de 50 personas. La informacin se resume en la siguiente tabla:

    Nmero de vuelos

    Edad 1-2

    3-5

    mayor que 5

    Total

    [0 , 25[ 1 0,02 1 0,02 2 0,04 4 0,08

    [25 , 40[ 2 0,04 8 0,16 10 0,2 20 0,4

    [40 , 65[ 1 0,02 6 0,12 15 0,3 22 0,44

    [65 , 100[ 1 0,02 2 0,04 1 0,02 4 0,08

    Total 5 0,1 17 0,34 28 0,56 50 1

    En relacin a la tabla anterior, se puede concluir acerca de la relacin entre ambas variables. Por ejemplo, se observa que las personas de entre 40 y 65 aos son las que ms viajan ya que tienen la mayor frecuencia correspondiente a 5 vuelos o ms.

  • Estadstica I

    Prof. Edmundo Pea Rozas

    13/04/2015

    2

    A partir de los ejemplos anteriores resulta fcil establecer de manera ms formal las llamadas tablas de contingencia. Tablas de Contingencia Cuando las observaciones de una muestra pueden clasificarse en dos o ms categoras, stas pueden ser presentadas en las denominadas Tablas de Contingencia. Las tablas de contingencia ms utilizadas son las que permiten clasificar las observaciones de acuerdo a dos criterios de clasificacin (usualmente variables categricas, pero no necesariamente) con r y c categoras en cada criterio respectivamente.

    Y Total

    X 1 2 j c

    1 n11 n12 n1j n1c n1. 2 n21 n22 n2j n2c n2.

    i ni1 ni2 nij nic ni.

    r nr1 nr2 nrj nrc n1. Total n.1 n.2 n.j n.c n..

    Donde nij es la frecuencia absoluta conjunta del par (xi,yi), es decir, el nmero de objetos que presentan el valor xi en X e yj en Y. La frecuencia relativa conjunta correspondiente se calcula como:

    ,..

    ij

    i j

    nf

    n

    donde

    ..

    1 1 1 1

    1r c r c

    ij ij

    i j i j

    n n f

    Distribucin Marginal A partir de la distribucin conjunta de X e Y es posible estudiar cada una de las variables por separado, dando con ello origen a las distribuciones marginales de X e Y. Las distribuciones marginales se obtienen cuando se establecen las distribuciones de frecuencias de cada una variable de manera independiente La distribucin marginal de X corresponde a los distintos valores de X junto a sus respectivas frecuencias, siendo ni. y fi. la frecuencia absoluta y relativa marginal de xi en X, independientemente del valor que adopte Y. La frecuencia absoluta marginal del valor de la variable observada X, es el nmero de veces que aparece el valor xi de X, sin tener en cuenta cual es el valor de la variable Y.

    .

    . 1 2 .

    1 ..

    ci

    i ij i i ic i

    j

    nn n n n n f

    n

    Frecuencia relativa

    conjunta

  • Estadstica I

    Prof. Edmundo Pea Rozas

    13/04/2015

    3

    De manera anloga, la distribucin marginal de Y corresponde a los distintos valores de Y junto a sus respectivas frecuencias, siendo n.j y f.j la frecuencia absoluta y relativa marginal de yi en Y, independientemente del valor que adopte X.

    .

    1 2 .

    1 ..

    .r

    j

    j ij j j rj j

    i

    nn n n n n f

    n

    Y Total

    X 1 2 j c

    1 f11 f12 f1j f1c f1. 2 f21 f22 f2j f2c f2.

    i fi1 fi2 fij fic fi.

    r fr1 fr2 frj frc fr. Total f.1 f.2 f.j f.c 1

    Distribucin condicional La distribucin condicional permite observar cmo se distribuye una variable sobre la base de una determinada condicin en la otra. La distribucin de X condicionada al valor yi de Y (X\Y=yi) muestra el comportamiento de la variable X en aquellos sujetos que presentan el valor en Y el valor yi..

    X nij fij

    x1 n1j f1j

    x2 n2j f2j

    xi nij fij

    xr nrj frj

    Total n.j

    Ejemplo: Una lnea area realiz un estudio respecto de la edad de sus pasajeros, y el nmero de vuelos al ao que realizan. Para ello se tom una muestra de 50 personas. La informacin se resume en la siguiente tabla:

    N de Vuelos al Ao

    Edad 1-2 3-5 Ms de 5 Total

    [0 , 25[ 1 1 2 4

    [25 , 40[ 2 8 10 20

    [40 , 65[ 1 6 15 22

    [65 , 100[ 1 2 1 4

    Total 5 17 28 50

    Frecuencia relativa marginal de X

    Frecuencia relativa marginal de Y

  • Estadstica I

    Prof. Edmundo Pea Rozas

    13/04/2015

    4

    Distribucin Marginal

    de la Edad

    Edad ni. fi.

    [0 , 25[ 4 0,08

    [25 , 40[ 20 0,40

    [40 , 65[ 22 0,44

    [65 , 100[ 4 0,08

    Total 50 1,00

    Distribucin Marginal del N de Vuelos

    N de Vuelos al Ao

    1-2 3-5 Ms de 5 Total

    n.j 5 17 28 50

    f.j 0,10 0,34 0,56 1,00

    Distribucin Condicional, dado que el Nmero de

    Vuelos es entre 3 y 5

    X\Y=3-5 ni. fi.

    [0 , 25[ 1 0,06

    [25 , 40[ 8 0,47

    [40 , 65[ 6 0,35

    [65 , 100[ 2 0,12

    17

    .

    1

    ..

    r

    i i

    i

    x n

    xn

    .

    1

    ..

    c

    j j

    j

    y n

    yn

    .

    1

    ..

    12,5 4 32,5 20 52,5 22 82,5 443,7

    50

    r

    i i

    i

    x n

    xn

    \ [3 5[ \ [3 5[

    1[3 5[

    ..

    12,5 1 32,5 8 52,5 6 82,5 244,26

    17

    r

    i y i y

    iy

    x n

    xn

  • Estadstica I

    Prof. Edmundo Pea Rozas

    13/04/2015

    5

    Ejemplo: Se analiz la distribucin de la nota final en un curso de Estadstica en una Universidad de la regin. A los 72 alumnos, se les registr la nota final, y adems el sexo. La informacin anterior se resume en la siguiente tabla:

    Gnero

    Intervalo de Clase Hombres

    Mujeres Total

    Nota Final

    [3,4 - 4,0[ 1 0,0139 0 0,0000 1 0,0139

    [4,0 - 4,5[ 10 0,1389 4 0,0556 14 0,1944

    [4,5 - 5,0[ 17 0,2361 8 0,1111 25 0,3472

    [5,0 - 5,5[ 15 0,2083 3 0,0417 18 0,2500

    [5,5 - 6,0[ 5 0,0694 1 0,0139 6 0,0833

    [6,0 - 6,5[ 3 0,0417 4 0,0556 7 0,0972

    [6,5 - 7,0] 1 0,0139 0 0,0000 1 0,0139

    Total 52 0,7222 20 0,2778 72 1

    Distribucin Marginal de

    Notas

    Edad ni. fi.

    [3,4 - 4,0[ 1 0,0139

    [4,0 - 4,5[ 14 0,1944

    [4,5 - 5,0[ 25 0,3472

    [5,0 - 5,5[ 18 0,2500

    [5,5 - 6,0[ 6 0,0833

    [6,0 - 6,5[ 7 0,0972

    [6,5 - 7,0] 1 0,0139

    Total 72 1

    Distribucin Marginal del Gnero

    Gnero Hombres Mujeres Total

    n.j 52 20 72

    f.j 0,7222 0,2778 1,00

    Distribucin Condicional, dado que la

    Nota es 4,5 5,0 Y\X=[4,5 - 5,0[ ni. fi.

    Hombres 17 0,68

    Mujeres 8 0,32

    25

    Bibliografa

    DOttone, H. (1974). Estadstica Elemental. Santiago, Chile: Publicaciones Multiactiva Ltda. Triola, M. (2004). Estadstica; 9 edicin, Mxico: Editorial Pearson Educacin.

    Webster, A., (2000), Estadstica Aplicada a la Economa y los Negocios, 3ed., Bogot: McGraw-Hill