estadística descriptiva.pdf

36
Estadística Descriptiva Métodos gráficos

Upload: ianhooft

Post on 16-Nov-2015

228 views

Category:

Documents


0 download

TRANSCRIPT

  • Estadstica Descriptiva

    Mtodos grficos

  • Diagrama de Barras

    Ejemplo 1:

    De un conjunto de 30 empleados se estudia la cantidad de das que se llegaron tarde desde el mes de marzo al mes de junio del 2014.

    1 1 1 1 1 2 4 4 4 4

    4 4 4 4 5 5 5 5 5 5

    5 5 6 6 6 7 7 8 9 9

  • Valor Frecuencia Frecuencia relativa

    1 5 5/30 = 0.167

    2 1 1/30 = 0.033

    3 0 0/30 = 0

    4 8 8/30 = 0.267

    5 8 8/30 = 0.267

    6 3 3/30 = 0.1

    7 2 2/30 = 0.067

    8 1 1/30 = 0.033

    9 2 2/30 = 0.067

    n = 30 suma de las frec. relativas = 1

  • 20.5 19.5 15.6 24.1 9.9

    15.4 12.7 5.4 17.0 28.6

    16.9 7.8 23.3 11.8 18.4

    13.4 14.3 19.2 9.2 16.8

    8.8 22.1 20.8 12.6 15.9

    Ejemplo 2:

    Relacin precio-rendimiento de 25 acciones (price earnings ratios)

    Valor Frecuencia Frecuencia relativa

    [5, 9) 3 3/25 = 0.12

    [9, 13) 5 5/25 = 0.20

    [13, 17) 7 7/25 = 0.28

    [17, 21) 6 6/25 = 0.24

    [21, 25) 3 3/25 = 0.12

    [25, 29) 1 1/25 = 0.04

    n = 25 suma de las frec.

    relativas = 1

  • Ejemplo 3: Los datos que se presentan a continuacin indican el ingreso per capita en miles de dlares para 50 estados de EEUU en 1983.

    Estado Ingreso Estado Ingreso Estado Ingreso Estado Ingreso

    AL 9.2 IN 10.5 NE 11.2 SC 9.2

    AK 17.2 IA 10.7 NV 12.5 SD 9.8

    AZ 10.7 KS 12.2 NH 12.2 TN 9.5

    AR 9.0 KY 9.4 NJ 14.1 TY 11.7

    CA 13.3 LA 10.3 NM 9.6 UT 9.0

    CO 12.8 ME 9.8 NY 13.0 VT 10.0

    CT 14.9 MD 13.0 NC 9.8 VA 12.1

    DE 12.7 MA 13.3 ND 11.7 WA 12.2

    FL 11.6 MI 11.5 OH 11.2 WV 9.2

    GA 10.4 MN 11.9 OK 11.0 WI 11.4

    HI 12.1 MS 8.1 OR 10.7 WY 11.9

    ID 9.6 MO 11.0 PA 11.5

    IL 12.4 MT 9.9 RI 11.7

  • Si agrupamos en intervalos de igual longitud resultaran intervalos sin observaciones, por ejemplo:

    Valor Frecuencia Frecuencia relativa

    [8, 9) 1 1/50 = 0.02

    [9, 10) 13 13/50 = 0.26

    [10, 11) 7 7/50 = 0.14

    [11, 12) 13 13/50 = 0.26

    [12, 13) 9 9/50 = 0.18

    [13, 14) 4 4/50 = 0.08

    [14, 15) 2 2/50 = 0.04

    [15, 16) 0

    [16, 17) 0

    [17, 18) 1 1/50 = 0.02

    total 50 1

  • Ejemplo 4: A cada miembro de una muestra de 120 dueos de motocicletas, se les pregunt la marca de su mquina. Se obtuvo la siguiente tabla de frecuencias:

    Marcas Frecuencia Frec. relativa

    Honda 41 0.34

    Yamaha 27 0.23

    Kawasaki 20 0.17

    Suzuki 18 0.15

    Harley Davidson 3 0.03

    Otras 11 0.09

    n = 120 1

    (por redondeo: 1.01)

  • Ejemplo 5: Con el objetivo de estudiar la situacin laboral de las personas en relacin con el nivel de educacin que ellas han alcanzado se registraron los siguientes datos:

    Mximo

    nivel

    Nivel

    Avanzado

    Otras

    calificaciones

    Sin

    calificacion

    es

    Totales

    En

    actividad

    8.224 5.654 11.167 2.583 27.628

    Desem-

    pleado

    217 231 693 303 1.444

    Inactivo 956 1.354 3.107 2.549 7.966

    Totales 9.397 7.239 14.967 5.435 37.038

  • El diagrama de barras con los totales de cada categora de la situacin laboral muestra como es la situacin laboral de los encuestados sin considerar su nivel de educacin:

    Table 1 referencias: 1 en actividad; 2 desempleado; 3 - inactivo

  • El diagrama de barras que permite ver el nivel educativo en cada una de las categoras de la situacin laboral el diagrama de barras mltiple siguiente:

    Table 2 referencias: serie 1- activos; serie 2 - desempleados; serie 3 -inactivos Eje x: 1- nivel mximo; 2-nivel avanzado; 3-otras calificaciones; 4-s/calificaciones

  • Estadstica Descriptiva

    Mtodos numricos

    a.- Medidas de localizacin

    b.- Medidas de dispersin

  • I.- Media o Promedio muestral:

    a.- Medidas de localizacin

    Si nuestro conjunto de datos es x1, x2, ..., xn la

    Media o Promedio muestral se lo define y

    calcula como:

    1

    n

    i

    i

    x

    xn

    Se recomienda usar un dgito decimal ms que los

    utilizados para las observaciones xi .

  • Ejemplo 2: Si lo datos vienen dados por sus tablas de frecuencia, como en el

    ejemplo de la cantidad de das que los 30 empleados de una fbrica

    llegan tarde en un trimestre de trabajo:

    Valor Frecuencia

    1 5

    2 1

    3 0

    4 8

    5 8

    6 3

    7 2

    8 1

    9 2

    n = 30

    1

    1

    c

    i i

    i

    c

    i

    i

    x f

    x

    f

    1*5 3*1 4*8 5*8 6*3 7*2 8*1 9*2

    30x

    4.6x

  • Si la poblacin es finita, de tamao N, entonces

    la media poblacional es:

    1

    N

    i

    i

    x

    N

    Si se conocen los datos poblacionales

    agrupados por intervalos de clase podemos

    estimar esta media poblacional con la frmula:

    1

    1

    c

    i i

    i

    c

    i

    i

    x f

    f

    donde fi es la frecuencia del

    intervalo, xi es el punto medio

    del intervalo y c es la cantidad

    de intervalos de clase

  • Otras veces se necesita calcular el promedio pesado

    porque los valores corresponden a distintos porcentajes

    de la poblacin. Por ejemplo:

    Ejemplo 6:

    Los costos por alumno de los diferentes niveles

    educativos en Inglaterra en libras son:

    Primaria: 890; Secundaria: 1450; post secundaria:1910

    La proporcin de alumnos en cada nivel educativo es:

    Primaria: 44,4%; Secundaria: 38,9%; post secundaria:

    16,7%.

    El gasto promedio de un alumno cualquiera de ese pas

    es (media poblacional):

    890*0.44 1450*0.389 1910*0.167

    = 1277.8 libras

  • II. Modo:

    Es el valor que se presenta con mayor frecuencia en el

    conjunto de datos.

    Ejemplo 7:

    Se registra en dos negocios la cantidad de vestidos de los

    distintos talles que se venden en una semana de trabajo.

    Los datos son:

    Talles Cantidad de vestidos

    8 7

    10 25

    12 36

    14 11

    16 3

    118 1

    Talles Cantidad de vestidos

    8 8

    10 25

    12 25

    14 15

    16 9

    118 1

    unimodal (un solo modo) bimodal (tiene dos modos)

  • III. Mediana:

    Sean x1, x2, ..., xn las observaciones. Los datos ordenados

    de menor a mayor se notan:

    (1) (2) ( ); ;...; nx x x

    Se define la mediana muestral como:

    valor medio o central si n es imparx

    promedio de las dos observaciones centrales si n es par

    Al igual que en el caso de la media, podemos pensar un

    una mediana poblacional a la que notaremos:

  • Para calcular la mediana en el caso de datos

    agrupados por intervalos de clase se debe calcular el

    intervalo donde estar ubicada la mediana y usar la

    siguiente frmula:

    1

    2L U L

    NF

    x x x xf

    xL = lmite inferior del intervalo que contiene a la mediana.

    xU = lmite superior del intervalo que contiene a la mediana.

    N = nmero total de observaciones.

    F = frecuencia acumulada hasta el intervalo ms prximo al

    de la mediana;

    f = frecuencia del intervalo donde se encuentra la mediana.

  • Ejemplo 3:

    Los datos que se presentan a continuacin indican el ingreso per

    capita en miles de dlares para 50 estados de EEUU en 1983.

    Valor Frecuencia Frecuencia

    acumuladas

    [8, 9) 1 1

    [9, 10) 13 14

    [10, 11) 7 21

    [11, 12) 13 34

    [12, 13) 9 43

    [13, 14) 4 47

    [14, 15) 2 49

    [15, 18) 1 50

    totales 50 50

    11Lx

    12Ux

    N = 50

    F = 21

    f = 13

    11.35x

  • IV. Cuartiles y percentiles:

    Ejemplo 3:

    Los datos que se presentan a continuacin indican el ingreso per

    capita en miles de dlares para 50 estados de EEUU en 1983.

    Calcular el tercer cuartil (75% de los datos a su izquierda)

    Valor Frecuenc

    ia

    Frecuencia

    acumuladas

    [8, 9) 1 1

    [9, 10) 13 14

    [10, 11) 7 21

    [11, 12) 13 34

    [12, 13) 9 43

    [13, 14) 4 47

    [14, 15) 2 49

    [15, 18) 1 50

    totales 50 50

    0.75

    3 1

    4L U L

    NF

    x x x xf

    0.7538,25 34

    12 13 129

    x

    0.75 12.47x

  • Ejemplo 2:

    En el ejemplo de la cantidad de das que los 30 empleados de una

    fbrica llegan tarde en un trimestre de trabajo:

    Valor Frecuen-

    cia

    Frec.

    Acumu-

    lada

    1 5 5

    2 1 6

    3 0 6

    4 8 14

    5 8 22

    6 3 25

    7 2 27

    8 1 28

    9 2 30

    n = 30

    El primer cuartil indica el 25% de

    las observaciones:

    F= 0.25*31 = 7.75

    corresponde a x=4

    El tercer cuartil indica el 75% de

    las observaciones:

    F= 0.75*31 = 23.5

    corresponde a x=6.

  • Ejemplo para datos listados:

    a) Sean las siguientes 8 observaciones ordenadas:

    2 ; 3 ; 5 ; 6 ; 8 ; 8 ; 9.2 ; 10.

    QI est en la posicin 9/4= 2.25 3 0.25* 5 3 3.50 IQ

    Q3 est en la posicin 27/4= 6.75 3 8 0.75* 9.2 8 8.9 Q

    b) Si tuvisemos 9 observaciones:

    2 ; 3 ; 5 ; 6 ; 8 ; 8 ; 9 ; 10 ; 12.

    QI est en la posicin 10/4= 2. 5 3 0.5* 5 3 4 IQ

    9 0.5* 10 9 9.5 IQ Q3 est en la posicin 30/4= 7.5

  • b.- Medidas de dispersin

    I.- Rango muestral:

    Se define como la diferencia entre el valor mximo y el valor

    mnimo de la muestra.

    r = mx(xi) mn(xi) = ( ) (1)nx x

    Ejemplo:

    x 0 5 5 5 10

    y 0 1 5 9 10

    5x y 5x y rx = ry = 10

  • II.- Varianza y Desvo estndar:

    a. Varianza poblacional para una poblacin finita

    Para datos listados: 2 2

    1

    1( )

    n

    i

    i

    xN

    Para tabla de frecuencias: 2 2

    1

    1

    1( )

    c

    i ic

    ii

    i

    f x

    f

    b. Varianza muestral

    Para datos listados: 2 2

    1

    1( )

    1

    n

    i

    i

    s x xn

    Para tabla de frecuencias: 2 2

    1

    1( )

    1

    c

    i i

    i

    s f x xn

  • Frmulas de clculo para la varianza poblacional

    2 2

    2 1

    N

    i

    i

    x N

    N

    2 2

    2 1

    n

    i i

    i

    x f N

    N

    Frmulas de clculo para la varianza muestral

    2 2

    2 1

    1

    n

    i

    i

    x nx

    sn

    2 22 1 1

    1

    1

    c c

    i i i

    i i

    c

    i

    i

    x f x f

    s

    f

    El desvo estndar muestral, notado con s , es la raiz cuadrada

    de la varianza

  • Ejemplo 3:

    Los datos corresponden al ingreso per capita en miles de

    dlares para 50 estados de EEUU en 1983. Calcular la

    varianza de esta muestra. Valor fi xi xifi

    [8, 9) 1 8.5 8.5 72.25 72.25 [9, 10) 13 9.5 123.5 90.25 1173.25 [10, 11) 7 10.5 73.5 110.25 771.75 [11, 12) 13 11.5 149.5 132.25 1719.25 [12, 13) 9 12.5 112.5 156.25 1406.25 [13, 14) 4 13.5 54.0 182.25 729 [14, 15) 2 14.5 29.0 210.25 420.5 [15, 18) 1 16.5 16.5 272.25 272.25

    totales 50 6564.5

    2

    ix2

    i ix f

    11.34x

    22 6564.5 50*11. 2.7494

    3

    49

    4s

    2 1.658s s

    El desvo estndar es aproximadamente 1658 dlares

  • III.- Coeficiente de variacin:

    Datos poblacionales: .coef var

    Datos muestrales: .s

    coef varx

    Ejemplo 8:

    El salario promedio de las mujeres es $16.800 y el desvo

    estndar es $3.800. Para los hombres el salario promedio es

    $19.500 y el desvo $4.750. Cul de las dos poblaciones

    tiene mayor variabilidad?

    0.24364750

    .19500

    coef var hombres

    30

    800.

    16800.2262coef var mujeres

    El desvo es mayor en los hombres.

  • V.- Rango intercuartil:

    Se define como la diferencia entre el tercer cuartil y el

    primer cuartil:

    3 1Id Q Q

    Indica la amplitud del intervalo que contiene al 50%

    de las observaciones centrales.

    VI. Diagrama de caja o box-plot:

    Permite describir caractersticas del conjunto de datos, por

    ejemplo:

    centro

    dispersin

    naturaleza y magnitud de cualquier desviacin de la simetra

    identificacin de puntos atpicos (outliers)

  • 2.68 3.06 4.31 4.71 5.71 5.99 6.06 7.04 7.17 7.46 7.50

    8.27 8.42 8.73 8.84 9.14 9.19 9.21 9.39 11.28 15.19 21.06

    Ejemplo:

    Consideremos las siguientes observaciones ya

    ordenadas ( n = 22 ).

  • Ejemplo 1:

    Losdatos corresponden al ejemplo de la cantidad de das que

    los 30 empleados de una fbrica llegan tarde en un trimestre

    de trabajo:

    Valor Frecuencia

    1 5

    2 1

    3 0

    4 8

    5 8

    6 3

    7 2

    8 1

    9 2

    n = 30

  • Ejemplo 2:

    Relacin precio-rendimiento de 25 acciones

    (price earnings ratios)

    Valor Frecuencia

    [5, 9) 3

    [9, 13) 5

    [13, 17) 7

    [17, 21) 6

    [21, 25) 3

    [25, 29) 1

    n = 25

  • Ejemplo 3:

    Los datos que se presentan a continuacin indican el ingreso per

    capita en miles de dlares para 50 estados de EEUU en 1983.

    Valor Frecuencia

    [8, 9) 1

    [9, 10) 13

    [10, 11) 7

    [11, 12) 13

    [12, 13) 9

    [13, 14) 4

    [14, 15) 2

    [15, 18) 1

    totales 50