estadistica-scsf-03

Upload: avefenyz

Post on 16-Oct-2015

2 views

Category:

Documents


0 download

TRANSCRIPT

  • MEDIDAS DE RESUMEN: MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA MEDIDAS DE TENDENCIA CENTRAL Y DISPERSICENTRAL Y DISPERSINN

    Lic. Esperanza GarcLic. Esperanza Garca a CribillerosCribilleros

  • ANANLISIS EXPLORATORIO DE LISIS EXPLORATORIO DE DATOSDATOS

    Diagrama de tallo y hojasDiagrama de tallo y hojasDiagrama de cajaDiagrama de caja

  • DESCRIPCIDESCRIPCIN DE LOS DATOSN DE LOS DATOS

    TablasTablas GrGrficosficosMedidas de resumenMedidas de resumen

  • Stem-and-Leaf Display: Perdida de peso

    Stem-and-leaf of Prdida de peso N = 65Leaf Unit = 0.10

    1 9 02 9 55 10 0008 10 56913 11 0000315 11 7826 12 0000000012329 12 566(11) 13 0000000022425 13 55566719 14 000002223338 14 5565 15 00033

    Diagrama de Tallos y hojasLos datos tienen un decimal

    Terminacin de dgitos del 0 al 4

    Terminacin de dgitos del 5 al 9

    8 datos menores e iguales que 10.9

    11 datos entre 13 y 13.4 y uno de ellos es la mediana

    8 datos mayores e iguales que 14.5

    tallo hojas

  • BOXPLOT (Diagrama de Cajas)BOXPLOT (Diagrama de Cajas) Es un grEs un grfico que nos sirve para ver cfico que nos sirve para ver cmo estmo estn distribuidas las n distribuidas las

    observaciones (distribuciobservaciones (distribucin sesgada a la derecha o izquierda), n sesgada a la derecha o izquierda), comparacicomparacin de la dispersin de la dispersin de dos o mas conjuntos de datos y si n de dos o mas conjuntos de datos y si existen valores extremos que afectan a la distribuciexisten valores extremos que afectan a la distribucin.n.

    XmXmninonino : Es la observaci: Es la observacin de menor valor n de menor valor XmXmximoximo : Es la observaci: Es la observacin de mayor valor n de mayor valor Q1 : Primer Q1 : Primer CuartilCuartil Q3 : Tercer Q3 : Tercer CuartilCuartil Si aparece * en la grafica significa que es un valor extremoSi aparece * en la grafica significa que es un valor extremo

    Mediana Q3Q1 XmximoXmnimo

  • EJEMPLO:EJEMPLO:Se tienen las edades de 35 pacientes:Se tienen las edades de 35 pacientes:

    2833455635382227463820554536292234216423452653374554123628283943213235

    Explorar los datos especialmente para ver la simetra.

  • DIAGRAMA DE CAJAS

    Valor mximo

    E

    d

    a

    d

    70

    60

    50

    40

    30

    20

    10

    EDAD DE 35 MADRES

    MeQ3

    Q1

    Valor Mximo

    Valor mnimo

  • Diagrama de tallos y hojasDiagrama de tallos y hojas

    Hojas

    Tallo

    12 madres tienen 29

    aos o menos

    11 madres tiene 43 aos o

    ms

    Stem-and-leaf of Edad N = 35Leaf Unit = 1.0

    1 1 212 2 01122367889(12) 3 23455667888911 4 3555565 5 34561 6 4

  • MEDIDAS DE RESUMEN PARA MEDIDAS DE RESUMEN PARA VARIABLES CUANTITATIVASVARIABLES CUANTITATIVAS

    MEDIDAS DE TENDENCIA CENTRAL O DE POSICIMEDIDAS DE TENDENCIA CENTRAL O DE POSICIN: N: MEDIA ARITMMEDIA ARITMTICA, TICA, MEDIANA, MEDIANA, MODAMODAOTRAS MEDIDAS : PERCENTILES Y CUARTILESOTRAS MEDIDAS : PERCENTILES Y CUARTILES

    MEDIDAS DE DISPERSIMEDIDAS DE DISPERSIN: N: RANGORANGOVARIANZAVARIANZADESVIACION ESTANDARDESVIACION ESTANDARCOEFICIENTE DE VARIACIONCOEFICIENTE DE VARIACIONINTERVALO CUARTILARINTERVALO CUARTILAR

  • MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE TENDENCIA CENTRALO POSICIO POSICINN

    Son valores que indican el centro de la distribucin de los datos. Es el valor representativo de estos. Las ms usadas son: la media aritmtica o promedio, la mediana, moda, cuartiles y percentiles .

  • MEDIDA DE ASIMETRMEDIDA DE ASIMETRAA

    DistribuciDistribucin simn simtrica:trica: Cuando su curva de Cuando su curva de frecuencia es simfrecuencia es simtrica con respecto al centro trica con respecto al centro de los datos, en este caso de los datos, en este caso =Me=Mo.=Me=Mo.

    7654321

    9

    8

    7

    6

    5

    4

    3

    2

    1

    0

    X

    F

    r

    e

    q

    u

    e

    n

    c

    y

    Distribucion simetrica

  • DistribuciDistribucin asimn asimtrica positiva trica positiva >Me>Mo>Me>Mo

    654321

    8

    7

    6

    5

    4

    3

    2

    1

    0

    X

    F

    r

    e

    q

    u

    e

    n

    c

    y

    Distribucion asimetrica positiva

    DistribuciDistribucin asimn asimtrica negativatrica negativa

  • MEDIA ARITMETICA:MEDIA ARITMETICA:Medida descriptiva de tendencia central, llamada Medida descriptiva de tendencia central, llamada tambitambin promedio. Resulta de sumar los valores de n promedio. Resulta de sumar los valores de todas las observaciones y dividir la sumatoria entre todas las observaciones y dividir la sumatoria entre el total de ellas.el total de ellas.

    Nx i=

    Parmetron

    xxxxnxx ni ++++== ...321

    Estadstica

    Se caracteriza por:Ser nicaFcil de calcularEs afectada por todos los valores

    DondeN es la poblacinn es la muestraxi Valores de x1, x2, , xn

    la media muestralx

  • PASOS PARA CALCULAR LA MEDIA:PASOS PARA CALCULAR LA MEDIA:

    1.1. Verificar la simetrVerificar la simetra de los datos: Edadesa de los datos: Edades

    2833455635382227463820554536292234216423452653374554123628283943213235

    E

    d

    a

    d

    70

    60

    50

    40

    30

    20

    10

    EDAD DE 35 MADRES

    aos....nxx i

    093635

    283635 =+++=

    =

    Las madres tuvieron en promedio 36.09 aos

    2.

  • Es el valor que divide al conjunto ordenado de Es el valor que divide al conjunto ordenado de datos en dos grupos de igual tamadatos en dos grupos de igual tamao en cuanto al o en cuanto al nnmero de observaciones se refiere.mero de observaciones se refiere.Es Es nica, fnica, fcil de calcular y los valores extremos cil de calcular y los valores extremos no afectan su valor.no afectan su valor.

    MEDIANA

    Pasos:1. Los datos se ordenan en forma creciente: x1 + x2 ++xn2. Calcular la mediana teniendo en cuenta:

    a) Si n es par: con la frmula

    21 /)n(xMe +=n Tamao de muestra

    Me es la mediana

    Valor de la mediana21 /)n(x +

  • Donde: Me es la medianan es el tamao de la muestra(n+1)/2 es la posicin donde se

    encuentra la mediana.

    Datos ordenados

    1 2 3 4 5 6 7 8 9 10 11 1212 20 21 21 22 22 23 26 27 28 28 29

    13 14 15 16 17 18 19 20 21 22 23 2432 33 34 35 35 36 36 37 38 38 38 39

    25 26 27 28 29 30 31 32 33 34 35 3643 45 45 45 45 46 53 54 55 56 64

    aosxMe /n 3621 == + n impar

  • b) Si b) Si n es par:n es par:

    MODAMODAValor mValor ms frecuente en el conjunto. En el s frecuente en el conjunto. En el ejemplo es 45ejemplo es 45

    2

    122++

    =nn xx

    Me

    Donde:

    X n/2 Valor en la pesa posicin

    X (n/2) +1 Valor en la posicin siguiente.

  • CuartilesCuartiles Tres valores que dividen a un conjunto de Tres valores que dividen a un conjunto de

    datos en 4 partes iguales.datos en 4 partes iguales.

    41

    1+= nQ

    4)1(3

    3+= nQ

    1 2 3 4 5 6 7 8 9 10 11 1212 20 21 21 22 22 23 26 27 28 28 2913 14 15 16 17 18 19 20 21 22 23 2432 33 34 35 35 36 36 37 38 38 38 3925 26 27 28 29 30 31 32 33 34 35 3643 45 45 45 45 46 53 54 55 56 64

    posicinQ 94135

    1 =+=

    Q1Q3

    posicin)n(Q 274

    133 =+=

  • Valor de Valor de Q=xQ=xnn/2/2+0. +0. ( x( x (n/2)+1(n/2)+1 ) ) (x(xn/2n/2))

    Usos de los cuartiles: Para indicar el porcentaje igual o menor que el

    valor de un cuartil

    Para construir la curva endmica

    Para describir el 50% central de las observaciones

    Elaboracin del grfico de caja.

    25% 25% 25% 25%

    Q1 Q2 Q3

    RICRIC

  • CURVA ENDCURVA ENDMICAMICA

    Q3Q2 =Me

    Q1

  • PERCENTILES:PERCENTILES: 99 valores que dividen a un conjunto de 99 valores que dividen a un conjunto de

    datos en 100 partes iguales. Indica el datos en 100 partes iguales. Indica el porcentaje de la distribuciporcentaje de la distribucin igual o n igual o menor a su valor.menor a su valor.

    Ejemplo: Se tienen las edades de 35 Ejemplo: Se tienen las edades de 35 madres.madres.

    1 2 3 4 5 6 7 8 9 10 11 1212 20 21 21 22 22 23 26 27 28 28 29

    13 14 15 16 17 18 19 20 21 22 23 2432 33 34 35 35 36 36 37 38 38 38 39

    25 26 27 28 29 30 31 32 33 34 35 3643 45 45 45 45 46 53 54 55 56 64

  • Primero se ordenan los datos de menor a Primero se ordenan los datos de menor a mayor.mayor.

    CClculo: lculo:

    El valor del percentil 25 es 27 aEl valor del percentil 25 es 27 aos os Valor del percentil 70Valor del percentil 70

    1001 )n(k

    iP+= posicin)(P 9100 1352525 =+=

    aos.)(..*P 44343452043225103670

    70 =+==

  • Uso de los Uso de los percentilespercentiles:: Para comparar un valor de un individuo Para comparar un valor de un individuo

    con un conjunto de normas.con un conjunto de normas. Para determinar Rangos normales de Para determinar Rangos normales de

    ananlisis de laboratorio. Los llisis de laboratorio. Los lmites mites normales de muchos annormales de muchos anlisis se ubican lisis se ubican entre el percentil 2.5 y 97.5 .entre el percentil 2.5 y 97.5 .

    TambiTambin se usa para establecer el rango n se usa para establecer el rango intercuartintercuartlicolico. .

  • MEDIDAS DE DISPERSIMEDIDAS DE DISPERSINNMiden la variabilidad de un conjunto de Miden la variabilidad de un conjunto de datos.datos.

    RangoVarianza Desviacin estndarCoeficiente de variacinIntervalo cuartilar

  • RANGORANGOEs la diferencia entre el valor mEs la diferencia entre el valor ms s grande y el mgrande y el ms peques pequeo del conjunto de o del conjunto de datos.datos.

    Rango = Valor mRango = Valor mximo ximo -- Valor mValor mnimonimo

    R = 64 R = 64 12 = 5212 = 52

  • VARIANZAVARIANZAEs la medida que cuantifica la variabilidad Es la medida que cuantifica la variabilidad de los datos respecto al valor de la media.de los datos respecto al valor de la media.

    Donde: xi valores de la variable, x1 , x2, etc. n es de la muestra

    es la media aritmticax

    1

    22

    =

    n)xx(s i

  • USOS:USOS: En inferencia estadEn inferencia estadsticastica Para calcular la desviaciPara calcular la desviacin n

    estestndar.ndar. Para calcular el tamaPara calcular el tamao de o de

    muestra.muestra.

  • Ejemplo: Ejemplo: Los datos de la siguiente tabla son los mismos Los datos de la siguiente tabla son los mismos que se usaron para el cque se usaron para el clculo de las medidas de lculo de las medidas de tendencia central.tendencia central.

    0)( = xxi Propiedad de la media, por eso se eleva al cuadrado

    2833455635382227463820554536292234216423452653374554123628283943213235

    ( ) ( ) ( ) 4436145135

    093628093632093635 2222 .......s =+++=

  • One-Sample Kolmogorov-Smirnov Test

    2020.052.212

    .111

    .109-.111.496.966

    NMeanStd. Deviation

    Normal Parametersa,b

    AbsolutePositiveNegative

    Most ExtremeDifferences

    Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)

    respiracionesx minuti

    (muestra)

    Test distribution is Normal.a.

    Calculated from data.b.

    PRUEBA DE HIPTESIS

  • DESVIACION ESTANDAR: DESVIACION ESTANDAR: Es la raEs la raz cuadrada positiva de la varianza. Mide la z cuadrada positiva de la varianza. Mide la variabilidad de los datos en las unidades en que se variabilidad de los datos en las unidades en que se midieron originalmente. Los smidieron originalmente. Los smbolos son: mbolos son: s, s, si es si es una muestra y ; una muestra y ; si es una poblacisi es una poblacin.n.

    CaracterCaractersticas de la desviacisticas de la desviacin estn estndar:ndar:1.1. Siempre es un valor positivoSiempre es un valor positivo2.2. EstEst influenciada por todos los valores de la influenciada por todos los valores de la

    muestra o poblacimuestra o poblacin.n.3.3. Mayor influencia ejercen los valores extremos Mayor influencia ejercen los valores extremos

    debido a que son elevados al cuadrado en el debido a que son elevados al cuadrado en el cclculo.lculo.

    4.4. Sirve para definir la dispersiSirve para definir la dispersinn de los datos de los datos alrededor de la media. alrededor de la media.

    2ss =

  • Aproximadamente el 68% de los alumnos tuvieron 36.09 12.06 aos.

    061244361452 ..ss ===

    Interpretacin:

    Las madres tuvieron en promedio 36.09 aos con una desviacin estndar de 12.06

  • 3.573.5766BB

    1.311.3166AA

    DesviaciDesviacin Estn EstndarndarVarianzaVarianzaMediaMediaGrupoGrupo

    Tabla 1. Medidas Descriptivas de las Edades de dos Tabla 1. Medidas Descriptivas de las Edades de dos GruposGrupos

    5. Sirve para comparar

    Dos grupos teniendo la misma media podemos identificar el ms disperso. Cuando las medias son diferentes , para identificar cul es el ms variado se tiene que hacer utilizando el COEFICIENTE DE VARIACIN.

  • COEFICIENTE DE VARIACICOEFICIENTE DE VARIACIN:N:Medida de variabilidad relativa: Se usa para comparar la Medida de variabilidad relativa: Se usa para comparar la variabilidad entre dos o mvariabilidad entre dos o ms muestras medidas en las s muestras medidas en las mismas unidades o no.mismas unidades o no.

    %...

    xsCV 4233

    09360612100 ===

    Si el coeficiente es:< 10 % poca dispersin10 33% aceptable34 50% alta dispersin> 50% muy alta

    El CV es til cuando se quieren comparar el efecto de un tratamiento en dos o ms grupos.

  • PorquPorqu se usa la media junto con la desviacise usa la media junto con la desviacin n estestndar en el anndar en el anlisis de datos?lisis de datos?

    Se quiere expresar una medida que represente Se quiere expresar una medida que represente a todos los datos (media) pero al mismo tiempo se a todos los datos (media) pero al mismo tiempo se desea expresar la variacidesea expresar la variacin de los mismos respecto n de los mismos respecto a esa medida de tendencia central.a esa medida de tendencia central.CuCul es la medida que expresa homogeneidad de l es la medida que expresa homogeneidad de un conjunto de datos? un conjunto de datos?

    El coeficiente de variaciEl coeficiente de variacinnCuCul es la ventaja de calcular medidas de resumen l es la ventaja de calcular medidas de resumen con los datos sin agrupar?con los datos sin agrupar?

    La mayor exactitud de La mayor exactitud de stas.stas.

    PREGUNTAS

  • MEDIDAS DEMEDIDAS DE RESUMEN CON DATOS RESUMEN CON DATOS AGRUPADOSAGRUPADOS

    Presinsistlica(mmHg) N Pm Fa107-116117-126127-136137-146147-156157-166

    721421884

    112122132142152162

    728708896100

    Total 100

    Ejemplo: PRESIN SISTLICA EN 100 PACIENTESPresinsistlica(mmHg) N Pm Fa107-116117-126127-136137-146147-156157-166

    721421884

    112122132142152162

    728708896100

    Total 100

  • CLCULO DE LA MEDIA ARITMTICA:

    ( )100

    1

    = =k

    iii fm

    x

    mi es el punto mediofi frecuencia absoluta absolutan tamao de la muestra

    ( ) ( ) Hgmmx /1.133100

    4162...21122)7112( =+++=

  • Presinsistlica(mmHg) N Pm Fa107-116117-126127-136137-146147-156157-166

    721421884

    112122132142152162

    728708896100

    Total 100

    PRESIN SISTLICA EN 100 PACIENTES

    mmHgMe 24.13210422850127 =

    += mmHgMo 67.13110242121127 =

    ++=

    If

    Fan

    LIMeMe

    += 2

    Idd

    dLIMo

    ++= 211

    Clculo de la Mediana:

  • CClculo de la Varianza:lculo de la Varianza:PRESIPRESIN SISTN SISTLICA EN 100 PACIENTESLICA EN 100 PACIENTES

    ( ) ( )11

    2222

    =

    =n

    xnxn

    xms i

    Presinsistlica(mmHg)

    N Pm Fa107-116117-126127-136137-146147-156157-166

    721421884

    112122132142152162

    728708896100

    Total 100

    ( ) ( ) ( ) 22222 6.1899

    41.133162...211.13312271.133112 mmHgs =+++=

  • mmHgs 31.46.18 ==DESVIACIN ESTNDAR

  • CALCULO DE CUARTILES Y PERCENTILESPresinsistlica(mmHg) N Pm Fa

    107-116117-126127-136137-146147-156157-166

    721421884

    112122132142152162

    728708896100

    Total 100

    If

    Fank

    LIQQ

    k

    +=

    1

    4)(

    mmHgQ 57.1251021

    7251171 =

    +=

    If

    Fank

    LIPkP

    k

    += 100

    )(mmHgP 75.15510

    8889514795 =

    +=