med dispersión _teoria

2
DIRECCIÓN ACADÉMICA DE INVESTIGACIÓN ALDO RAMÍREZ BRIONES ESTADÍSTICA GENERAL INGENIERO ESTADISTICO -1- MEDIDAS DE DISPERSIÓN Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan una parte de la información que necesitamos acerca de las características de los datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos medir también su dispersión, extensión o variabilidad. La dispersión es importante porque: 1. Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos. 2. Para poder elegir y comparar diferentes muestras a partir de sus dispersiones. Si no se desea tener una amplia dispersión de valores, debemos ser capaces de distinguir que presenta esa dispersión antes de abordar esos problemas. En conclusión: las medidas de dispersión son aquellas que miden cuánto se alejan de la media cada uno de los valores de la variable. VARIANZA Cada población tiene una varianza, que se simboliza con 2 (sigma cuadrada). Para calcular la varianza de una población, dividimos la suma de las distancias al cuadrado de la media y cada elemento de la población entre el número total de observaciones de dicha población. Siendo sus respectivas formulas: σ² = varianza de la población s² = varianza de la muestra La varianza tiene el inconveniente de que no viene expresada en las mismas unidades que los datos, debido a que las desviaciones están elevadas al cuadrado. Si los datos fueran en metros, la varianza vendría dada en metros cuadrados. Por esta razón, tenemos que hacer un cambio significativo en la varianza para calcular una medida útil y menos confusa. Esta medida se conoce como la desviación estándar y es la raíz cuadrada de la varianza, esta medida sí viene expresada en las mismas unidades que los datos. ( - = N x x N i i 2 2 2 1 σ ( - - = n x x n S i i 2 2 2 1 1

Upload: dayana-flores

Post on 14-Sep-2015

220 views

Category:

Documents


0 download

DESCRIPTION

lsdldñfalad,vld,vvsplcmv,bsm,bpvlksc,kcsvmsbbb

TRANSCRIPT

  • DIRECCIN ACADMICA DE INVESTIGACIN ALDO RAMREZ BRIONES ESTADSTICA GENERAL INGENIERO ESTADISTICO

    -1-

    MEDIDAS DE DISPERSIN

    Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda

    slo nos revelan una parte de la informacin que necesitamos acerca de las

    caractersticas de los datos. Para aumentar nuestro entendimiento del patrn de los

    datos, debemos medir tambin su dispersin, extensin o variabilidad.

    La dispersin es importante porque:

    1. Proporciona informacin adicional que permite juzgar la confiabilidad de la

    medida de tendencia central. Si los datos se encuentran ampliamente dispersos,

    la posicin central es menos representativa de los datos.

    2. Para poder elegir y comparar diferentes muestras a partir de sus dispersiones. Si

    no se desea tener una amplia dispersin de valores, debemos ser capaces de

    distinguir que presenta esa dispersin antes de abordar esos problemas.

    En conclusin: las medidas de dispersin son aquellas que miden cunto se alejan de la media cada uno de los valores de la variable.

    VARIANZA

    Cada poblacin tiene una varianza, que se simboliza con 12 (sigma cuadrada). Para

    calcular la varianza de una poblacin, dividimos la suma de las distancias al

    cuadrado de la media y cada elemento de la poblacin entre el nmero total de

    observaciones de dicha poblacin.

    Siendo sus respectivas formulas:

    = varianza de la poblacin s = varianza de la muestra

    La varianza tiene el inconveniente de que no viene expresada en las mismas

    unidades que los datos, debido a que las desviaciones estn elevadas al cuadrado.

    Si los datos fueran en metros, la varianza vendra dada en metros cuadrados. Por

    esta razn, tenemos que hacer un cambio significativo en la varianza para calcular

    una medida til y menos confusa. Esta medida se conoce como la desviacin

    estndar y es la raz cuadrada de la varianza, esta medida s viene expresada en las

    mismas unidades que los datos.

    ( )

    = N

    xx

    Ni

    i

    222 1 ( )

    = n

    xx

    nS ii

    222

    11

  • DIRECCIN ACADMICA DE INVESTIGACIN ALDO RAMREZ BRIONES ESTADSTICA GENERAL INGENIERO ESTADISTICO

    -2-

    DESVIACIN ESTNDAR

    La desviacin estndar de la poblacin, o 1, es simplemente la raz cuadrada de la

    varianza de la poblacin. Como la varianza es el promedio de las distancias al

    cuadrado que van desde las observaciones a la media, la desviacin estndar es la

    raz cuadrada del promedio de estas distancias. La desviacin estndar est en las

    mismas unidades que las que se usaron para medir los datos.

    Siendo sus respectivas formulas:

    = Desviacin Estndar de la poblacin

    S = Desviacin Estndar de la muestra

    COEFICIENTE DE VARIACIN

    La desviacin estndar (DE) es til como medida de la variacin dentro de un

    conjunto de datos. Sin embargo, cuando se desea comparar la dispersin en dos

    conjuntos de datos, comparar las DE pueden conducir a resultados sin sentido, si

    las medias se encuentran en distintas unidades de medicin. Lo que se necesita en

    situaciones como sta es una medida de variacin relativa, en lugar de una

    variacin absoluta. La medida que nos puede resolver este problema es el

    coeficiente de variacin (C.V.), llamado de Pearson, que es la relacin entre la DE y

    la media aritmtica; se multiplica adems por 100, para considerar el resultado en

    forma de porcentaje. A mayor el porcentaje, mayor es la variacin y viceversa. La

    frmula del CV est dada por:

    S = Desviacin estndar de una muestra

    = media aritmtica de una muestra

    El coeficiente de variacin es til cuando se desea comparar la variabilidad de dos

    conjuntos de datos en relacin con la media de cada conjunto. Se debe tener en

    cuenta lo siguiente:

    CV < 50% Datos Homogneos.

    50 < CV < 100% Datos Heterogneos.

    CV > 100% Datos Muy Heterogneos.

    ( )

    = N

    xx

    Ni

    i

    221 ( )

    = n

    xx

    nS ii

    22

    11

    100*XSCV =