clase 2 estadistica basica

Upload: st4sis

Post on 07-Jan-2016

218 views

Category:

Documents


0 download

DESCRIPTION

estadística básica curso de evaluación de yacimientos

TRANSCRIPT

  • Medidas de posicin Media Aritmtica : Promedio aritmtico de los datos, es decir promedia las leyes de los datos presentes en dicho conjunto en el cual todos tiene el mismo peso ( igual ponderacin).

    Cuantiles o Percentiles : Valores que dividen la poblacin en partes de igual nmero de datos. La mediana divide la poblacin en dos partes, los cuartiles en cuatro partes ( la mediana coincide con el segundo cuartil), as con las siguientes divisiones.

    Mnimo y Mximo : Establecen el rango en el cual se distribuyen los datos.

    Estadstica Bsica

    Mediana : Es el valor donde el 50% de los datos es menor y el 50% es mayor, es decir divide a la muestra en dos partes iguales.

    Mnimo y Mximo : Establecen el rango en el cual se distribuyen los datos.

    Medidas de dispersin

    Varianza : Promedio aritmtico de la desviacin cuadrtica entre cada valor y la media. Esta medida cuantifica la dispersin del histogramay se expresa en el cuadrado de la unidad de la variable en estudio.

    Desviacin estndar : Raz cuadrada de la varianza; se expresa en la misma unidad que la variable en estudio. Representa cuan dispersos se encuentran los datos, a mayor valor mayor dispersin y viceversa.

    Coeficiente de variacin : Razn entre la desviacin estndar y la media. De acuerdo a estudios realizados por SME Mining Engineering Handbook se llego a la conclusin que el coeficiente de variacin (CV) es un parmetro muy importante al momento de poder

    interpretar la distribucin de las leyes de un yacimiento y que puede resumirse en la siguiente tabla:

    C.V. = Desviacin Estndar / Media

  • CV Interpretacin

    0.0 - 0.25 Caso Simple. Leyes distribuidas simtricamente. La estimacin de Recursos es fcil. La mayora de los mtodos funcionarn.

    0.25 - 1.0 Distribuciones sesgadas con moderada dificultad en la

    estimacin de recursos. Las distribuciones son tipicamente lognormal.

    1.0 - 2.0 Distribuciones altamente sesgadas con un gran rango de leyes.

    Dificultad a la hora de estimar los recursos locales.

    > 2.0 Distribuciones altamente errticas, datos sesgados o mltiples

    poblaciones. La estimacin local es difcil de estimar o imposible de estimar.

    Medidas de forma

    Asimetra : Es una medida de forma de una distribucin, la que permite identificar y describir la manera como los datos tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribucin. Permite identificar las caractersticas de la distribucin de datos sin

    necesidad de generar el grfico.

    Curtosis o apuntamiento : La curtosis mide el grado de agudeza o achatamiento de una distribucin con relacin a una distribucin normal. Adems determina el grado de concentracin que presentan los valores en la regin central de la distribucin.

  • Tipos de Distribuciones

    Distribucin normal o funcin de densidad de probabilidad gausiana: es la curva conocida

    Comnmente como campana y es simtrica alrededor de la media.

    Distribucin Lognormal: si la variable x es transformada usando el logaritmo y estos valores

    Transformados tienen una distribucin normal, se dice que la variable tiene una distribucinTransformados tienen una distribucin normal, se dice que la variable tiene una distribucin

    lognormal.

  • Histograma : Es una representacin grfica de una poblacin muestral, la cual se separa por intervalos

    (clases) que cubre todo el dominio de las muestras.

    Grfico de probabilidades : Este grfico es utilizado para reconocer multiples poblaciones, para lo cual es

    necesario entender la divisin del grfico de probabilidades.

    6354453627189

    1er cuartil 14.890

    Mediana 21.344

    3er cuartil 29.450

    Mximo 68.730

    A -cuadrado 393.47

    V alor P < 0.005

    Media 23.376

    Desv .Est. 11.455

    V arianza 131.209

    A simetra 1.01790

    Kurtosis 1.04726

    N 26544

    Mnimo 2.275

    Prueba de normalidad de A nderson-Darling

    Resumen para FE

    necesario entender la divisin del grfico de probabilidades.

    Las distribuciones de las leyes generalmente no son normales, sino ms bien lognormales.

    Por lo tanto si hay dos tipos de mineralizacin, se puede esperar dos subpoblaciones distribuidas

    lognormalmente. Ej. Para el cobre: Sfuros y xidos, o para el hierro: estril, baja-mediana y alta ley.

  • 706050403020100

    100

    80

    60

    40

    20

    0

    FE

    P

    o

    r

    c

    e

    n

    t

    a

    j

    e

    Media 23.38

    Desv.Est. 11.45

    N 26544

    CDF emprica de FENormal

    706050403020100

    100

    80

    60

    40

    20

    0

    FE

    P

    o

    r

    c

    e

    n

    t

    a

    j

    e

    Ubic. 3.032

    Escala 0.5003

    N 26544

    CDF emprica de FELognormal

    806040200-20-40

    99.99

    99

    95

    80

    50

    20

    5

    1

    0.01

    FE

    P

    o

    r

    c

    e

    n

    t

    a

    j

    e

    Media 23.38

    Desv.Est. 11.45

    N 26544

    AD 393.470

    Valor P

  • Anlisis Bi-varial

    Correlacin: es una medida de similitud entre variables o items.

    Modo-R: tiene que ver con similitud entre variables.

    Modo-Q:tiene que ver con la similitud entre pares de la variable.

    R = cov(x,y)/(desv. est. x * desv. est. y) -1 < R < 1

  • Anlisis de regresin : Es una tcnica estadstica utilizada para estudiar la relacin entre variables.

    Hay situaciones en que es necesario ajustar una lnea recta a un set de datos pareados.

    XY ++= 10

    Donde 0, 1 son, respectivamente, el intercepto y la pendiente del modelo de regresin y es un error aleatorio. Utilizando el mtodos de los mnimos cuadrados.

    = =

    = = =

    =n

    i

    n

    iii

    n

    i

    n

    i

    n

    iiiii

    xxn

    yxyxn

    1 1

    22

    1 1 11 )(

    xy 10 =

    Una vez que se ajusta la recta de regresin, en lugar del error aleatorio, se cuenta con un valor observado

    .

    .

    Una vez que se ajusta la recta de regresin, en lugar del error aleatorio, se cuenta con un valor observado

    que es llamado residual, el cual se representa por ri o por

    ie ii yy =Estimacin de la varianza del error

    La varianza del error, representada por 2 es desconocida y se debe estimar usando los

    residuales. Un estimador insesgado de 2 es s2, llamado tambin el cuadrado medio del

    error.

    22

    )(1

    2

    1

    2

    2

    =

    =

    ==

    n

    e

    n

    yys

    n

    ii

    n

    iii

    806040200

    60

    40

    20

    0

    FE

    F

    E

    M

    A

    G

    Norte

    FEMAG = - 4.122 + 1.036*FE

    R2 = 94.87%

  • Anlisis Multivariado

    Regresin mltiple: En estadstica la regresin lineal o ajuste lineal es un mtodo matemtico que modela

    la relacin entre una variable dependiente Y, las variables independientes Xiy un trmino aleatorio .

    Este modelo puede ser expresado como:

    Anlisis discriminante: Es una tcnica estadstica multivariante, cuya finalidad es

    describir (si existen) las diferencias entre grupos de objetos sobre los que se observan variables

    (variables discriminantes). Ms concretamente, se comparan y describen las medias de las variables

    clasificadoras a travs de los grupos.

    Anlisis de factores : Es una tcnica estadstica de reduccin de datos usada para explicar las correlaciones

    entre las variables observadas en trminos de un nmero menor de variables no observadas llamadas

    factores. Las variables observadas se modelan como combinaciones lineales de factores ms expresiones

    de error.