Download - Clase 2 Estadistica Basica
-
Medidas de posicin Media Aritmtica : Promedio aritmtico de los datos, es decir promedia las leyes de los datos presentes en dicho conjunto en el cual todos tiene el mismo peso ( igual ponderacin).
Cuantiles o Percentiles : Valores que dividen la poblacin en partes de igual nmero de datos. La mediana divide la poblacin en dos partes, los cuartiles en cuatro partes ( la mediana coincide con el segundo cuartil), as con las siguientes divisiones.
Mnimo y Mximo : Establecen el rango en el cual se distribuyen los datos.
Estadstica Bsica
Mediana : Es el valor donde el 50% de los datos es menor y el 50% es mayor, es decir divide a la muestra en dos partes iguales.
Mnimo y Mximo : Establecen el rango en el cual se distribuyen los datos.
Medidas de dispersin
Varianza : Promedio aritmtico de la desviacin cuadrtica entre cada valor y la media. Esta medida cuantifica la dispersin del histogramay se expresa en el cuadrado de la unidad de la variable en estudio.
Desviacin estndar : Raz cuadrada de la varianza; se expresa en la misma unidad que la variable en estudio. Representa cuan dispersos se encuentran los datos, a mayor valor mayor dispersin y viceversa.
Coeficiente de variacin : Razn entre la desviacin estndar y la media. De acuerdo a estudios realizados por SME Mining Engineering Handbook se llego a la conclusin que el coeficiente de variacin (CV) es un parmetro muy importante al momento de poder
interpretar la distribucin de las leyes de un yacimiento y que puede resumirse en la siguiente tabla:
C.V. = Desviacin Estndar / Media
-
CV Interpretacin
0.0 - 0.25 Caso Simple. Leyes distribuidas simtricamente. La estimacin de Recursos es fcil. La mayora de los mtodos funcionarn.
0.25 - 1.0 Distribuciones sesgadas con moderada dificultad en la
estimacin de recursos. Las distribuciones son tipicamente lognormal.
1.0 - 2.0 Distribuciones altamente sesgadas con un gran rango de leyes.
Dificultad a la hora de estimar los recursos locales.
> 2.0 Distribuciones altamente errticas, datos sesgados o mltiples
poblaciones. La estimacin local es difcil de estimar o imposible de estimar.
Medidas de forma
Asimetra : Es una medida de forma de una distribucin, la que permite identificar y describir la manera como los datos tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribucin. Permite identificar las caractersticas de la distribucin de datos sin
necesidad de generar el grfico.
Curtosis o apuntamiento : La curtosis mide el grado de agudeza o achatamiento de una distribucin con relacin a una distribucin normal. Adems determina el grado de concentracin que presentan los valores en la regin central de la distribucin.
-
Tipos de Distribuciones
Distribucin normal o funcin de densidad de probabilidad gausiana: es la curva conocida
Comnmente como campana y es simtrica alrededor de la media.
Distribucin Lognormal: si la variable x es transformada usando el logaritmo y estos valores
Transformados tienen una distribucin normal, se dice que la variable tiene una distribucinTransformados tienen una distribucin normal, se dice que la variable tiene una distribucin
lognormal.
-
Histograma : Es una representacin grfica de una poblacin muestral, la cual se separa por intervalos
(clases) que cubre todo el dominio de las muestras.
Grfico de probabilidades : Este grfico es utilizado para reconocer multiples poblaciones, para lo cual es
necesario entender la divisin del grfico de probabilidades.
6354453627189
1er cuartil 14.890
Mediana 21.344
3er cuartil 29.450
Mximo 68.730
A -cuadrado 393.47
V alor P < 0.005
Media 23.376
Desv .Est. 11.455
V arianza 131.209
A simetra 1.01790
Kurtosis 1.04726
N 26544
Mnimo 2.275
Prueba de normalidad de A nderson-Darling
Resumen para FE
necesario entender la divisin del grfico de probabilidades.
Las distribuciones de las leyes generalmente no son normales, sino ms bien lognormales.
Por lo tanto si hay dos tipos de mineralizacin, se puede esperar dos subpoblaciones distribuidas
lognormalmente. Ej. Para el cobre: Sfuros y xidos, o para el hierro: estril, baja-mediana y alta ley.
-
706050403020100
100
80
60
40
20
0
FE
P
o
r
c
e
n
t
a
j
e
Media 23.38
Desv.Est. 11.45
N 26544
CDF emprica de FENormal
706050403020100
100
80
60
40
20
0
FE
P
o
r
c
e
n
t
a
j
e
Ubic. 3.032
Escala 0.5003
N 26544
CDF emprica de FELognormal
806040200-20-40
99.99
99
95
80
50
20
5
1
0.01
FE
P
o
r
c
e
n
t
a
j
e
Media 23.38
Desv.Est. 11.45
N 26544
AD 393.470
Valor P
-
Anlisis Bi-varial
Correlacin: es una medida de similitud entre variables o items.
Modo-R: tiene que ver con similitud entre variables.
Modo-Q:tiene que ver con la similitud entre pares de la variable.
R = cov(x,y)/(desv. est. x * desv. est. y) -1 < R < 1
-
Anlisis de regresin : Es una tcnica estadstica utilizada para estudiar la relacin entre variables.
Hay situaciones en que es necesario ajustar una lnea recta a un set de datos pareados.
XY ++= 10
Donde 0, 1 son, respectivamente, el intercepto y la pendiente del modelo de regresin y es un error aleatorio. Utilizando el mtodos de los mnimos cuadrados.
= =
= = =
=n
i
n
iii
n
i
n
i
n
iiiii
xxn
yxyxn
1 1
22
1 1 11 )(
xy 10 =
Una vez que se ajusta la recta de regresin, en lugar del error aleatorio, se cuenta con un valor observado
.
.
Una vez que se ajusta la recta de regresin, en lugar del error aleatorio, se cuenta con un valor observado
que es llamado residual, el cual se representa por ri o por
ie ii yy =Estimacin de la varianza del error
La varianza del error, representada por 2 es desconocida y se debe estimar usando los
residuales. Un estimador insesgado de 2 es s2, llamado tambin el cuadrado medio del
error.
22
)(1
2
1
2
2
=
=
==
n
e
n
yys
n
ii
n
iii
806040200
60
40
20
0
FE
F
E
M
A
G
Norte
FEMAG = - 4.122 + 1.036*FE
R2 = 94.87%
-
Anlisis Multivariado
Regresin mltiple: En estadstica la regresin lineal o ajuste lineal es un mtodo matemtico que modela
la relacin entre una variable dependiente Y, las variables independientes Xiy un trmino aleatorio .
Este modelo puede ser expresado como:
Anlisis discriminante: Es una tcnica estadstica multivariante, cuya finalidad es
describir (si existen) las diferencias entre grupos de objetos sobre los que se observan variables
(variables discriminantes). Ms concretamente, se comparan y describen las medias de las variables
clasificadoras a travs de los grupos.
Anlisis de factores : Es una tcnica estadstica de reduccin de datos usada para explicar las correlaciones
entre las variables observadas en trminos de un nmero menor de variables no observadas llamadas
factores. Las variables observadas se modelan como combinaciones lineales de factores ms expresiones
de error.