determinísticos divisiÓn general de la estadÍstica
TRANSCRIPT
DeterminísticosDIVISIÓN GENERAL DE LA ESTADÍSTICADIVISIÓN GENERAL DE LA ESTADÍSTICADIVISIÓN GENERAL DE LA ESTADÍSTICADIVISIÓN GENERAL DE LA ESTADÍSTICA
Tipos de
variables
Cuantitativas
Cualitativas
Tipos de
modelos
Son aquellas que se cuentan, pueden tomar valor enteros positivos.
Ejemplos: cantidad de estudiantes inscritos en la materia, cantidad de sillas en el curso, cantidad de focos que tiene el aula, etc.
Tipos de
modelos
Son aquellas que dentro de un intervalo de clase o rango pueden tomar valores infinitos, es decir se pueden medir y los valores pueden estar expresados en fracciones.
Ejemplos: peso de una persona, estatura de un alumno, ventas de una empresa, etc.
DeterminísticosAgrupamiento de datos en categorías mutuamente excluyentes, que indican el número de observaciones en cada categoría.
Ejemplo: AUTOVENTA "SANTA CRUZ"
Precio de venta de vehículos (Ex. en $us)
Cantidad de vehículos
desde 5.000 hasta 10.000 13desde 10.000 hasta 15.000 21desde 20.000 hasta 25.000 35desde 25.000 hasta 30.000 39desde 30.000 hasta 35.000 12desde 35.000 y más 5
TOTAL 125
Tipos de
modelos
DeterminísticosLas clases se marcan en el eje horizontal y las frecuencias de clase en el eje vertical. Las frecuencias están representadas por las alturas de las barras.Ejemplo:
DeterminísticosSimilar al histograma, consiste en unir con una línea los puntos medios de los techos de los rectángulos del histograma.Ejemplo:
Determinísticos
También denominada como «promedio», es la suma de todos los valores, dividido entre el número total de los mismos.
Su principal desventaja es de que está muy afectada por los valores extremos (muy grandes o muy pequeños).
DeterminísticosEs el valor que corresponde al punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor. 50% de las observaciones son mayores que la mediana y 50% son menores que ella.
< = Mediana =>
Precios de 5 vehículos ordenados
de menor a mayor
Precios de 5 vehículos ordenados
de mayor a menor$us. 10.000 $us. 32.000$us. 15.000 $us. 28.000$us. 25.000 $us. 25.000$us. 28.000 $us. 15.000$us. 32.000 $us. 10.000
DeterminísticosEs el valor de la observación que aparece con más frecuencia.
¿Cuál es el valor modal de los precios?Precios de 5
vehículos ordenados de menor a mayor
$us. 10.000$us. 15.000$us. 25.000$us. 28.000$us. 32.000
NO hay valor modal
DeterminísticosPosiciones relativas de la media, mediana y moda.
MediaMediana
Moda
Distribución simétrica (sesgo cero)
DeterminísticosPosiciones relativas de la media, mediana y moda.
Asimétrica a la derecha(sesgo positivo)
Moda Mediana Media
Ej: Salarios Mensuales
Asimétrica a la izquierda (sesgo negativo)
Media Mediana Moda
Ej: Notas de un examen
Porque cuando la dispersión es amplia, la medida de tendencia central no es representativa.
Una medida de dispersión se puede utilizar para evaluar la confiabilidad de dos o más promedios.
Ejemplo:Ud. puede invertir en 2 portafolios de acciones, el 1ero tiene una rentabilidad promedio de $us. 10.000 anuales y el 2do de $us. 11.000 anuales. Suponiendo que el monto de la inversión a realizar es el mismo ¿Qué decisión tomaría?
Pero ¿Qué decisión tomaría si el 1er portafolio tiene una desviación estándar histórica de $us. 50, mientras que la desviación del 2do portafolio es de $us. 4.000 ?
La media aritmética de las desviaciones cuadráticas con respecto a la media.
La raíz cuadrática positiva de la varianza.
NOTA: La variancia es difícil de interpretar porque las unidades están al cuadrado, mientras que la desviación estándar se presenta en las mismas unidades que los datos.
Datos con baja dispersión
Media
Datos con alta dispersión
Media
Aplicable solamente a distribuciones simétricas del tipo de campana.
68% = 1 .95% = 2.
99,7% = 3.
Es la ración (cociente) de la desviación estándar y la media aritmética, expresada como un porcentaje.
NOTA: Al multiplicar por 100, se convierte la expresión decimal a porcentaje.
Si los datos son ordenados de menor a mayor, o de mayor a menor, los cuartiles dividen las observaciones en cuatro partes iguales, por lo tanto existen 3 cuartiles.
Q 1 Q 3Q 2 = Mediana
25%
25% 25%
25%
Si los datos son ordenados de menor a mayor, o de mayor a menor, los deciles dividen las observaciones en diez partes iguales, por lo tanto existen 9 deciles.
D5 Mediana
D1 D7
10%
D2 D3 D4 D6 D8 D9
10%10% 10%
10%
10%
10%
10%
10%10%
Si los datos son ordenados de menor a mayor, o de mayor a menor, los centiles dividen las observaciones en cien partes iguales, por lo tanto existen 99 centiles.
La asimetría es útil porque indica si la mayor cantidad de datos se encuentran por encima o debajo de la media.
Cuando el coeficiente es igual a cero, la distribución es simétrica.
Cuando el coeficiente es mayor que cero, la distribución es positivamente asimétrica.
Nota: El coeficiente puede variar entre 0 y 3, a medida que más se acerca a 3, la asimetría es mayor.
Cuando el coeficiente es menor que cero, la distribución es negativamente asimétrica.
Nota: El coeficiente puede variar entre 0 y -3, a medida que más se acerca a -3, la asimetría es mayor.
Mide el grado de deformación vertical, es decir, en que medida una curva de frecuencia está deformada hacia arriba o hacia abajo en relación a una curva normal.
4 4
1
1( ) /
n
ii
X X sn
Cuando el coeficiente de curtosis es igual a tres, la distribución es mesocurtica o normal.
Curtosis = 3
Cuando el coeficiente de curtosis es mayor a tres, la distribución es leptocurtica y es más apuntada de la distribución normal.
Curtosis > 3
Cuando el coeficiente de curtosis es menor a tres, la distribución es platicurtica y es menos apuntada de la distribución normal.
Curtosis < 3
Es el conjunto de técnicas estadísticas empleado para medir la intensidad de la asociación entre dos variables.
p = coeficiente de correlación de SpearmanD2 = Cuadrado de las diferencias entre X e YN = número de parejas
Ejemplos de grado de correlación:
Correlación = 0(X y Y no tienen relación lineal)
Y
X
.
..
.
...
.
.
.
.
.
.
..
.
..
.....
.
.
.
.
Número de hijos
Sa
lari
o
Correlación negativa (inversa) y débil
(X y Y tienen cierta relación lineal)
....
... .
.
.
.
.
.. ..
..
. .. ... .
..
Y
XPrecio
Ca
ntid
ad
ve
nd
ida
Correlación positiva (directa) y fuerte
(X y Y tienen una relación lineal intensa)
....
....
..
..
.
.
..
......
. ....
Y
XNotas escuela
No
tas
un
ive
rsid
ad
El siguiente cuadro resume la intensidad y la dirección del coeficiente de correlación:
1
Correlaciónnegativaperfecta
-1 0-0,5 0,5
SinCorrelación
Correlaciónpositivaperfecta
Correlaciónnegativa
(inversamente proporcional)
Correlaciónpositiva
(directamente proporcional)
Correlaciónnegativa
moderada Correlaciónnegativa
débil
Correlaciónnegativaintensa
Correlaciónpositiva
moderada Correlaciónpositivaintensa
Correlaciónnegativa
débil
DeterminísticosDIVISIÓN GENERAL DE LA ESTADÍSTICADIVISIÓN GENERAL DE LA ESTADÍSTICADIVISIÓN GENERAL DE LA ESTADÍSTICADIVISIÓN GENERAL DE LA ESTADÍSTICA
Valor que describe la posibilidad relativa de que ocurra un evento.
Una distribución de probabilidad muestra todos los resultados posibles de un experimento y la probabilidad de ocurrencia de cada resultado.
Cantidad de vehículos vendidos por día
Probabilidad P(x)
0 0,101 0,202 0,303 0,30
4 y más 0,10TOTAL 1,00
Seleccionar una distribución para un supuesto es uno de los pasos más desafiantes para realizar la simulación con Crystal Ball.
DistribuciónTipo de variable
Parámetros CondicionesAplicaciones y
Ejemplos
Continua - Media - Desviación estándar
- El valor de la media es el más probable. - Es simétrico con relación a la media. - Es más probable que los valores se encuentren cerca de la media.
Fenomenos naturales, alturas de las personas, inflación, cantidad de dias de un ítem en el inventarioetc.
Continua - Valor mínimo - Valor máximo - Valor más probable
- Los mínimos y los máximos están fijos. - La valor más probable se encuentra entre los valores mínimos y máximos, formando una distribución de forma triangular que muestra que los valores cercanos al mínimo y al máximo tienen menos probabilidad de ocurrir.
Es muy útil cuando los datos son limitados, pronostico en ventas y costos cuando se tienen 3 escenarios, etc.
DistribuciónTipo de variable
Parámetros CondicionesAplicaciones y
Ejemplos
Continua - Media - Desviación estándar - Ubicación
- El límite superior es ilimitado; el límite inferior es cero. - La distribución es sesgada positivamente, con la mayor parte de los valores cerca del límite inferior. - El logaritmo natural de la distribución es una distribución normal.
Las situaciones en lasque los valores sonsesgados positivamente,pero no pueden sernegativos, por Eje: Precios de acciones, inmuebles, escalas salariales, etc.
Continua - Valor mínimo - Valor máximo
- El mínimo está fijo. - El máximo está fijo. - Todos los valores en el rango tienen la misma probabilidad.
Cuando se conoce el rangoy todos los valoresposibles tienen lamisma probabilidad. Ej: Costos fijos de una empresa
DistribuciónTipo de variable
Parámetros CondicionesAplicaciones y
Ejemplos
Discreta - Valor mínimo - Valor máximo
- El mínimo está fijo. - El máximo está fijo. - Todos los valores en el rango tienen la misma probabilidad.
Cuando se conoce el rangoy todos los valoresposibles tienen lamisma probabilidad. Ej: La cantidad de camiones en un almacén.
Continua - Probabilidad - Iteraciones o experimentos
- Para cada ensayo, sólo 2 resultados son posibles; generalmente, el éxito o fracaso. - Los iteraciones son independientes. - La probabilidad es la mismade ensayo en ensayo. - La distribución Si-No es equivalente a la distribución Binomial.
Probabilidad de éxitoo fracaso (verdadero/falso).
DistribuciónTipo de variable
Parámetros CondicionesAplicaciones y
Ejemplos
Discreta - Probabilidad - Iteraciones o experimentos
- Para cada ensayo, sólo 2 resultados son posibles; generalmente, el éxito o fracaso. - Los iteraciones son independientes. - La probabilidad es la mismade ensayo en ensayo. - La distribución Binomial es equivalente a la distribución Sí-No.
Cantidad de carasen 10 tiradas de unamoneda a cara o cruz,probabilidad de éxitoo fracaso.
- La distribución muy flexible, utilizada para representar una situación que no pueda describir otro tipo de distribución. - Puede ser continua o discreta o una combinación de ambas. - Se utiliza para ingresar un conjunto entero de puntos de datos de un rango de celdas.
¿Qué distribuciones se pueden usar?• Usar Distribuciones basándose
en datos históricos o en principios físicos (Normal, Lognormal).
• Usar la Opinión de Expertos junto con la Distribución Triangular:
– Mínimo
– Máximo
– Más Probable
• Usar límites con la Distribución Uniforme:
– Límite inferior
– Límite superior
MIN MAX
M/L
MEAN
LOWERBOUND
UPPERBOUND
More Realistic,Less Conservative
Less Realistic,More Conservative
DISTRIBUCIÓN UNIFORME
• Todos los valores dentro del rango factible tienen la misma densidad de probabilidad.
• Parámetros : Uniform (min,max)• Aplicaciones: Se usa en la generación de los
valores de todas las demás distribuciones de probabilidad en el muestreo aleatorio.
• Es una aproximación muy cruda para usar como estimación de la incertidumbre percibida de un parámetro
EJEMPLO UNIFORME
• Una compañía de inversiones esta interesada en comprar un centro comercial de gran magnitud. Esta compañía piensa gastar al menos $ 500.000 pero no más de $ 900.000. El gerente piensa que cualquier monto que este dentro de este rango, tiene igual probabilidad de ocurrencia.
• Graficar la distribución de probabilidad para esta variable.
GRÁFICO UNIFORME
DISTRIBUCIÓN TRIANGULAR
• Aplicaciones: estimar subjetivamente la distribución de la variable aleatoria cuando todo lo que puede precisarse de la misma es el valor mínimo, el valor más probable y el valor máximo.
• Parámetros: Triang (min, +prob, max).
• Variando la posición más probable con relación a los extremos, la distribución puede ser simétrica o no.
EJEMPLO TRIANGULAR
• El propietario de una estación de gasolina que vendió por semana para abastecer su estación. Sus ventas pasadas indican que vendió un mínimo de 3.000 litros y un máximo de 7.000 litros por semana, pero en la mayoría de las semanas las ventas fueron de 5.000 litros.
• Graficar la distribución de probabilidad para esta variable.
GRÁFICO TRIANGULAR
• Se caracteriza por su forma acampanada.• Es simétrica y tiene la propiedad de que la
mediana, la moda, la media aritmética coinciden.• Aplicaciones: una variedad de situaciones, como
se desprende del Teorema Central del Límite.• Es útil en finanzas pues la suma o diferencia de
distribuciones Normales resulta también en una distribución Normal con parámetros que pueden ser determinados a partir del TCL.
DISTRIBUCION NORMAL
EJEMPLO NORMAL
• Un gerente de recursos humanos estima que la distribución de los salarios de todos los empleados están distribuidos normalmente con una media de $ 800 y una desviación estándar de 30 $.
• Graficar la distribución de probabilidad para esta variable.
GRÁFICO NORMAL
DISTRIBUCIONES TRUNCADAS
• Un vendedor de casas sabe que los precios de venta de los inmobiliarios tienen una distribución normal con media igual a $ 100.000 y desviación estándar de $ 15.000. Sin embargo, no existe posibilidad de vender una casa en menos de $ 80.000.
• Graficar la distribución de probabilidad para esta variable.
GRÁFICO DISTRIBUCIÓN TRUNCADA
DISTRIBUCIÓN PERSONALIZADA (CUSTOM)
• Es posible una distribución “personalizada” para representar una situación única que no puede ser modelada por ninguna de las distribuciones de probabilidad conocidas.
• Ejemplos: describir valores simples, rangos discretos, continuos.
EJEMPLO DISTRIBUCIÓN PERSONALIZADA (CUSTOM)• Una empresa desea describir el costo probable de
producir un nuevo producto. La compañía decide que el costo podría ser $5, $8 o $ 10.
Elección de una distribución que se ajuste a las entradas del modelo
• Cuando existe información empírica: Para muchos inputs de un modelo de simulación podría existir información empírica disponible, a través de registros históricos o recopiladas especialmente al efecto.
• Este enfoque tiene sus desventajas:– Por un lado, la información histórica podría no
representar adecuadamente la verdadera población debido a un error de muestreo.
– Adicionalmente el uso de información empírica impide el uso de valores fuera del rango original.