pasos estadistica

29

Click here to load reader

Upload: rene-garcia

Post on 25-Jun-2015

2.761 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Pasos estadistica

1 Estadística I

1

2 BIBLIOGRAFÍA

TEXTO BASE “ESTADÍSTICA APLICADA A LA EMPRESA Y A LA ECONOMÍA” por Allen Webster Editorial Mac Graw Hill

TEXTOS COMPLEMENTARIOS “ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA” por William J. Stevenson, Editorial Harla.“ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & David S. Rubin, Sexta edición, editorial Prentice Hall

2 ESTADÍSTICA

[1] La estadística comprende la rama descriptiva, la teoría de la probabilidad y el muestreo

DATOS ESTADÍSTICOS

[2]LOS MÉTODOS ESTADÍSTICOS comprenden el análisis e interpretación de números, ventas mensuales, calificaciones de exámenes, número de partes defectuosas, porcentaje de respuestas correctas a un cuestionario, años de servicio, tiempo de terminación, etc. Tales números se conocen como DATOS. Por lo general para interpretarlos correctamente, en primer lugar es necesario organizar y resumir los números.DATOS E INFORMACIÓN OBTENIDA DE ELLOS

Los datos no procesados pueden carecer de significado, grandes cantidades de número tienden a confundir en lugar de aclarar, nos abrumamos con detalles mayores. El Procesamiento de datos disminuye la cantidad de detalles.DATOS ESTADÍSTICOS

Los datos estadísticos se obtienen mediante un proceso que comprende la observación o medición de conceptos, como ingresos anuales de una comunidad, calificaciones de exámenes, etc. Tales conceptos reciben el nombre de VARIABLES, ya que producen valores que tienden a mostrar cierto grado de variabilidad, el efectuarse mediciones sucesivas.

TIPOS DE DATOSCasi siempre, seleccionar el procedimiento que se habrá de utilizar para analizar o describir

datos estadísticos depende de que tipo sean. Son de 4 tipos: CONTINUOS, DISCRETOS, NOMINALES y JERARQUIZADOS.

Las variables que pueden asumir virtualmente cualquier valor en determinado intervalo de valores se conocen como continuas. Características tales como altura, peso, etc., quedan dentro de esta categoría. Los datos que se toman acerca de estas características y otras semejantes se denominan continuos, aún cuando, en términos prácticos, los instrumentos de medición presentan ciertas limitaciones de tipo físico que restringen el grado de precisión. Como ejemplos de datos continuos tenemos: la cantidad de café que se vende por día, la gasolina que se expende por hora.

Una variable discreta es la que puede asumir sólo ciertos valores, por lo regular, enteros. Los datos discretos surgen al contar el número de conceptos que poseen cierta característica, ejemplos de datos discretos son el número de clientes por día, los accidentes de trabajo, etc.

Tanto los datos discretos como los continuos se conocen como datos cuantitativos ya que son inherentemente numéricos. Es decir ciertos valores numéricos se relacionan de manera natural con las variables que se miden. Por otra parte, los dos tipos restantes de datos nominales y jerarquizados comprenden variables que no son inherentemente numéricas. A estas se les llama cualitativas, y se deben convertir a valores numéricos antes de que se trabaje con ellas.

Las variables nominales comprenden categorías, como el sexo (masculino o femenino), el color de ojos (azul, castaño, negro, verde), campo de estudios (medicina, derecho, administración, biología, ingeniería), calificaciones (excelente, bueno, regular, malo)etc. Ninguna de las características anteriores es numérica por naturaleza. Sin embargo, cuando se aplican, ya sea a una población o a una muestra, es posible asignar cada individuo a una categoría (por ejemplo, el campo de estudios es administración de empresas), y contar luego el número que queda en cada una de ellas (por ejemplo, 15 estudiantes).

Otro tipo de variable cuantitativa es la que comúnmente se refiere a las evaluaciones subjetivas cuando los conceptos se jerarquizan según la preferencia o logro. Por ejemplo, en concursos de cocina, belleza, florería y caninos, los lugares se jerarquizan en primero, segundo, tercero, etc. De igual manera, a las posiciones de los equipos se les asignan los números 1,2,3,.. Por otra parte, los signos +

Page 2: Pasos estadistica

y – se pueden utilizar para designar mejoramiento o deficiencia (por ejemplo, el desarrollo de cierto conocimiento después de tomar un curso de él). Si bien es posible considerar la variable subyacente en cada uno de estos casos como continua, no obstante, empleamos arbitrariamente a los enteros a,2,3,...(es decir, rangos) ya sea por conveniencia o por la falta de un método más científico.

Es interesante observar que muchas poblaciones pueden proporcionar los cuatro tipos de datos. Por ejemplo, una carga de cierta mercancía se puede clasificar en una de dos categorías (dicotómicas): aceptable o no aceptable. O bien, mercancía se puede jerarquizar de acuerdo con algún plan, como buena, superior o excelente (tres o más categorías). Ambas clasificaciones producen datos discretos. Si lo importante, por ejemplo tratándose de carne, es la cantidad de grasa por kilogramo, el peso promedio de la mitad de una res, o la proporción entre grasa y carne, entonces los datos serán continuos. Otro ejemplo de cómo los datos pueden asumir diferentes características se presenta en la siguiente tabla:LA MISMA POBLACIÓN PUEDE DAR ORIGEN A DIFERENTES TIPOS DE DATOSTIPOS DE DATOS|POBLACIÓN |CONTINUOS |DISCRETOS |NOMINALES |JERARQUIZADOS POR RANGOS ||Clase de tercer |Edades, pesos |No, en el grupo |Niños/ niñas |3er grado ||grado | | | | ||Automóviles |Kph, hpl |No, de defectos por|Colores |Más sucio || | |auto | | ||Ventas de bienes |Valor en $ |No, de ofertas |sobrevaluado |Más claro ||raíces | | | | |

Una colección de datos se conoce como conjunto de datos, y una sola observación es un punto de dato.

¿Cómo podemos ordenar los datos?

RECOLECCIÓN DE DATOS

Hay que seleccionar las observaciones de manera que todos los grupos relevantes estén representados en los datos. Los datos pueden prevenir de observaciones reales o de registros que se mantienen para otros propósitos. Los datos pueden ayudar a los responsables de tomar decisiones a hacer suposiciones bien pensadas acerca de las causas y por lo tanto de los efectos probables de ciertas características en situaciones dadas. También el conocimiento de tendencias adquirido de la experiencia previa puede permitir a los ciudadanos que les interesa estar al tanto de posibles resultados y actuar en consecuencia.

Cuando los datos son ordenados de manera compacta y útil los responsables de tomar decisiones pueden obtener información confiable sobre el ambiente y usarla para tomar decisiones inteligentes.

[3]PRUEBA PARA DATOS

1. ¿De donde vienen los datos?. ¿La fuente es parcial?, es decir,¿ es posible que haya un interés en proporcionar datos que conduzcan a una cierta conclusión más que a otras?2. ¿Los datos comprueban o contradicen otras evidencias que se poseen?3. ¿Hace falta alguna evidencia cuya ausencia pueda ocasionar que se llegue a una conclusión diferente?4. ¿Cuántas observaciones se tienen?¿ representan a todos los grupos que se desea estudiar?5. ¿La conclusión es lógica?¿ Se ha legado a conclusiones que nuestros datos no confirman?

DIFERENCIA ENTRE MUESTRA Y POBLACIÓN

Una población es un todo y una muestra es una fracción o segmento de ese todo. Las muestras las estudiamos con el fin de ser capaces de describir poblaciones. El estudio de las muestras es más sencillo que el estudio de la población completa, más barato, menos tiempo.

Una población es un conjunto de todos los elementos del asunto que estamos estudiando, acerca de los cuales intentamos sacar conclusiones.

PATRON SIGNIFICATIVO DE DATOS

Existen muchas formas de organizar los datos. Podemos colectarlos y mantenerlos en orden. Una forma común de organizar los datos es dividirlos en categorías o clases parecidas y luego contar el número de observaciones que quedan dentro de cada categoría.

Page 3: Pasos estadistica

DISTRIBUCIONES DE FRECUENCIAS

[4]Una distribución de frecuencia es un método de clasificación de datos en clases o intervalos, de manera tal que se pueda establecer el número o porcentaje (es decir, la frecuencia) de cada clase. Esto proporciona una forma de observar un conjunto de números sin que se tenga que considerar cada número, y puede ser extremadamente útil al manejar grandes cantidades de datos. El número o porcentaje en una clase se denomina frecuencia de clase.

El procedimiento para elaborar realmente una distribución de frecuencias para un conjunto de datos dado, depende del tipo de datos particulares (esto es, continuos, discretos, nominales, jerarquizados). Se supone que la producción de fruta (en bushels por árbol) se mide en una escala continua

ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS CONTINUOS1. Halle el rango (diferencia entre el mayor y el menor de los datos)2. Seleccione el numero de intervalos de clase. No debe ser menor de 15 ni menor de 5. Los intervalos de clase tienen por lo general el mismo ancho, de modo que fijado el número de clases el intervalo se obtiene por simple operación aritmética : intervalo = rango ( (número de clases).3. Forme los intervalos de clase.4. Fije los límites reales de cada clase, teniendo siempre presente que los intervalos de clase son mutuamente excluyentes y que por lo tanto no debe haber ambiguedades en los límites.5. Determine las frecuencias de clase contando el número de observaciones que cae dentro de cada intervalo de clase.EJEMPLO

El instructor de preparación física tiene a su cargo un grupo de 108 alumnos, los siguientes son las estaturas de los mismos|141 |151 |144 |138 |138 |152 |146 |144 |151 |153 ||131 |152 |145 |139 |148 |146 |139 |154 |145 |143 ||132 |153 |146 |140 |158 |149 |145 |137 |144 |152 ||136 |154 |147 |159 |154 |145 |147 |145 |139 |143 ||137 |155 |146 |157 |147 |139 |153 |157 |154 |142 ||138 |157 |149 |155 |146 |148 |149 |144 |143 |152 ||139 |158 |131 |149 |145 |147 |143 |148 |143 |142 ||140 |159 |132 |158 |151 |159 |146 |151 |150 |142 ||141 |160 |137 |148 |145 |144 |152 |144 |143 |142 ||142 |162 |137 |154 |125 |153 |145 |152 |158 | ||143 |150 |137 |140 |150 |146 |149 |144 |143 | |

[5]Utilizando los datos del cuadro anterior tenemos:

Rango 162 – 125 = 37

Seleccionamos 8 como número de clases (mayor que 5 y menor que 15). Para la anchura del intervalo de clase tenemos . i = 37 ( 8 = 4,6(i = 5; si consideramos que 8(5=40, quiere decir que hay un exceso de 3 sobre el rango verdadero, entonces lo distribuimos quitando 1 al límite inferior( 125 – 1 = 124) y aumentando 2 al límite superior( 162+2=164).

Formamos los intervalos de clase de la siguiente manera : el primero ( 124, 125, 126, 127, 128; total 5 amplitud, el segundo de 129 a 133 y así sucesivamente hasta el octavo que será 159-163.

Encontramos los límites reales, o sea la mediana o punto medio entre el límite superior de una clase y el inferior de la siguiente. Limites reales: 123.5, 128.5,133.5,...,163.5; luego observamos si hay ambigüedad o no en los límites.

Contamos las frecuencias que caen en cada intervalo de clase y elaboramos primero la tabla de conteo y luego el cuadro correspondiente a la distribución

TABLA DE CONTEO CLASE MARCAS CONTEO 123.5 – 128.5 ( 1 128.5 – 133.5 (((( 4 133.5 – 138.5 ((((((((( 9 138.5 – 143.5 (((((((((((((((((((((((( 24 143.5 – 148.5 ((((((((((((((((((((((((((((( 29

Page 4: Pasos estadistica

148.5 – 153.5 (((((((((((((((((((((( 22 153.5 – 158.5 (((((((((((((( 14 158.5 – 163.5 ((((( 5 TOTAL 108 DISTRIBUCIÓN DE FRECUENCIAS DATOS CONTÍNUOS CLASE FRECUENCIA PORCENTAJE DE ALUMNOS 123.5 – 128.5 1 1/108 =0.00925 ( 0.93% 128.5 – 133.5 4 4/108 =0.03703 ( 3.703% 133.5 – 138.5 9 9/108 =0.08333 ( 8.333% 138.5 – 143.5 24 24/108 =0.22222 (22.222% 143.5 – 148.5 29 29/108 =0.26851 (26.851% 148.5 – 153.5 22 22/108 =0.20370 (20.370% 153.5 – 158.5 14 14/108 =0.12962 (12.962% 158.5 – 163.5 5 5/108 = 0.04629 (4.629% TOTAL 108 1.00 ( 100%

FRECUENCIAS RELATIVASLas frecuencias relativas o porcentajes, para una distribución de frecuencias se calculan

dividiendo cada frecuencia para el número total de objetos clasificados. En el ejemplo anterior están en la tercera columna(Porcentaje de alumnos)

[6]ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS DISCRETOSAl elaborar una distribución de frecuencias de datos continuos se pierde cierta información

debido a que los valores individuales pierden su identidad cuando se agrupan en clases. Esto puede o no suceder con datos discretos, dependiendo de la naturaleza de los mismos, y de los objetivos del analista. Considérese los datos siguientes acerca del número de accidentes que ocurren diariamente (durante 50 días) en un enorme estacionamiento|6 |9 |2 |7 |0 |8 |2 |5 |4 |2 ||5 |4 |4 |4 |4 |2 |5 |6 |3 |7 ||3 |8 |8 |4 |4 |4 |7 |7 |6 |5 ||4 |7 |5 |3 |7 |1 |3 |8 |0 |6 ||5 |1 |2 |3 |6 |0 |5 |6 |6 |3 |

Se puede elaborar una distribución de frecuencias con clases 0-1,2-3,4-5,6-7,8-9. El resultado es una distribución igual a la que se utiliza para datos continuos.

DISTRIBUCIÓN DE FRECUENCIAS DATOS DISCRETOS CLASE NÚMERO DE DÍAS PORCENTAJE DE DÍAS 0 - 1 5 1/50 =0.10 ( 10% 2 - 3 11 11/50 =0.22 ( 22% 4 - 5 16 16/50 =0.32 ( 32% 6 - 7 13 13/50 =0.26 ( 26% 8 - 9 5 5/50 =0.10 ( 10% TOTAL 50 1.00 ( 100%

ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS ACUMULADAUna distribución de frecuencias acumuladas está diseñada para indicar el número o porcentaje

de elementos que son menores que cierto valor específico o iguales a éste. Se pueden convertir cualquier distribución de frecuencias fácilmente en acumuladas, mediante sumas sucesivas de frecuencias de clase. La distribución “menor que” permite ver de inmediato cuántos valores de los datos son menores que algún valor determinado. La distribución “mayor que” muestra el número y/o el porcentaje de elementos en el conjunto de datos que es mayor que cierto valor clave.

De modo en la tabla se puede observar que el 64% de los valores no excedió de 5, y que el 90% no pasó de 7.

DISTRIBUCIÓN DE FRECUENCIAS ACUMULADA Clase Frec Frc. Ac. < Fec. Acum.> Frec. Rel. Frec. Porc< Frec.AC.> 0 - 1 5 5 45 0.10 0.10 0.90 2 - 3 11 16 34 0.22 0.32 0.68 4 - 5 16 32 18 0.32 0.64 0.36 6 - 7 13 45 05 0.26 0.90 0.10 8 - 9 5 50 0 0.10 1.00 0.00 Total 50 1.00

Page 5: Pasos estadistica

DISTRIBUCIONES DE FRECUENCIAS PARA DATOS NOMINALES Y JERARQUIZADOS

Quizá las distribuciones de frecuencias más fáciles que sean las que se utilizan para datos nominales y jerarquizados. Esta simplicidad radica en el hecho en que las clases se ponen de manifiesto con más facilidad, de modo que los cálculos son mínimos. En la siguiente distribución en la que se analizan las ventas de gaseosas, observamos que las categorías son los diversas sabores de las gaseosas, la última categoría, varios, son aquellos sabores que se venden poco como: fresa, tamarindo y toronja se agrupan en una sola categoría para simplificar la comprensión de los datos:

VENTA DE GASEOSAS EN UN DÍAFRECUENCIA|Sabor |Ventas Reales |Ventas Relativas ||Cola |600 |60% ||Limón |200 |20% ||Naranja |100 |10% ||Uva |50 |5% ||Fresa |40 |4% ||Otros |10 |1% |

La representación de datos jerarquizados es bastante semejante. Consideremos los datos del promedio de calificaciones que presentan a continuación en un formato un tanto diferente al de las tablas de frecuencias anteriores, sólo para demostrar otra forma de elaborarlas.

CALIFICACCIONES DEL CURSO

| |Mala |Regular |Promedio |Buena |Excelente |Totales ||NUMERO |2 |4 |20 |10 |4 |40 ||PORCENTAJE |5% |10% |50% |25% |10% |100% |

DIAGRAMAS Y GRÁFICASLas distribuciones de frecuencias constituyen un mundo ideal para representar los aspectos

esenciales de un conjunto de datos en términos entendibles y concisos, aún así los dibujos pueden ser más efectivos para desplegar grandes conjuntos de datos

Los diagramas y gráficas más sencillos en su construcción están diseñados para datos nominales u ordinales. Como los datos constituyen categorías, las clases son obvias y es fácil describirlas en una gráfica.[7]Diagrama pastel

Es una forma efectiva de desplegar los porcentajes en que se dividen los datos. Se usan mucho en los presupuestos y la información económica. Se utilizan considerando que el círculo completo tiene un área que equivale al 100%; un sector representa un tanto por ciento equivalente a la razón entre el ángulo que forman los radios que limitan al sector y 360º que son el total de los grados de la circunferencia.

[8]Ejemplos:[pic]

La compañía Brite Paint pidió a varias personas que indicaran sus colores favoritos. La tabulación de los resultados que están en la siguiente tabla muestra que 12 personas indicaron que el rojo era su color favorito, 8 escogieron el verde, 8 escogieron el azul y 4 el amarillo 8 (datos nominales). Esta tabulación representa una distribución de frecuencias porque enumera varias categorías (colores) junto con el número de veces (frecuencia) que se seleccionaron cada una. A menos que exista algún orden predeterminado, las categorías se enumeran en orden de magnitud: la categoría con la frecuencia mayor se enumera primero, y así sucesivamenteEl número total de personas se divide según el número de personas que eligieron cada color, las frecuencias relativas que resultan son: 12/32=0.375; 8/32= 0.25; 8/32 0 0.25; 4/32 = 0.125. como el 37.5% de 360º [(0.375)(360)]= 135º. Las restantes longitudes de arco se calculan de forma similar, se redondean los porcentajesDiagrama de Barras

Con escala nominal u ordinal. Cada barra representa la frecuencia de una categoría. La altura de la barra es proporcional al número de elementos de cada categoría. En general las barras se ponen en posición vertical con la base en el eje horizontal de la gráfica. Las barras se separan ya ello se debe que se utilice con tanta frecuencia para datos nominales y ordinales, la separación pone de manifiesto que se están dibujando frecuencias de categorías distintas.

[9]Diagrama de Pareto

Page 6: Pasos estadistica

Es un diagrama que se usa para identificar y jerarquizar problemas. Se usa con frecuencia en control de calidad. Consiste en barras que describen las componentes de una línea de producción o de montaje. La altura de cada barra representa el número de ocurrencias de cada problema, de manera que el diagrama muestra la gravedad del problema de calidad para cada variable medidaEjemplo:

El siguiente gráfico representa los problemas más importantes de control de calidad de asientos especiales para camiones. El diagrama de Pareto puede incluir también una segunda escala, encima de las barras de las categorías, que muestran los porcentajes acumulados de las variables medidas.

Histograma y Polígonos de Frecuencia

HISTOGRAMA.- Con escala de intervalos o de razón. Se dibujan las categorías o clases a lo largo del eje horizontal de la gráfica y los valores numéricos de cada clase se representan por barras verticales. Un histograma se parece a un diagrama de barras sólo que no hay espacio entre las barras. Esta es la razón por la que el histograma se usa con frecuencia para datos con escala de intervalos o de razón: las barras adyacentes indican que se está resumiendo un intervalo numérico que muestra las frecuencias de clases elegidas arbitrariamente.

Ejemplo:

DISTRIBUCIÓN DE FRECUENCIAS DATOS CONTÍNUOS CLASE PUNTO MEDIO FRECUENCIA PORC. DE ALUMNOS 123.5 – 128.5 126 1 0.93% 128.5 – 133.5 131 4 3.703% 133.5 – 138.5 136 9 8.333% 138.5 – 143.5 141 24 22.222% 143.5 – 148.5 146 29 26.851% 148.5 – 153.5 151 22 20.370% 153.5 – 158.5 156 14 12.962% 158.5 – 163.5 161 5 4.629% TOTAL 108 100%

El siguiente gráfico representa el ejemplo desarrollado de las estaturas de los alumnos analizadas por el preparador físico

POLÍGONOS DE FRECUENCIA.- se marcan las frecuencias sobre el eje vertical y los valores de la variable que se está midiendo en el eje horizontal. Se representa la frecuencia de cada clase dibujando unpunto medio de la clase dibujando un punto medio de la clase y se conectan los puntos sucesivos con líneas rectas para formar el polígono. En los extremos de la escala horizontal se agregan 2 nuevas clases con frecuencia cero. Esto permite que el polígono llegue al eje horizontal en los extremos de la distribución.

Diagrama de Tallo y Hoja

Es una alternativa de mostrar datos. Es similar al histograma, aunque se muestran los datos reales en lugar de barras

Ejemplo:

Kyle Chang, el dueño de la tintorería The Wash, quiere saber el número de órdenes de trabajo que se procesan al día. Se elige una muestra aleatoria de días de estudio. A continuación los datos, Kyle quiere usar estos datos para entender el patrón que sigue su carga de clientes.

CLIENTES POR DÍA DE LA TINTORERIA The Wash Tub|65 |23 |26 |45 |12 |45 |56 |35 |26 ||de examen de admisión |Aumento |9 |7 |7 |6 |4 |2 |2 |

Calculamos la media de esta muestra de 7 estudiantes de la manera siguiente:Media de la muestra ( x = (x . = 9+7+7+6+4+4+2 = 39 = 5.6 puntos de estudiante

n 7 7

Cálculo de la Media para datos agrupados.

Page 7: Pasos estadistica

En una distribución de frecuencias consta de datos agrupados en clases, a diferencia del ejemplo del examen de admisión, no sabemos el valor individual de cada observación. Para encontrar la media aritmética de datos agrupados primero calculamos el punto medio de cada clase, después multiplicamos cada punto medio por la frecuencia de las observaciones de dicha clase, sumamos los resultados y dividimos esta suma entre el número total de observaciones de la muestra. La fórmula es la siguiente:Media de datos agrupados ( x = ((f ( x)

nen la cualx = media de la muestra( = símbolo que significa “la suma de”[12]f = frecuencia (número de observaciones) de cada clase.X = punto medio de cada clase de la muestra.n = número de observaciones de la muestra.

Ejemplo:En la siguiente distribución de frecuencias del saldo promedio mensual de la cuenta de cheques

de 600 clientes de una sucursal bancaria.|Saldos promedio |Clase(dólares) |Frecuencia ||mensuales de 600 |0 – 49.99 |78 ||cuentas de |50.00 – 99.99 |123 ||cheques |100.00 – 149.00 |187 || |150.00 – 199.99 |82 || |200.00 – 249.99 |51 || |250.00 – 299.99 |47 || |300.00 – 349.99 |13 || |350.00 – 399.99 |9 || |400.00 – 449.99 |6 || |450.00 – 499.99 | 4 .|| | |600 |

A partir de la información de la tabla podemos calcular fácilmente una estimación del valor de la media de estos datos agrupados. Es una estimación debido a que no utilizamos el total de las 600 puntos dados de la muestra.

|Cálculo |Clase(dólares) |Puntos Medios (X) | |Frecuencia | |Frecuencia ||mensuales de 600 |0 – 49.99 |25.00 |( |78 |= |1 950 ||cuentas de |50.00 – 99.99 |75.00 |( |123 |= |9 225 ||cheques |100.00 – 149.00 |125.00 |( |187 |= |23 375 || |150.00 – 199.99 |175.00 |( |82 |= |14 350 || |200.00 – 249.99 |225.00 |( |51 |= |11 475 || |250.00 – 299.99 |275.00 |( |47 |= |12 925 || |300.00 – 349.99 |325.00 |( |13 |= |4 225 || |350.00 – 399.99 |375.00 |( |9 |= |3 375 || |400.00 – 449.99 |425.00 |( |6 |= |2 550 || |450.00 – 499.99 |475.00 |( | 4 . |= |1 900 || | | | |(f = n = 600 | |((f(x) =83 350 |

x = ((f ( x) = 85 350 = 142.25( Media de la muestra ( dólares ) n 600

En nuestra muestra de 600 clientes, el saldo mensual es de 142.25 dólares.

La Media Pesada

La media pesada (Ponderada) nos permite calcular el promedio que toma en cuenta la importancia de cada valor con respecto al total. En la siguiente distribución una compañía utiliza tres niveles de trabajo, no calificado, semicalificado y calificado, para la producción de 2 de sus productos finales. La compañía desea saber el promedio del costo de trabajo por hora par cada uno de los productos.

| | | |Horas de trabajo |invertido || | | |Por unidad |producida |

Page 8: Pasos estadistica

|Entrada de trabajo |Nivel de trabajo |Salario por hora (x) |Producto 1 |Producto 2 ||por proceso de |No calificado |$ 5.00 |1 |4 ||manufactura |Semicalificado |7.00 |2 |3 || |Calificado |9.00 |5 |3 |

Cálculo de la Media Pesada

Los promedios pesados dan el valor correcto para los costos promedio por hora de trabajo para los dos productos, ya que toman en cuenta las diferentes cantidades de cada nivel de trabajo que se utiliza en la elaboración de los productos. Usando símbolos, la fórmula para calcular el promedio pesado es:

Xw = ((w ( x) ( w en donde: Xw = símbolo para la media pesada[13] W = peso asignado a cada observación ( 1/8, 2/8 y 5/8) para le producto 1, 4/10, 3/10 y 3/10 para el producto 2 del ejemplo ((w ( x) = la suma de los productos del peso de cada elemento por el elemento correspondiente ( w = suma de todos los pesos Si aplicamos la ecuación tenemos:

Xw = ((w ( x) = ( 1/8 ( $5) + ( 2/8 ( $7) + ( 5/8 ( $9) = $ 8 = $8.00/ hora ( w 1/8 + 2/8 + 5/8 1

13La Media geométrica

En ocasiones trabajamos con cantidades que cambian en un cierto periodo, necesitamos conocer una tasa promedio de cambio, como la tasa de crecimiento promedio en un período de varios años. En tales casos, la media aritmética simple resulta inapropiada, pues nos da resultados equivocados. Lo que necesitamos es la media geométrica, conocida sencillamente como M.G.

Por ejemplo considere el crecimiento de una cuenta de ahorros. Suponga que depositamos $100 inicialmente y dejamos que acumule interés a diferentes tasas durante 5 años, como lo expresa la siguiente distribución:

| |Año |Tasa de |Factor de |Ahorros al ||Crecimiento de | |Interés |crecimiento |final de año ||depósito de $100 |1 |7% |1.07 |$107.00 ||en una cuenta |2 |8 |1.08 |115.56 ||de ahorros |3 |10 |1.10 |127.12 || |4 |12 |1.12 |142.37 || |5 |18 |1.18 |168.00 |

Cálculo de la Media geométrica

Para encontrar el factor de crecimiento promedio correcto podemos multiplicar los factores de crecimiento de los 5 años y luego tomar la raíz quinta del producto (es decir encontrar un número que al multiplicarse cuatro veces por sí mismo dé como resultado el producto con el que empezamos). El resultado es el factor de crecimiento como media geométrica, que es el promedio adecuado que debemos utilizar. La fórmula para encontrar la media geométrica de una serie de números es:

Aplicando al problema tenemos:

La Mediana

La mediana es solo un valor calculado a partir del conjunto de datos que mide la observación central de estos

[14]Cálculo de la Mediana a partir de datos no agrupados

El procedimiento para obtener la mediana es como sigue:

1. Ordenar o clasificar valores.2. Contar para saber si existe un número de valores par o impar.

Page 9: Pasos estadistica

3. En caso de que se tenga un número impar de valores, la mediana es el valor intermedio. En cambio para un número par de valores, la mediana es el promedio de los dos valores intermedios.

[15]Cálculo de la Mediana a partir de datos agrupadosLos especialistas utilizan la siguiente ecuación para determinar la mediana de un conjunto de

datos agrupados:Mediana de la muestra ( m = ( (n+1)/2 – ( f + 1) ( w + Lw.

( fm (en la que :m =mediana de la muestran = número total de elementos de la distribuciónF = suma de todas las frecuencias de clase hasta, pero sin incluir, la clase mediana fm =frecuencia de la clase medianaw = ancho del intervalo de claseLw. = límite inferior del intervalo de clase mediano

Ejemplo En el ejemplo de los saldos mensuales promedio de las cuentas de 600 clientes, no podemos calcular la mediana del saldo de cuentas, determinando cuál de los diez intervalos de clase contiene a la mediana, debemos calcular en que intervalo estará al acumular las frecuencias, la hallamos en 600(2=300 y aplicamos la fórmula.

| |Clase en |Frec. |Frec. |Frec. |Frec. Rel. | || |dólares | |Acum |Relat. |Acum | ||Saldos |0.00 –49.99 |78 |78 |13% |13% | ||Mensuales |50.00 – 99.99 |123 |201 |20.5 |33.5 | ||Promedio de |100.00 – 149.99 |187 |388 |31.16 |64.66 |(clase mediana || |200.00 – 249.99 |51 |521 |8.5 |86.83 | || |250.00 – 299.99 |47 |568 |7.83 |94.66 | || |300.00 – 349.99 |13 |581 |2.16 |96.83 | || |350.00 – 399.99 |9 |590 |1.5 |98.33 | || |400.00 – 449.99 |6 |596 |1 |99.33 | || |450.00 – 499.99 | 4 .|600 |.66 |100.00 | || | |600 | | | | || | | | | | | |

Utilizando la ecuación tenemos:m = ?n = 600F = 201 fm =187w = $50Lw. = 100

m = ( (601)/2 – ( 202) ( $50 + $100 ( 187 (

m = ( 98.5 ( $50 + $100 ( 187 ( = (0.527)($50) + $100 = $ 126.35 (Mediana de la muestra estimada

La Moda

La moda es una medida de tendencia central diferente de la media, pero un tanto parecida a la mediana. La moda es aquel valor que más se repite en el conjunto de datos

Cálculo de la Moda a partir de datos no agrupados

El azar puede desempeñar un papel importante en la organización de los datos, en ocasiones el azar hace que un valor se repita lo suficiente para ser el valor más frecuente del conjunto de datos.

EjemploVIAJES ORGANIZADOS EN ORDEN ASCENDENTE

Page 10: Pasos estadistica

|Viajes por |0 |2 |5 |7 |15 |( ||Entrega por un |0 |2 |5 |7 |15 |((moda ||día en un |1 |4 |6 |8 |15 |( ||Período de |1 |4 |6 |12 |19 | ||20 días | | | | | | |

En el ejemplo, presentamos el número de viajes de entrega por día que hace una planta revolvedora de concreto. El valor modal es 15, ya que se presenta más a menudo que cualquier otro valor (tres veces). La moda nos dice que 15 es el número más frecuente de viajes, pero no nos dice que la mayor cantidad de viajes está por debajo de 10.

[16]Cálculo de la Moda a partir de datos agrupados

Cuando los datos ya se encuentran agrupados en una distribución de frecuencias, podemos suponer que la moda está localizada en la clase que contiene el mayor número de elementos, es decir, en la clase que tiene la mayor frecuencia. Se utiliza la siguiente ecuación para determinar la moda de un conjunto de datos agrupados:Moda de la muestra ( Mo = LMo + ( d1 ( w.

( d1 + d2 (en la que :LMo = límite inferior de la clase modald1 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente debajo de ella.d2 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por encima de ella.w = ancho del intervalo de clase

Ejemplo

En el ejemplo de los saldos mensuales promedio de las cuentas de 600 clientes, la moda del saldo de las cuentas de cheques entonces LMo = $100; d1 =187 – 123 = 64 ; d2 = 187 – 82 = 105 y w=$50

| |Clase en |Frec. |Frec. |Frec. |Frec. Rel. | || |dólares | |Acum |Relat. |Acum | ||Saldos |0.00 –49.99 |78 |78 |13% |13% | ||Mensuales |50.00 – 99.99 |123 |201 |20.5 |33.5 | ||Promedio de |100.00 – 149.99 |187 |388 |31.16 |64.66 |(clase modal || |200.00 – 249.99 |51 |521 |8.5 |86.83 | || |250.00 – 299.99 |47 |568 |7.83 |94.66 | || |300.00 – 349.99 |13 |581 |2.16 |96.83 | || |350.00 – 399.99 |9 |590 |1.5 |98.33 | || |400.00 – 449.99 |6 |596 |1 |99.33 | || |450.00 – 499.99 | 4 .|600 |.66 |100.00 | || | |600 | | | | || | | | | | | |

Utilizando la ecuación tenemos:

Moda de la muestra ( Mo = LMo + ( d1 ( w. ( d1 + d2 (

m = $100 + ( 64 ( $50 . ( 64 + 105 ( = $100 + (0.38)($50) = $ 119.00 (Moda

[17]Todo promedio encubre y allana los valores extremos – al mismo tiempo que es influido por ellos

La Media, la Mediana y la Moda

[18]De lo que hemos aprendido sobre los promedios, hay algo que cada vez ha ido apareciendo más claramente. Los valores medios (y sobretodo la media aritmética tantas veces utilizada) necesitan de una segunda medida si queremos valorarlos correctamente en su significado y fuerza de afirmación.

El modo más fácil de completar la información es indicar cuan lejos se hallan los extremos de ella. Ya que la estadística conoce “ la amplitud del intervalo”, ha ideado una medida mejor que junto

Page 11: Pasos estadistica

con la media haga posible tener una buena idea de la distribución de los valores alrededor de la misma. Es la llamada Desviación típica, la medida de la dispersión.

[19]DISPERSIÓN: MEDIDAS DE DESVIACIÓN PROMEDIO

Es conveniente considerar cuatro variables de dispersión: la amplitud de variación, la desviación media, la varianza y la desviación estándar. Todas estas medidas, excepto la amplitud de variación, toman a la media como punto de referencia

Amplitud de variación

La amplitud de variación de un grupo de números es generalmente la medida más sencilla de calcular y comprender. Se puede expresar estableciendo la diferencia entre los números mayor y menor de un grupo, o bien, identificando ambos números

Ejemplo A continuación se dan algunos ejemplos;

AMPLITUD DE VARIACIÓN

Números Diferencia Del más bajo al más alto|1 |5 |7 ||1 |-2 |2 ||2 |-1 |1 ||3 |0 |0 ||4 |1 |1 ||5 | 2 .| 2 || | |. || |0 |6 |

[21] Las descripciones más comprensivas de la dispersión son aquellas que tratan con la desviación promedio con respecto a alguna medida de tendencia central. Dos de tales medidas son importantes para nuestro estudio: la variancia y la desviación estándar. Ambas medidas nos dan una distancia promedio de cualquier observación del conjunto de datos con respecto a la media de la distribución.

Varianza de la población

Cada población tiene una varianza, que se simboliza con (2 (sigma cuadrada). Para calcular la varianza de la población usamos la siguiente fórmula

(2 = ( ( x - ()2 = ( x2 - (2 = N N

En la que:(2 = varianza de la poblaciónx = elemento u observación( = media de la poblaciónN = número total de elementos de la población( = suma de todos los valores (x - ()2, o todos los valores de x2

Desviación Estándar de la población

La desviación estándar de la población o (, es simplemente la raíz cuadrada de la varianza de la población

Cálculo de la Varianza y la desviación estándar a partir de datos no agrupados

Ejemplo

Si tenemos una muestra de un compuesto producido en un día y probamos cada frasco para determina la pureza del compuesto obtendríamos los datos que están en la tabla siguiente:

PORCENTAJE DE IMPUREZA OBSERVADO|Resultados de |0.04 |0.14 |0.17 |0.19 |0.22 ||la prueba de pureza |0.06 |0.14 |0.17 |0.21 |0.24 |

Page 12: Pasos estadistica

|De compuestos |0.12 |0.15 |0.18 |0.21 |0.25 |

| |Observación | |Media | |Desviación |Desviación |Observación || | | | | | |al cuadrado |al cuadrado || |(x) | |( | |(x - () |(x - ()2 |x2 ||Determinación | 0.04 |- |0.166 |= |- 0.126 |0.016 || | |medio |f | | | ||Determinación |700 - 799 |750 |4 | 3000 |- 500 |1000000 ||de la varianza |800 - 899 |850 |7 | 5950 |- 400 |1120000 ||y de la |900 – 999 |950 |8 | 7600 |- 300 |720000 ||desviación |1000 - 1099 |1050 |10 |10500 |- 200 |400000 ||estándar de las |1100 - 1199 |1150 |12 |13800 |- 100 |120000 ||ventas en 100 |1200 - 1299 |1250 |17 |21250 |0 |0 ||restaurantes |1300 - 1399 |1350 |13 |17550 |100 |130000 ||de comida |1400 - 1499 |1450 |10 |14500 |200 |400000 ||rápida |1500 - 1599 |1550 |9 |13950 |300 |810000 ||situados en el |1600 – 1699 |1650 |7 |11550 |400 |1120000 || |1700 - 1799 |1750 |2 | 3500 |500 |500000 ||Distrito Ori. |1800 - 1899 |1850 | 1 . | 1850 |600 | 3600000 ||de Cumberland | | |100 |125000 | | 6680000 |

X = ( (f ( x) = 125000 = 1250( media (2 = (f ( x - ()2 = 6680000 = 6680000( varianza N 100 N 100

Desviación Estándar de la muestra

Para calcular la desviación estándar de una muestra, utilizamos las mismas fórmulas que en la población pero cambiamos ( por x y N con n-1:

s2 = ( ( x - x)2 = ( x2 - nx2 = n-1 n-1 n-1

s2 = varianza de la muestra

x = valor de cada una de las n observaciones( = media de la muestran-1 = número de observaciones de la muestra menos 1x = media de la muestrase debe usar n-1 como denominador porque al tomar muchas muestras de una población dada, si encontramos la varianza de la muestra(s2) para cada muestra y promediamos los resultados, entonces este promedio no tiende a tomar el valor de la varianza de la población, (2, a menos que lo usemos.

Ejemplo

En la siguiente tabla se muestran los donativos anuales de Blue Cross-Blue Shield al Hospital de Cumberland:

| |Observación | |Media | |Desviación |Desviación |Observación || | | | | | |al cuadrado |al cuadrado || |(x) | |x | |(x - x) |(x - x)2 |x2 ||Determinación |863 |- |1351 |= |- 488 |238144 |744769 ||de la varianza |903 |- |1351 |= |- 448 |200704 |815409 ||y de la |957 |- |1351 |= |- 394 |155236 |915849 ||desviación |1041 |- |1351 |= |- 310 |96100 |1083681 ||estándar del |1138 |- |1351 |= |- 213 |45369 |1295044 ||donativos |1204 |- |1351 |= |- 147 |21609 |1449616 ||anuales de |1354 |- |1351 |= |3 |9 |1833204 ||Blue Cross- |1624 |- |1351 |= |273 |74529 |2637376 ||Blue Shield |1698 |- |1351 |= |347 |120409 |2883204 ||al Hospital |1745 |- |1351 |= |394 |155236 |3045025 ||de Cumberland |1802 |- |1351 |= |451 |203401 |3247204 || |1883 |- |1351 |= |532 |283024 |3545689 || | | | | | |((x-x)2(1593770 |(x2(23496182 || | | | | | | | |

s2 = ( ( x - x)2 = 1593770 = 144888(Varianza de la muestra

Page 13: Pasos estadistica

n-1 11

PROBABILIDADESEXPERIMENTO.- Es el proceso de efectuar una observación. (lanzar un dado una o varias veces y reunir los datos sobre los resultados posibles)ESPACIO MUESTRAL.- Es un conjunto que corresponde a todos los resultados posibles de un experimento listados de modo completo y mutuamente excluyente (cualquier experimento puede originar varios resultados posibles, el conjunto de todos ellos se llama Espacio Muestral).EVENTO.- Es cualquier subconjunto de un espacio muestral.PROBABILIDAD

De la definición elemental de probabilidad tenemos que si n es el número de ensayos de un e4xperimento, como por ejemplo el número de lanzamientos de una moneda parece que entonces se podría definir la probabilidad de un evento E, mediante:

P(E) = l i m número de veces que sucede E n(( n

Pero el problema es establecer si converge siempre este límite por esto necesitamos una definición formal de Probabilidad:EJEMPLO[pic]

Supóngase que un experimento tiene asociado un espacio muestral S. Una probabilidad es una función de valor numérica que asigna un número P(A) a cada evento A de tal manera que son válidos las siguientes axiomas:1) P(A)(02) P(S) = 13) Si A1, A2,..., es una sucesión de eventos mutuamente excluyentes, es decir Ai, Aj = ( para toda i(j, entonces, ( P( ( Ai ) 0 ( P( Ai ) i=1

De acuerdo a lo anterior A y B son eventos mutuamente excluyentesP(A(B) = P(A) + P(B)Si lanzamos un dado normal cada uno de las caras tiene la misma probabilidad de ocurrir o sea

que son equiprobables. Se asigna 1/6 a cada uno de esos 6 elementos de S.P(E) = 1/6 i = 1.2.3..6 E2 será un 2 E4 será un 4 E6 será un 6P(A) = P(E2)+P(E4)+P(E6) = 1/6+1/6+1/6= ½

Los términos al AZAR y ALEATORIO se interpretan como una imposición de probabilidades iguales al número finito de puntos en el espacio muestral.

Con frecuencia, las probabilidades que se asignan a los eventos se basan en evidencia experimental o en estudios de observación, que producen datos de frecuencia relativa para los eventos de interés. Los datos sólo dan aproximaciones a las verdaderas probabilidades pero bastantes buenas. EJEMPLO[pic]

REGLAS DE CONTEO ÚTILES EN PROBABIILIDADES

Si consideramosP(A) = número de resultados favorables a A

Número total de resultados equiprobablesEsta definición funcionará con espacio muestral finito con resultados equiprobables.

1 REGLA DE LA SUMA

Para calcular la probabilidad de que ocurra cualquier suceso A o B, se usa la regla de la suma. Para ello debe determinarse si los sucesos son mutuamente excluyentes o no SUCESOS QUE NO SON MUTUAMENTE EXCLUYENTES, P(A(B)=P(A)+P(B)-P(A(B) SUCESOS MUTUAMENTE EXCLUYENTES, P(A(B)=P(A)+P(B) SUCESOS INDEPENDIENTES.- Si la ocurrencia de uno no afecta en ninguna forma a las posibilidades de que el segundo ocurra ( P(A(B)=P(A)(P(B)

SUCESOS DEPENDIENTES.- Si la ocurrencia de uno altera las posibilidades de que el segundo ocurra ( P(A(B)=P(A)(P(B/A)

2 PROBABILIDAD CONDICIONAL E INDEPENDENCIA

Page 14: Pasos estadistica

Fácilmente pueden surgir dificultades cuando se pide la probabilidad de un evento sin especificar el espacio muestral o también este se puede reducir mediante información adicional disponible entre los elementos en cuestión. Esta información adicional se llama información condicional.

1 Definición.- Si P(B) no es igual a cero, entonces la probabilidad condicional de A en relación con B, es decir, la probabilidad de A dada B, es

P(A/B) = P(A(B) P(B)

EJEMPLO Los registros de policía muestran que en cierta ciudad la probabilidad es 0.35 de que se capture a un ladrón y 0.14 de que se capture y condene el ladrón. ¿Cuál es la probabilidad de que un ladrón, si es capturado, será condenado?A = evento un ladrón sea condenadoB = evento que un ladrón sea capturadoP(B)= 0.35P(A(B) = 0.14 P(A/B) = P(A(B) = 0.14 = 0.40

P(B) 0.35EVENTOS INDEPENDIENTES El evento A es independiente de el evento B si la probabilidad del evento A no se ve afectada por la incidencia o no incidencia de ASi los eventos A y B no son independientes, se dice que son dependientesEJEMPLO Se tiene una urna con 7 bolas rojas y 3 negras. Si se extraen 2 bolas una a continuación de otra, ¿cuál es la probabilidad de que sea roja la primera y roja la segunda? a)Hay reposición P(R1(R2), debe ocurrir los dos eventosP(R1yR2)= P(R1)P(R2) = 7/10(7/10 = 49/100Son independientes porque hay reposiciónb) no hay reposiciónP(R1yR2)= P(R1)P(R2 / R1)=7/10(6/9 = 42/90Son dependientes, entonces la posibilidad de que ocurra R2 dado que ocurrirá R1 es 6/9

3 REGLA DE MULTIPLICACIÓN

Si la primera tarea de un experimento da como resultado n1 resultados posibles y, para cada uno de ellos, la segunda tarea da como resultado n2 resultados posibles, entonces se tienen n1 y n2, resultados posibles para las dos tareas juntas.

La regla de multiplicación se amplía a más tareas sucesivas.Nos ayudamos del diagrama del árbol

Si se tienen que calcular la probabilidad de que ambos sucesos A y B ocurran, se usa la regla de la multiplicación, para usarse esta regla debe determinarse si son dependientes o independientes P(A(B)=P(A)(P(B/A) ( EVENTOS DEPENDIENTES P(A(B)=P(A)(P(B) (EVENTOS INDEPENDIENTESEJEMPLOa)¿Cuál es la probabilidad de obtener 2 águilas en dos lanzamientos al aire de una moneda equilibrada ? ½ ( ½ = ¼b)P( C )= 0.65, P (D) = 0.40 y P(C(D)= 0.24, ¿Son inde4ependientees los eventos C y D?P(C )(P(D) = 0.65( 0.40 = 0.26 y no 0.24, los dos eventos son dependientesEJEMPLO

Supóngase que una empresa ha de decidir donde construir dos plantas nuevas, una en el lado oriente y otra en el poniente[pic]n1 n2, = 4(2=8Calcular la probabilidad de que sea seleccionada la ciudad E .{E sale seleccionada} = {AE} ({BE}({CE}({DE}=P{AE}+P{BE}+P{CE}+P{DE} = 1//8+1/8+1/8+1/8=½ = 0.5

No es importante el orden y solo interesa el número de subconjuntos de determinado tamaño que se pueden seleccionar de un conjunto dadoEJEMPLO

Supóngase 3 empleados deben seleccionarse de entre los 10 para ir a la misma planta. ¿De cuántos modos se puede hacer la selección?

Page 15: Pasos estadistica

ARREGLOS ORDENADOS O PERMUTACIONESEl número de arreglos ordenados o permutaciones , de 5 objetos seleccionados entre n

objetos distintos, si (r(n) está dado porPrn = n(n-1) ...(n – r + 1) = n! .

(n – r )!EJEMPLO

De entre 10 empleados se deben seleccionar tres para viajar a 3 plantas A,B,C fuera de la ciudad. Cada empleado irá a una planta. Como las plantas están en distintas ciudades, es importante el orden de asignación de los empleados de las plantas. ¿De cuántos modos se puede hacer la selección?Es importante el orden.

P310 = 10! = 720 3!

2 COMBINACIONES

El número de subconjuntos distintos o combinaciones, de tamaño r que se pueden seleccionar de n objetos distintos, si (r(n) es;

No es importante el orden y solo interesa el número de subconjuntos de determinado tamaño que se pueden seleccionar de un conjunto dadoEJEMPLO

Supóngase 3 empleados deben seleccionarse de entre los 10 para ir a la misma planta. ¿De cuántos modos se puede hacer la selección?

[pic]

3

4 TEOREMA DE BAYES

DEFINICIÓN.- Sean A1,A2...,Ak sucesos mutuamente excluyentes que ocupan todo el espacio muestral (. Si cada uno de estos sucesos tiene probabilidad no nula y uno de ellos debe ocurrir, entonces para cada suceso B en el espacio muestral ( .

P(A1/B) = P(A1) P(B/ A1) . P(A1) P(B/ A1) + P(A2) P(B/ A2) + . . . . . . . . + P(AK) P(B/ AK)P(A2/B) = P(A2) P(B/ A2) . P(A1) P(B/ A1) + P(A2) P(B/ A2) + . . . . . . . . + P(AK) P(B/ AK)

Y finalmenteP(Ak/B) = P(Ak) P(B/ Ak) . P(A1) P(B/ A1) + P(A2) P(B/ A2) + . . . . . . . . + P(AK) P(B/ AK)

Para i = 1,2,. . . . , o bien kEJEMPLOSa) Un[22][23] fabricante está considerando comprar un lote del 10 000 piezas de un proveedor. El fabricante estima la proporción de piezas defectuosas en el lote en la forma siguiente:|Proporción de piezas |Probabilidad ||defectuosas |P(x) ||(1 = 0.10 |P((1 )= 0.210 ||(2 = 0.15 |P((2 )= 0.30 ||(3 = 0.25 |P((3 )= 0.50 |

Esto significa que el fabricante no está seguro acerca de la proporción de piezas defectuosas en el lote; sin embargo, basándose en experiencias anteriores, cree que hay una probabilidad de 0,20 de que el lote tenga 10% de piezas defectuosas, una probabilidad de0,30 de que tenga 15% y finalmente, de 0,50 de que tenga 25% de piezas defectuosas.

a) ¿Cuál es la probabilidad de que elige una pieza al azar en el lote. b) Dado que la pieza resulta defectuosa, ¿cuál es la probabilidad de que el lote tenga 25% de piezas defectuosas?

P((3 / D) = P(((3 ( D) = 0.1250 = 0.6579 P(D) 0.1900

b) Todas las noches el señor Herrera llega tarde a su casa. La señora Herrera, que es una buena esposa, le deja encendida la luz de la entrada a la casa. La probabilidad de que el señor Herrera

Page 16: Pasos estadistica

llegue borracho es 0,60. Si llega borracho, hay una probabilidad de 0,90 de que olvide apagar la luz en tanto que ésta solo de 0.05 si llega sobrio.a) ¿Cuál es la probabilidad de que el señor Herrera apague la luz en una noche cualquiera?b) Dado que el señor Herrera apagó la luz una cierta noche, ¿cuál es la probabilidad de que haya llegado borracho?

RESPUESTA: a)0.44 b)6/44

1 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD

Las variables aleatorias discretas sólo pueden tomar un número de valores finito. Cuando una variable puede tomar un conjunto discreto de valores. Las variables aleatorias suelen clasificarse de acuerdo con el número de valores que pueden asumir.

Una distribución de probabilidades es una correspondencia que asigna probabilidades a sus valores.

La tabla del ejemplo que sigue sirve para ilustrar lo que significa la Distribución de Probabilidad de una variable aleatoria

Se construye una tabla donde se muestra las probabilidades de obtener la suma de dos los puntos obtenidos en el lanzamiento de dos dados.

|x |P(x) |xP(x) |x2 |x2P(x) ||2 |1/36 |2/36 |4 |4/36 ||3 |2/36 |6/36 |9 |18/36 ||4 |3/36 |12/36 |16 |48/36 ||5 |4/36 |20/36 |25 |100/36 ||6 |5/36 |30/36 |36 |180/36 ||7 |6/36 |42/36 |49 |294/36 ||8 |5/36 |40/36 |64 |320/36 ||9 |4/36 |36/36 |81 |324/36 ||10 |3/36 |30/36 |100 |300/36 ||11 |2/36 |22/36 |121 |242/36 ||12 |1/36 |12/36 |144 |144/36 || |1 |((x)=7 | |((x2)=54.83 |

ESPERANZA MATEMÁTICA El valor esperado de una variable discreta X que tiene una función p(x) de probabilidad está dada p[24]o[25]r

E(X)=( xP(x)(La suma es con respecto a todos los valores de x para los cuales P(x)>0.)A veces se emplea la notaciónE(X) =(

VARIANCIA La variancia de una variable aleatoria X cuyo valor esperado es ( es

V(X) = E [(X - ()2] o V(X) = E(X2) – [E(X)]2A veces se usa la notación

E [(X - ()2] = (2

DESVIACIÓN ESTÁNDAR. De una variable aleatoria X es la raíz de la variancia, y está definida mediante( = ((2 = (E[(X - ()2 ] o ( = ((2 = (E(X2) – [E(X)]2

HISTOGRAMA DE FRECUENCIA RELATIVA (para la tabla anterior)6/36 ( (5/36 ( ( (4/36 ( ( (3/36 ( ( (2/36 ( ( (1/36 ( ( ( 0 2 3 4 5 6 7 8 9 10 11 12

1 DISTRIBUCIÓN BINOMIAL

Page 17: Pasos estadistica

Se acostumbra a decir que el número de aciertos en n ensayos es una variable aleatoria que tiene la distribución de probabilidad Binomial o simplemente la distribución Binomial.. la distribución Binomial recibe el nombre en virtud de que para x = 0,1,2,.,.,.,y n, los valores de las probabilidades son los término sucesivos de la expansión Binomial de [(1 - p) + p]n.DEFINICIÓN.- Si n es el número de intentos o ensayos, p es la probabilidad de un acierto en cada ensayo y todos los ensayos son independientes, entonces la probabilidad de lograr x aciertos en n ensayos es:

Una variable aleatoria X tiene una distribución Binomial si existen las cinco condiciones siguientes:1) El experimento consiste en un número fijo de n intentos idénticos .2) Cada intento sólo puede tener un resultado de dos posibles, que se llaman “éxito” y ”fracaso”3) La probabilidad p de “éxito” es constante de intento a intento4) Los intentos son independientes5) Se define a X como el número de éxitos en n intentosn y p son los parámetros de la distribución BinomialEJEMPLO

Si la probabilidad de que una pareja de divorciados se vuelva a casar dentro de 3 años es 0.40 determine las probabilidades de que de 10 parejas de divorciados.

a. cuando mucho tres se volverán a casar dentro de tres años;b. cuando menos tres se volverán a casar dentro de tres años;c. de dos a cinco se volverán a casar dentro de tres años;d. cuando menos dos se volverán a casar dentro de tres años.

a) n = 10 , p = 0.40 y x = 0,1,2 y 3 ( 0.006 + 0.040 + 0.121 + 0.215 = 0.382b) n = 10 , p = 0.40 y x = 7,8,9 y 10 ( 0.042 + 0.011 + 0.002 + 0.000 = 0.055c) n = 10 , p = 0.40 y x = 2,3,4 y 5 ( 0.121 + 0.215 + 0.251 + 0.201 = 0.788d) n = 10 , p = 0.40 y x = 0 y 1 son 0.006 y 0.040. por tanto , la probabilidad de que cuando menos dos de 10 parejas de divorciados se vuelvan a casar dentro de tres años es ( 1- (0.06+0.040) = 0.954

2 DISTRIBUCIÓN DE POISSON

Cuando n es grande y p es chica, las probabilidades binomiales a menudo se aproximan por medio de la fórmula:Es una forma especial de la distribución de Poisson: la utilizaremos sólo cuando n sea cuando menos 100 y n p sea menor que 10 EJEMPLO

Los registros muestran que la probabilidad es 0.00005 de que a un automóvil se lee reviente un neumático al cruzar cierto túnel. Emplee la aproximación de Poisson a la distribución Binomial para determinar las probabilidades de que entre 10 000 automóviles que cruzan este túnel.

a) cuando menos a dos se les reviente un neumático;b) cuando mucho a dos se les reviente una llanta

f(0) = (0.5)0(e –0.5 =0.607 f(1) = (0.5)x(0.607 =0.304f(2) = (0.5)x(0.607 = 0.076 0! 1! 2!a) 1 –(0.607 + 0.304) = 0.089b) 0.607 + 0.304 +0.076= 0.987DISTRIBUCIÓN DE POISSON ( parámetro ()

La distribución de Poisson tiene, muchas aplicaciones importantes que no tienen relación directa con la distribución Binomial. En este caso n p se sustituye por el parámetro ( (letra lambda griega minúscula)y se calcula la probabilidad de lograr x “aciertos” por medio de la fórmulaDonde ( se interpreta como el número esperado, o promedio, de aciertos. Esta fórmula se aplica a muchas situaciones donde se puede esperar un número fijo de “aciertos” por unidad de tiempoEJEMPLO1).- El[26] número de llamadas telefónicas que entran a una central de edificio de oficinas es de 4 por minuto, en promedioa) Calcular la probabilidad de que no lleguen llamadas en un determinado período de un minutob) Calcular la probabilidad de que por lo menos lleguen 2 llamadas en un período de un minutoc) Calcular la probabilidad de que por lo menos lleguen 2 llamadas en un período de dos minutos

a).- ( = 4 P(x = 0) = P(0)b)P (x ( 2) = 1 –p(x = 1) = 1 –f(1) = 1 - 0.092 = 0.0908

Page 18: Pasos estadistica

c) ( = 2(4) = 8 P(x ( 2) = 1 – f(1) = 1 – 0.003 = 0.9972).- El número de lesiones menores que se puede esperar presente un entrenador de fútbol durante el curso de un juego es una variable aleatoria que tiene la distribución de Poisson con ( = 4.4. Calcule la probabilidad de que durante el curso de un juego ese haya cuando menos 3 lesiones menores.Respuesta:0.020-----------------------[1] por “William J. Stevens”,[2] “ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA” por William J. Stevenson, Editorial Harla.

[3] “ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & David S. Rubin, Sexta edición, editorial Prentice[4] “ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA” por William J. Stevens, Editorial Harla.[5] “Curso práctico de estadística” por Lincoyan Portus Govinden. Editorial McGrawHill[6] “ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA” por William J. Stevens, Editorial Harla.[7] “ El libro de la Estadística Moderna” por Helmut Swoboda, ediciones Omega, S.A. Casanova. 220- Barcelona[8] “ESTADÍSTICA PARA NEGOCIOS” John E. Hanke / Arthur G. Reitsch McGrawHill[9] “ESTADÍSTICA PARA NEGOCIOS” John E. Hanke / Arthur G. Reitsch McGrawHill[10] “Estadística para Administradores” por Richard Levin/David Rubin, ; Prentice Hall[11] Percentil: Con respecto a una escala de cien, valor que indica el porcentaje de una distribución que es igual o menor que dicho valor.[12] El símbolo (, en el ámbito de las matemáticas, se le conoce como sumatoria. En este caso significa la suma de todos los productos de f por x[13] El símbolo Xw se lee x testada sub w. La letra w se conoce como subíndices y sirve par recordar que no se trata de una media pesada, de acuerdo con la importancia relativa de los valores de x.13 “ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & S. Rubin. Prentice Hall[14] “ Estadística para Administración y economía” por William J. Stevenson, editorial Harla[15]“ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & S. Rubin. Prentice Hall[16]“ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & S. Rubin. Prentice Hall[17] “EL LIBRO DE LA ESTADÍSTICA MODERNA” por Helmut Swoboda, editorial. Ediciones Omega[18] “EL LIBRO DE LA ESTADÍSTICA MODERNA” por Helmut Swoboda, editorial. Ediciones Omega[19] “ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & S. Rubin. Prentice Hall[20] “ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA”, por William J. Stevenson, Harla[21]Estadística General aplicada por Fadil H. Zuwaulyf

[22] “Probabilidad y Estadística para Ingeniería” pag 72 por Scheaffer McClave[23] “Estadística” por Jhon E Freund /Richard Manning Smith[24] Pag. 104 Ejercicio 3.53 “Probabilidad y Estadística para Ingeniería” por Scheaffer McClave

-----------------------[pic]

En ocasiones, la barras se colocan juntas para comparar dos variables para dos períodos distintos. Este diagrama de barras indica la forma en que contestaron 1997 adultos a las preguntas relativas a la reglamentación gubernamental de las líneas aéreas. A veces, por razones de espacio, las barras se encuentran en posición horizontal.

Ejemplo:

COLORES FAVORITOSColor Frecuencia Frec.Rel GradosRojo 12 0.375 135ºVerde 8 0.25 90ºAzul 8 0.25 90ºAmarillo 4 0.125 45º

32 1.000 360º

M.G, = n producto de todos los valores de x

M.G, = n 1.679965 = n 1.1093( factor de crecimiento

--

Page 19: Pasos estadistica

M.G, = n 1.07 ( 1.08 ( 1.10 ( 1.12 ( 1.18

( = (2 = ( ( x - ()2 = ( x2 - (2 =N N

--

( = (2 = 0.034 = 0.058% --

s = s2 = ( f( x - ()2 = (f x2 - (2 =N N

--

( = (2 = 66800 = 258.5 ( desviación estándar --

s = s2 = ( ( x - x)2 = ( x2 - nx2 =n-1 n-1 n-1

--

s = s2 = 144888 = 380.64(desviación estándar de la muestra --

10 = 10! = 10.9.8 = 1203 3!(10 – 3 )! 3.2

n = n .r r!(n – r )!

10 = 10! = 10.9.8 = 1203 3!(10 – 3 )! 3.2

A1 P(B/A1) B P(A1)(P(B/A1)

P(A1) A2 B P(B/A2) P(A2)(P(B/A2) P(A2)

P(Ak) Ak A P(B/Ak) P(Ak)(P(B/Ak)

(1 P(D/(1) = 0.10 D P((1 ( D)= 0.20(0.10 = 0.0200 P((1)=0.20

(2 D P((2) = 0.30 P(D/(2) = 0.15 P((2 ( D)= 0.30 ( 0.15 =0.0450

P((3) = 0.50 (3 D P(D/(3) =0.25 P((3 ( D)=0.50 (0.25=0.1250 P(D) = 0.1900

nf(x) = px(1 - p)n-x para x = 0,1,2,...,o n x

10f(2) = (0.40)2(0.60)8 =0.121

Page 20: Pasos estadistica

2

10f(1) = (0.40)1(0.60)9 =0.010 1

10f(0) = (0.40)0(0.60)10 =0.006 0

10f(9) = (0.40)9(0.60)1 =0.006 9

10f(8) = (0.40)8(0.60)2 =0.006 8

10f(7) = (0.40)7(0.60)3 =0.006 7

10f(6) = (0.40)6(0.60)4 =0.006 6

10f(5) = (0.40)5(0.60)5 =0.201 5

10f(4) = (0.40)4(0.60)6 =0.251 4

10f(3) = (0.40)3(0.60)7=0.215 3

(x) = (x(e -( para x = 0,1,2,...,o n x!

P(0) = 40(e -4= 0.0183 0!

f(1) = 81(e -8= 0.003 1!

f(1) = 41(e -4= 0.092 1!