estadisticas luis castellanos

78
REPÚBLICA BOLIVARIANA DE VENEZUELA UNIVERSIDAD EXPERIMENTAL POLITÉCNICA DE LA FUERZA ARMADA NACIONAL (UNEFA) Probabilidades y Estadística Ing° Luis Castellanos MSc

Upload: alejandro-arias

Post on 13-Aug-2015

50 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Estadisticas Luis Castellanos

REPÚBLICA BOLIVARIANA DE VENEZUELA UNIVERSIDAD EXPERIMENTAL POLITÉCNICA

DE LA FUERZA ARMADA NACIONAL (UNEFA)

Probabilidades y Estadística

Ing° Luis Castellanos MSc

Page 2: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. ii

Ing° Luis Castellanos (Versión 1.20)

Índice

1 INTRODUCCIÓN A LA ESTADÍSTICA.......................................................................................................1 1.1 DEFINICIÓN DE ESTADÍSTICA. ...................................................................................................................1 1.2 DIVISIÓN DE MÉTODOS ESTADÍSTICOS......................................................................................................1 1.3 MEDIDAS USADAS EN LA ESTADÍSTICA DESCRIPTIVA..................................................................................1 1.4 MEDIDAS USADAS EN ESTADÍSTICA INDUCTIVA: .........................................................................................2 1.5 MEDIDAS USADAS EN MÉTODOS COMPLEJOS............................................................................................2 1.6 PASOS PARA SEGUIR EN UN MÉTODO ESTADÍSTICO...................................................................................2 1.7 MÉTODOS DE RECOLECCIÓN DE DATOS ...................................................................................................2 1.8 POBLACIÓN Y MUESTRA...........................................................................................................................2 1.9 DISTRIBUCIÓN DE FRECUENCIAS ..............................................................................................................3 1.10 GRÁFICAS DE FRECUENCIAS ....................................................................................................................5 1.11 ESTADÍSTICOS IMPORTANTES...................................................................................................................6 1.12 RELACIÓN ENTRE LA MEDIA, MEDIANA Y MODO EN UN POLÍGONO DE FRECUENCIAS ...................................8 1.13 EJERCICIOS ............................................................................................................................................9

2 TEOREMAS DE PROBABILIDADES. ......................................................................................................10 2.1 DEFINICIONES. ......................................................................................................................................10 2.2 PRINCIPIO DE ENUMERACIÓN O CONTEO. ...............................................................................................12 2.3 PRINCIPIO DE ADICIÓN...........................................................................................................................13 2.4 PROBABILIDAD DE UN EVENTO ...............................................................................................................15 2.5 TEOREMA DE PROBABILIDAD COMPLETA (TEOREMA ADITIVO):.................................................................16 2.6 TEOREMA DE PROBABILIDAD COMPUESTA (TEOREMA DE MULTIPLICACIÓN)..............................................16 2.7 PROBABILIDAD CONDICIONAL .................................................................................................................17 2.8 TEOREMA DE BAYES..............................................................................................................................18 2.9 EJERCICIOS ..........................................................................................................................................19

3 VARIABLE ALEATORIA Y FUNCIÓN DE PROBABILIDADES. .............................................................21 3.1 DEFINICIONES VARIAS............................................................................................................................21 3.2 FUNCIÓN DE DISTRIBUCIÓN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA. ..........................22 3.3 DISTRIBUCIÓN ACUMULATIVA DE UNA VARIABLE ALEATORIA DISCRETA ....................................................22 3.4 FUNCIÓN O DISTRIBUCIÓN DE PROBABILIDAD DE UNA VARIABLE...............................................................23 3.5 DISTRIBUCIÓN ACUMULATIVA DE UNA VARIABLE ALEATORIA CONTINUA....................................................24 3.6 EJERCICIOS. .........................................................................................................................................24

4 ESPERANZA MATEMÁTICA....................................................................................................................26 4.1 DEFINICIONES VARIAS. ..........................................................................................................................26 4.2 PROPIEDADES O LEYES DE LA ESPERANZA MATEMÁTICA.........................................................................27 4.3 VARIANZA DE UNA VARIABLE ALEATORIA.................................................................................................27 4.4 TEOREMA DE CHEBYSHEV. ....................................................................................................................28 4.5 EJERCICIOS. .........................................................................................................................................29

5 DISTRIBUCIONES DE PROBABILIDAD..................................................................................................31 5.1 DISTRIBUCIÓN BINOMIAL. .......................................................................................................................31 5.2 DISTRIBUCIÓN DE POISSON....................................................................................................................32 5.3 DISTRIBUCIÓN NORMAL .........................................................................................................................33 5.4 EJERCICIOS ..........................................................................................................................................35

6 DISTRIBUCIÓN EN EL MUESTREO ........................................................................................................38 6.1 TEORÍA DEL MUESTREO.........................................................................................................................38 6.2 DISTRIBUCIÓN MUESTRAL DE MEDIA ARITMÉTICA....................................................................................42 6.3 DISTRIBUCIÓN MUESTRAL DE MEDIA ARITMÉTICA CON DOS MUESTRAS ...................................................42 6.4 DISTRIBUCIÓN MUESTRAL χ2 / CHI 2 / JI 2 ................................................................................................43

Page 3: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. iii

Ing° Luis Castellanos (Versión 1.20)

6.5 DISTRIBUCIÓN “T” DE STUDENT ..............................................................................................................43 6.6 DISTRIBUCIÓN F (DE FISCHER)...............................................................................................................45 6.7 EJERCICIOS ..........................................................................................................................................46

7 TEORÍA DE LA ESTIMACIÓN ..................................................................................................................47 7.1 GENERALIDADES. ..................................................................................................................................47 7.2 ESTIMACIÓN PUNTUAL O LOCAL .............................................................................................................47 7.3 ESTIMACIÓN POR INTERVALOS ...............................................................................................................48 7.4 ERROR MUESTRAL ................................................................................................................................48 7.5 ESTIMACIÓN DE LA MEDIA ......................................................................................................................49 7.6 ¿CÓMO SE CALCULA EL TAMAÑO DE UNA MUESTRA?...............................................................................50 7.7 LÍMITE DE TOLERANCIA ..........................................................................................................................51 7.8 DISTINCIÓN ENTRE LÍMITES DE CONFIANZA Y LÍMITES DE TOLERANCIA .....................................................52 7.9 ESTIMACIÓN DE LA VARIANZA.................................................................................................................52 7.10 EJERCICIOS ..........................................................................................................................................52

8 ENSAYOS DE HIPÓTESIS Y SIGNIFICACIÓN........................................................................................54 8.1 HIPÓTESIS ESTADÍSTICA ........................................................................................................................54 8.2 HIPÓTESIS NULA (H0) ............................................................................................................................54 8.3 PRUEBA DE HIPÓTESIS ESTADÍSTICA ......................................................................................................54 8.4 PRUEBA DE MEDIAS Y VARIANZAS ..........................................................................................................57 8.5 EJERCICIOS ..........................................................................................................................................59

9 ANÁLISIS DE CORRELACIÓN Y REGRESIÓN ......................................................................................61 9.1 ANÁLISIS DE REGRESIÓN PARA DOS VARIABLES.......................................................................................61 9.2 ANÁLISIS DE CORRELACIÓN PARA DOS VARIABLES...................................................................................64 9.3 EJERCICIOS ..........................................................................................................................................66

10 BIBLIOGRAFÍA......................................................................................................................................68 11 ANEXOS.................................................................................................................................................69

11.1 ÁREAS BAJO LA CURVA NORMAL ............................................................................................................69 11.2 VALORES CRÍTICOS DE LA DISTRIBUCIÓN Χ2............................................................................................70 11.3 VALORES CRÍTICOS DE LA DISTRIBUCIÓN T .............................................................................................71 11.4 SUMAS DE DISTRIBUCIÓN BINOMIAL .......................................................................................................72 11.5 FACTORES DE TOLERANCIA PARA DISTRIBUCIONES NORMALES ...............................................................73

[email protected]

Page 4: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 1

Ing° Luis Castellanos (Versión 1.20)

1 Introducción a la Estadística

1.1 Definición de Estadística.

• Técnica especial apta para el estudio cuantitativo de los fenómenos de masa

o colectivos, cuya medición requiere una masa de observaciones de otros

fenómenos (Conrado Gini)

• Ciencia que trata de la recolección, clasificación y presentación de los

hechos sujetos a una apreciación numérica como base a la explicación,

descripción y comparación de un fenómeno (G. Vany Yule)

• Basa sus leyes, no en el estudio de una observación aislada o individual,

sino en el estudio de un gran número de observaciones.

• Dato Estadístico: aquel que mide un fenómeno colectivo (Tasa de

Mortalidad de Venezuela en últimos 10 años, Producción de Petróleo en

Venezuela durante los últimos 5 años, etc.).

1.2 División de Métodos Estadísticos.

• Métodos Descriptivos (o Estadística Descriptiva): resumen o condensan

todos los datos de una serie de valores para describir determinados aspectos de

la serie.

• Métodos Inductivos (o Estadística Inferencial): tratan de estimar las

características del universo estadístico o población total a través del estudio de

una parte de ese universo.

• Métodos Simples: se refieren al estudio de una sola característica o variable.

• Métodos Complejos: se refieren al estudio de dos o más características o

variables, determinando la relación entre ellas.

1.3 Medidas usadas en la Estadística Descriptiva

• Razones, tasas y porcentajes

• Distribución de frecuencias

• Medidas de Tendencia Central (Media, Mediana, Modo)

Page 5: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 2

Ing° Luis Castellanos (Versión 1.20)

• Medidas de Dispersión (Desviación cuartel, quintil, decil, percentil)

• Momentos, Asimetría, Kurtosis

1.4 Medidas usadas en Estadística Inductiva:

• Probabilidades

• Distribuciones

• Pruebas de Significación

1.5 Medidas usadas en Métodos Complejos

• Dispersión

• Correlación

• Regresión

1.6 Pasos para seguir en un Método Estadístico

• Formulación del Problema

• Desarrollo del Método de Recolección de Datos

• Recolección de Datos

• Clasificación de Datos

• Análisis Estadístico

• Presentación de Resultados

• Interpretación de los Resultados

1.7 Métodos de Recolección de Datos

• Entrevista Personal

• Cuestionario

• Observación Directa

• Experimentos Estadísticos

1.8 Población y Muestra

• Población: conjunto de individuos, objetos o cosas que se van a analizar. Es el

Universo Estadístico. Es el TODO. Puede ser:

Page 6: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 3

Ing° Luis Castellanos (Versión 1.20)

o Finita: se pueden contar todos sus elementos

o Infinita: el número de elementos es ilimitado.

• Muestra: parte representativa de la población. Puede ser:

o Probabilística: sus elementos tienen una probabilidad conocida y no nula

de ser seleccionados usando un método de selección aleatorio.

o No Probabilística: sus elementos son escogidos de acuerdo al criterio del

investigador y no al azar.

• Estudio Poblacional: análisis deductivo. Lo que es válido para el todo, es

válido para uno.

• Estudio Muestral: análisis deductivo. Lo que es válido para uno, podría ser

válido para el todo.

1.9 Distribución de Frecuencias • Componentes:

o Intervalo Total (o Rango): diferencia entre Límite Superior y el Límite

Inferior. (IT)

o Clases: fraccionamiento de la amplitud total o Rango.

o Intervalo de Clase: diferencia entre los Límites Inferior y Superior de una

Clase. (IC)

o Punto Medio del Intervalo de Clase. (xi)

o Frecuencia de Clase: número de casos en que la variable está

comprendida entre los límites de una clase. (fi)

• Organización:

o Determinar el Intervalo Total

• IT = LS - LI

o Determinar el número de Clases (se recomiendan entre 3 y 25)

o Determinar el Intervalo de Clase

ClasesNI

I TC º=

nxI

I TC log322,31+=

(Ecuación de Sturges)

Page 7: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 4

Ing° Luis Castellanos (Versión 1.20)

o Determinar Límites de Clase, de acuerdo a los IC definidos.

Series Discretas Series Continuas

10 – 19

20 – 29

30 – 39

10 – 19,99

20 – 29,99

30 – 39,99

o Determinar las frecuencias: registrar el número de datos u ocurrencias en

cada clase.

• Ejemplo:

o Agrupar en Distribución de Frecuencias las notas obtenidas por la

Sección J en Matemática II:

• 16, 8, 6, 10, 12, 10, 10, 10, 11, 7, 10, 8, 14, 10, 11, 11, 8, 17, 8, 6,

10, 2, 10.

Se recomienda primero ordenar los datos:

2, 6, 6, 7, 8, 8, 8, 8, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 11, 12,

14, 16, 17.

n = 3

IT = LS - LI IT = 17 – 2 IT = 15

372,223log322,31

15log322,31

=→=→+

=→+

= CCCT

C IIx

Inx

II

Sin embargo, se recomienda tomar IC = 4, para que se incluya en

el Límite Inferior de la primera clase, el número menor, y en el Límite

Superior de la última clase, el número mayor.

Clases Punto Medio Frecuencia Frecuencia Acumulada

2 – 5 3,5 1 1

6 – 9 7,5 7 8

10 – 13 11,5 12 20

14 – 17 15,5 3 23

Page 8: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 5

Ing° Luis Castellanos (Versión 1.20)

1.10 Gráficas de Frecuencias

• Polígono de Frecuencias: diagrama de líneas que representa los puntos

medios y sus respectivas frecuencias de una distribución.

Polìgono de Frecuencias

05

1015

2 - 5 6 - 9 10 - 13 14 - 17

Clases

Frec

uenc

ias

• Histograma de Frecuencias: serie de rectángulos paralelos, cuya base

representa el Intervalo de Clase y su altura la magnitud de la frecuencia de la

clase respectiva.

Histograma de Frecuencias

15105 0

2 - 5 6 - 9 10 - 13 14 - 17

Clases

Frecuencias

• Histograma de Frecuencias Acumuladas: serie de rectángulos paralelos,

cuya base representa el Intervalo de Clase y su altura la magnitud de la

frecuencia acumulada.

Page 9: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 6

Ing° Luis Castellanos (Versión 1.20)

Histograma de Frecuencias Acumuladas

3020100

2 - 5 6 - 9 10 - 13 14 - 17

Clases

Frecuencias

1.11 Estadísticos Importantes

• Estadístico: Medida que se calcula para describir la característica de una sola

muestra (, s, s2, p).

• Media Aritmética:

=

== n

ii

n

iii

f

xfx

1

1.

• Media Geométrica:

n

xfn

iii

G∑=

=1

log.

10

• Desviación Estándar:

( )n

xxs

n

ii∑

=

−= 1

2

A mayor desviación, mayor dispersión. En una Distribución Normal (ver

Unidad correspondiente), el porcentaje de los datos muestrales se agrupan de

acuerdo a la siguiente proporción:

o ± s 68,27% (Zona Normal)

o ± 2 s 95,45%

o ± 3 s 99,73%

Page 10: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 7

Ing° Luis Castellanos (Versión 1.20)

• Varianza (s2)

e más se repite o más típico. • Moda: valor qu

csigant

sigi I

fff

LMo+

+=

• Mediana: valor que divide una distribución de tal manera que quede a cada lado

un número igual de términos.

ci

ant

n

ii

i If

ff

LMd−

+=

∑=

21

• Ejemplo:

imos unas columnas a la tabla del Ejercicio del Ejemplo anterior,

fi facum fi xi fi log xi (xi - )2

o Añad

para facilitar los cálculos.

Clases xi

2 – 5 3,5 1 1 3,50 0,54 48,39

6 – 9 7,5 7 8 52,50 6,13 8,74

10 – 13 11,5 12 20 138,00 12,73 1,09

14 – 17 15,5 3 23 46,50 3,57 25,44

Totales 23 240,50 22,97 83,66

o 4565,1023

50,240.

1

1 =→=→=

=

= xxf

xfx n

ii

n

iii

9689,91010 2397,22

log.1

=→=→=∑=

GGG n

xfn

iii

o

o ( )

9072,123

66,831

2

=→=→−

=∑= ss

n

xxs

n

ii

o s2 = ( 1,9072) 2 s2 = 3,6374

Page 11: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 8

Ing° Luis Castellanos (Versión 1.20)

o 20,11437

310 =→+

+=→+

+= MoMoIff

fLMo c

sigant

sigi

o 50,11412

7223

1021

=→−

+=→−

+=

∑=

MdMdIf

ff

LMd ci

ant

n

ii

i

1.12 Relación entre la Media, Mediana y Modo en un Polígono de Frecuencias

• Curva Simétrica: = Md = Mo

• Curva Asimétrica Positiva: Mo < Md <

• Curva Asimétrica Negativa: < Md < Mo

Simétrica Asimétrica Positiva Asimétrica Negativa

Aparte, pueden variar, de acuerdo a su Kurtosis:

Leptokùrtica Mesokùrtica Platikùrtica

Page 12: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 9

Ing° Luis Castellanos (Versión 1.20)

1.13 Ejercicios

• Sean las medidas de peso de un grupo de personas:

56, 55, 40, 47, 73, 75, 81, 60, 65, 53, 52, 43, 56, 69, 67, 55, 52, 43, 52, 56, 69,

56.

Con los datos agrupados halle:

Media, Media Geométrica, Mediana, Modo, Desviación Estándar,

Varianza

Grafique Polígono de Frecuencias, Histograma de Frecuencias e

Histograma de Frecuencias Acumuladas

Determine si la gráfica es Simétrica o Asimétrica (Positiva o Negativa)

Page 13: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 10

Ing° Luis Castellanos (Versión 1.20)

2 Teoremas de Probabilidades.

2.1 Definiciones.

• Tipos de Modelos:

o Determinísticos (Ej. tdv = )

o Probabilísticos (Ej. Lanzamiento de dados)

• Experimento Aleatorio: registra los resultados al azar, que ocurren en un

estudio planificado o en una investigación científica. Ej.: lanzar una moneda.

• Datos Iniciales: información registrada en la forma en que se recoge, ya

sean cuentas o mediciones. Ej.: cara, sello, cara, cara.

• Cualquier recolección de información debe tener un propósito específico y

ser seguido por acciones.

• Sugerencias para la Recolección de Datos:

o Registrar claramente el origen de los datos

o Registrar para usar los datos fácilmente

o Si se van a registrar datos de manera continua, se pueden preparar y

usar formatos para ello

• Métodos de Recolección de Datos:

o Entrevistas

o Cuestionarios

o Observación Directa

o Experimentos Estadísticos

• Conjunto: agrupación de elementos que comparten una propiedad común.

• Espacio Muestral: conjunto de todos los resultados posibles de un

experimento aleatorio (s).

o Cada resultado se llama elemento, o miembro del Espacio Muestral, o

Punto Muestral.

o El Espacio Muestral puede ser Finito o Infinito.

• Ejemplo:

o Sea el lanzamiento de una moneda

Page 14: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 11

Ing° Luis Castellanos (Versión 1.20)

s = { cara, sello }

o Ciudades con más de 1 millón de Habitantes

s = { x / x es ciudad con Población > 1.000.000 }

o Puntos (x,y) dentro de un círculo de radio 2 y centro en el origen

s = { (x,y) / x2 + y2 ≤ 4 }

• Ejercicios:

o Halle el Espacio Muestral al tirar un Dado.

o Halle el Espacio Muestral al seleccionar 3 piezas al azar en un

proceso de producción. Cada pieza se inspecciona y clasifica como

Defectuosa (D) o No Defectuosa (N).

• Suceso o Evento: cualquier subconjunto del Espacio Muestral (A).

o Ejemplo: Determine el evento al lanzar el dado y observar números

pares que salen.

A = { 2, 4, 6 }

• Evento Simple: contiene sólo un elemento del Espacio Muestral.

o Ejemplo: A = { t / t < 5 } del S = { t / t ≥ 0 }

o (Donde t es la vida en años de un componente electrónico. A es el

evento de que falle antes del 5to año).

• Conjunto Vacío: subconjunto del Espacio Muestral que no contiene

elementos (Ø).

• Evento Compuesto: proviene de la unión de dos o más eventos simples.

o Ejemplo.

Tomemos el evento de sacar corazón de un Mazo de Cartas.

• A = { corazón } del S = { corazón, pica, trébol, diamante }

Ahora tomemos el evento de sacar una carta roja del mismo

mazo:

• B = { corazón, diamante } (B = { corazón o diamante })

• Eventos Mutuamente Excluyentes o Exclusivos: cuando su intersección

es Conjunto Vacío.

o Sean A = { 2, 4, 6 }; B = { 1, 3, 5 }; C = { 1, 2 }

A ∩ C = { 2 } ; B ∩ C = { 1 }; A ∩ B = Ø

Page 15: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 12

Ing° Luis Castellanos (Versión 1.20)

• Repaso:

o Intersección (∩): evento que contiene todos los elementos comunes a

A y a B (A ∩ B).

o Unión (U): evento que contiene todos los elementos que pertenecen a

A, a B, o a ambos. (A U B).

• Complemento de un Evento A con respecto a S: es el conjunto de todos

los elementos de S que no están en A (A’).

o Ejemplo. Sea Q el evento de que una persona seleccionada al azar en

un salón de clases fume. Entonces Q’ es el evento de que la persona

No Fume.

2.2 Principio de Enumeración o Conteo.

• Si una operación se puede efectuar en n1 formas, y si para cada una de ellas

se puede efectuar una segunda operación en n2 formas, y si para cada una

de las dos primeras se puede efectuar una tercera operación en n3 formas, y

así sucesivamente, entonces la secuencia de k operaciones se podrá realizar

en n1.n2.n3. … nk formas.

n1

n2

n3

o Ejemplo: ¿Cuántos almuerzos que contengan Sopa, Seco, Postre y

Jugo, se pueden preparar si se puede escoger entre cuatro (04)

sopas, tres (03) secos, cinco (05) postres y cuatro (04) jugos?

k = 4.3.5.4. k = 240 almuerzos

Page 16: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 13

Ing° Luis Castellanos (Versión 1.20)

2.3 Principio de Adición • T = n1 + n2

n1

n2

• Frecuentemente nos interesamos en un Espacio Muestral que contenga

como elementos a todos los órdenes o arreglos posibles de un grupo de

objetos.

o Permutaciones importa el orden

o Combinaciones no importa el orden

• Permutaciones de n elementos:

o !nP nn =• Permutaciones de n elementos tomados r a la vez:

o )!(!rn

nPrn −=

• Permutaciones en forma circular:

o )!1( −= nPcn

• Permutaciones de n elementos en k clases:

o !!...!!!

321 kkn nnnn

nP =

• Combinaciones de n elementos tomados r a la vez:

o )!(!!

rnrnC rn −

=

Page 17: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 14

Ing° Luis Castellanos (Versión 1.20)

• Ejemplos:

o Consideremos las letras a, b, c. ¿Cuántos objetos distintos se pueden

obtener si las agrupamos en 3 letras?

61.2.3!3 333333 =→=→= PPP

S = { abc, acb, bca, cab, bac, cba }

o Consideremos las letras a, b, c, d. ¿Cuántos objetos distintos se

pueden obtener, si las agrupamos en 2 letras?

12!2

!2.3.4)!24(

!4242424 =→=→

−= PPP

o Consideremos a cuatro (4) jugadores de cartas. ¿Cuántas formas

distintas de ubicar a los jugadores se pueden obtener?

61.2.3!3)!14( 4444 =→=→=→−= cccc PPPP

o ¿En cuántas formas diferentes pueden arreglarse 3 bombillos rojos, 4

bombillos amarillos y 2 bombillos azules en una extensión navideña de

9 bombillos?

260.1!2!4!3

!999 =→= kk PP

o ¿De cuántas formas se pueden alojar 7 ingenieros en un cuarto triple y

en dos cuartos dobles de un Hotel?

210!2!2!3

!777 =→= kk PP

o Consideremos a 8 alumnos. ¿Cuántos comités de 3 alumnos se

pueden formar?

56)!38(!3

!83838 =→

−= CC

o ¿De cuántas formas puede salir el billete ganador de un Kino?

Page 18: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 15

Ing° Luis Castellanos (Versión 1.20)

760.268.3)!1525(!15

!2515251525 =→

−= CC

2.4 Probabilidad de un Evento • La Probabilidad de cualquier evento A es la suma de los pesos de todos los

puntos muestrales en A, con valor entre 0 y 1.

o 0 ≤ p(A) ≤ 1

• Un peso cercano a 0 indica que el evento tiene poca posibilidad de ocurrir, y

un peso cercano a 1 indica que tiene mucha posibilidad de ocurrir.

• Otra definición de Probabilidad: número que se le asigna a un evento que

determinará las veces que el mismo puede ocurrir.

• NnAP =)(

• SAAP =)(

• Si un evento puede ocurrir de a maneras, y deja de ocurrir de b maneras,

siendo todos los casos posibles, ba

aAP+

=)(

• p + q = 1 (probabilidad de ocurrencia + probabilidad de no ocurrencia)

• Ejemplo:

o Probabilidad que al lanzar un dado salga un “2”.

S = { 1, 2, 3, 4, 5, 6 } ; A = { 2 }

65)2(;

61)2( == qp

o Probabilidad que al lanzar dos monedas salga una cara.

S = { cc, cs, ss, sc } ; A = { cs, sc }

21)(;

42)( == ApAp

o Si se sacan tres (3) cartas de un mazo de barajas españolas, ¿cuál es

la probabilidad que éstas sean as, dos y tres?

Primero se halla el número de maneras que pueden salir 3

cartas de 40:

Page 19: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 16

Ing° Luis Castellanos (Versión 1.20)

880.9)!340(!3

!40340340 =→

−= CC

S = { 9.880 maneras } ; A = { 4 ases, 4 dos, 4 tres }

0065,0)(;880.9

4.4.4)( == ApAp

o Si se saca una carta de un mazo de barajas, ¿cuál es la probabilidad

que la carta sea diamante?

S = { 52 } ; A = { 13 }

25,0)(;5213)( == ApAp

2.5 Teorema de Probabilidad Completa (Teorema Aditivo):

• En dos eventos mutuamente excluyentes A y B, A tiene p1 probabilidades de

ocurrir, y B tiene p2 probabilidades de ocurrir. La probabilidad de ocurrir A o B es igual a p1 + p2.

o P(A U B) = P(A) + P(B)

o P(A+B) = P(A) + P(B)

• Ejemplo: Si tenemos en una caja 12 bolas blancas, 10 bolas azules y 8 bolas

rojas, ¿cuál es la probabilidad de que al sacar una bola, ésta sea blanca o

roja?

o 3012)( =bP ;

308)( =rP

o 66,0)(3020)(

308

3012)( =+→=+→+=+ rbPrbPrbP

2.6 Teorema de Probabilidad Compuesta (Teorema de Multiplicación) • Si un evento A tiene p1 probabilidades de ocurrir y otro evento B tiene p2

probabilidades de ocurrir, simultáneamente o después de A, entonces la

probabilidad de ocurrir A y B es igual a p1. p2.

o P(A ∩ B) = P(A). P(B) Eventos Independientes o P(AB) = P(A). P(B)

Page 20: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 17

Ing° Luis Castellanos (Versión 1.20)

o P(AB) = P(A).P(B/A)

o P(BA) = P(B).P(A/B)

• Eventos Independientes: ocurre un evento sin importar el resultado del

evento anterior.

Probabilidad Condicional Eventos Independientes

• Eventos Dependientes: la probabilidad de ocurrencia de un evento depende

de la ocurrencia del evento anterior.

• Ejemplo:

o Si tenemos en una caja 12 bolas blancas, 10 bolas azules, y 8 bolas

rojas, ¿cuál es la probabilidad de que al realizar dos extracciones de la

caja, la primera sea blanca y la segunda roja?

o 3012)( =bP ;

1308)(−

=rP

o 1103,0)(298.

3012)( =→= brPbrP

2.7 Probabilidad Condicional • Es la probabilidad de que ocurra un evento B cuando se conoce que ha

ocurrido un evento A. P(B/A).

o )()(

)()()/(

APABP

APBAPABP =

∩= Probabilidad Condicional

Eventos Dependientes

• Ejemplo:

o Sea la probabilidad de que aumenten las ventas de carros el próximo

mes p(A) = 0,40. Sea la probabilidad de que aumenten las ventas de

repuestos el próximo mes p(R) = 0,50. Sea p(AR) = 0,10. Calcule la

probabilidad que aumente “A” dado que aumentará “R”, y la

probabilidad que aumente “R” dado que aumentó “A”.

→=)()()/(

RPRAPRAP

→=50,010,0)/( RAP

20,0)/( =RAP

→=)()()/(

APARPARP

→=40,010,0)/( ARP

25,0)/( =RAP

Page 21: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 18

Ing° Luis Castellanos (Versión 1.20)

2.8 Teorema de Bayes

• Se emplea para conocer las probabilidades de causas que hayan actuado

sobre sucesos ya constatados.

• Enunciado: si un suceso puede ser originado por varias causas, las cuales a

priori son igualmente probables, la probabilidad de que el suceso sea debido

a una determinada causa es igual a la probabilidad compuesta

correspondiente a dicha causa, dividida entre la suma de las probabilidad

compuestas, según las cuales el suceso pudiere derivarse de todas y cada

una de ellas.

o )/()(

)/().()/(

1i

n

ii

kkk

ABPAP

ABPAPBAP

∑=

=

o )/()(

)/().()/(

1i

n

ii

kkk

BAPBP

BAPBPABP

∑=

=

• Ejemplo:

o Se tienen 3 cajas:

A1 5 bolas blancas + 2 bolas negras

A2 6 bolas blancas + 5 bolas negras

A3 8 bolas blancas + 3 bolas negras

o Se saca una bola blanca. ¿Cuál es la probabilidad de que sea de la

primera caja?

3333,031)()()( 321 ==== ApApAp

)/()()/()()/()(

)/().()/(

332211

111 ABPAPABPAPABPAP

ABPAPBAP

++=

3595,0)/(15355)/(

118.

31

116.

31

75.

31

75.

31

)/( 111 =→=→++

= BAPBAPBAP

Page 22: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 19

Ing° Luis Castellanos (Versión 1.20)

2.9 Ejercicios • Encuentre la Probabilidad de que en el lanzamiento sencillo de un dado,

resulte un número menor a 4.

• Las probabilidades de que un marido y su esposa estén vivos durante 20

años a partir de ahora está dada por 0.8 y 0.9 respectivamente. Encuentre la

posibilidad de que en 20 años:

o Ambos estén vivos

o Ninguno esté vivo

o Al menos uno de ellos esté vivo

• Se saca al azar una carta de un mazo de 52 cartas. Encuentre la

probabilidad de que la carta sea:

o J de Corazones (J♥)

o 3 de Trébol (3♣) ó 6 de Diamantes (6♦)

o Un Corazón (♥)

o Cualquier carta que no sea Corazón.

o Ni 4 ni Trébol (♣)

• Se saca al azar una bola de una caja que contiene 6 bolas rojas, 4 blancas y

5 azules. Determine la probabilidad de que la bola sea:

o Roja

o Blanca

o Azul

o No Roja

o Roja o Blanca

• Un dado balanceado se lanza dos (2) veces. Encuentre la probabilidad de

obtener 4, 5 ó 6 en el primer lanzamiento, y 1, 2, 3 ó 4 en el segundo

lanzamiento.

• Determine la Probabilidad de obtener 3 “seis” al lanzar 5 veces un dado

balanceado

• Se sacan 2 cartas de un mazo de 52 cartas. Encuentre la probabilidad de

que ambas cartas sean Ases.

o Con reemplazo

Page 23: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 20

Ing° Luis Castellanos (Versión 1.20)

o Sin reemplazo

• Sea un mazo de 52 cartas, y un jugador de “Blackjack” desea saber la

probabilidad de tener “Blackjack”:

o Con 2 cartas

o Con 3 cartas

o Con 4 cartas

• ¿De cuántas maneras se pueden ordenar 5 personas en una rueda de

reconocimiento de testigos?

• ¿De cuántas maneras se pueden sentar 10 personas en una banca, si sólo

hay 4 puestos disponibles?

• ¿De cuántas maneras posibles se pueden sentar 7 personas alrededor de

una mesa redonda, si

o Se pueden sentar en cualquier lugar?

o 2 personas en particular no se pueden sentar juntas?

• ¿De cuántas maneras se puede formar un comité de 5 personas a partir de

un grupo de 9?

• Se va a formar un comité de 2 matemáticos y 3 físicos a partir de 5

matemáticos y 7 físicos. ¿De cuántas maneras se puede hacer si

o Se puede incluir cualquier matemáticos y cualquier físico?

o Un físico en particular debe estar en el comité?

o Dos matemáticos en particular no pueden pertenecer al comité?

• Empleando Teorema de Bayes:

o La Caja 1 tiene 3 metras rojas y 2 metras azules. La Caja 2 tiene 2

metras rojas y 8 metras azules. Se lanza una moneda balanceada. Si

se obtiene cara, se saca una metra de la Caja 1. Si se obtiene sello, se

saca una metra de la Caja 2.

o Si no se revela si se obtiene Cara o Sello, pero se dice que se sacó

una metra roja, ¿Cuál es la probabilidad de que la metra haya sido

sacada de la Caja1?

Page 24: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 21

Ing° Luis Castellanos (Versión 1.20)

3 Variable Aleatoria y Función de Probabilidades.

3.1 Definiciones varias. • Variable: cualquier característica de cada elemento de una población o muestra.

• Algunas Clasificaciones:

o Variables Cualitativas: miden cualidades (género, etc.)

o Variables Cuantitativas: se miden a través de cantidades cuantificables

(estatura, peso, etc.)

o Variables dependientes: aquella cuyo resultado es afectado por el efecto

producido por otra variable

o Variables Independientes: aquella cuyo valor no depende de otra

variable.

• Variable Aleatoria: es la función cuyo valor es un número real determinado por

cada elemento en el Espacio Muestral. Se usa letra mayúscula para

representarla, y letra minúscula para representar sus resultados.

• Espacio Muestral Discreto: contiene una cantidad finita de posibilidades.

• Variable Aleatoria Discreta: variable aleatoria definida sobre un Espacio

Muestral Discreto.

• Espacio Muestral Continuo: contiene una cantidad infinita de posibilidades.

• Variable Aleatoria Continua: variable aleatoria definida sobre un Espacio

Muestral Continuo. También se llama Función de Densidad.

• Generalmente las Variables Aleatorias Discretas representan datos contados, y

las Continuas datos medidos (alturas, pesos, temperaturas, distancias).

• Ejemplo:

o De una caja que contiene 4 bolas rojas y 3 blancas, se toman

sucesivamente 2 bolas sin reemplazarlas. Los resultados posibles z los

valores y de la Variable Aleatoria Z (Nº de bolas rojas) es:

z

RR 2

RB 1

BR 1

BB 0

Z = { 2, 1 , 1, 0 }

Page 25: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 22

Ing° Luis Castellanos (Versión 1.20)

o Se conduce una investigación para medir las distancias que recorre un

vehículo con 5 litros de gasolina (W).

3.2 Función de Distribución de Probabilidad de una Variable Aleatoria Discreta. • La Función ƒ(x) es una función de probabilidad de la Variable Aleatoria X si,

para cada x resultado posible:

o ƒ(x) ≥ 0

o ∑ ƒ(x) = 1

o P(X = x) = ƒ(x)

• Ejemplo:

o Encuentre la distribución de Probabilidad de la suma de los números

cuando se lanzan 2 dados.

2 dados pueden caer en 6x6 = 36 formas.

x 2 3 4 5 6 7 8 9 10 11 12

ƒ(x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

ƒ(x) = 36

1−x x ≤ 7

3613 x− x > 7

3.3 Distribución Acumulativa de una Variable Aleatoria Discreta

• F(x) = P(X≤x) = ∑≤xt

tf )(

• Ejemplo:

o F(2) = ƒ(2) = 1/36

o F(3) = ƒ(2) + ƒ(3) = 3/36

o F(4) = ƒ(2) + ƒ(3) + ƒ(4) = 3/36

o …

o F(12) = ƒ(2) + ƒ(3) + ƒ(4) + … + ƒ(12) = 36/36

Page 26: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 23

Ing° Luis Castellanos (Versión 1.20)

• Histograma de Probabilidad

0,2

0,15

0,1

0,05

0

• Histograma de Distribución Acumulada Discreta

3.4 Función o Distribución de Probabilidad de una Variable. • La función ƒ(x) es una función de Probabilidad de la Variable Aleatoria Continua

X (Función de Densidad), definida en R, si:

o ƒ(x) ≥ 0; Rx∈∀

o ∫∞

∞−

=1)( dxxf

o P(a<X<b) = ∫b

a

dxxf )(

2 3 4 5 6 7 8 9 10 11 12

1,21

0,80,60,40,2

02 3 4 5 6 7 8 9 10 11 12

Page 27: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 24

Ing° Luis Castellanos (Versión 1.20)

• Ejemplo:

na Funci de Densidad:

= x2/3 ; -1 < x < 2

≤X≤1).

o Sea X, con u ón

ƒ(x)

0 ; en otro valor

Verifique si ƒ(x) es función de Probabilidad y halle P(0

1182

=+=xx

9993 11 −−

22 3

=∫ dx

• 91

93

1

0

1

0

32

==∫xdxx

3.5 Distribución Acumu iva de una Variable Aleatoria Continua.

lat

∫=≤=x

dttfxXPxF )()()( ∞−

• Ejemplo:

91

93)(

3

11

32 +

−−

=== ∫xtdttxF

xx

o

3.6 Ejercicios.

• Se lanza una moneda dos veces. Halle la Función de Probabilidad y la Función

ad de X (N° de Caras).

úmero de metras blancas, halle la Función de

ión de Probabilidad y la Función de

de Densid

• Se lanza una moneda tres veces. Halle la Función de Probabilidad y la Función

de Densidad de X (N° de Caras).

• Una caja tiene 5 metras blancas y 3 metras negras. Si se sacan 2 metras al

azar, sin reemplazo, y X indica el n

Probabilidad y la Función de Densidad de X.

Sea X una Variable Aleatoria que indica el número de Ases al retirar 4 cartas al

azar de un mazo de 52 barajas. Halle la Func

Densidad de X.

Halle la constante “c” de manera que la siguiente función sea una Función de

Densidad:

Page 28: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 25

o ƒ(x) = c x2 ; 0 < x < 3

0 ; en otro valor

• Una Variable e oria tiene unción de Densidad:

0 ≤ x ≤ 2

r

o Halle

o Halle P(X>2)

< X < 3/2 )

• La Función de Distribución de una Variable Aleatoria X está dada por:

0 ≤ x < 3

o Si P(X

o Halle P(1 <2)

• Sea

0 ≤ x ≤ 2

o Halle P(1/2 < X < 3/2)

o Halle P(1<X<2)

at X la siguiente F Al

o ƒ(x) = c x2 ;

c x ; 2 < x < 3

0 ; en otro valo

c

o Halle P( ½

o ƒ(x) = c x3 ;

1 ; x ≥ 3

0 ; x < 0

=3) = 0, halle c

<X

X una Variable Aleatoria con Función de Densidad:

o ƒ(x) = c x ;

0 ; en otro valor

o Halle c

Ing° Luis Castellanos (Versión 1.20)

Page 29: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 26

4 Esperanza Matemática

4.1 Definiciones Varias. • El Valor Esperado, o la Esperanza Matemática, de una Variable

Aleatoria X, con una Función de Probabilidad ƒ(x) es:

o E(X) = ∑ x ƒ(x) (X Discreta)

o E(X) = ∫ (X Continua) ∞

∞−

dxxxf )(

• Ejemplo:

o Calcule la Esperanza de los siguientes Experimentos

Aleatorios:

Dos monedas se lanzan 16 veces al aire, donde X es el

número de caras por lanzamiento. X = { 0, 1, 2 }. Se

obtienen 0, 1 y 2 caras, 4, 7 y 5 veces respectivamente.

• 06,1)(165.2

167.1

164.0)( =→⎟

⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛= XEXE

Sea X la vida en horas de una válvula electrónica. La

Función de Densidad de Probabilidad es:

ƒ(x) = 3

000.20x

; x > 100

0; x ≤ 100

• ∫∫∞

−∞

→=→=100

2

1003 000.20)(000.20.)( dxxXEdx

xxXE

• ⎟⎠⎞

⎜⎝⎛−−

∞−=→−=

100000.20000.20)(000.20)(

100

XEx

XE

• E(X) = 200

• Sea X una variable aleatoria con distribución de probabilidad ƒ(x). El

valor esperado de la función g(X) es:

o E[g(X)] = ∑ g(x) ƒ(x) (X Discreta)

Ing° Luis Castellanos (Versión 1.20)

Page 30: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 27

o E[g(X)] = (X Continua) ( )∫∞

∞−

dxxfxg )(

• Ejemplo:

o Calcule la Esperanza de los siguientes Experimentos

Aleatorios:

Sea X una variable aleatoria con la siguiente

distribución de probabilidad:

x 0 1 2 3

ƒ(x) 1/3 1/2 0 1/6 Encuentre el valor de Y = (X – 1)2

• E[(X – 1)2] = ∑ (X – 1)2 ƒ(x)

• E[(X – 1)2] = (– 1)2 (1/3) + (0)2 (1/2) + (1)2 (0) + (2)2 (1/6) • E[(X – 1)2] = 1

Sea X una variable aleatoria con función de densidad:

ƒ(x) = x2/3 ; -1 < x < 2

0 ; en otro valor

Encuentre el valor de g(X) = 2X -1

• 23)2(

31

3)12()12(

2

1

232

1

2

∫∫−−

=−=−

=− dxxxdxxxXE

4.2 Propiedades o Leyes de la Esperanza Matemática. • E (aX + b) = a E(X) + b a y b constantes

• E [ƒ(X) ± g(X)] = E [ƒ(X)] ± E [g(X)]

• E [ƒ(X,Y) ± g(X,Y)] = E [ƒ(X,Y)] ± E [g(X,Y)]

• E (X,Y) = E (X) . E (Y)

4.3 Varianza de una Variable Aleatoria • La varianza de una variable aleatoria X está dada por:

o σ2 = E (X2) - µ2

• Ejemplo:

Ing° Luis Castellanos (Versión 1.20)

Page 31: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 28

o Calcule la varianza de X, donde X es el número de Ingenieros

de Sistema en un comité de tres personas seleccionadas al

azar entre un grupo de cuatro Ingenieros de Sistema y tres

Ingenieros Mecánicos.

4x

3 3-x

f(x) = 73

E(X) = (0)(1/35)+(1)(12/35)+(2)(18/35)+(3)(4/35)

E(X) = 1,7

E(X2) = (0)(1/35)+(1)(12/35)+(4)(18/35)+(9)(4/35)

E(X2) = 24/7

σ2 = 24/7 – (12/7)2 σ2 = 24/49

4.4 Teorema de Chebyshev.

• La varianza de una variable aleatoria indica acerca de la variabilidad

de las observaciones con respecto a la media.

• Si una variable aleatoria tiene una varianza o desviación estándar

pequeña, se puede esperar que la mayoría de los valores estén

agrupados alrededor de la media.

• Por ello, la probabilidad de que una variable aleatoria tome un valor

dentro de cierto intervalo, alrededor de la media, es mayor que para

una variable similar con una desviación estándar mayor.

• Si se considera a la probabilidad en términos de área (bajo la curva),

en una distribución continua con una desviación estándar pequeña

que tenga la mayor parte de su área cercana a µ.

• Un valor mayor de σ indica una mayor variabilidad, y por lo tanto se

espera que el área estará más extendida.

Ing° Luis Castellanos (Versión 1.20)

Page 32: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 29

• El matemático ruso Chebyshev descubrió que hay una relación entre

la desviación estándar y la fracción del área que se encuentra entre

dos valores cualesquiera, simétricos con respecto a la media:

• Teorema de Chebyshev:

o La probabilidad de que cualquier variable aleatoria X caiga

dentro de k desviaciones estándar de la media, es al menos (1

– 1/k2).

o P ( µ - k σ < X < µ + k σ ) ≥ 1 - 1 / k2

• Ejemplo:

o Una variable aleatoria X tiene una media µ=8, una varianza

σ2=9, y una distribución de probabilidad desconocida.

Encuentre P (-4 < X < 20).

P (-4<X<20) = P ( 8 – (4)(3) < X < 8 + (4)(3)) ≥ 1 - 1 / 42

P (-4 < X < 20) ≥ 15/16.

4.5 Ejercicios.

• Se rifan 200 premios de Bs. 1.000, 20 premios de Bs. 2.000 y 5

premios de Bs. 5.000. Suponiendo que se elaboran y venden 10.000

tickets, ¿cuál es el precio justo por cada ticket (sin incluir ganancia)?

• En un juego de apuesta, un hombre recibe Bs 5.000 si al tirar 3

monedas al aire se obtienen todas caras o todas sellos, y paga Bs.

3.000 si resultan 1 ó dos caras. ¿Cuál es la ganancia esperada?

• Un hombre, al invertir en una mercancía, puede tener una ganancia

de Bs. 3.000.000 en un año con una probabilidad de 0,3, o puede

perder Bs. 1.000.000 con una probabilidad de 0,7 en el mismo lapso.

¿Cuál es su Esperanza Matemática?

• Un hombre desea asegurar su vehículo en Bs. 20 millones. La

Compañía de Seguros estima que una Pérdida Total puede ocurrir

con una probabilidad de 0,002; una pérdida del 50% con una

probabilidad de 0,01 y una pérdida del 25% con una probabilidad de

Ing° Luis Castellanos (Versión 1.20)

Page 33: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 30

0,1. Si se ignoran las demás pérdidas parciales, ¿que prima anual

debe cobrar la aseguradora para tener una ganancia del 10%?

• Suponga que X es una Variable Aleatoria con media igual a 100 y

desviación estándar igual a 5.

o Halle la conclusión que se puede derivar de la Desigualdad de

Chebyshev para k=2 y k=3

o Estime la posibilidad de que X se encuentre entre 100 ± 20.

o Encuentre un intervalo [a,b] alrededor de la media, para el cual

la probabilidad de que X se encuentre en el intervalo sea por lo

menos de 99%.

• Sea X una variable aleatoria con media igual a 40 y desviación

estándar igual a 5. Use la Desigualdad de Chebyshev para encontrar

un valor b para el cual P(40 – b ≤ X ≤ 40 + b) ≥ 0,95.

• Sea X una variable aleatoria continua con media igual a 80 y

desviación estándar desconocida. Use la desigualdad de Chebyshev

para encontrar un valor de σ para el cual P(75 ≤ X ≤ 85) ≥ 0,95.

Ing° Luis Castellanos (Versión 1.20)

Page 34: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 31

5 Distribuciones de Probabilidad

5.1 Distribución Binomial. • Es una Distribución Discreta, llamada también Distribución de

Bernoulli. Sus frecuencias son proporcionales a los términos del

Binomio de Newton o Binomio de Pascal.

• Propiedades:

o El experimento consta de n intentos repetidos.

o Cada intento tiene un resultado que puede ser éxito o fracaso.

o La probabilidad de un éxito, indicado por p, permanece

constante.

o Las repeticiones del ensayo son independientes.

• Variable Aleatoria Binomial:

o Es el número de éxitos en n ensayos de un Experimento

Binomial.

• Ecuación:

o b( x; n; p) = px.qn-x; x = 0, 1, 2, …, n x• Media o Esperanza:

n n = N° ensayos p = Probab. éxito

o = n . p

• Aplicación:

o En experimentos que pueden arrojar dos resultados posibles.

• Ejemplo:

o La probabilidad de que cierto componente resista una prueba

de impacto es de ¾. Encuentre la probabilidad de que

exactamente 2 de los 4 componentes siguientes la resistan.

p = 3/4 ; q = ¼ ; x = 2; n = 4

b (2, 4, ¾) = b (2, 4, ¾) = 0,21094

14

2 2 42

34

Ing° Luis Castellanos (Versión 1.20)

Page 35: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 32

5.2 Distribución de Poisson

• Distribución Discreta.

• Propiedades de un Experimento de Poisson:

o El número de éxitos que ocurren en un intervalo de tiempo o en

una región especificada son independientes de los que ocurren

en cualquier otro intervalo de tiempo o región del espacio

disjuntos.

o La probabilidad de un solo éxito que ocurre durante un intervalo

de tiempo muy corto o en una pequeña región, es proporcional

a la duración del intervalo de tiempo o al tamaño de la región, y

no depende del número de éxitos que ocurran fuera de este

intervalo de tiempo o región.

o La probabilidad de que ocurra más de un éxito en dicho

intervalo de tiempo corto o de caer en dicha región pequeña, es

insignificante.

• Variable Aleatoria de Poisson:

o Es el número X de éxitos en un Experimento de Poisson.

• Ecuación: µ = promedio de éxitos en intervalo de tiempo o región e = 2,71828 o p ( X, µ ) = !x

e xuµ−

• Aplicación:

o Se emplea cuando se trata de un suceso de probabilidad muy

pequeña en cada observación y se desea obtener la

probabilidad de que suceda cierto número de veces en un gran

número de observaciones.

o También se llama Ley de los Sucesos Raros.

• Ejemplo:

o En un experimento, el promedio de partículas radioactivas que

pasan por un contador durante 1 milisegundo es de 4. ¿Cuál es

Ing° Luis Castellanos (Versión 1.20)

Page 36: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 33

la probabilidad de que 6 partículas pasen por el contador en 1

milisegundo dado?

X = 6, µ = 4

o p ( 6, 4 ) = !6464−e

p ( 6, 4 ) = 0,1042

5.3 Distribución Normal

• Distribución Continua. Su nombre se debe a que al principio, se

consideraba que todos los fenómenos en su estado normal debían

seguir esta Distribución. Fue desarrollada por De Moivre en 1733, y

luego por Gauss.

• Propiedades de un Experimento Normal:

o Las fuerzas causales que afectan los sucesos individuales

deben ser numerosas y aproximadamente de igual

ponderación.

o Las fuerzas causales deben ser independientes unas de otras.

o Existe equilibrio entre las desviaciones por encima y por debajo

de la media.

o La curva originada es simétrica.

• Teorema del Límite Central:

o La Distribución de una Media Muestral de una población que

tiene una varianza finita, tiende a distribuirse normalmente a

medida que el tamaño de la muestra tiende hacia el infinito.

• Variable Aleatoria Normal:

o Tiene una Distribución en forma de campana (de Gauss)

• Ecuación:

o p ( x, µ , σ ) =

2

21

21 ⎟

⎠⎞

⎜⎝⎛ −⎟⎠⎞

⎜⎝⎛ −

σµ

πσ

x

e

Ing° Luis Castellanos (Versión 1.20)

Page 37: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 34

• Aplicación:

o Se emplea comúnmente en fenómenos biológicos y

antropológicos.

• Área bajo la Curva Normal:

o El área limitada por las ordenadas x = x1 ∧ x = x2 es igual a la

probabilidad de que la Variable Aleatoria X tome un valor entre

x = x1 ∧ x = x2.

P ( x1 < X < x2 ) = dxedxxnx

x

xx

x∫∫

⎟⎠⎞

⎜⎝⎛ −⎟⎠⎞

⎜⎝⎛ −

≈2

1

22

1

21

21),,( σ

µ

πσσµ

o Como quiera que la Distribución Normal es continua, se deben

transformar todas las observaciones de cualquier Variable

Aleatoria en un nuevo conjunto de observaciones de una

Variable Aleatoria Normal con media cero y varianza 1,

mediante la transformación:

σµ−

=XZ

o Con ello se obtiene que

P ( x1 < X < x2 ) = P ( z1 < Z < z2 ) = ∫2

1 z

)1,0,(z

dzzn

o Con los valores de zn, se pueden emplear las Tablas de Datos.

• Ejemplo:

o Dada una Distribución Normal con µ = 50 y σ = 10, encuentre la

probabilidad de que X tome un valor entre 45 y 62.

5,010

504511 −=⇒

−= zz

2,110

506222 =⇒

−= zz

P ( 45 < X < 62 ) = P ( -0,5 < Z < 1,2 ) =

= P (Z < 1,2 ) – P (Z < 0,5) = 0,8849 – 0,3085 = 0,5764.

Ing° Luis Castellanos (Versión 1.20)

Page 38: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 35

5.4 Ejercicios

• Aplique Distribución Binomial para calcular:

o Probabilidad de que al lanzar 3 veces una moneda balanceada

aparezcan:

3 caras

2 sellos y 1 cara

Al menos 1 cara

o Probabilidad de que en una familia de 4 hijos haya:

Al menos 1 varón

Al menos 1 varón y al menos 1 hembra

(Probabilidad de nacimiento de varón pv = 0,5).

o Si el 20% de los tornillos producidos por una máquina son

defectuosos. Determine la probabilidad de que de 4 tornillos

escogidos al azar:

1 sea defectuoso

0 sean defectuosos

Menos de 2 sean defectuosos

o Probabilidad de obtener, al menos una vez, un total de 7 en 3

lanzamientos de un par de dados balanceados.

• Aplique Distribución de Poisson para calcular (µ = n x p):

o El 10% de las herramientas producidas son defectuosas. Encuentre

la probabilidad de que en una muestra de 10 herramientas,

seleccionadas al azar, exactamente 2 sean defectuosas.

o Sea la probabilidad de que una persona tenga una mala reacción a

la inyección de determinado suero es 0,001. Determine la posibilidad

de que de cada 2.000 individuos:

3 tengan mala reacción

Más de 2 tengan mala reacción

o 10 personas por hora en promedio utilizan una oficina de información

al público. Cuál es la probabilidad de que:

6 ó menos usen el servicio

Ing° Luis Castellanos (Versión 1.20)

Page 39: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 36

12 ó más lo usen en una hora

Nadie lo use.

• Aplique Distribución Normal para calcular:

o El peso promedio de 500 estudiantes varones en cierta universidad

es de 151 libras, y la desviación estándar es de 15 libras. Cuántos

estudiantes pesan:

Entre 120 y 155 libras

Más de 185 libras

o La media del diámetro interior de una muestra de 200 empaques es

de 0,502 cms y la desviación estándar es de 0,005 cms. El propósito

para el cual se hicieron estos empaques permite un máximo de

tolerancia en el diámetro de 0,496 a 0,508 cms., o de lo contrario se

considera que los mismos son defectuosos. Determine el porcentaje

de empaques defectuosos producidos.

o La vida útil de los cauchos de un autobús es de 50.000 Kms en

promedio, con una desviación estándar de 4.200 Kms. Cuál es la

probabilidad que uno de estos cauchos dure:

Menos de 38.000 Kms.

Entre 55.000 y 60.000 Kms.

Más de 45.000 Kms.

Ing° Luis Castellanos (Versión 1.20)

Page 40: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 37

Ing° Luis Castellanos (Versión 1.20)

Page 41: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 38

6 Distribución en el Muestreo

6.1 Teoría del Muestreo • Concepto:

o Es la rama de la Estadística, que trata de los métodos y teorías

para seleccionar muestras, del uso de los datos obtenidos a

partir de las muestras para estimar características de la

población, y de la evaluación de los estimadores.

• Criterios para la Selección de una Muestra:

o Que la muestra represente a la población

o Que el costo de la selección de la muestra sea pequeño

o Que los estimadores de las características de la población a

partir de la muestra sean precisos.

• Ventajas del Muestreo:

o Reducción de costos

o Reducción de trabajo

o Mayor rapidez

o Atención individual

o Mayores posibilidades de obtener la información

o Mayor exactitud

• Limitaciones en el uso del Muestreo:

o Se usa cuando se requieren datos para áreas o grupos

pequeños de la población

o Se usa cuando se requieren datos en instantes regulares de

tiempo y se quieren medir cambios pequeños entre períodos

consecutivos

o Los costos de una encuesta por muestreo son muy altos

(selección de muestra, control, significancia, etc.).

• Categorías del Muestreo:

o Muestreo Simple al Azar: Permite a cada muestra posible una

probabilidad igual de ser elegida, y a cada elemento de la

Ing° Luis Castellanos (Versión 1.20)

Page 42: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 39

población completa una oportunidad igual de ser incluido en la

muestra.

o Muestreo Sistemático: los elementos que se muestran se

seleccionan de la población en un intervalo uniforme que se

mide con respecto al tiempo, orden o espacio.

o Muestreo Estratificado: la población se divide en grupos

homogéneos o estratos, y los elementos dentro de cada estrato

se seleccionan al azar.

o Muestreo por Agrupación: la población se divide en grupos y

se selecciona una muestra aleatoria de cada grupo.

• Concepto de Estadístico:

o Un valor calculado a partir de una muestra, se llama

“Estadístico”.

o Medida que se calcula para describir la característica de una

sola muestra (, s, s2, p).

o El Estadístico varía de acuerdo a la muestra, y por lo tanto, es

una variable aleatoria que depende de la muestra aleatoria

observada.

o La Distribución de Probabilidad de una Estadístico se llama

Distribución Muestral.

Media Muestral (No agrupada): n

xx

n

ii∑

== 1

• Dadas las observaciones 20, 27 y 25, halle la

Media Muestral.

o 243

252720=⇒

++= xx

Mediana Muestral: 2

1~

+= nXx (n es impar)

2

122+

+=

nn XX (n es par)

Ing° Luis Castellanos (Versión 1.20)

Page 43: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 40

• Dadas las observaciones 8, 3, 9, 5, 6, 8, 5, halle

la Mediana Muestral.

o 3, 5, 5, 6, 8, 8, 9 (n = 7)

o 6~~~4

217 =⇒=⇒= + xXxXx

• Dadas las observaciones 10, 8, 4 y 7, halle la

Mediana Muestral.

o 4, 7, 8, 10 (n = 4)

o ⇒+

=⇒+

=+

2~

2~ 32

124

24 XX

xXX

x

o 5,7~2

87~ =⇒+

=⇒ xx

Modo Muestral: Valor que se repite con mayor

frecuencia

• Dadas las observaciones, Halle el Modo:

o 2, 4, 4, 5, 6, 6, 6, 7, 7, 8 Mo= 6

o 3, 4, 4, 4, 4, 6, 7, 7, 8, 8, 8, 8, 9

Mo1 = 4; Mo2 = 8 (Bimodal)

Rango Muestral: r = Xn – X1

Varianza Muestral: considera la posición de cada

observación con respecto a la media. ( )

1

2

12

−=∑=

n

xxS

n

ii

o

( ) ( )

( )1

2

11

2

2

−=

∑∑==

nn

xxnS

n

ii

n

ii

Desviación o Error Estándar: 2SS =

Ing° Luis Castellanos (Versión 1.20)

Page 44: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 41

o Dadas 2 compañías que envasan Jugo de Naranja. Haga un

análisis estadístico de las muestras observadas:

A B A B

75 86 74 69

80 80 75 71

74 69 Datos 80 80

83 71 Ordenados 83 86

86 94 86 94

A = 79,6; B = 80,0

x~ A = 80,0; x~ B = 80,0

MoA = MoB = Ø

Hasta acá, esos datos no aportan mucha información, y

ambas muestras tienen resultados muy parecidos. Analicemos

ahora el Rango y la Dispersión.

rA = 12; rB = 25

3,264.5

39831786.5 22

2 =⇒−

= AA SS ;

5,1084.5

40032434.5 22

2 =⇒−

= BB SS

SA = 5,1284; SB = 10,4163

La Compañía A tiene un contenido más uniforme que la

Compañía B (tiene menos dispersión y menos rango o

picos).

• Concepto de Parámetros:

o Medida que se calcula para describir la característica de una

población completa (µ, σ, σ 2, P).

• Estadísticos y Parámetros

Muestral Poblacional

Media µ

Desviación S σ

Ing° Luis Castellanos (Versión 1.20)

Page 45: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 42

6.2 Distribución Muestral de Media Aritmética • La aproximación normal para será confiable para n≥30. Si n<30, la

aproximación será confiable ssi la población se aproxima a Población

Normal.

n

xZσµ−

=

• Ejemplo:

o Una firma eléctrica fabrica bombillos, cuya vida se distribuye en

forma normal aproximadamente, con Media de 800 hrs y

Desviación Estándar de 40 hrs. ¿Cuál es la probabilidad de que

una muestra aleatoria de 16 bombillos tenga vida promedio

inferior a 775 hrs?

5,2

1640

80075−=⇒

−= ZZ

P(<775) = P(Z< -2,5) = 0,0062

6.3 Distribución Muestral de Media Aritmética con Dos Muestras

• ( ) ( )

2

22

1

21

2121

nn

xxZ

σσ

µµ

+

−−−=

• Ejemplo:

o Los Monitores para PC de la Compañía A tienen una vida

media de 6,5 años y una Desviación Estándar de 0,9 años. Los

de la Compañía B tienen una vida media de 6 años y una

Desviación Estándar de 0,8 años. ¿Cuál es la probabilidad de

que una muestra aleatoria de 36 monitores del fabricante A

tenga una vida media de la menos 1 año mayor que la vida

media de una muestra de 49 monitores de la Compañía B?

Ing° Luis Castellanos (Versión 1.20)

Page 46: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 43

A B

µ 6,5 6,0

σ 0,9 0,8

n 36 49

1 - 2 = 1

( ) ( ) 646,2189,0

5,01=⇒

−= ZZ

P(1 - 2 ≥1) = (Z > 2,2,646) = 1 - (Z < 2,2,646) = 0,0041

6.4 Distribución Muestral χ2 / Chi 2 / Ji 2

• ( )2

22 1

σχ Sn −

= (con n-1 Grados de Libertad <GL>)

• Ejemplo:

o Un fabricante de Baterías para carros garantiza que su

producto durará, en promedio, 3 años con una Desviación

Estándar de 1 año. Si 5 de las Baterías tienen duraciones de

1.9, 2.4, 3.0, 3.5, y 4.2 años, ¿qué tan cierta será esa garantía

de duración?

n = 5; σ2 = 1

( ) 815,04.5

1526,48.5 22

2 =⇒−

= SS

( ) 26,31

815,0.15 22 =⇒−

= χχ con 4GL

Con 4GL 3,26 є [0.484,11.143]

α є [0.025,0.975] (95% de los datos)

6.5 Distribución “t” de Student • Fue publicada por W.S. Gosset (irlandés), en 1908, bajo el seudónimo

“Student”.

Ing° Luis Castellanos (Versión 1.20)

Page 47: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 44

nS

XT µ−= (Variable Aleatoria)

• Distribución “t”:

o ( ) ( )[ ]( )

⎟⎠⎞

⎜⎝⎛ +

⎟⎟⎠

⎞⎜⎜⎝

⎛+

Γ

+Γ=

21

2

1.2/2/1

v

vt

vvvth

π

o v Grados de Libertad ( v = n – 1)

o Función Gamma ( ) dxex x∫∞

−=Γ0

1αα

• Aplicación:

o En problemas que tienen que ver con inferencia acerca de la media

de la población o en problemas que implican muestras comparativas.

o 95% de los valores de una Distribución “t” caen entre -t0,025 y t0,025.

Un valor por debajo de -t0,025 o por encima de t0,025 es motivado

generalmente por mala definición de µ, o que sea improbable dicho

valor.

• Ejemplo:

o Encuentre k tal que P (k < T < -1,761) = 0,045 para una muestra de

15 elementos.

V = 15 – 1 v = 14

Por tabla 1,761 corresponde a t0,005 - t0,005 = - 1,761

0,045 = 0,05 - α α = 0,005

t0,005 = 2,977

- t0,005 = - 2,977

P ( -2,977 < T < -1,761 ) = 0,045

• Otro ejemplo:

o Un Ingeniero Químico afirma que el rendimiento medio de la

Población de cierto proceso en lotes de de 500 gr. por mm de

materia prima. Para verificar, muestrea 25 lotes cada mes. Si el

Ing° Luis Castellanos (Versión 1.20)

Page 48: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 45

valor de t calculado cae entre - t0,005 y t0,005 queda satisfecho

con su afirmación. ¿Qué conclusión extraería de una muestra

con una media de 518 gr. x mm y una Desviación Estándar

Muestral de 40 gr.?

v = 25 – 1 v = 24

S = 40; = 518; n = 25; µ = 500

Por tabla t0,05 = 1,711, para v = 24

25,2

2540

500518=⇒

−= tt

Por tabla 2,25 corresponde aproximadamente a t0,02

o t0,015. El Proceso produce un mejor producto del que

se piensa.

6.6 Distribución F (de Fischer)

2

1

vV

vU

F =

• h(f) = ( )[ ]

2

2

1

12

21

2

2

121

21

1

1

1

.

2.2

2/

vv

v

v

vfv

fvv

vv

vv

+

⎟⎟⎠

⎞⎜⎜⎝

⎛−

⎟⎟⎠

⎞⎜⎜⎝

⎛+

⎟⎠⎞⎜

⎝⎛Γ⎟

⎠⎞⎜

⎝⎛Γ

⎟⎟⎠

⎞⎜⎜⎝

⎛+Γ

; 0 < f < ∞

0 ; en cualquier otro caso

U y V son Variables Aleatorias independientes con Distribuciones χ2

con v1 y v2 GL

• Aplicación:

o En situaciones de dos muestras para extraer inferencias acerca

de las varianzas de población. De hecho, la Distribución “f” se

llama también la Distribución de Razón de Varianzas.

• Ejemplo:

o Se toman dos muestras y se hallan sus estadísticos para

comparar , S2 y S.

Ing° Luis Castellanos (Versión 1.20)

Page 49: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 46

6.7 Ejercicios

• Empleando la Distribución χ2 calcule:

o Suponga que los tiempos requeridos por un cierto autobús para

alcanzar uno de sus destinos en una ciudad grande forman una

Distribución Normal con una desviación estándar de 1 minuto.

Si se elige al azar una muestra de 17 tiempos, encuentre la

probabilidad de que la varianza muestral sea mayor que 2.

o Los siguientes son los pesos en gramos de 10 paquetes de

semillas distribuidas por la Compañía Acme: 46.4, 46.1, 45.8,

47.0, 46.1, 45.9, 45.8, 46.9, 45.2, y 46.0. Encuentre un

Intervalo de Confianza de 95% para la Varianza de todos los

paquetes de semilla.

• Empleando la Distribución t de Student calcule:

o Un fabricante de bombillos anuncia que su producto alumbrará

en promedio durante 500 horas. Para mantener este promedio,

prueba 25 bombillos cada mes. Si el valor t calculado cae entre

–t0,05 y t0,05, ¿queda satisfecho con su publicidad? ¿Qué

conclusión debe sacar de una muestra que tiene media de 518

horas y desviación estándar de 40 horas?

• Empleando la Distribución F de Fischer calcule:

o Si y son las Varianzas de Muestras Aleatorias

independientes de tamaño n

21S 2

2S

1 = 8 y n2 = 12, de poblaciones

normales con = . Determine la probabilidad

P(

21σ

22σ

26,122

21 >

SS

)=?.

o Si tomamos 2 muestras independientes de tamaño n1 = 6 y n2 =

10 de 2 poblaciones normales con la misma varianza

poblacional. Halle b tal que: P( bSS

≤22

21 ) = 0,95.

Ing° Luis Castellanos (Versión 1.20)

Page 50: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 47

7 Teoría de la Estimación

7.1 Generalidades. • Inferencia Estadística: métodos por los que se realizan inferencias o

generalizaciones acerca de una población. Puede ser:

o Estimación

o Prueba de Hipótesis

• Espacio de Decisión: conjunto de todas las decisiones posibles que

pueden tomarse en un problema de estimación.

• La Estimación conlleva a determinar o inferir parámetros poblacionales,

en base a estadísticas muestrales. Puede ser:

o Puntual

o Por Intervalo

7.2 Estimación Puntual o Local • Una estimación puntual de algún parámetro de la población ϑ es un

solo valor ϑ de una Estadística Θ.

• Por ejemplo, el valor de la Estadística , que se calcula a partir de la

muestra de tamaño n, es una estimación puntual del parámetro

poblacional µ.

• No se espera que un estimador realice la estimación sin error o

exactamente, pero sí que no esté muy alejado.

• Estimador Insesgado: una Estadística Θ es un estimador insesgado del

parámetro ϑ si µΘ = E ( Θ ) = ϑ

o (Si la Distribución Muestral tiene una media igual al parámetro

estimado).

• Varianza de un Estimador Puntual: si consideramos todos los posibles

estimadores insesgados de algún parámetro ϑ, el de menor varianza se

llama el estimador más eficiente de ϑ.

• Ejemplo:

Ing° Luis Castellanos (Versión 1.20)

Page 51: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 48

o Si Θ1 y Θ2 son estimadores insesgados del mismo parámetro

poblacional ϑ, se elegiría el estimador cuya distribución muestral

tuviera la menor varianza. Si σ2Θ1 < σ2

Θ2, decimos que Θ1 es un

estimador más eficiente de ϑ que Θ2.

7.3 Estimación por Intervalos

• Es un intervalo de anchura finita, centrado en la estimación puntual

del parámetro, que se espera contenga el verdadero valor del

parámetro

ϑ – E < ϑ < ϑ + E

ϑI < ϑ < ϑS

• El intervalo estimado indica, por su longitud, la precisión de la

estimación puntual.

• El intervalo calculado se llama Intervalo de Confianza (IC) del (1- α )

100%. La fracción (1- α ) es el Coeficiente o Grado de Confianza.

Los extremos ϑI y ϑS son los Límites de Confianza Inferior y

Superior.

o P(ΘI < ϑ < ΘS ) = 1 – α

o Si α = 0,05, tenemos un IC de 95%.

o Si α = 0,01, tenemos un IC de 99%.

• Es preferible un IC corto pero con alto grado de confianza.

7.4 Error Muestral

• Es un error o variación entre Estadísticas de Muestra debido al azar,

o diferencias entre cada Muestra y la Población, y entre varias

Muestras (E).

o E = σx Z

o nxσσ =

1−=

nS x

σ

Ing° Luis Castellanos (Versión 1.20)

Page 52: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 49

7.5 Estimación de la Media

• P ( - 2

αZ nσ < µ < +

2αZ

nσ ) = (1- α )

• Ejemplo:

o En una población, considerada con tendencia normal, se ha

hecho un estudio muestral (n=15) donde el rendimiento o

promedio de vida útil de los bombillos es de = 9000 horas,

con una desviación S = 610 hrs. De estudios anteriores, se

toma que la Desviación Poblacional σ = 500 hrs. Determine la

Media Poblacional, considerando IC de 90% y 95%.

Método 1:

• n = 15; = 9000; S = 610; σ = 500

• hrsn xxx 1,129

15500

=⇒=⇒= σσσσ

• IC1 = 90% P(0,90) Z = 1,65

• E1 = 129,1 x 1,65 E1 = 213

• LI1 = 9000 – 213 LI1 = 8787

• LS1 = 9000 + 213 LS1 = 9243

• 8833 ≤ µ1 ≤ 9167

• IC2 = 95% P(0,95) Z = 1,96

• E2 = 129,1 x 1,96 E2 = 253

• LI2 = 9000 – 253 LI2 = 8747

• LS2 = 9000 + 253 LS2 = 9253

• 8787 ≤ µ2 ≤ 9213

Método 2:

• IC 90%

P(9000–Z0,0515

500 < µ < 9000+ Z0,0515

500 ) = 0,90

P (9000 – 213 < µ < 9000 + 213) = 0,90

Ing° Luis Castellanos (Versión 1.20)

Page 53: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 50

P(8787 < µ < 9213) = 0,90

• IC 95%

P(9000–Z0,05/215

500 <µ<9000+ Z0,05/215

500 ) = 0,95

P (9000 – 253 <µ< 9000 + 253) = 0,95

P(8747 < µ < 9253) = 0,95

• IC 99%

P(9000–Z0,00515

500 <µ<9000+ Z0,00515

500 ) = 0,99

P (9000 – 333 <µ< 9000 + 333) = 0,99

P(8667 < µ < 9333) = 0,99

8667 8747 8787 9213 9253 9333

90%

95% 99%

7.6 ¿Cómo se calcula el tamaño de una Muestra?

2

2

⎟⎟

⎜⎜

⎛=

error

Zn

σα

• Ejemplo:

o IC = 95%; σ = 0,3

o 3,13805,0

3,096,12

=⇒⎟⎠

⎞⎜⎝

⎛= nxn

• IC con σ desconocida (con “t” de Student)

o n

Stxn

Stx22

αα µ +<<−

• Ejemplo:

Ing° Luis Castellanos (Versión 1.20)

Page 54: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 51

o El contenido de 7 contenedores similares de Ácido Sulfúrico

son: 9,8; 10,2; 10,4; 9,8; 10,0; 10,2; 9,6 litros. Encuentre la

Media en un IC de 95%.

= 10,0; S = 0,283

10,0 – 2,477 (0,283/√7) < µ < 10,0 + 2,477 (0,283/√7)

9,74 < µ < 10,26

7.7 Límite de Tolerancia • En una Distribución Normal, los datos están agrupados de acuerdo a

las siguientes proporciones:

o ± s 68,27% (Zona Normal)

o ± 2 s 95,45%

o ± 3 s 99,73%

• Ello nos ofrece un Límite de Tolerancia, de acuerdo a los Porcentajes

requeridos. Como no siempre se tiene a mano el valor σ, se emplea:

o X ± k.S

• Siendo k el valor tomado de la tabla de Factores de Tolerancia para

Distribuciones Normales.

• Ejemplo:

o Una Máquina produce piezas de metal de forma cilíndrica. Se

toma una muestra de estas piezas y se encuentran los

diámetros 1.01; 0.97; 1.03; 1.04; 0.99; 0.98; 0.99; 1.01 y 1.03

cms. Encuentre los Límites de Tolerancia del 99% que

contendrán el 95% de las piezas, en una Distribución Normal.

= 1,0056

S = 0,0245

1,0056 ± 0,1115

( 0,8941 ; 1,1171)

Ing° Luis Castellanos (Versión 1.20)

Page 55: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 52

7.8 Distinción entre Límites de Confianza y Límites de Tolerancia • El Intervalo de Confianza sirve cuando interesa hallar la Media Poblacional.

El Intervalo de Tolerancia sirve para precisar dónde caen las observaciones

individuales.

7.9 Estimación de la Varianza

• Si S2 es la Varianza de una Muestra Aleatoria de tamaño n de una

Población Normal, un Intervalo de Confianza de (1- α ) 100% para σ2 es:

o ( ) ( )2

21

22

2

2

2 11

αα χσ

χ −

−<<

− snsn

• Ejemplo:

o A continuación se muestran los pesos de 10 paquetes de semillas:

46,4; 46,1; 45,8; 47,0; 46,1; 45,9; 45,8; 46,9; 45,2;46,0. Encuentre un

IC de 95% para la Varianza, suponiendo una Distribución Normal.

( )

( )( )

( ) 286,0910

2,461)12,2127310(1

22

2

222 =⇒

−=⇒

−= ∑ ∑ SxS

nnxxn

S ii

Si IC = 95%, α = 0,05, para V = 9 GL

• 2700;023,19 2975,0

2025,0

2

2=== χχχα

• 0,135 < σ2 < 0,953

7.10 Ejercicios

• Se ha calculado que la media y la desviación estándar, para los promedios

de puntuación de una muestra aleatoria de 36 estudiantes, son 2.6 y 0.3

respectivamente. Encuentre la media poblacional con un 90, 95 y 99% de

Intervalo de Confianza.

• Una empresa eléctrica fabrica bombillos que tienen una vida con una

Distribución aproximadamente Normal que tiene una desviación estándar

de 40 horas. Si una muestra de 30 bombillos tiene una vida promedio de

Ing° Luis Castellanos (Versión 1.20)

Page 56: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 53

780 horas, encuentre la media poblacional con un Intervalo de Confianza

del 96%.

• Las estaturas de una Muestra Aleatoria de 50 estudiantes mostró una

media de 174.5 cms y una desviación estándar de 6.9 cms. Halle la media

poblacional con un Intervalo de Confianza del 98%.

Ing° Luis Castellanos (Versión 1.20)

Page 57: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 54

8 Ensayos de Hipótesis y Significación

8.1 Hipótesis Estadística

• Aseveración o conjetura con respecto a una o más poblaciones.

• La prueba de una Hipótesis Estadística sobre toda la Población nos dará la

verdad o falsedad de la misma.

• Ello es poco práctico, por lo cual se escogerá una muestra aleatoria

“Significativa”.

• La aceptación de una Hipótesis simplemente implica que los datos no dan

suficiente evidencia para rechazarla.

8.2 Hipótesis Nula (H0)

• Es cualquier Hipótesis que deseamos probar.

• Su rechazo conduce a la aceptación de una Hipótesis Alternativa (H1).

• Una Hipótesis Nula con respecto a un Parámetro Poblacional siempre se

establecerá de modo que especifique un valor exacto del parámetro (Ej. H0

p = 0,5), mientras que la Hipótesis Alternativa puede tomar uno o varios

valores (H1 p≠ 0,5; p < 0,5; p > 0,5). (Si H1 toma un valor, se habla de

Hipótesis con una Cola. Si puede tomar dos valores, se habla de dos

colas).♠

8.3 Prueba de Hipótesis Estadística

• Error Tipo I: Se rechaza H0 cuando es Verdad.

• Error Tipo II: Se acepta H0 cuando es Falsa.

• Al probar cualquier Hipótesis Estadística, hay cuatro situaciones posibles:

H0 es Verdad H0 es Falsa

Aceptar H0

Rechazar H0

Correcto

Error Tipo I

Error Tipo II

Correcto

♠ Con dos colas, se usa α/2. Con una cola se usa α.

Ing° Luis Castellanos (Versión 1.20)

Page 58: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 55

• La probabilidad de cometer un error Tipo I se denomina nivel de

significancia (α).

• La probabilidad de cometer un error Tipo II (β) no puede calcularse a

menos que se plantee una Hipótesis Alternativa específica.

• Ejemplo:

o Una vacuna contra la gripe sólo es eficaz un 25% a los 2 años. Para

probar si una vacuna nueva ofrece mayor protección, se inoculan 20

personas al azar. Si 9 ó más personas rebasan ese lapso sin

contraer gripe, la nueva vacuna es superior a la actual. Plantee y

compruebe la Hipótesis dada.

H0 : p = ¼ (25%)

H1 : p > ¼

α = P (error Tipo I)

• α = P(X ≥ 9 p = ¼ ) (una cola)

• α = ∑=

20

9)4

1;20;(x

xb

• α = 1 - ∑=

8

0)4

1;20;(x

xb

• α = 1 – 0,9591

• α = 0,0409

β = P (error Tipo II) (Tomemos H1 p = ½ )

• β = P (X < 9 p = ½ )

• β = ∑=

8

0)2

1;20;(x

xb

• β = 0,2517

A medida que H1 se aproxima a la unidad, β disminuye hacia

cero.

• β = P (error Tipo II) (Tomemos H1 p = 0,7 )

• β = P (X < 9 p = 0,7 )

• β = ∑ =

8

0

)7,0;20;(x

xb

Ing° Luis Castellanos (Versión 1.20)

Page 59: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 56

• β = 0,0051

Los valores por encima del valor que divide las 2 regiones

(valor crítico) constituyen la región crítica. Los menores

constituyen la región de aceptación.

• x = 8,5 Valor crítico

• x ≥ 8,5 Región Crítica

• x ≤ 8,5 Región de Aceptación

Si la estadística X cae en la región crítica, se rechaza H0 a

favor de H1.

Si cae en la zona de aceptación, H0 se acepta.

• Otro Ejemplo:

o Considere la Hipótesis Nula de que el Peso Promedio de los

estudiantes varones de una Universidad es de 68 Kgr., contra la

Hipótesis alternativa de que no es igual a 678 Kgr. Supóngase σ =

3,6, y una muestra n = 36.

H0 : µ = 68

H1 : µ ≠ 68 ( con µ < 68 ó µ > 68) (2 colas).

6,0366,3

=⇒=⇒= xxx nσσσσ

Se escoge una Región Crítica arbitraria:

α / 2 α / 2

69 67 µ = 68

α = P ( < 67 H0 es verdad) + P ( > 69 H0 es verdad)

Siendo entonces 1 = 67 y 2 = 69.

Ing° Luis Castellanos (Versión 1.20)

Page 60: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 57

z1 = ⇒−6,06867 z1 = - 1,67

z2 = ⇒−6,06869 z2 = 1,67

α = P(Z < -1,67) + P(Z > 1,67)

α = 2 P(Z < -1,67)

α = 0,0950

El 9,5% de las muestras de tamaño 36 conducirá al rechazo

de µ = 68, cuando H0 es verdadera.

• Para reducir α, se puede aumentar el tamaño de la muestra o ampliar la

región de aceptación.

• Ejercicio:

o Haga el Ejercicio Anterior, pero con n = 64.

8.4 Prueba de Medias y Varianzas

• Se debe probar la Hipótesis de que la media µ de una población, con

varianza σ2 conocida, sea igual a un valor especificado µ0 contra la

alternativa de que la media no es igual a µ0.

o H0 : µ = µ0

o H1 : µ ≠ µ0

• Sea la variable aleatoria con media µ = µ y varianza = 2xσ

n

2σ .

• Si se emplea un nivel de significancia de α, se deben encontrar dos valores

críticos 1 y 2, tales que el intervalo 1 < < 2, defina la región de

aceptación y < 1 y > 2 constituyan la región crítica, empleando:

o

n

xz

σµ0−

=

• Se hallan los valores críticos de Z correspondientes a 1 y 2. De la

población se extrae una muestra aleatoria de tamaño α y se calcula la

media de la muestra . Si cae en la región de aceptación 1 < < 2, se

Ing° Luis Castellanos (Versión 1.20)

Page 61: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 58

concluye que µ = µ0. De lo contrario, se rechaza H0 y se acepta H1 : µ ≠

µ0.

• Ejemplo:

o Un fabricante de artículos deportivos ha inventado una nueva cuerda

sintética para pescar, con una resistencia media de 8 Kg. a la ruptura

y una desviación estándar de 0,5 Kg. Pruebe la Hipótesis de que µ =

8 Kg contra la alternativa de que µ ≠ 8 Kg, si se toma una muestra

aleatoria de 50 cuerdas y se encuentra que tienen una resistencia

media a la ruptura de 7,8 Kg. Emplee nivel de significancia de 0,01. H0 : µ = 8 Kg

H1 : µ ≠ 8 Kg

α = 0,01

(α/2 = 0,005)

z1 = - 2,58

z2 = 2,58

Por lo tanto, -2,58 < Z < 2,58

= 7,8 Kg

n = 50

828,2505,088,7

−=⇒−

= zz

-2,828 no pertenece al intervalo [-2,58; 2,58], por lo tanto se

rechaza H0. Se concluye que la resistencia a la ruptura

promedio no es igual a 8 Kg sino menor.

• Otra manera de efectuar una Prueba de Hipótesis es aplicando la

Distribución “t” de Student, con la fórmula:

o n

Sx

T 0µ−= ; v = n -1

• Ejemplo: o El tiempo promedio empleado para inscribir a los alumnos de una

Universidad ha sido de 50 minutos con una desviación estándar de

Ing° Luis Castellanos (Versión 1.20)

Page 62: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 59

10 minutos. Se está ensayando un nuevo procedimiento de

inscripción a través de computadores. Si una muestra aleatoria de 12

estudiantes obtiene un tiempo promedio en inscribirse de 42 minutos

con una desviación estándar de 11,9 minutos con el nuevo sistema.

Prueba la Hipótesis de que la media de la población es ahora menor

de 50, usando un nivel de significancia de: a) 0,05 b) 0,01. H0 : µ = 50 min H1 : µ < 50 min S = 11,9 min = 42 n = 12; v = 11 GL

α1=0,05

T < - 1,796 α2=0,01

T < - 2,718

33,2

129,11

50420 −=⇒−

=⇒−

= TT

nS

xT

µ

α1=0,05

Se rechaza H0 α2=0,01

Se acepta H0

8.5 Ejercicios

• Para probar la hipótesis de que una moneda es balanceada, se debe

adoptar la regla de decisión: (1) aceptar la hipótesis si el número de caras

en una muestra sencilla de 100 lanzamientos está entre 40 y 60 inclusive,

(2) rechazar la hipótesis en otros casos. o Encuentre la probabilidad de rechazar la Hipótesis cuando en

realidad es correcta.

• El fabricante de un medicamento patentado sostiene que tiene una eficacia

del 90% en aliviar cierta alergia durante un período de 8 horas. En una

muestra de 200 personas con dicha alergia, el medicamento mejoró a 160

personas.

Ing° Luis Castellanos (Versión 1.20)

Page 63: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 60

o Determine si la afirmación del fabricante es verdad, usando un nivel

de significancia de 0,001.

• Se calculó que el tiempo de vida promedio de una muestra de 100

bombillos fluorescentes producidos por una compañía es de 1570 horas,

con una desviación estándar de 120 horas. Si µ es el tiempo de vida

promedio de todos los bombillos producidos por la compañía, pruebe la

Hipótesis µ = 1600 horas en contra de una Hipótesis Alterna µ ≠ 1600

horas, usando un nivel de significancia de

o 0,05

o 0,01

• La resistencia al rompimiento de los cables producidos por un fabricante

tienen media de 1800 libras y desviación estándar de 100 libras. Se afirma

que con ayuda de una técnica nueva introducida en el proceso, se puede

aumentar dicha resistencia. Para probar esa afirmación, se probó una

muestra de 50 cables y se encontró que la resistencia promedio al

rompimiento es de 1850 libras. ¿Se acepta la Hipótesis con significancia de

0,001?

Ing° Luis Castellanos (Versión 1.20)

Page 64: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 61

9 Análisis de Correlación y Regresión

9.1 Análisis de Regresión para dos variables

Definición

o El Análisis de Regresión busca hallar la relación que existe entre dos

ó más variables. Al graficar los puntos correspondientes a todas las

variables, se obtiene un Diagrama de Dispersión. La Curva que

aproxima los datos se conoce como Curva de Aproximación o Curva

de Ajuste. Esa curva puede ser lineal o no lineal.

Regresión Lineal Regresión No Lineal

o Uno los principales propósitos de la Curva de Ajuste es estimar una

de las variables (la variable dependiente) a partir de la otra (variable

independiente). Ese proceso de estimación se denomina

“Regresión”.

o Regresión Lineal significa que la Media de Y|x está relacionada

linealmente con x, y que la ecuación que las relaciona es la de la

recta en su forma usual dada por:

µ Y|x = α + β x

donde α y β son parámetros por estimar a partir de los datos de la

muestra. Indicando a sus estimaciones por a y b respectivamente, la

respuesta estimada ŷ se obtiene de la línea de regresión muestral:

ŷ = a + b x

o En la Regresión No Lineal se utiliza la ecuación de parábola:

x

y

x

y

. . . . .. .. .

. ......

.

Ing° Luis Castellanos (Versión 1.20)

Page 65: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 62

y = a + b x + c x2

o Regresión Simple considera sólo una Variable Independiente.

o Regresión Múltiple considera más de una Variable Independiente,

normalmente dos (2). Usa la ecuación:

z = a + b x + c y

o Generalmente la Regresión se calcula mediante el Método de

Mínimos Cuadrados.

Cálculo

o La Regresión a calcular será la Regresión Lineal Simple, con dos

valores, mediante las fórmulas (Ecuaciones Normales):

∑ ∑+= xbnay .

∑ ∑∑ += 2. xbxayx

o Luego de desarrollar las ecuaciones, se obtiene:

( )( )( )∑ ∑∑∑ ∑

−= 22 xxn

yxxynb

= a + b a = - b

Selección de un Modelo de Regresión

o Todo lo señalado anteriormente se basa en el supuesto que el

modelo escogido es el correcto, donde y está relacionada

efectivamente con x. No se puede esperar que la predicción de la

respuesta sea buena si hay varias variables independientes, no

consideradas en el modelo, que afectan la respuesta y están

variando en el sistema. De igual manera, la predicción será

inadecuada si la estructura verdadera que relaciona a y con x es

extremadamente no lineal en el rango de las variables consideradas.

o Con frecuencia se usa el modelo de Regresión Lineal Simple, a

pesar que se sabe que el modelo no es exactamente lineal o de que

la estructura verdadera es desconocida. Esta aproximación es

bastante acertada, sobre todo cuando el rango de x es angosto. Así,

Ing° Luis Castellanos (Versión 1.20)

Page 66: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 63

el modelo usado se convierte en una función de aproximación, que

se espera sea una representación adecuada de la región de interés.

Ejemplo: o Dados los siguientes datos experimentales: I 1 2 3 4 5 6 7 8 9 xi 1.5 1.8 2.4 3.0 3.5 3.9 4.4 4.8 5.0 yi 4.8 5.7 7.0 8.3 10.9 12.4 13.1 13.6 15.3

Estime la línea de Regresión Lineal.

• n = 9 • =∑ y 91,1

• = 3,3667 • ∑ =xy 345,09

• = 10,1222 • ∑ =2x 115,11

• 30,3 ∑ =x

( ) ( )( )( ) ( )

9303,23,3011,115.9

1,913,3009,345.92 =⇒

−−

= bb

a = 10,1222 – (2,9303)(3,3667) a = 0,2568

ŷ = 0,2568 + 2,9303 x

Significación Estadística de la Regresión

o Un Diagrama de Dispersión es una representación gráfica de los

puntos de datos para una muestra en particular. Si se escoge una

muestra diferente o se agranda la muestra original, se obtendrá

seguramente un Diagrama de Dispersión diferente. Y cada Diagrama

originará Rectas (o Curvas) de Regresión diferentes (aunque no

deben ser muy diferentes si las muestras se toman de la misma

población).

o La dispersión de puntos alrededor de la Recta (o Curva) de

Regresión indica que para un valor particular de x, hay varios valores

de y distribuidos alrededor de la Recta (o Curva). Por lo tanto, de ese

concepto de distribución se desprende que hay conexión entre la

Recta o Curva y la probabilidad.

Ing° Luis Castellanos (Versión 1.20)

Page 67: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 64

o La conexión se suministra al introducir las variables aleatorias X y Y,

las cuales pueden asumir valores muestrales diferentes x y y,

respectivamente.

o Dada la función de densidad conjunta o función de probabilidad,

f(x,y), de dos variables aleatorias X y Y, entonces existe una Recta

(o Curva) de Regresión de Mínimos Cuadrados de Y en X dada por

y = g(x) = E (Y|X=x), siempre y cuando X y Y tengan varianza

finita, y se cumple que E {[Y-g(X)]2} = un mínimo.

9.2 Análisis de Correlación para dos variables

Definición

o Al hablar de Regresión, se ha supuesto que la variable

independiente x está controlada y que, en consecuencia, no es una

variable aleatoria. Dentro de ese contexto, x se llama frecuentemente

variable matemática, la cual, en el proceso muestral, se mide con un

error despreciable e insignificante. En muchas aplicaciones en

técnicas de Regresión, es más realista suponer que tanto X como Y

son variables aleatorias y que las mediciones {(xi,yi); i = 1, 2, …, n}

son observaciones tomadas de una función de densidad conjunta

ƒ(x,y).

Cálculo

o Formalmente, el Coeficiente de Correlación Muestral se halla:

yx

xy

SSS

r = o ( )( )[ ]

( ) ( )∑ ∑∑

−−

−−=

22yyxx

yyxxr

o Otra manera de expresarlo es a través del Coeficiente de

Determinación:

( )( )

( )( )totaliación

licadaiación

yy

yyr est

_varexp_var

2

2

2 ⇒−

−=∑∑

• La Variación total se compone de Variación Explicada

(tiende a seguir patrones definidos por la recta de

Ing° Luis Castellanos (Versión 1.20)

Page 68: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 65

regresión de mínimos cuadrados) y Variación No

Explicada (se comporta de manera aleatoria o

impredecible).

• El Coeficiente r2 se puede interpretar como la relación

de la variación total que se explica por la recta de

regresión de mínimos cuadrados.

• El Coeficiente r mide que tan bien se ajusta la recta de

regresión de mínimos cuadrados a los datos

muestrales.

• Si r2 = 1 o r = ±1, se dice que hay Correlación Lineal

Perfecta o Regresión Lineal Perfecta

(respectivamente).

o El Coeficiente de Correlación Poblacional se halla:

2

22

2

2

1Y

X

Y σσβ

σσρ =−= o

yx

xy

σσσ

ρ =

Los valores de ρ = ±1 ocurren cuando σ2 = 0, y existe una

relación perfecta entre las dos variables.

Los valores cercanos a cero (0) indican poca o nula

correlación.

Los valores cercanos a +1 implica relación lineal perfecta con

pendiente positiva.

Los valores cercanos a -1 implica relación lineal perfecta con

pendiente negativa.

El Coeficiente de Correlación Poblacional ofrece una medida

de qué tan bien se ajusta la Curva de Regresión de una

Población dada, a los datos de la Población.

Significación Estadística de la Correlación

o El Coeficiente de Correlación de la Población debe ser una medida

de qué tan bien se ajusta una Recta o Curva de Regresión de una

Población dada a los datos de dicha Población.

Ing° Luis Castellanos (Versión 1.20)

Page 69: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 66

Ejemplo:

o Dadas las estaturas de los Padres y de sus Hijos Mayores en

pulgadas (x,y respectivamente):

i 1 2 3 4 5 6 7 8 9 10 11 12 xi 65 63 67 64 68 62 70 66 68 67 69 71 yi 68 66 68 65 69 66 68 65 71 67 68 70

Estime la línea de Regresión Lineal y Halle el Coeficiente de

Correlación.

• ( )( )( )∑ ∑∑∑ ∑

−= 22 xxn

yxxynb

• = a + b a = - b

• ∑x = 800; ∑y = 811; ∑x.y = 54107; ∑x2 = 53418

• = 66,667; = 67,583

• b = 0,4764

• a = 35,8248

• ŷ = 35,8248 + 0,4764 x (Recta de Regresión)

• ∑(x-).(y-) = 40,3333; ∑(x-)2 = 84,6667; ∑(y-)2 =

38,9167

• ( )( )[ ]

( ) ( )∑ ∑∑

−−

−−=

22yyxx

yyxxr

• r = 0,7027 (Muy cercano a 1)

9.3 Ejercicios

Dados los siguientes datos experimentales:

i 1 2 3 4 5 6 7 8 xi 1 3 4 6 8 9 11 14 yi 1 2 4 4 5 7 8 9

o Estime la línea de Regresión Lineal, Grafique el Diagrama de

Dispersión y Halle el Coeficiente de Correlación.

En un Estudio de Correlación entre la Precipitación Pluvial y de la

contaminación del aire arrastrada, se obtuvieron los siguientes datos (x,y

respectivamente):

Ing° Luis Castellanos (Versión 1.20)

Page 70: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 67

i 1 2 3 4 5 6 7 8 9 xi 4.3 4.5 5.9 5.6 6.1 5.2 3.8 2.1 7.5 yi 126 121 116 118 114 118 132 141 108 o Estime la línea de Regresión Lineal, Grafique el Diagrama de

Dispersión y halle el Coeficiente de Correlación.

Se hizo un estudio sobre la cantidad de azúcar transformada en cierto

proceso, a varias temperaturas (y, x respectivamente):

i 1 2 3 4 5 6 7 8 9 10 11 xi 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 yi 8.1 7.8 8.5 9.8 9.5 8.9 8.6 10.2 9.3 9.2 10.5o Estime la línea de Regresión Lineal, Grafique el Diagrama de

Dispersión y Halle el Coeficiente de Correlación.

Ing° Luis Castellanos (Versión 1.20)

Page 71: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 68

10 Bibliografía

• KUME, Hitoshi: “Herramientas Estadísticas Básicas para el

Mejoramiento de la Calidad”. Ed Norma. Bogotá, 1992.

• RIVAS G, Ernesto: “Estadística General”. UCV. Caracas, 1985.

• SPIEGEL, SCHILLER & SRINIVASAN: “Probabilidad y Estadística”. Ed

McGraw Hill. Serie Schaum. México, 2005.

• WALPOLE & MYERS: “Probabilidad y Estadística para Ingenieros”. 2da

Edición. Ed Interamericana. México 1984.

• WALPOLE, MYERS & MYERS: “Probabilidad y Estadística para

Ingenieros”. Editorial Pearson. México 1999.

Ing° Luis Castellanos (Versión 1.20)

Page 72: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 69

11 Anexos

11.1 Áreas bajo la Curva Normal

Ing° Luis Castellanos (Versión 1.20)

Page 73: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 70

11.2 Valores Críticos de la Distribución χ2.

Ing° Luis Castellanos (Versión 1.20)

Page 74: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 71

11.3 Valores Críticos de la Distribución t

Ing° Luis Castellanos (Versión 1.20)

Page 75: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 72

11.4 Sumas de Distribución Binomial

Ing° Luis Castellanos (Versión 1.20)

Page 76: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 73

11.5 Factores de Tolerancia para Distribuciones Normales

Ing° Luis Castellanos (Versión 1.20)

Page 77: Estadisticas Luis Castellanos

UNEFA. Probabilidades y Estadística. 74

Ing° Luis Castellanos (Versión 1.20)

Page 78: Estadisticas Luis Castellanos

UNEFA

“Excelencia Educativa”