clase 1 probabilidades distribuciones

86
Probabilidades DEFINICIÓN Probabilidad de un suceso es el número al que tiende la frecuencia relativa asociada al suceso a medida que el número de veces que se realiza el experimento crece. La frecuencia relativa de un suceso A: Fr (a)= número de veces que aparece A Número de veces que se realiza el experimento 1 Curso : Modelación y Simulación

Upload: claudio-aballay

Post on 26-Jun-2015

475 views

Category:

Documents


7 download

TRANSCRIPT

Page 1: clase 1 probabilidades  distribuciones

ProbabilidadesDEFINICIÓN

Probabilidad de un suceso es el número al que tiende la frecuencia relativa asociada al suceso a medida que el número de veces que se realiza el experimento crece.

La frecuencia relativa de un suceso A:

Fr (a)= número de veces que aparece ANúmero de veces que se realiza el experimento

1Curso : Modelación y

Simulación

Page 2: clase 1 probabilidades  distribuciones

ProbabilidadesDEFINICIÓN DE LAPLACE

En el caso de que todos los sucesos elementales del espacio muestral E sean equiprobables, Laplace define la probabilidad del suceso A como el cociente entre el número de resultados favorables a que ocurra el suceso A en el experimento y el número de resultados posibles del experimento.

Si E={x1,x2,…..,xk} y P(x1)=P(x2)=……=P(xk), entonces:

P(A)= número de casos favorables al suceso Anúmero de casos posibles

2Curso : Modelación y

Simulación

Page 3: clase 1 probabilidades  distribuciones

Probabilidades

Permutaciones

Una permutación es un arreglo de todo o parte de un conjunto de datos, el número de permutaciones de n objetos distintos es n!

el número de permutaciones de n objetos tomados de r a la vez es

Ejemplo 1

Considere las tres letras a,b y c, las permutaciones posibles son abc, acb, bac, bca, cab y cba

n !=3 !=1*2*3=6

)!(

!

rn

nPrn

3Curso : Modelación y

Simulación

Page 4: clase 1 probabilidades  distribuciones

Probabilidades

Ejemplo 2

Se sacan dos billetes de lotería de 20 para un primer y un segundo premios. Encuentre el número de puntos muéstrales en el espacio S.

Solución

)!(

!

rn

nPrn

38019*20)!220(

!20220

P

4Curso : Modelación y

Simulación

Page 5: clase 1 probabilidades  distribuciones

Probabilidades

Combinaciones

El número de combinaciones de n objetos distintos tomados de r a la vez es

Ejemplo

En una mano de póquer que consiste en cinco cartas, encuentre la probabilidad de tener 2 ases y tres sotas

)!(!

!

rnr

n

r

n

5Curso : Modelación y

Simulación

Page 6: clase 1 probabilidades  distribuciones

Probabilidades

Solución

El número de formas de tener dos ases de cuatro es:

y el número de formas de tener tres sotas de cuatro es:

Mediante la regla de multiplicación hay n=6*4=24 manos con dos ases y tres sotas.

6)!2(!2

!4

2

4

4)!1(!3

!4

3

4

6Curso : Modelación y

Simulación

Page 7: clase 1 probabilidades  distribuciones

Probabilidades

El número total de 5 manos de póquer de cinco cartas, las cuales son igualmente probables es

por tanto la probabilidad de obtener dos ases y tres sotas en una mano de póquer de cinco cartas es:

960.598.2)!47(!5

!52

5

52

N

5109,0960.598.2

24)( xxP

7Curso : Modelación y

Simulación

Page 8: clase 1 probabilidades  distribuciones

Probabilidades

Experimentos Aleatorios

Un experimento aleatorio es aquel que proporciona diferentes resultados aun cuando se repita siempre de la misma forma.

Espacio Muestral

Un conjunto de los posibles resultados de un experimento aleatorio recibe el nombre de espacio muestral del experimento

Evento

Un evento es un subconjunto del espacio muestral de un experimento aleatorio.

8Curso : Modelación y

Simulación

Page 9: clase 1 probabilidades  distribuciones

Probabilidades

Axiomas de Probabilidades

La probabilidad es un número que se asigna a cada miembro de una colección de eventos de un experimento aleatorio y que satisface las siguientes propiedades

1.- P(s) =1

2.-

3.- Para dos eventos E1 y E2

P(E1 U E2)= P(E1)+P(E2)-P(E1∩E2 )

con E1∩E2 =ø, P(E1 U E2)= P(E1)+P(E2)

1)(0 EP

9Curso : Modelación y

Simulación

Page 10: clase 1 probabilidades  distribuciones

Probabilidades

Probabilidad Condicional

La probabilidad condicional de un evento A dado un Evento B, denotada por P(A\B), es :

P(A\B)= P( A ∩ B) / P(B) si P(B)>0

Probabilidad Total

Sea A1,a2,… An, un sistema completo de sucesos tales que la probabilidad de cada uno de ellos es distinta de cero, y sea B un suceso cualquier del que se conocen las probabilidades condicionales P(B\Ai), entonces la probabilidad del suceso B viene dada por la expresión.

P(B)= P(A1)*P(B/A1)+P(A2)*P(B/A2)+…..+P(An)*P(B/An)

10Curso : Modelación y

Simulación

Page 11: clase 1 probabilidades  distribuciones

Probabilidades

Teorema de Bayes

Sea A1,A2,....An un sistema completo de sucesos, tales que la probabilidad de cada uno de ellos es distinta de cero, y sea B un suceso cualquier del que se conocen las probabilidades condicionales P(B/Ai), entonces la probabilidad P(Ai/B) viene dada por la expresión :

P(Ai/B)= P(Ai)* P(B/Ai)

P(A1)*P(B/A1)+ P(A2)*P(B/A2) +.....+ P(An)*P(B/An)

11Curso : Modelación y

Simulación

Page 12: clase 1 probabilidades  distribuciones

Solución

sea D = " La pieza es defectuosa", y N="La pieza no es defectuosa"La información del problema puede expresarse en el diagrama de árbol

a.- Para calcular la probabilidad de que la pieza elegida sea defectuosa, P(D) por la Propiedad de la probabilidad total,

P(D)= P(A)*P(D/A)+P(B)*P(D/B)+P(C)*P(D/C)

P(D)= 0,4*0,02+0,35*0,03+0,25*0,04P(D)= 0,0285

b.- Debemos calcular P(B/D). Por el teorema de Bayes

P(B/D)= P(B)*P(D/B)P(A)*P(D/A)+P(B)*P(D/B)+P(C)*P(D/C)

P(B/D)= 0,35*0,03 0,4*0,02+0,35*0,03+0,25*0,04

P(B/D)= 0,0105 0,0285

P(B/D)= 0,368

c.- Calculamos P(A/D) y P(C/D), comparándolas con el valor de P(B/D) ya calculado. Aplicando el teorema de Bayes , obtenemos

P(A/D)= 0,4*0,02 = 0,008 = 0,281 0,4*0,02+0,35*0,03+0,25*0,04 0,0285

P(C/D)= 0,25*0,04 = 0,01 = 0,351 0,4*0,02+0,35*0,03+0,25*0,04 0,0285

La línea de producción con mayor probabilidad de haber producido la pieza defectuosa es B

A

B

C

D

N

D

N

D

N

0,40

0,35

0,25

0.02

0.03

0.04

0.97

0.96

0.98

1.- Tres líneas de producción de ánodos, A, B, C producen el 40%, 35%, 25%, respectivamente, del total de la producción. Los porcentajes de ánodos defectuosos de estas líneas son del 2%, 3%, 4%.

12

Page 13: clase 1 probabilidades  distribuciones

Estadística: El campo de la Estadística tiene que ver con la

recopilación, presentación, análisis y uso de datos para tomar decisiones y resolver problemas.

La importancia de la estadística en la ingeniería, la ciencia y la administración ha sido subrayada por la participación en la industria en el aumento de la calidad. Muchas compañías se han dado cuenta de que la baja calidad de un producto (defectos de fabricación, baja confiabilidad en su rendimiento) tiene un efecto muy pronunciado en la productividad global de la Empresa. La estadística es un elemento decisivo en el incremento de la calidad, ya que las técnicas estadísticas pueden emplearse para describir y comprender la variabilidad.

13Curso : Modelación y

Simulación

Page 14: clase 1 probabilidades  distribuciones

Estadística Descriptiva

Media aritmética:

La media aritmética o media de un conjunto de N números x1,x2,x3,....,xn se representa por x y se define como

n

xj x = x1 + x2 +x3 +......+ xn = j=1__

N N

14Curso : Modelación y

Simulación

Page 15: clase 1 probabilidades  distribuciones

Mediana: Sean x1,x2,x3,.....,xn una muestra acomodada en orden creciente de magnitud,; esto es x1 denota la observación pequeña y xn denota la observación más grande. Entonces la mediana x se define como la parte media o la ( n+1 / 2)-ésima observación si n es impar, o el promedio entre las dos observaciones intermedias la (n / 2)-ésima y la ( n / 2)+1)-ésima si n es par. En términos matemáticos

___________________ 2

imparn 2/1

parnxnx 12/2

Estadística Descriptiva

15Curso : Modelación y

Simulación

Page 16: clase 1 probabilidades  distribuciones

Moda: La moda es la observación que se presenta con mayor frecuencia en la muestra. Esta puede no existir cuando los datos no están agrupados o ser bimodales, etc.

Estadística Descriptiva

16Curso : Modelación y

Simulación

Page 17: clase 1 probabilidades  distribuciones

Varianza muestral y desviación estándar muestral. Las medidas más importantes de variabilidad son la varianza muestral y la desviación estándar muestral. Si x1,x2,x3,.....,xn es una muestra de n observaciones, entonces la varianza muestral es:

La desviación estándar S es la raíz cuadrada positiva.

n

ii XXx

nS1

2_2

1

1

Estadística Descriptiva

17Curso : Modelación y

Simulación

Page 18: clase 1 probabilidades  distribuciones

Coeficiente de Variación: En ocasiones es deseable expresar la variación como una fracción de la Media. El coeficiente de variación es útil cuando se compara la variabilidad de dos o más conjuntos de datos que difieren de manera considerable en la magnitud de las observaciones. El coeficiente muestral es:

x

SCV

Estadística Descriptiva

18Curso : Modelación y

Simulación

Page 19: clase 1 probabilidades  distribuciones

Error estándar: El error estándar de una estadística es la desviación estándar de su distribución de muestreo. Si el error estándar involucra parámetros desconocidos cuyos valores pueden estimarse, la sustitución de estas estimaciones en el error estándar da como resultado un error estándar estimado.

El error estándar da alguna idea sobre la precisión de la estimación. Si no se sabe que valor tiene pero se sustituye la desviación estándar muestral S en la ecuación anterior, entonces el error estándar estimado de x es

nx

nSx

Estadística Descriptiva

19Curso : Modelación y

Simulación

Page 20: clase 1 probabilidades  distribuciones

Rango de la Muestra: Una medida muy sencilla de variabilidad es el rango de la muestra, definido como la diferencia entre las observaciones más grande y más pequeña. r = máx (xi) - min (xi)

Estadística Descriptiva

20Curso : Modelación y

Simulación

Page 21: clase 1 probabilidades  distribuciones

Coeficiente de Asimetría: El coeficiente de simetría que mide el grado de asimetría o falta de simetría de una distribución. Y se define por

3

1)2)(1(

n

i

SXXi

nnn

Estadística Descriptiva

21Curso : Modelación y

Simulación

Page 22: clase 1 probabilidades  distribuciones

Curtosis: El coeficiente de curtosis es una medida de achatamiento de un histograma con respecto al modelo teórico de Gauss. El coeficiente de curtosis se define por

Se puede demostrar que: E 0 histograma más puntiagudo que la ley de Gauss (leptocúrtica) E 0 histograma más achatado que la ley de Gauss (platicúrtica) E 0 histograma sin achatamiento (mesocúrtica)

)3)(2()1(3

)3)(2)(1(

)1( 2

1

4

nnn

SXXi

nnn

nnk

n

i

Estadística Descriptiva

22Curso : Modelación y

Simulación

Page 23: clase 1 probabilidades  distribuciones

Histograma

 Un histograma o histograma de frecuencias consiste en una serie de

rectángulos que tienen:

  1.- Sus bases sobre un eje horizontal con centros en las marcas de clase y

longitud igual al tamaño de los intervalos de clase.

2.- Superficie proporcionales a las frecuencias de clase, el número de

observaciones en una clase recibe el nombre de frecuencia de clase. La

marca de clase es el punto medio del intervalo de clase y se obtiene

sumando los límites inferior y superior de la clase y dividiendo por 2. 

3.- Un polígono de frecuencia es un gráfico de línea trazado sobre las

marcas de clase.

 

Estadística Descriptiva

23Curso : Modelación y

Simulación

Page 24: clase 1 probabilidades  distribuciones

Reglas generales para formar la distribución de frecuencias

1.- Determinar el mayor y el menor entre los datos registrados y así encontrar

el rango.

2.- Dividir el rango en un número conveniente de intervalos de clase del

mismo tamaño, el número de clases que se emplea para clasificar los datos

en un conjunto dependen del total de observaciones en éste. Si el número de

observaciones es relativamente pequeño, el número de clase a emplear será

cercano a cinco, pero generalmente nunca menor que este valor. Si existe

una cantidad sustancial de datos, el número de clases debe encontrarse entre

ocho y doce y generalmente no existirán mas de 15 clases. Un número muy

pequeño de clases puede ocultar la distribución real del conjunto de datos,

mientras que un número muy grande puede dejar sin observaciones o

lagunas de las clase, limitando de esta forma su uso.

Estadística Descriptiva

24Curso : Modelación y

Simulación

Page 25: clase 1 probabilidades  distribuciones

Criterio de Sturguess

Es usado ampliamente , ya que entrega la dimensión del intervalo de

clase que permite la mejor definición de la forma real de la distribución en

estudio. Para estimar el intervalo de clase Sturguess planteó la siguiente

expresión.

 

 

 Raíz cuadrada del número de observaciones

)log(322,31minmax

n

xxIC

nIC

Estadística Descriptiva

25Curso : Modelación y

Simulación

Page 26: clase 1 probabilidades  distribuciones

Estadística Descriptiva Desviación estandar 12,05147 Mínimo 10

Media 36,53264 Varianza de la muestra 145,238 Máximo 69,9

Error Típico 0,163652 curtosis -0,39836 Suma 198116,5

Mediana 36 coeficiente de asimetría 0,291128 Cuenta 5423

Moda 45,5 Rango 59,9

Histograma Grupal vacios<4

0

100

200

300

400

500

600

Velocidad [Km/h]

Fre

cu

en

cia

0

0,005

0,01

0,015

0,02

0,025

0,03

0,035

Frcuencia

normal

26Curso : Modelación y

Simulación

Page 27: clase 1 probabilidades  distribuciones

Histograma Sturges vacios<4

0

100

200

300

400

500

600

700

800

10,00 14,47 18,9423,41 27,88 32,35 36,83 41,3045,77 50,24 54,71 59,18 63,65

Velocidad [Km/h]

Frecuencia

0

0,005

0,01

0,015

0,02

0,025

0,03

0,035

Frecuencia

normal

Histograma raiz de (n) vacios <4

0

20

40

60

80

100

120

140

160

180

200

Velocidad [Km/h]

Fre

cu

en

cia

0

0,005

0,01

0,015

0,02

0,025

0,03

0,035

Frecuencia

normal

27Curso : Modelación y

Simulación

Page 28: clase 1 probabilidades  distribuciones

Distribución de Poisson Es una distribución de probabilidad discreta con un parámetro λ < 0 cuya función de

masa para sucesos es

Aquí e significa el número e y x! significa el factorial de x. Se prefiere su uso por sobre una distribución binominal cuando los valores de p < 0.10 y (p * n) < 10 ", donde p es la probabilidad de acierto y n es el numero de eventos. La distribución de Poisson describe el número de sucesos en una unidad de tiempo de un proceso de Poisson. Muchos fenómenos se modelan como un proceso de Poisson, por ejemplo las llamadas telefónicas en una empresa o los accidentes en una carrera. El valor esperado y la varianza de una variable aleatoria X de distribución Poisson son E[X] = V[X] = λ

28Curso : Modelación y

Simulación

Page 29: clase 1 probabilidades  distribuciones

Distribución de Poisson

Ejemplo Un número promedio de camiones tanque que llega cada día a cierta ciudad portuaria es 10. Las instalaciones en el puerto pueden manejar a lo más 15 camiones tanque por día. ¿ Cuál es la probabilidad de que en un día dado los camiones se tengan que regresar? Solución Sea X el número de camiones tanque que llegan cada día.Entonces con el uso de la tabla de poisson tenemos

P(x>15)= 1- P(X15)=1-

15

0

)10;(x

xp = 1-0,9513= 0,0487

!10

15)15(

1015 exP

29Curso : Modelación y

Simulación

Page 30: clase 1 probabilidades  distribuciones

Distribución BinomialEn estadística la distribución binomial es una distribución probabilidad discreta describiendo el numero de éxitos de n experimentos independientes con probabilidad p de un éxito. Su función de densidad es

Eso es por que en n experimentos (o eventos) hay n sobre x (el coeficiente binomial) posibilidades para un numero de x éxitos (o aciertos) (probabilidad pk) y n − x no-éxitos ((1 − p)n − x). El valor esperado de una variable aleatoria de probabilidad binominal es E[x] = np y su varianza V[x] = np(1 − p).

30Curso : Modelación y

Simulación

Page 31: clase 1 probabilidades  distribuciones

Distribución BinomialLa probabilidad de que cierta clase de componente sobreviva a una prueba de choque dada es 3/4 . Encuentre la probabilidad de que sobrevivan exactamente dos de los siguientes cuatro componentes que se prueben.

Solución

Suponga que las pruebas son independientes y como p=3/4 para cada una de las 4 pruebas tenemos

128/274

3

¡2¡2

¡4)4/1(4/3

2

44

222

2

x

xB(2;4,3/4)= =0,2109

31Curso : Modelación y

Simulación

Page 32: clase 1 probabilidades  distribuciones

Distribución Normal Esta distribución es frecuentemente utilizada en las aplicaciones

estadísticas. Su propio nombre indica su extendida utilización, justificada

por la frecuencia o normalidad con la que ciertos fenómenos tienden a

parecerse en su comportamiento a esta distribución.

Muchas variables aleatorias continuas presentan una función de densidad

cuya gráfica tiene forma de campana.

En resumen, la importancia de la distribución normal se debe

principalmente a que hay muchas variables asociadas a fenómenos

naturales que siguen el modelo de la normal32

Curso : Modelación y Simulación

Page 33: clase 1 probabilidades  distribuciones

Distribución Normal

Representación gráfica de esta función de densidad

• Sin lugar a dudas, la distribución más utilizada para modelar experimentos aleatorios es la distribución normal

33Curso : Modelación y

Simulación

Page 34: clase 1 probabilidades  distribuciones

Distribución Normal

F(x) es el área sombreada de esta gráfica

34Curso : Modelación y

Simulación

Page 35: clase 1 probabilidades  distribuciones

Distribución Normal

TIPIFICACIÓN

Por tanto su función de densidad es

y su función de distribución es

35Curso : Modelación y

Simulación

Page 36: clase 1 probabilidades  distribuciones

Distribución Normalsiendo la representación gráfica de esta función

a la variable Z se la denomina variable tipificada de X, y a la curva de su función de densidad curva normal tipificada.

36Curso : Modelación y

Simulación

Page 37: clase 1 probabilidades  distribuciones

Manejo de tablas, casos más frecuentes

La distribución de la variable z se encuentra tabulada

37Curso : Modelación y

Simulación

Page 38: clase 1 probabilidades  distribuciones

Manejo de tablas, casos más frecuentes

38Curso : Modelación y

Simulación

Page 39: clase 1 probabilidades  distribuciones

Manejo de tablas, casos más frecuentes

39Curso : Modelación y

Simulación

Page 40: clase 1 probabilidades  distribuciones

Manejo de tablas, casos más frecuentes

40Curso : Modelación y

Simulación

Page 41: clase 1 probabilidades  distribuciones

EJERCICIO   Tipificamos: La probabilidad de obtener puntuación entre 70 y 90

es:P(70≤X≤90)=p(-1,67≤X≤1,67)z1=(70-80)/6=-1,66666667z2=(90-80)/6=1,666666670,0478 0,9522+0,9522-0,0478=0,9044

 y el número esperado de individuos que la obtienen es:

 n=0,9044*200=180,883859n= 181 La probabilidad de que una persona tenga

puntuación superior a 90 es:

P(X>90)=P(Z>1,67)=1- 0,9522 =0,0478 Y para dos personas: p= 0,0478*0,0478 =0,00228484

Los resultados de una prueba objetiva de selección pasada a 200 personas indicaron que la distribución de puntuaciones era normal, con media de 80 puntos y desviación típica de 6 puntos. Calcular cuántos examinados han obtenido una puntuación entre 70 y 90 puntos. Si se eligen al azar dos de esas 200 personas, calcular la probabilidad de que ambas personas tengan puntuación superior a 90.

41Curso : Modelación y

Simulación

Page 42: clase 1 probabilidades  distribuciones

EJERCICIO

Los resultados de una prueba objetiva de selección pasada a 200 personas indicaron que la distribución de puntuaciones era normal, con media 60 puntos y desviación típica de 6 puntos. Cada prueba se puntuó con 0 ó 1 puntos. Calcular cuántos examinados han obtenido una puntuación entre 30 y 40 puntos, y cuál es la mínima puntuación por debajo de la cual están el 75 % de los examinados.

 

 

Tipifiquemos la variable con los valores extremos dados:

z1=(30-60)/6 -5

z1=(40-60)/6 -3,33333333

0,0000 0,0004

con lo cual no hay ningún examinado con una puntuación entre 30 y 40

Por otro lado , la mínima puntuación por debajo de la cual está el 75 % de los examinados

z normal0,67 0,74860,68 0,7517

se realiza una interpolación

0,01 0,0031

valor buscado 0,0014Luego

x=(0,0014*0,01)/0,0031 0,00451613

Zx=0,67+0,0045 0,6745

x1=6*zx+60 6*0,6745+60 64

La mínima puntuación por debajo de la cual está el 75 % de los examinados es 64

La probabilidad de obtener puntuación entre 30 y 40 es:

42Curso : Modelación y

Simulación

Page 43: clase 1 probabilidades  distribuciones

Distribución Normal

Media Aritmética

Mediana La mediana de un conjunto de observaciones se

ordenan de manera creciente, la mitad de éstas es menor que este valor y la otra mitad mayor

Moda La moda de un conjunto de observaciones es el

valor de la observación que ocurre con mayor frecuencia en un conjunto

n

iix x

n 1

1

43Curso : Modelación y

Simulación

Page 44: clase 1 probabilidades  distribuciones

Distribución Normal Desviación Estándar

Coeficiente de Simetría

Esta función caracteriza el grado de asimetría de una distribución con respecto a su media. La asimetría positiva indica una distribución unilateral que se extiende hacia valores más positivos. La asimetría negativa indica una distribución unilateral que se extiende hacia los valores más negativos

n

ixix x

n 1

2)(1

n

ixix

nmqueen

m

1

33

)(1

33

44Curso : Modelación y

Simulación

Page 45: clase 1 probabilidades  distribuciones

Distribución Normal

Curtosis

La curtosis representala elevación o achatamiento de una distribución , Una curtosis positiva indica una distribución relativamente elevada, mientras que una curtosis negativa indica una distribución relativamente plana.

n

ixix

nmqueen

m

1

44

)(1

44

45Curso : Modelación y

Simulación

Page 46: clase 1 probabilidades  distribuciones

Distribución Ji Cuadrado (2 )

•Es una distribución asimétrica.

• Solo toma valores positivos y es asintótica con respecto al eje de las x positivas (0 < 2 < +).

• Está caracterizada por un único parámetro llamado: grados de libertad (g.l.)

• El área comprendida entre la curva y el eje de las x es 1 o 100%.

46Curso : Modelación y

Simulación

Page 47: clase 1 probabilidades  distribuciones

Gráfico de la distribución Ji Cuadrado

1 -

Región de aceptación

Región de rechazo

2 gl,

47Curso : Modelación y

Simulación

Page 48: clase 1 probabilidades  distribuciones

Distribución Ji Cuadrado

220

( )i i

i

E

E

48Curso : Modelación y

Simulación

Page 49: clase 1 probabilidades  distribuciones

Ejercicio Chi - Cuadrado

12 2

4

6

8

54

2 2

0

25

1

49Curso : Modelación y

Simulación

Page 50: clase 1 probabilidades  distribuciones

Ejercicio Chi-cuadradoai bi Fi

Marca Clase Fi*MC (xi-x) ^2 fi*(xi-x)^2

1,18 1,22 1 1,2 1,2 0,07002639 0,07002639

1,22 1,27 2 1,245 2,49 0,04823514 0,09647028

1,27 1,32 2 1,295 2,59 0,02877264 0,05754528

1,32 1,37 4 1,345 5,38 0,01431014 0,05724056

1,37 1,42 6 1,395 8,37 0,00484764 0,02908584

1,42 1,47 8 1,445 11,56 0,00038514 0,00308113

1,47 1,52 5 1,495 7,475 0,00092264 0,0046132

1,52 1,57 4 1,545 6,18 0,00646014 0,02584056

1,57 1,62 2 1,595 3,19 0,01699764 0,03399528

1,62 1,67 3 1,645 4,935 0,03253514 0,09760542

1,67 1,72 1 1,695 1,695 0,05307264 0,05307264

1,72 1,8 2 1,76 3,52 0,08724639 0,17449278

             

    40 suma 58,585 suma 0,70306938

      media 1,464625 varianza 0,01802742

          desviación 0,1342662350

Page 51: clase 1 probabilidades  distribuciones

Ejercicio Chi-cuadrado

ajuste bueno, es una distribución normal

3,32chiv9 ,5=

16,93chi v9,95=

v=k-1-m=12-1-2=9

chi calculado =9,43

0,1347s

9,429921004097,6309961,4646x

1,50187,50925,00022,259799,360997,10122,4901,8961,801,72

0,37490,93722,50013,468197,101293,63311,8961,5251,721,67

0,27322,04897,50036,068693,633187,56451,5251,1531,671,62

3,640818,20405,00029,266687,564578,29791,1530,7821,621,57

0,55135,512710,000412,347978,297965,95000,7820,4111,571,52

0,27633,454012,500514,358565,950051,59150,4110,0401,521,47

1,474129,481720,000814,570351,591537,02120,040-0,3311,471,42

0,29334,399815,000612,902437,021224,1188-0,331-0,7021,421,37

0,00010,000910,00049,970524,118814,1483-0,702-1,0741,371,32

0,59422,97095,00026,723614,14837,4246-1,074-1,4451,321,27

0,21771,08865,00023,95677,42463,4680-1,445-1,8161,271,22

0,23220,58062,50011,73803,46801,7299-1,816-2,1131,221,18

ej f*100/40ojN(yc2)*100N(yc1)*100(bi-x)/s(ai-x)/sbiai

(oj-ej)^2/ej

(oj-ej)^2fre en %

frecuenciaarea2-area1area2area1

ajuste bueno, es una distribución normal

3,32chiv9 ,5=

16,93chi v9,95=

v=k-1-m=12-1-2=9

chi calculado =9,43

0,1347s

9,429921004097,6309961,4646x

1,50187,50925,00022,259799,360997,10122,4901,8961,801,72

0,37490,93722,50013,468197,101293,63311,8961,5251,721,67

0,27322,04897,50036,068693,633187,56451,5251,1531,671,62

3,640818,20405,00029,266687,564578,29791,1530,7821,621,57

0,55135,512710,000412,347978,297965,95000,7820,4111,571,52

0,27633,454012,500514,358565,950051,59150,4110,0401,521,47

1,474129,481720,000814,570351,591537,02120,040-0,3311,471,42

0,29334,399815,000612,902437,021224,1188-0,331-0,7021,421,37

0,00010,000910,00049,970524,118814,1483-0,702-1,0741,371,32

0,59422,97095,00026,723614,14837,4246-1,074-1,4451,321,27

0,21771,08865,00023,95677,42463,4680-1,445-1,8161,271,22

0,23220,58062,50011,73803,46801,7299-1,816-2,1131,221,18

ej f*100/40ojN(yc2)*100N(yc1)*100(bi-x)/s(ai-x)/sbiai

(oj-ej)^2/ej

(oj-ej)^2fre en %

frecuenciaarea2-area1area2area1

51

Page 52: clase 1 probabilidades  distribuciones

Ejercicio Chi-cuadrado

Límite Límite Frecuencia Frecuencia PorcentajeInferior Superior Acumulada

1,18 1,22 1 1 2,51,22 1,27 2 3 7,51,27 1,32 2 5 12,51,32 1,37 4 9 22,51,37 1,42 6 15 37,51,42 1,47 8 23 57,51,47 1,52 5 28 70,01,52 1,57 4 32 80,01,57 1,62 2 34 85,01,62 1,67 3 37 92,51,67 1,72 1 38 95,01,72 1,80 2 40 100,0

52Curso : Modelación y

Simulación

Page 53: clase 1 probabilidades  distribuciones

1200

1010

105

20

90 53Curso : Modelación y

Simulación

Page 54: clase 1 probabilidades  distribuciones

Ejercicio Chi-cuadrado

114

56

172

245

263

156

67

23

3

0

25

50

75

100

125

150

175

200

225

250

275

300

1

54Curso : Modelación y

Simulación

Page 55: clase 1 probabilidades  distribuciones

Ejercicio Chi-cuadrado

ai bi Fi Marca Clase Fi*MC (x-X)**2 Fi*(x-X)**227,5 31,5 1 29,5 29,5 331,677 331,67731,5 35,5 14 33,5 469 201,981 2827,73335,5 39,5 56 37,5 2100 104,285 5839,95739,5 43,5 172 41,5 7138 38,589 6637,29843,5 47,5 245 45,5 11147,5 4,893 1198,77147,5 51,5 263 49,5 13018,5 3,197 840,79651,5 55,5 156 53,5 8346 33,501 5226,14755,5 59,5 67 57,5 3852,5 95,805 6418,93159,5 63,5 23 61,5 1414,5 190,109 4372,50663,5 67,5 3 65,5 196,5 316,413 949,239

1000 suma 47712 suma 34643,056media 47,71 varianza 34,678

desviacion 5,889

55Curso : Modelación y

Simulación

Page 56: clase 1 probabilidades  distribuciones

Ejercicio Chi-cuadrado        area1 area2

area2-area1 frecuencia fre en % (oj-ej)^2

(oj-ej)^2/ej

ai bi (ai-x)/s (bi-x)/s N(yc1)*100 N(yc2)*100 oj ej f*100/1000    

27,5 31,5 -3,434 -2,754 0,0297 0,2940 0,2642 1 0,1 0,0270 0,270

31,5 35,5 -2,754 -2,075 0,2940 1,9001 1,6062 14 1,4 0,0425 0,030

35,5 39,5 -2,075 -1,395 1,9001 8,1474 6,2473 56 5,6 0,4190 0,075

39,5 43,5 -1,395 -0,716 8,1474 23,7113 15,5638 172 17,2 2,6770 0,156

43,5 47,5 -0,716 -0,036 23,7113 48,5634 24,8521 245 24,5 0,1240 0,005

47,5 51,5 -0,036 0,644 48,5634 74,0077 25,4443 263 26,3 0,7322 0,028

51,5 55,5 0,644 1,323 74,0077 90,7113 16,7036 156 15,6 1,2179 0,078

55,5 59,5 1,323 2,003 90,7113 97,7400 7,0287 67 6,7 0,1080 0,016

59,5 63,5 2,003 2,682 97,7400 99,6345 1,8945 23 2,3 0,1644 0,071

63,5 67,5 2,682 3,362 99,6345 99,9613 0,3268 3 0,3 0,0007 0,002

                     

x 47,712           1000     0,732

s 5,886                  

          chi calculado =0,7315   chi v7,95= 14,1    

          v=k-1-m=10-1-2=7   chiv7 ,5= 2,17    

                     

          ajuste muy bueno          56

Curso : Modelación y Simulación

Page 57: clase 1 probabilidades  distribuciones

Ejercicio Chi-cuadrado

Límite Frecuencia Frecuencia Porcentaje

Superior Acumulada  

31,5 1 1 0,1

35,5 14 15 1,5

39,5 56 71 7,1

43,5 172 243 24,3

47,5 245 488 48,8

51,5 263 751 75,1

55,5 156 907 90,7

59,5 67 974 97,4

63,5 23 997 99,7

67,5 3 1000 100,0

57Curso : Modelación y

Simulación

Page 58: clase 1 probabilidades  distribuciones

Curva tonelaje vs leyFormulasCalculo de área: Ocupando la normal reducida

Ley media

Curso : Modelación y Simulación 58

Xc

Yc

)()%( YcXc

)(*

2)(

2

2

Yc

eXc

Yc

Page 59: clase 1 probabilidades  distribuciones

Curva tonelaje vs leyEjemploµ=47,712 =5,886 Xc=40

Ley media

Curso : Modelación y Simulación 59

31,1886,5

712,4740

Xc

Yc

%49,909049,00951,01)()%( YcXc

385,539049,0

*14,3*2

886,5712,47

)(*

2)(

2

)31,1(

2

22

e

Yc

eXc

Yc

Page 60: clase 1 probabilidades  distribuciones

Curva tonelaje vs ley

Curso : Modelación y Simulación 60

Tonelaje Total =100.000 toneladas 100.000

% XC (ai-x)/s Normal %(+Xc) Tonelaje n exp Ley

25 -3,859 0,000 1,000 99994,3 -7,445 0,001 47,7130 -3,009 0,001 0,999 99869,1 -4,528 0,011 47,7435 -2,160 0,015 0,985 98460,5 -2,332 0,097 47,9440 -1,310 0,095 0,905 90494,8 -0,858 0,424 48,8145 -0,461 0,322 0,678 67751,8 -0,106 0,899 50,8350 0,389 0,651 0,349 34873,7 -0,076 0,927 53,9655 1,238 0,892 0,108 10781,5 -0,767 0,465 57,8360 2,088 0,982 0,018 1841,1 -2,179 0,113 62,14

x 47,712s 5,8858

R2pi 2,50659769

)(

*2

2

2

Yc

eXc

Yc

9049,0

*14,3*2

886,5712,4740

2

)31,1( 2

e

Page 61: clase 1 probabilidades  distribuciones

Curva tonelaje vs ley

Curso : Modelación y Simulación 61

Page 62: clase 1 probabilidades  distribuciones

Coeficiente de correlación El coeficiente de correlación se define por :

La correlación es nula si rxy=0

11

:

*

xy

yx

xyxy

r

donde

SS

Sr

62Curso : Modelación y

Simulación

Page 63: clase 1 probabilidades  distribuciones

Línea de Regresión La linea de regresión se define por:

yxx

S

Sry

y

xxy

63Curso : Modelación y

Simulación

Page 64: clase 1 probabilidades  distribuciones

Producción Coston x y X-x Y-y (X-x)^2 (Y-y)^2 (X-x)(Y-y)1 1,5 2,5 -1,45 -1,01 2,103 1,020 1,46452 2,0 3,1 -0,95 -0,41 0,903 0,168 0,38953 3,0 3,8 0,05 0,29 0,002 0,084 0,01454 1,5 2,1 -1,45 -1,41 2,103 1,988 2,04455 3,5 4,3 0,55 0,79 0,303 0,624 0,43456 3,0 3,2 0,05 -0,31 0,002 0,096 -0,01557 4,5 4,8 1,55 1,29 2,403 1,664 1,99958 4,0 3,9 1,05 0,39 1,103 0,152 0,40959 4,0 4,4 1,05 0,89 1,103 0,792 0,934510 2,5 3,0 -0,45 -0,51 0,203 0,260 0,2295

Suma 29,5 35,1 10,225 6,849 7,905Media 2,95 3,51Varianza 1,136 0,761Desviación Sta 1,066 0,872Covarianza 0,878Coeficiente correlación 0,945 0,77310513

2,280660151,22933985

Y=1,229+0,77*X

0,0

1,0

2,0

3,0

4,0

5,0

6,0

0,0 1,0 2,0 3,0 4,0 5,0 6,0

Datos

Recta

Lineal (Recta)

yxx

S

Sry

y

xx y

64

Page 65: clase 1 probabilidades  distribuciones

Regresión Lineal Múltiple

Supongamos que la variable Y depende de las variables X1,X2,X3, por analogía con el modelo lineal simple se puede formular el modelo siguiente

321320 1 XXXY iiii

En que X1,X2;x3 son los valores de las variable independientes en el experimento i, siendo Yi, la respuesta correspondiente. Debido a la presencia de más de dos variables , este modelo se llama regresión lineal múltiple. Para estimar los parámetros 0 , 1, 2, 3 se utiliza el método de los mínimos cuadrados, minimizando la cantidad:

)321( 2

13210 XXXYD iii

i

n

i

65Curso : Modelación y

Simulación

Page 66: clase 1 probabilidades  distribuciones

Regresión Lineal Múltiple

al derivar parcialmente D con respecto a parámetros 0, 1, 2, 3, se llega al sistema de ecuaciones siguientes, llamado sistema normal

YXXXXXXX

YXXXXXXX

YXXXXXXX

YXXXn

332322311303

233222211202

133122112

101

3322110

Coeficiente de determinación r2 que corresponde al índice de ajuste lineal, siendo r el coeficiente de correlación múltiple

66Curso : Modelación y

Simulación

Page 67: clase 1 probabilidades  distribuciones

Regresión Lineal Múltiple

Ejemplo Montgomery y Peck (1992) describen el uso de un modelo de regresión para relacionar la cantidad de tiempo que requiere un vendedor para dar servicio a una máquina expendedora de refrescos, con el número de envases contenidos en la máquina y la distancia del vehículo de servicio al sitio donde se encuentra la máquina . Este modelo fue utilizado para diseñar la ruta , los horarios y la salida de vehículos, La tabla presenta 25 observaciones del tiempo de suministro tomadas del mismo estudio descrito por Montgomery y Peck.

67Curso : Modelación y

Simulación

Page 68: clase 1 probabilidades  distribuciones

Regresión Lineal MúltipleY x1 x2 x1*x1 x1*x2 x1*y x2*x2 x2*y

1 9,95 2,00 50,00 4,00 100,00 19,90 2500 497,52 24,45 8,00 110,00 64,00 880,00 195,60 12100 2689,53 31,75 11,00 120,00 121,00 1320,00 349,25 14400 38104 35,00 10,00 550,00 100,00 5500,00 350,00 302500 192505 25,02 8,00 295,00 64,00 2360,00 200,16 87025 7380,96 16,86 4,00 200,00 16,00 800,00 67,44 40000 33727 14,38 2,00 375,00 4,00 750,00 28,76 140625 5392,58 9,60 2,00 52,00 4,00 104,00 19,20 2704 499,29 24,35 9,00 100,00 81,00 900,00 219,15 10000 2435

10 27,50 8,00 300,00 64,00 2400,00 220,00 90000 825011 17,08 4,00 412,00 16,00 1648,00 68,32 169744 7036,9612 37,00 11,00 400,00 121,00 4400,00 407,00 160000 1480013 41,95 12,00 500,00 144,00 6000,00 503,40 250000 2097514 11,66 2,00 360,00 4,00 720,00 23,32 129600 4197,615 21,65 4,00 205,00 16,00 820,00 86,60 42025 4438,2516 17,89 4,00 400,00 16,00 1600,00 71,56 160000 715617 69,00 20,00 600,00 400,00 12000,00 1380,00 360000 4140018 10,30 1,00 585,00 1,00 585,00 10,30 342225 6025,519 34,93 10,00 540,00 100,00 5400,00 349,30 291600 18862,220 46,59 15,00 250,00 225,00 3750,00 698,85 62500 11647,521 44,88 15,00 290,00 225,00 4350,00 673,20 84100 13015,222 54,12 16,00 510,00 256,00 8160,00 865,92 260100 27601,223 56,23 17,00 590,00 289,00 10030,00 955,91 348100 33175,724 22,13 6,00 100,00 36,00 600,00 132,78 10000 221325 21,15 5,00 400,00 25,00 2000,00 105,75 160000 8460

Ysuma 725,42 206 8294 2396 77177 8001,67 3531848 274580,71

Ecuaciones 1 B0*n+B1*X1+B2*X2=Y2 B0*X1+B1*X1*X1+B2*X1*X2=X1*Y3 B0*X2+B1*X1*X2+B2*X2*X2=X2*Y

Y=B0+B1*x1+B2*X2

68

Page 69: clase 1 probabilidades  distribuciones

Regresión Lineal MúltipleEcuaciones 1 25*B0 +206*B1 +8294*B2 =725,42 *206

2 206*B0 +2396*B1 +77177*B2 =8001,67 *253 8294*B0 +77177*B1 +3531848*B2 =274580,71

5150 42436 1708564 149436,525150 59900 1929425 200041,75

0 17464 220861 50605,23 12,64664453

B1 = 2,89768839 -12,646644*B2

6942,861377 -30301,36028 223634,8967 -976030,0846

206 46875,64 1058,81 *82948294 2555817,92 50945,82 *206

1708564 388786558 8781770,141708564 526498492 10494838,92

0 137711933 1713068,78

B2 = 0,012439509 57,73041402 B1= 2,740370335 475,6986021 2,309216515 B0= 2,309216561

Y=2,3092+2,7403*X1+0,0124*X2

69Curso : Modelación y

Simulación

Page 70: clase 1 probabilidades  distribuciones

Regresión Lineal MúltipleY= 2,31 + 2,740 X1 0,0124 X2

Y Ys ei Y-YM Ys-YsM (Y-YM)^2 (Ys-YsM)^2 (Y-YM)*(Ys-YsM)1 9,95 8,4098 1,54 -19,07 -20,59 363,543 424,084 392,6482 24,45 25,5956 -1,15 -4,57 -3,41 20,856 11,611 15,5613 31,75 33,9405 -2,19 2,73 4,94 7,470 24,378 13,4954 35,00 36,5322 -1,53 5,98 7,53 35,799 56,687 45,0485 25,02 27,8896 -2,87 -4,00 -1,11 15,974 1,240 4,4506 16,86 15,7504 1,11 -12,16 -13,25 147,788 175,634 161,1107 14,38 12,4398 1,94 -14,64 -16,56 214,236 274,343 242,4348 9,60 8,4346 1,17 -19,42 -20,57 377,012 423,063 399,3749 24,35 28,2119 -3,86 -4,67 -0,79 21,779 0,626 3,692

10 27,50 27,9516 -0,45 -1,52 -1,05 2,301 1,106 1,59511 17,08 18,3792 -1,30 -11,94 -10,62 142,487 112,867 126,81512 37,00 37,4125 -0,41 7,98 8,41 63,731 70,718 67,13413 41,95 41,3928 0,56 12,93 12,39 167,268 153,505 160,23914 11,66 12,2538 -0,59 -17,36 -16,75 301,259 280,539 290,71415 21,65 15,8124 5,84 -7,37 -13,19 54,270 173,994 97,17316 17,89 18,2304 -0,34 -11,13 -10,77 123,806 116,051 119,86617 69,00 64,5552 4,44 39,98 35,55 1598,656 1263,952 1421,48718 10,30 12,3035 -2,00 -18,72 -16,70 350,319 278,877 312,56319 34,93 36,4082 -1,48 5,91 7,41 34,966 54,836 43,78820 46,59 46,5137 0,08 17,57 17,51 308,817 306,621 307,71721 44,88 47,0097 -2,13 15,86 18,01 251,641 324,238 285,64222 54,12 52,478 1,64 25,10 23,47 630,171 551,071 589,29523 56,23 56,2103 0,02 27,21 27,21 740,558 740,232 740,39524 22,13 19,991 2,14 -6,89 -9,01 47,428 81,218 62,06525 21,15 20,9707 0,18 -7,87 -8,03 61,887 64,519 63,189

SUMA 725,42 725,08 6084,021 5966,009 5967,491MEDIA 29,0168 29,00 253,501 248,584 248,645

15,922 15,767

Coeficiente de correlación múltiple r 0,99049999Coeficiente de determinación r^2 0,98109023

70Curso : Modelación y

Simulación

Page 71: clase 1 probabilidades  distribuciones

Regresión Lineal Múltiple Matricial

Sean K: Número de variables de Regresión n: número de observaciones en la

forma ((Xi1;Xi2;Xi3;…..;Xik);Yi) con i=1,2,3,…n)

Y el modelo de regresión

Yi= Bo+i

k

jijj X

1

71Curso : Modelación y

Simulación

Page 72: clase 1 probabilidades  distribuciones

Regresión Lineal Múltiple Matricial

Este Modelo es un sistema de n ecuaciones que puede expresarse en forma matricial como

nknknn

k

k

n

y

XXX

XXX

XXX

X

Y

Y

Y

Y

..

......1

.

......1

......1

.2

1

1

0

21

22221

11211

2

1

72Curso : Modelación y

Simulación

Page 73: clase 1 probabilidades  distribuciones

Regresión Lineal Múltiple Matricial

Se desea encontrar el vector de estimadores de minimos cuadrados que es:

L=´= (y-Xβ)´(y-Xβ)

Al derivar en forma parcial nos queda X´Xβ=X´y

El estimador de mínimos cuadrados es:

YXXX tT 1ˆ

73Curso : Modelación y

Simulación

Page 74: clase 1 probabilidades  distribuciones

Regresión Lineal Múltiple Matricial En el ejemplo : x1 x2

9,95 1 2 5024,45 1 8 11031,75 1 11 12035,00 1 10 55025,02 1 8 29516,86 1 4 20014,38 1 2 375

y 9,60 X 1 2 5224,35 1 9 10027,50 1 8 30017,08 1 4 41237,00 1 11 40041,95 1 12 50011,66 1 2 36021,65 1 4 20517,89 1 4 40069,00 1 20 60010,30 1 1 58534,93 1 10 54046,59 1 15 25044,88 1 15 29054,12 1 16 51056,23 1 17 59022,13 1 6 10021,15 1 5 400

74Curso : Modelación y

Simulación

Page 75: clase 1 probabilidades  distribuciones

Regresión Lineal Múltiple Matricial

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 502 8 11 10 8 4 2 2 9 8 4 11 12 2 4 4 20 1 10 15 15 16 17 6 5 1 8 110

50 110 120 550 295 200 375 52 100 300 412 400 500 360 205 400 600 585 540 250 290 510 590 100 400 1 11 1201 10 550

25 206 8294 1 8 295206 2396 77177 1 4 200

8294 77177 3531848 1 2 3751 2 52

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 9 1002 8 11 10 8 4 2 2 9 8 4 11 12 2 4 4 20 1 10 15 15 16 17 6 5 1 8 300

50 110 120 550 295 200 375 52 100 300 412 400 500 360 205 400 600 585 540 250 290 510 590 100 400 1 4 4121 11 400

725,42 9,95 1 12 5008001,67 24,45 1 2 360

274580,71 31,75 1 4 20535,00 1 4 400

25 206 8294 -1 725,42 25,02 1 20 600206 2396 77177 8001,67 16,86 1 1 585

8294 77177 3531848 274581 14,38 1 10 5409,60 1 15 250

0,2146526 -0,0074909 -0,0003404 725,42 24,35 1 15 290-0,0074909 0,0016708 -0,0000189 8001,67 27,50 1 16 510-0,0003404 -0,0000189 0,0000015 274581 17,08 1 17 590

37,00 1 6 10041,95 1 5 400

2,309200429 11,662,740369424 21,650,012439581 17,89

69,00Y=2,3092+2,74037*X1+0,01244*X2 10,30

34,9346,5944,8854,1256,2322,1321,15

75Curso : Modelación y

Simulación

Page 76: clase 1 probabilidades  distribuciones

Estimación Puntual Propiedades de los estimadores

Insesgadez : Es mínimo cuando . Y de este modo,el Error Cuadrático Medio es la varianza del estimador.

Eficiencia: Dado un tamaño de muestra fijo, se busca, entre los estimadores, el que menor varianza tenga.

2ˆ)ˆ( EECM

)ˆ(E

76Curso : Modelación y

Simulación

Page 77: clase 1 probabilidades  distribuciones

Estimación PuntualConsistencia: Nos dice que, cuando el tamaño de las muestra se incrementa, el estimador puntual debe estar próximo al parámetro con probabilidad alta.

Suficiencia: El estimador puntual debe resumir la información proporcionada por la muestra aleatoria Además no debe haber pérdida de ésta.

Invarianza: Si es el estimador de , esta propiedad nos dice que g() tiene como estimador a g( ).

Robustez: Se presenta cuando la distribución del estimador no se ve seriamente afectada por violaciones en los supuestos.

77Curso : Modelación y

Simulación

Page 78: clase 1 probabilidades  distribuciones

Consistencia: Nos dice que, cuando el tamaño de las muestra se incrementa, el estimador puntual debe estar próximo al parámetro con probabilidad alta.

Suficiencia: El estimador puntual debe resumir la información proporcionada por la muestra aleatoria Además no debe haber pérdida de ésta.

Invarianza: Si es el estimador de , esta propiedad nos dice que g() tiene como estimador a g( ).

Robustez: Se presenta cuando la distribución del estimador no se ve seriamente afectada por violaciones en los supuestos.

78Curso : Modelación y

Simulación

Page 79: clase 1 probabilidades  distribuciones

Ley de los Grandes Números

Como caso especial, cuando es , la media muestral, tenemos que E( ) = y converge a .

De la misma manera, s2 converge a

2 cuando n tiende a infinito.

Z x

x

x

79Curso : Modelación y

Simulación

Page 80: clase 1 probabilidades  distribuciones

Teorema del Límite central Sea x1, x2, ..., xn una muestra aleatoria de observaciones tomadas de la misma distribución y sea E(Xi)= y Var(Xi)= 2.

Entonces la distribución muestral de la variable aleatoria

converge a la normal standard cuando n tiende a infinito.

)(

xn

Zn

80Curso : Modelación y

Simulación

Page 81: clase 1 probabilidades  distribuciones

Teorema central del Límite

El TCL es una herramienta muy poderosa porque se cumple aún cuando la distribución desde la que se toman las observaciones no sea normal. Esto significa que si nosotros nos aseguramos que el tamaño de la muestra es grande, entonces podemos usar la variable Zn para responder preguntas acerca de la población de la cual provienen las observaciones.

81Curso : Modelación y

Simulación

Page 82: clase 1 probabilidades  distribuciones

Estos dos conceptos anteriores sirven para prepararnos para dos objetivos básicos de cualquier estudio empírico: la estimación de parámetros desconocidos que nos interesan y la prueba de hipótesis

82Curso : Modelación y

Simulación

Page 83: clase 1 probabilidades  distribuciones

Cálculo del tamaño de la muestra

El tamaño de la muestra para un diseño de encuestas basado en una muestra aleatoria simple, puede calcularse por la siguiente fórmula

pqZNE

pqNZn

22

2

83Curso : Modelación y

Simulación

Page 84: clase 1 probabilidades  distribuciones

Cálculo del tamaño de la muestra

Donde:  n es el tamaño de la muestra Z es el nivel de confianza del 95%, y es igual a 1,96 según la tabla de

distribución normal es decir: P(-1,96<z<1,96)=0,95

p es la variabilidad positiva, es decir la probabilidad con que se acepta la hipótesis que se quiere investigar, con un valor de 0,5.

q es la variabilidad negativa, es decir, la probabilidad con que se rechaza la hipótesis que se quiere investigar, con un valor de 0,5.

N es el tamaño de la población, de 684 individuos.

E es la precisión o el error, con un valor del 5 % de error.

individuosxxx

xxxxn 246

5,05,096,105,0684

6845,05,05,096,122

2

84Curso : Modelación y

Simulación

Page 85: clase 1 probabilidades  distribuciones

Cálculo del tamaño de la muestra

otra Forma: El tamaño de la muestra para un diseño de encuestas basado en una muestra aleatoria simple, puede calcularse por la siguiente fórmula

n= tamaño de la muestra requeridoT= nivel de fiabilidad (95 % = 1,96)P=probabilidad de ocurrenciam=margen de error( 5%=0.05)

2

2 )1(*

m

pptn

85Curso : Modelación y

Simulación

Page 86: clase 1 probabilidades  distribuciones

Ejemplo

Se ha determinado que en una población cerca del 30 %(0.3) de los niños están desnutridos.Este datos de basa en estadísticas nacionales . Determine con una 95 % de confianza el tamaño de la muestra requerido

n=322,72 323Se considera un efecto de diseño 2 luego el número de muestreas es : n*d=323X2=646Corrección por imprevistos aumenta en un 5 % como errores N=646x1,05=690 niños

2

2

05.0

)3.01(3.0*96,1 n

86Curso : Modelación y

Simulación