descriptiva

115
Prof.: David Becerra Rojas 1 Contenidos 1. Introducción 2. Estadística Descriptiva: Univariante Bivariante 3.- Probabilidades 4.- Distribución de probabilidades 5.- Distribución en el Muestreo 6.- Estimación de Parámetros 7.- Dócimas de Hipótesis

Upload: francisco-gallardo-pizarro

Post on 24-Oct-2014

171 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Descriptiva

Prof.: David Becerra Rojas 1

Contenidos

1. Introducción2. Estadística Descriptiva:

Univariante Bivariante3.- Probabilidades4.- Distribución de probabilidades

5.- Distribución en el Muestreo6.- Estimación de Parámetros7.- Dócimas de Hipótesis

Page 2: Descriptiva

Prof.: David Becerra Rojas 2

Bibliografía

1. Murray y Espieges “ Estadística”2. Paul Newbold “ Estadística para los negocios”3. Mario Triola “ Probabilidad y Estadística”4. L. Chao5. R. Levin6. Mongomery7. www.elprisma.com ( Matemática,….)

Page 3: Descriptiva

3

ESTADISTICA

CIENCIA QUE NOS PERMITE TOMAR DECISIONES BAJO CIERTA INCERTIDUMBRE

Page 4: Descriptiva

Prof.: David Becerra Rojas 4

Términos ComunesProceso de realizar una observación o una medición.

Característica o fenómeno, que puede tomar distintos valores.

Resultado de la observación de una variable.

Conjunto total de elementos o individuos, que poseen unacaracterística común, acerca de la cual se quiere información

Subconjunto de la población, seleccionada de acuerdo a una regla o un plan.

Obtención de todos los datos de interés que posee la población

Función o formula que depende de los datos de la muestra

Estimación del parámetro a través del estadístico

Función o formula que depende de los datos de la población

Muestra

CensoEstadísticoParámetroInferencia

Experimento

VariableDatoPoblación

Page 5: Descriptiva

Prof.: David Becerra Rojas 5

Método Científico

1. Planteamiento del Problema2. Diseño del Experimento3. Experimentación y Recolección4. Organización y Descripción de

Resultados5. Inferencia Estadística

Page 6: Descriptiva

Prof.: David Becerra Rojas 6

Muestreo

Notación:

N : Tamaño de la Poblaciónn : Tamaño de la Muestra

Page 7: Descriptiva

Prof.: David Becerra Rojas 7

Tipos de Muestreos Aleatorios

Aleatorio SimpleEstratificadoSistemáticoPor Conglomerado

Page 8: Descriptiva

Prof.: David Becerra Rojas 8

Muestreo Aleatorio Simple

Todos los elementos de la población, tienen la misma oportunidad de estar contenidos en la muestra.

Se enumeran todos los elementos, y luego se extraen de uno en uno, aleatoriamente, hasta completar el tamaño de la muestra.

Cuando la población es muy grande, se puede recurrir a los números aleatorios.

Page 9: Descriptiva

Prof.: David Becerra Rojas 9

Muestreo Estratificado

Método de selección, utilizado cuando la población, está dividida en grupos llamados estratos, cada uno, formado por una gran cantidad de elementos homogéneos.

Se toma una muestra aleatoria simple, en cada estrato.

Los estratos, pueden ser de igual o distinto tamaño, si son distintos, una manera posible de determinar el tamaño de la muestra al interior de cada estrato, es que esta sea proporcional al tamaño del mismo, a este tipo de asignación, se le conoce como Afijación Proporcional, que no siempre resulta la mejor, debido al costo de muestreo en cada estrato.

Page 10: Descriptiva

Prof.: David Becerra Rojas 10

Muestreo Sistemático

Este método, se utiliza cuando la población tiene sus elementos ordenados. Se divide la población (de tamaño N) en tantas sub poblaciones, como sea el tamaño de la muestra (n), todas de igual tamaño (k = N/n).

Se selecciona al azar un elemento de la primera sub población, y de ahí en adelante, de las sub poblaciones siguientes, se extrae el elemento correspondiente.

Page 11: Descriptiva

Prof.: David Becerra Rojas 11

Muestreo por Conglomerado

Se utiliza, cuando la población, está dividida en una gran cantidad de pequeños grupos, llamados Conglomerados, cada uno formado por elementos heterogéneos. Se toma una muestra aleatoria de Conglomerados, y luego se censan todos los conglomerados seleccionados.

Page 12: Descriptiva

Prof.: David Becerra Rojas 12

Tipos (Género) de Variable

1.- Numéricas : a.- Discretasb.- Continuas

2.- Categóricas: a.- Ordinalesb.- Nominales

Page 13: Descriptiva

Prof.: David Becerra Rojas 13

Organización de Datos

Consideremos que la variable X, se divide

En k clases o categorías, denominadas:

C1 , C2 , …………… C i ,……… Ck

Dando origen a la Siguiente tabla de Frecuencia

Page 14: Descriptiva

Prof.: David Becerra Rojas 14

Tablas de Frecuenciai X ni fi Ni Fi

1 C1 n1 f1 N1 F1

2 C2 n2 f2 N2 F2

: : : : : :

i Ci ni fi Ni Fi

: : : : : :

k Ck nk fk Nk Fk

T o t a l n 1 /// ///

Page 15: Descriptiva

Prof.: David Becerra Rojas 15

Tablas de Frecuencias

Frecuencia Absoluta: (ni )

Frecuencia Relativa : ( fi =ni/n )

Frecuencia Acumulada Absoluta: (Ni)

Frecuencia Acumulada Relativa : (Fi =Ni/n )

Page 16: Descriptiva

Prof.: David Becerra Rojas 16

Ejemplo 1:

M MB B B R M MM R MB MB R B B M R B B R MB B B B R M MM B R R B R B R

Tablai X1 MM2 M3 R4 B5 MBTotal

Determine: a.- La variable x:b.- El típo de Variable:c.- Una tabla de frecuencia

ni 2 41012 432

fi

.06

.13

.31

.38

.121.0

Ni

2 6162832//

Fi

.06

.19

.50

.881.0//

Opinión de alumnos por una bebida nueva

d.- Determine e Interprete k= f4=

n3= N3=

n= F3=e.- ¿Cuantos alumnos consideran que

la bebida es al menos regular?

5

1032

.38

16

.50

26 alumnos

Opinión de los alumnos…..

Categórica Ordinal

Page 17: Descriptiva

Prof.: David Becerra Rojas 17

Ejemplo 2:

4 3 5 8 3 6 3 2 2 4 4 3 3 5 8 6 8 3 6 6 4 3 5 2 2 4 6 6 3 5

Tabla

i X

1 22 33 44 55 66 77 8Total

Determine: a.- La variable X:b.- El típo de Variable:c.- Una tabla de frecuencia

ni

485460330

fi

.13

.27

.17

.13

.20

.00

.101.0

Ni

4121721272730//

Fi

.13

.40

.57

.70

.90

.901.0//

Número de artículos defectuosos por día.

d.- Determine e Interprete k= f4=

n3= N4=

n= F3=

e.- ¿En cuantos días el número de artículos defectuosos fue de al

menos 4?

75

30

.1321

.57

18 días

Número de artic. Defec. Por día

Numérica Discreta

f.- ¿Cuál fué el número máximo de artículos def. por día en los 15 días que hubieron menos?

4 artículog.- ¿Cuántos artículos en total, se juntaron en Los 6 días en que hubieron más? 42 art.

Page 18: Descriptiva

Prof.: David Becerra Rojas 18

Tabla de Frecuencia con Intervalos de Clase

1. Rango: R = Valor Máx. – Valor mín. + 1u (1u:

Una unidad de medida)

2. Cantidad de Intervalos, Según Sturger´s: k = 1 + 3.3 log(n) kN

3. Amplitud: a = Rk (a valor superior cuando no es exacto)

Aparentes (XA)

6. Marcas de Clases (Xi)

Ej. Si 1u = 0.01

y a= R/k = 4.571 4.58 ( se expresa en la unidad de medida)4. Adicionales: p = a*k –R5. Intervalos :

Xi = ( Ls + Li ) 2

Características (XA):

1.- Limite inferior del primer intervalo corresponde al valor mínimo menos las p* unidades adicionales correspondientes .

2.- Limite superior del último intervalo corresponde al valor máximo más las p** unidades adicionales correspondientes.3.- Se expresan en la unidad de medida.4.- Están separados por una unidad de medida.

Reales (XR)

Características ( XR):

Se obtienen a partir de los Intervalos Aparentes, ampliando estos en media unidad de medida hacia cada extremo, de tal manera, que el limite superior de un intervalo, corresponda al inferior del intervalo siguiente.

Obs.: La amplitud (a), se puede obtener de la diferencia entre dos limites

inferiores o superiores consecutivos, o entre dos marcas de clases consecutivas

Page 19: Descriptiva

Prof.: David Becerra Rojas 19

Ejemplo

Sea Valor mínimo= 4.7Valor Máximo = 12.6n = 42

Determine los intervalos aparentes y reales con sus respectivas marcas de clase.

Page 20: Descriptiva

Prof.: David Becerra Rojas 20

1. Rango R = 12.6 – 4.7 + 0.1 = 8.02. K = 1 +3.3 log(42) = 6.4 63. a = 8.0 6 = 1.33 1.44. P = 1.4*6 -8.0=0.4

5.=Intervalos : i XA XR Xi

123456

4.5 – 5.8

5.9 – 7.2

7.3 – 8.6

8.7 – 10.0

10.1 – 11.4

11.5 – 12.8

4.45 – 5.855.85 – 7.257.25 – 8.658.65 – 10.0510.05 – 11.4511.45 – 12.85

5.15 6.55 7.95 9.3510.7512.15

Page 21: Descriptiva

Prof.: David Becerra Rojas 21

Ejemplo 2:

Considere los siguientes datos:0.94 1.05 0.86 0.94 0.96 1.03 1.010.78 0.84 0.86 1.04 0.76 0.65 0.70

Confeccione una tabla de frecuencia Con 5 intervalos.

Page 22: Descriptiva

Prof.: David Becerra Rojas 22

1. Rango R = 1.05 – 0.65 + 0.01 = 0.412. K = 53. a = 0.41/5=0.082 0.094. P = 0.09*5 -0.41=0.04

5.=Intervalos : i XA XR Xi ni fi Ni Fi

12345

0.63 – 0.71

0.72 – 0.80

0.81 – 0.89

0.90 – 0.98

0.99 – 1.07

0.625 – 0.715

0.715 – 0.805

0.805 – 0.895

0.895 – 0.9850.985 – 1.075

0.670.760.850.941.03

2 2 3 3 414

0.140.140.210.210.291.00

2 4 71014

0.140.280.490.701.00

Page 23: Descriptiva

Prof.: David Becerra Rojas 23

Complete la siguiente Tabla

1 - 12

2 - 0.20 12.6

3 - 48

4 - 0.80

18.4

5 - 120

Total //// ///// /////

i XR ni fi Ni Fi Xi

24

12

9648

24

9.7

21.3

15.5

8.25

11.15 14.05

14.05 16.95

16.95 19.85

19.85 22.75

36

12

120

Luego como a = 2.9

11.15

Page 24: Descriptiva

Prof.: David Becerra Rojas 24

TIPOS de GRÁFICOS

Gráfico de BarrasGráfico de SectoresHistogramaPolígonoOjiva PíctogramaDiagrama de Caja y Bigote (Tarea)

Categóricas y Numéricas Discretas

Categóricas

Numéricas Continuas

Numéricas Continuas

Numéricas

Numéricas y Categóricas

Principalmente en variables :

Page 25: Descriptiva

Prof.: David Becerra Rojas 25

Gráfico de Barras

0

5

10

15

20

25

30

H A K M B

ni

xi

Page 26: Descriptiva

Prof.: David Becerra Rojas 26

Gráfico de Sectores (ó Circular)

1234

Page 27: Descriptiva

Prof.: David Becerra Rojas 27

Histograma

3.5 5.5 7.5 9.5 11.5 13.5 XR

 

   

     

       

         

         

         

| | | | | | | _________________________

ni

120

100

80

60

40

20

Page 28: Descriptiva

Prof.: David Becerra Rojas 28

0

20

40

60

80

100

120

Polígono

2.5 4.5 6.5 8.5 10.5 12.5 X i

ni

Page 29: Descriptiva

Prof.: David Becerra Rojas 29

Ojiva

,00%

20,00%

40,00%

60,00%

80,00%

100,00%

1 2 3 4 5 6 7 8 9 10

Fi

Page 30: Descriptiva

Prof.: David Becerra Rojas 30

Pictograma

1990199520002005

1000 ejemplares

Consumo de carne de vacuno

Page 31: Descriptiva

Prof.: David Becerra Rojas 31

Ejemplo 1i xi ni fi

1 H 10 .143

2 A 18 .257

3 K 12 .171

4 M 5 .071

5 B 25 .357

To tal 70 1.00

fix360

51.4

92.5

61.6

25.6

128.5

360

Confeccione un gráfico de Barras y uno de Sectores

()ºac

51.4

143.9

205.5

231.1

360.0

/////

Page 32: Descriptiva

Prof.: David Becerra Rojas 32

i 1234

X 4 - 5 6 - 7 8 - 910 - 11T otal

ni407510530250

fi.16.30.42.121.0

Ni40115220250

Fi.16.46.881.0

Xi4.56.58.510.5

Ejemplo 2

Confeccione un: Histograma, un Polígono, y un Ojiva

Page 33: Descriptiva

Prof.: David Becerra Rojas 33

Ejercicio Supongamos que los datos siguientes representan

los tiempos, que demoran unos atletas en terminar una maratón.

1:35 1:28 1:45 1:52 1:40 1:30 1:381:47 1:37 1:30 1:40 1:36 1:29 1:35 1:37 1:36 1:40 1:36 1:48 2:05 1:322:28 1:45 1:50 1:47 2:29 1:44 1:49

1. Identifique la variable2. Indique el género ( tipo)3. Construya una tabla de frecuencia de 5 intervalos4. Confeccione un; Histograma, Ojiva

Page 34: Descriptiva

Prof.: David Becerra Rojas 34

ESTADISTICOS ( o

Estimadores)

CUANTILES ( Estadísticos de Orden)MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE DISPERSIÓN

Page 35: Descriptiva

Prof.: David Becerra Rojas 35

CUANTILES: ( ESTADÍSTICOS DE

ORDEN)

Cuartíles : ( Kk )

Quintíles : (Qq)

Decíles : ( Dd )

Percentíles : ( Pp )

Page 36: Descriptiva

Prof.: David Becerra Rojas 36

Cuartiles:

K1 K2 K3

25%

50%

75%

k = 1, 2, 3

Page 37: Descriptiva

Prof.: David Becerra Rojas 37

Quintiles:

Qq

q x 20%

Q = 1, 2, 3, 4

Page 38: Descriptiva

Prof.: David Becerra Rojas 38

Deciles:

Dd

(10*d)%

d = 1, 2, ….., 9

Page 39: Descriptiva

Prof.: David Becerra Rojas 39

Percentíles:

Pp

p%

p = 1, 2, …., 99

Page 40: Descriptiva

Prof.: David Becerra Rojas 40

EjercicioLa tabla siguiente, representa los años deServicio de los trabajadores de una empresa.

i Xi ni

1 3 152 6 183 9 264 10 385 12 306 18 25Total 152

1.- Calcular : K1 , Q3 , D2 , P45Ni

15335997127152

Fi

0.090.220.390.640.841.00

2.- ¿Cuál es el año de servicio mínimo

de los 30 trabajadores más antiguos

12 años

K1 = 9

P45 = 10

Q3 = 10

D2 = 6

Page 41: Descriptiva

Prof.: David Becerra Rojas 41

Cuantiles:

Li : Limite real inferior del intervalo que contiene el cuantil t, que es aquel donde por primera vez la frecuencia acumulada pasa el (t/Sx100)%.S : 4, 5, 10, 100 ( Cuartil, Quintil, Decíl, Percentil , respectivamente)Nt-1: frec. Acumulada anterior al intervalo que contiene el Ct.nt : frec. Absoluta del intervalo que contiene el Ct.a : Amplitud del intervalo. n : Tamaño de Muestra ( Total de Datos)

ttt n

aN

S

ntLiC *

*1

t : 1,2,3 Cuartiles 1,2,3,4 Quintiles 1,2…..9 Deciles 1,2,……99 PercentilesCuando los datos están ordenados en una tabla de frecuencia

Con intervalos de clase, se puede utilizar la siguiente expresión

Page 42: Descriptiva

Prof.: David Becerra Rojas 42

Ejemplo

8

6.0*4

10

50*195.21

D

5

6.0*37

4

50*375.43

K

i X 1 2.4 - 2.92 3.0 - 3.53 3.6 - 4.14 4.2 - 4.75 4.8 - 5.36 5.4 - 5.9 Total

ni

4 81510 5 850

Ni

41227374250

fi

.08

.16

.30

.20

.10

.161.0

Fi

.08

.24

.54

.74

.841.0

= 4.81

= 3.025

Determine : K3 , D1 , P35, y P74 , Q3

= 3.77

Si la variable X representa la utilidad en M$ por día determine: i.- ¿Cuál fue la utilidad máxima de los 15 días que ganó menos?

ii. ¿En cuántos días la utilidad fue de al menos M$ 5.0? 11 días

P74 = 4.75

M$ 3.67

15

6.0*12

100

50*3555.335

P

Q3 = 4.33

Page 43: Descriptiva

Prof.: David Becerra Rojas 43

MEDIDAS DE TENDENCIA CENTRAL

MODAMEDIANAMEDIA ARITMÉTICAMEDIA ARMÓNICAMEDIA GEOMÉTRICA

Page 44: Descriptiva

Prof.: David Becerra Rojas 44

MODA ( ó MODO)

La denotaremos por : Mo

a.- Está dada por la observación que más se repite ó la de mayor frecuencia.

b.- Es posible calcularla para cualquier tipo de variable.

c.- Pueden existir muchas o ninguna.

Page 45: Descriptiva

Prof.: David Becerra Rojas 45

MODA Ejemplo 1: Sean los siguientes datos:

F D R F T D R U D U U D

i Xi ni

1 F 22 D 43 R 24 T 15 U 3Total 12

Luego; en este caso la Moda es: Mo = D

Page 46: Descriptiva

Prof.: David Becerra Rojas 46

MODAEjemplo 2 : 2 3 5 1 1 5 2 5 4 2 4 2 5 1 6

i Xi ni

1 1 32 2 43 3 14 4 25 5 46 6 1Total 15

En este caso tenemos dos Mo:Mo1= 2 Mo2 = 5

Page 47: Descriptiva

Prof.: David Becerra Rojas 47

MODALa moda para datos tabulados, se obtiene a partir de la siguiente expresión:

Donde: Li : Limite real inferior del intervalo que contiene la Mo que es aquel que tiene mayor frecuencia

1 : Diferencia entre las frecuencias absolutas del intervalo modal y

el intervalo anterior.

2 : Diferencia entre las frecuencias absolutas del intervalo modal y

el intervalo posterior.

a : Amplitud del intervalo.

aLiM o *21

1

Page 48: Descriptiva

Prof.: David Becerra Rojas 48

i 1234

X 4 - 5 6 - 7 8 - 910 - 11T otal

ni

42 68102 38250

Ejemplo :

2*6434

345.7

oM = 8.19

Calcule la Moda

aLiM o *21

1

Page 49: Descriptiva

Prof.: David Becerra Rojas 49

MEDIANALa denotaremos como : MdPuntuación que divide la distribución de los datos (ó la muestra) en dos partes iguales.Es decir nos indica el punto hasta donde se tiene acumulado el 50% de las observaciones.Nota: - Para su determinación, los datos se ordenan previamente. - No tiene sentido cuando la variable es categórica nominal.

Page 50: Descriptiva

Prof.: David Becerra Rojas 50

MEDIANA

Si el número de observaciones impar, entonces la Md estará dada por la observación central.Si el número de observaciones par, entonces la Md estará dada por el promedio de las dos observaciones centrales.

Page 51: Descriptiva

Prof.: David Becerra Rojas 51

MEDIANAEjemplo: 1 2 3 5 7 9 10 27 29 30 38 40 n=11

En este caso la Md = 10

Ejemplo: 2 2,3 2,6 3,6 5,8 6,8 7,9 n=6

Luego ; Md = (3,6+5,8)/2 = 4,7

Page 52: Descriptiva

Prof.: David Becerra Rojas 52

MEDIANALa mediana para datos tabulados, se obtiene a partir de la siguiente expresión:

Donde: Li : Limite real inferior del intervalo que contiene la Md, que es aquel donde por primera vez la frecuencia acumulada pasa el 50%.

n : Tamaño de la muestra

N d-1 : Frec. acumulada anterior al intervalo que contiene la Mediana. n d : Frec. Absoluta del intervalo que contiene la Md

a : Amplitud del intervalo.

ddd n

aN

nLiM *

2 1

Page 53: Descriptiva

Prof.: David Becerra Rojas 53

Ejemplo: dado los siguientes datos:

MEDIANA

i Xi 1 42 53 64 75 86 9 Total

ni

3 2 2 3 4 317

Determine; Md

4 4 4 5 5 6 6 7 7 7 8 8 8 8 9 9 9

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Ni

3 5 7101417

Fi

.18

.29

.41

.59

.821.0

Md = 7

Page 54: Descriptiva

Prof.: David Becerra Rojas 54

Ejemplo de Mediana

i X 1 4 - 52 6 - 73 8 - 94 10 - 115 12 - 136 14 - 15 Total

ni

4 81518 2 350

Ni

41227454750

fi

.08

.16

.30

.36

.04

.061.0

Fi

.08

.24

.54

.90

.941.0

Luego la Md = 9.23

y la Moda Mo = 9.82

Determine; Md , Mo

15

2*12

25.7

n

M d

Page 55: Descriptiva

Prof.: David Becerra Rojas 55

Ejercicio.4.8 3.6 5.2 6.1 6.0 2.9 3.5 4.8 4.3 4.24.8 3.1 4.8 2.9 5.55.0 4.8 5.6 6.01.Calcular Mo , Md

2.Construya una tabla de frecuencia3.Calcule de la tabla Mo , Md.4.Comente.

Page 56: Descriptiva

Prof.: David Becerra Rojas 56

MEDIA ARITMÉTICALa media Aritmética también llamada Promedio ó simplemente Media, y esta dada para datos no tabulados por : (Se calcula solamente en variables numéricas)

Donde: Xi : Corresponde a las Observaciones

n : Tamaño de la Muestra

N : Tamaño de la Población

n

XX

n

ii

1

N

XN

ii

1

MuestralPoblacional

Page 57: Descriptiva

Prof.: David Becerra Rojas 57

Donde: Xi : Observación ó Marca de Clase

n : Tamaño de la muestra

ni : Frecuencia Absoluta de la observación o del intervalo

k : Número de intervalos

MEDIA ARITMÉTICA

Para datos Tabulados la Media está dada por :

n

XnX

k

iii

1

k

iiixf

1

Page 58: Descriptiva

Prof.: David Becerra Rojas 58

Ejemplo: La tabla siguiente representa una muestra de los años de servicio de trabajadores.

i12345

Xi 510121520

ni 4 7 8 3 224

Xi*ni 20 70 96 45 40271

fi0.1670.2920.3330.1250.0831.00

fixxi0.8352.9203.9961.8751.66011.286

--------------------------------------------

--------------------------------------------Total

Determine la Media:

5

1iiixfX = 11.286

5

1i

ii

n

xnX

286.1124

271X

Page 59: Descriptiva

Prof.: David Becerra Rojas 59

Ejemplo 2: Se toma una muestra de 21 observaciones, calcule la Media.

807.221

95.58

2.021

1595.2

i X1 2.3 - 2.42 2.5 - 2.63 2.7 - 2.84 2.9 - 3.05 3.1 - 3.26 3.3 - 3.4 Total

ni

4 5 3 2 4 321

xi

2.352.552.752.953.153.35

ni*xi

9.4012.758.255.9012.6010.0558.95

Luego como

ui

-3-2-1012

ni*ui

-12-10 -3 0 4 6-15

= 2.807an

unAX

k

iii

1

6

1i

ii

n

xnX

Page 60: Descriptiva

Prof.: David Becerra Rojas 60

MEDIA PONDERADA _ _ __ n1x1 + n2x2 +….+nkxk

xT = --------------------------------- n1 + n2+ …….+ nk

_ 100x480 + 300x320 + 400x Xc290 = --------------------------------------- 100 + 300 + 400

Ejemplo: En una empresa donde se distinguen tres tipos de trabajadores, el salario medio es de 290. Los 100 trabajadores de la categoría A tienen un salario medio de 480, los 300 de la categoría B tienen un salario medio de 320, ¿ Cuánto es el salario medio de los 400 de la categoría C?

_Luego Xc = 220

k

1i

x*nn

ii

Page 61: Descriptiva

Prof.: David Becerra Rojas 61

Tarea NºVentajas y Desventajas de: Moda, Mediana y Media.Defina y de un ejemplo de :Media Geométrica : (G)Media Armónica : (H)SesgoCurtosis

Page 62: Descriptiva

Prof.: David Becerra Rojas 62

Media Geométrica:

nnn xxxi

n

iG x *.....**

121

Media Armónica:

n

i ix

nH

1

1

Page 63: Descriptiva

Prof.: David Becerra Rojas 63

MEDIDAS DE DISPERSIÓN

Desviación Media: (DM)

Desviación Intercuartílica: (K)

Desviación Típica: ( s )

Varianza: ( s2 )

Rango: (R)

Page 64: Descriptiva

Prof.: David Becerra Rojas 64

MEDIDAS DE DISPERSIÓN

Rango: (R)

R = V. Máximo – V. Mínimo + 1 Unidad de Medida

Page 65: Descriptiva

Prof.: David Becerra Rojas 65

MEDIDAS DE DISPERSIÓN

Desviación Intercuartílica: (K)

213 KKK

Page 66: Descriptiva

Prof.: David Becerra Rojas 66

MEDIDAS DE DISPERSIÓN

Desviación Media: (DM)

Para datos No Tabulados

Para datos Tabulados

n

XX

DM

n

1i

i

n

XXnDM

k

iii

1

Page 67: Descriptiva

Prof.: David Becerra Rojas 67

MEDIDAS DE DISPERSIÓN

Varianza: (s2 ,2)

Poblacional

Muestral : Para datos No Tabulados

1

1

2

2

n

XXS

n

ii

)1n(n

xxn

2n

1i

i

n

1i

2i

21

2

1

2

2

)(

N

x

N

xN

ii

N

ii

Page 68: Descriptiva

Prof.: David Becerra Rojas 68

MEDIDAS DE DISPERSIÓN

1

1

2

2

n

XXnS

k

iii

)1(

2

11

2

nn

xnxnnk

iii

k

iii

Muestral : Para datos Tabulados

Page 69: Descriptiva

Prof.: David Becerra Rojas 69

Ejemplo

65

30X

5.7

4

30

11

2

2

n

XXS

n

ii

25

101

n

XXDM

n

ii

Obs. : x1 x2 x3 x4 x5 TotalXi : 2 5 6 8 9 30

Determinar: Desv Media Varianza

___

xi - x : - 4 -1 0 2 3 0 _ xi - x : 4 1 0 2 3 10 _(xi - x)2: 16 1 0 4 9 30

Sean las edades ( en año) de 5 niños

X2i : 4 25 36 64 81 210

5.7

4*5

30210*5

)1(

2

2

11

2

2

nn

xxn

S

n

ii

n

ii

Page 70: Descriptiva

Prof.: David Becerra Rojas 70

MEDIDAS DE DISPERSIÓNDesviación Típica: (S , σ)

1n

XX

S

n

1i

2i

)1(

2

11

2

nn

xxnn

ii

n

ii

21

2

1

2)(

N

x

N

xN

ii

N

iiPoblacional:

Muestral : Para datos No Tabulados

Page 71: Descriptiva

Prof.: David Becerra Rojas 71

MEDIDAS DE DISPERSIÓN

Para datos Tabulados

1

1

2

n

XXnS

k

iii

)1(

2

11

2

nn

xnxnnk

iii

k

iii

Page 72: Descriptiva

Prof.: David Becerra Rojas 72

COEFICIENTE DE VARIACIÓN

X

SCV

Mide la homogeneidad que existe en los datosRespecto a la variable en estudio.Mientras más pequeño, más homogéneo.

Page 73: Descriptiva

Prof.: David Becerra Rojas 73

Ejemplo 2

75.219

25.52: 1

n

xnXqueSabemos

k

iii

)119(19

25.52)61.145(19 2

i123456

X2.3 - 2.42.5 - 2.62.7 - 2.82.9 - 3.03.1 - 3.23.3 - 3.4

ni

45324119

xi

2.352.552.752.953.153.35

nixxi

9.4012.758.255.9012.603.3552.25

= 0.327

nixxi2

22.09 32.51 22.69 17.41 39.69 11.22145.61

Calcule: la Media , Desv. Típica

)1(

2

11

2

nn

xnxnn

S

n

iii

n

iii

119.075.2

327.0

x

sCV

Page 74: Descriptiva

Prof.: David Becerra Rojas 74

Ejemplo 2

an

unAX

k

iii

1

)119(19

19)67(192.0

2

)1(

2

11

2

nn

ununn

aS

n

iii

n

iii

i123456

X2.3 - 2.42.5 - 2.62.7 - 2.82.9 - 3.03.1 - 3.23.3 - 3.4

ni

45324119

xi

2.352.552.752.953.153.35

ui

-3-2-1012

ni*ui

-12-10 -3 0 4 2-19

= 2.75

ni*ui2

3620 3 0 4 467

= 0.327

Calcule: la Media , Desv. Típica por el Medio Provisorio

2.019

)19(95.2

Page 75: Descriptiva

Prof.: David Becerra Rojas 75

Coeficiente de Asimetría ( Sesgo )

Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y negativo cuando existe asimetría a la izquierda.

de Pearson

de Fisher33

1

331 )(

1

Sxxn

S

k

iii

Page 76: Descriptiva

Prof.: David Becerra Rojas 76

Coeficiente de Curtosisi

caPlaticúrti

aMesocúrtic

caLeptocúrti

:0

:0

:0

2

2

2

33)(

144

1

442

Sxxn

S

k

iii

Page 77: Descriptiva

Prof.: David Becerra Rojas 77

Estadística Descriptiva Bivariante

Page 78: Descriptiva

Prof.: David Becerra Rojas 78

Sean las siguientes variables:

X : A1, A2, ...................Af

Y : B1, B2,.....................Bc

Estas variables, se pueden ordenar en una tabla de doble entrada llamada Tabla de Contingencia:

Estadística Descriptiva Bivariante

Page 79: Descriptiva

Prof.: David Becerra Rojas 79

Tabla de Contingencia

X \ Y B1 B2 ..Bj .. Bc Total A1 n11 n12 : n1. A2 n21 n22 : n2. Ai ……. ……. nij ……. ni. : : : Af : nf. Total n.1 n.2 ... n.j ..... n.c n

Page 80: Descriptiva

Prof.: David Becerra Rojas 80

Frecuencia Absoluta(Conjunta)

Se denota por nij y se define como: Cantidad de elementos que cuentan simultáneamente con la característica Ai de la variable X y Bj de la variable Y

Page 81: Descriptiva

Prof.: David Becerra Rojas 81

Frecuencia AbsolutaMarginal

ni.: Total de la fila i = nij

n.j : Total de la Columna j = nij

n.. : Total General = nij = n ( Tamaño muestra) i=1 j=1

j=1

c

f

f c

i=1

Page 82: Descriptiva

Prof.: David Becerra Rojas 82

Frecuencia RelativaConjunta

Se denota por fij = nij

n

Page 83: Descriptiva

Prof.: David Becerra Rojas 83

Frecuencia Marginal Relativa

fi. = fij =

f.j = fij =

f.. = fij = 1 i=1 j=1

j=1

c

f

f c

i=1

n

n

n.j

ni.

Page 84: Descriptiva

Prof.: David Becerra Rojas 84

Frecuencia Condicional

.. i

ij

i

ij

ij n

n

f

ff

j

ij

j

ij

ji n

n

f

ff

..

De x dado y ( x/y):

De y dado x ( y/x):

Page 85: Descriptiva

Prof.: David Becerra Rojas 85

Independencia de Variables

Diremos que dos variables X e Y son independientes si y solo si, la conjunta es igual al producto de las marginales, para todo i, y para todo j. Es decir;

n

nnno

fff

jiij

jijiij

..

..

*

,*

Page 86: Descriptiva

Prof.: David Becerra Rojas 86

Estadística Descriptiva Bivariante

Ejemplo: Considere una muestra de contenedores en un recinto portuario.

Sea X : Peso (toneladas) Y : País de origen

Determine e Interprete : f = n51 =

f34 =

n.. =n.3 =n2. =

fj=4/i=3 =fi=4/j=3 =f.2 =f4. =

c=5 4 8 27 24 121

10/121 24/121 33/121 7/24 10/25

0.083 0.20 0.27 0.29 0.40

X \ Y Francia Alemania Japón España Total

5 – 10 4 5 4 10 23

10 - 15 8 7 10 2 27

15 - 20 3 9 3 10 25

20 - 25 1 10 7 6 24

25 - 30 8 2 0 12 22

Total 24 33 24 40 121

Page 87: Descriptiva

Prof.: David Becerra Rojas 87

Asociación de Variables Numéricas

i12...n

Xx1

x2

.

.

.xn

Yy1

y2

.

.

.yn

Diagrama de Disperción

Variable X

Y

Page 88: Descriptiva

Prof.: David Becerra Rojas 88

Tipos de Asociación

Favorable :

. .

. . .

....

..

y

x

Inversa:

... ..

....

.

x

y

xi xj xjxi

yj

yi

yi

yj

Page 89: Descriptiva

Prof.: David Becerra Rojas 89

Sea X: Remuneración Y: Cargas

Familiares

1 1 3 4 4 5

2 3 3 5 2 6

-2 -1.5 -2 -0.5 0 -0.5 1 1.5 1 -1.5 2 2.5

123456

Ejemplo:

3 1 0 1.5 -1.5 5

)()( yyxx ))(( yyxx yxi

Total 18 21

Media 3.0 3.5 --------- 1.50 0 9

Page 90: Descriptiva

Prof.: David Becerra Rojas 90

Covarianza ( cov (x,y) )

n

yyxxyxCov

))((

),(

5.16

9),( yxCov

Page 91: Descriptiva

Prof.: David Becerra Rojas 91

Coeficiente de Correlación

-1 r 1r : Se expresa en porcentaje

yx ss

yxCovr

*

),(

))()()(( 2222 yynxxn

yxxynr

Page 92: Descriptiva

Prof.: David Becerra Rojas 92

X11344518

Y23352621

XY 2 3 920 830 72

i 1 2 3 4 5 6Total

X2

1 1 916162568

En nuestro caso tenemos:

Y2

4 9 925 43687

= 0.65)2187*6)(1868*6(

21*1872*622

))()()(( 2222 yynxxn

yxxynr

Page 93: Descriptiva

Prof.: David Becerra Rojas 93

Regresión Lineal

Y = a + bX

Consiste en ajustar a los datos (representados en el diagrama de Dispersión, una línea, que puede ser rectao curvilínea .

En esta oportunidad analizaremos el caso de la línea recta.Esta recta, también sirve para marcar la tendenciaDe los datos, para hacer proyecciones, y para estimaralgún valor de y dado un valor de x.

Page 94: Descriptiva

Prof.: David Becerra Rojas 94

Error: iii yye ˆ

Varianza del Error: (2)cuyo estimador está dado por:

2

)ˆ( 222

n

yySS ii

xye

Oyye iii )ˆ(

Page 95: Descriptiva

Prof.: David Becerra Rojas 95

Debemos minimizar la varianza del Error

Para tal efecto debemos minimizar:

22 )()ˆ( iiii bxayyyA

Es decir derivar A

Page 96: Descriptiva

Prof.: David Becerra Rojas 96

0

0

b

Aa

A

Sistema de Ecuaciones Normales

Page 97: Descriptiva

Prof.: David Becerra Rojas 97

ii

ii

yxbna

bxaya

A0)1()(2

Luego tenemos:

iiii

iii

yxxbxa

xbxayb

A

2

0))((2

Page 98: Descriptiva

Prof.: David Becerra Rojas 98

xyxbxa

yxbna

ii

i

2

Por lo tanto, el sistema de Ecuaciones Normalesqueda de la siguiente forma:

Page 99: Descriptiva

Prof.: David Becerra Rojas 99

Por determinante tenemos;

222 xxn

xx

xn

xyxxy

xxy

xya

22

yxxyn

xyx

ynb

aa

bb

Page 100: Descriptiva

Prof.: David Becerra Rojas 100

Estimadores Mínimos Cuadrado

22

2

)x(xn

xyxxya

22 )x(xn

yxxynb

a

b

XbY

Page 101: Descriptiva

Prof.: David Becerra Rojas 101

X11344518

Y23352621

XY 2 3 920 830 72

i 1 2 3 4 5 6Total

X2

1 1 916162568

En el caso que estamos analizando tenemos:

Y2

4 9 925 43687

^

Y2.22.23.54.14.14.8

( e )

^

Y - Y-0.2 0.8-0.5 0.9-2.1 1.2 0.0

( e2 )

^

(Y – Y)2

0.04 0.64 0.25 0.81 4.41 1.44 7.59

y la varianza del error es 898.14

59.7

2

)ˆ( 22

n

yyS ii

xy

Luego tenemos que;

57.1

18)68(

)72)(18()68)(21(2

n

a 64.0

18)68(

)21)(18()72(62

n

b

Page 102: Descriptiva

Prof.: David Becerra Rojas 102

Error Típico: ( )

38.1898.14

59.7

2

)ˆ( 22

n

yySS ii

exy

2

2

n

xybyaySS

xye

También se puede obtener a partir de:

Page 103: Descriptiva

Prof.: David Becerra Rojas 103

Coeficiente de Determinación

El coeficiente de Determinación, nosindica la variabilidad explicada por la rectade regresión lineal, es decir que tan buenoes el ajuste de la recta.

Esta dado por: r2

0 r2 1

Nota: Referencia para el ajuste, también lo da

el error típico Sy/x

Page 104: Descriptiva

Prof.: David Becerra Rojas 104

Ejemplo:Supongamos que tenemos dos variables: X : Años de servicio de vendedores.

Y : Ventas en M$

Vendedor 1 2 3 4 5 6Total

X22344520

Y1.22.44.13.12.43.817.0

XY2.44.8

12.312.4

9.619.060.5

X2

449

16162574

Y2

1.445.76

16.819.615.76

14.4453.82

1. Confeccione un diagrama de dispersión2. Determine el grado de asociación entre las variables3. Estime a través de una recta de m. c. ¿cuanto debiera vender

un vendedor con siete años de servicio?. 4. Estime a través de una recta de m. c. ¿cuanto años de servicio

debería tener, un vendedor que vende m$ 4.0?.

Page 105: Descriptiva

Prof.: David Becerra Rojas 105

)2.)17(.)82.53(6)(2.)20(.)74(6(

.)17.)(20()5.60(6

)2)y(2yn)(2)x(2xn(

yxxynr

222 )20()74(6

)17)(20()5.60(6

)x(xn

yxxynb

222

2

)20()74(6

)5.60)(20()74)(17(

)x(xn

xyxxya

Luego:

1.09

.523

=.5954

Page 106: Descriptiva

Prof.: David Becerra Rojas 106

Varianza del Error:

Error Típico:

22

)ˆ( 222

n

xybyay

n

yyS ii

xy

22

)ˆ( 22

n

xybyay

n

yyS ii

xy =.9552

=.9124

Page 107: Descriptiva

Prof.: David Becerra Rojas 107

Las propiedades de la media son las siguientes:- La media de una constante es la propia constante.- La media de la suma o diferencia de variables es igual a la suma o diferencia de las medias de dichas variables.- La media del producto de una constante por una variable, es igual a la constante por la media de la variable.- La media de una combinación lineal de dos o más variables es igual a la combinación lineal de las medias de dichas variables.- La media es el centro de gravedad de la distribución, ya que las desviaciones respecto a la media suman 0.

- Mediana: La mediana es el valor del elemento que ocupa el lugar central, si los datos están ordenados, bien de forma creciente o de forma decreciente.- Moda: La moda es el valor más frecuente, es decir es el valor de la variable que se repite un mayor número de veces.En el caso de una distribución totalmente simétrica, la media y la mediana coinciden. Si la media y la mediana difieren mucho significa que hay heterogeneidad entre los datos y que la distribución, por tanto será asimétrica.

Page 108: Descriptiva

Prof.: David Becerra Rojas 108

Las propiedades de la varianza son:- La varianza es siempre positiva o cero.- La varianza de una constante es cero.- La varianza de la suma o diferencia de una variable y una constante es igual

a la varianza de la variable.- La varianza de un producto de una constante por una variable es igual al

cuadrado de la constante por la varianza de la variable.

Las propiedades de la desviación típica son:- La desviación típica es siempre positiva o cero.- La desviación típica de una constante es cero.- La desviación típica de una constante por una variable es igual a la

constante por la desviación típica de la variable.- La desviación típica de la suma o diferencia de una variable y una constante

es igual a la desviación típica de la variable.

Page 109: Descriptiva

Prof.: David Becerra Rojas 109

Teorema 3.5.5. (Propiedades de )   Para una distribución bien definida, el operador de valor esperado cumple:

Escala:

Adición:

Independencia: si X e Y son independientes.

Composición:

No desviado:

Page 110: Descriptiva

Prof.: David Becerra Rojas 110

Teorema 3.5.6. (Propiedades de la varianza)   Para una distribución bien definida, la varianza cumple:

Origen:

Adición: si X e Y son independientes.

Escala:

Page 111: Descriptiva

Prof.: David Becerra Rojas 111

Ejercicio:X \ Y Chilena Argentina Peruana Brasileña Total 5 – 10 4 2 4 10 20 10 – 15 8 3 1 12 24 15 – 20 3 9 3 10 25 20 – 25 0 10 1 10 21 25 - 30 5 2 0 15 22 Total 20 26 9 57 112

Determine:1.- Cuántos turistas chilenos app llevan un peso no superior a 12kr.2.- ¿Podemos decir que el comportamiento del peso que llevan los turistas argentinos , es mas homogéneo del que llevan los brasileros? 3.- Determine e interprete:4.- Determine el grado de asociación respecto al peso de equipaje, entre los turistas chilenos y argentinos.5.- A través de una recta de m. c. estime cuántos turistas deberían llevar un peso 27.5kr

Se toma una muestra de 112 turistas registrando el peso de equipaje y nacionalidad.

fj=1/i=2 =

Page 112: Descriptiva

Prof.: David Becerra Rojas 112

Cuartiles

Li : Limite real inferior del intervalo que contiene el cuartil t, que es aquel donde por primera vez la frecuencia acumulada pasa el (k/4x100)%.

kkk n

aN

nkLiK *

4

*1

Page 113: Descriptiva

Prof.: David Becerra Rojas 113

Quintiles( Qq ) q = 1,…..,99

Li : Limite real inferior del intervalo que contiene el percentil q, que es aquel donde por primera vez la frecuencia acumulada pasa el (q%)

qqq n

aN

nqLiQ *

5

*1

Page 114: Descriptiva

Prof.: David Becerra Rojas 114

Deciles( Dd ) d = 1,….,9

Li : Limite real inferior del intervalo que contiene el decil d, que es aquel donde por primera vez la frecuencia acumulada pasa el (d*10)%

ddd n

aN

ndLiD *

10

*1

Page 115: Descriptiva

Prof.: David Becerra Rojas 115

Percentiles( Pp ) p = 1,…..,99

Li : Limite real inferior del intervalo que contiene el percentil p, que es aquel donde por primera vez la frecuencia acumulada pasa el (p%)

ppp n

aN

npLiP *

100

*1