curso probabilidad y estadisticas fms175...

30
CURSO PROBABILIDAD Y ESTADISTICAS FMS175 PROFESOR RODOLFO TORO DEPARTAMENTO DE FISICA Y MATEMATICAS UNIVERSIDAD NACIONAL ANDRES BELLO

Upload: lykhue

Post on 09-Sep-2018

219 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

CURSO PROBABILIDAD Y ESTADISTICAS

FMS175

PROFESOR RODOLFO TORO

DEPARTAMENTO DE FISICA Y MATEMATICAS

UNIVERSIDAD NACIONAL ANDRES

BELLO

Page 2: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

EL MÉTODO CIENTÍFICO La Estadística, constituye así, una disciplina científica extremadamente amplia y que puede ser conceptualizada desde enfoques diferentes e incluso contrapuestos. No es raro, por tanto, que se hayan propugnado para ella distintas definiciones que en el fondo, implican diferentes visiones sobre lo que constituye la característica esencial de esta ciencia como instrumento insustituible para grandes empresarios, asignatura despreciable para muchos estudiantes y una gran desconocida para todos, o casi todos.

ESTADÍSTICA

Se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. Estadística descriptiva: Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. Estadística inferencial: Apoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos. Quien utiliza la estadística Campo de la investigación de las Ciencias Sociales: Medicina, Biología, Psicología, Economía, etc. Tipos de variables estadísticas Discretas : Aquellas que toman valores aislados (números naturales), y que no pueden tomar ningún valor intermedio entre dos consecutivos fijados, por ejemplo: número de goles marcados, núm. de hijos, numero de discos comprados, número de pulsaciones. Continuas : Aquellas que toman infinitos valores (números reales) en un intervalo dado, de forma que pueden tomar cualquier valor intermedio, al menos teóricamente, en su rango de variación, por ejemplo: talla, peso, presión sanguínea, temperatura. Tipos de Caracteres El carácter es, por tanto una cualidad o propiedad inherente en el individuo. Cualitativos : aquellos que son categóricos, pero no son numéricos, por ejemplo color de los ojos, profesión, marca de auto. Ordinales : aquellos que pueden ordenarse, pero no son numéricos, por ejemplo: preguntas de encuesta sobre el grado de satisfacción de algo; mucho, poco, nada. Bueno, regular, malo. Cuantitativos : son numéricos. Ejemplo: peso, talla, número de hijos, número de libros leídos al mes.

Page 3: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

TIPOS DE GRÁFICOS

Representación de tronco y hoja ejemplo que contiene las calificaciones obtenidas en una prueba de matemáticas:

78 93 61 100 70 83 88 74 97 72 66 73 76 81 83 64 91 70 77 86

Ahora pensaremos en cada uno de los datos separando las decenas de las unidades, es decir, el número 51 se verá como 5 | 1. De esta manera las decenas se pondrán en una columna, en forma vertical, y las unidades a su derecha:

6 7 8 9 10

1 6 4 8 0 4 2 3 6 0 7 3 8 1 3 6 3 7 1 0

Para entenderle un poco más, hemos de decir que el primer renglón que dice 6 | 1 6 4 quiere decir que entre la lista de datos se encuentran los valores 61, 66 y 64. Esta es la representación gráfica tronco y hoja, donde cada renglón es una posición de tronco y cada dígito de la derecha es una hoja. Para las distribuciones de frecuencias la representación gráfica más común es el histograma.

Un tipo de gráfico muy parecido al histograma es la gráfica de columnas. Es interesante observar que la escala horizontal no es continua (es nominal).

Page 4: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

También es posible realizar gráficas de barras horizontales

Gráficas de líneas, que consisten en una serie de puntos trazados en las intersecciones de las marcas de clase y las frecuencias de cada una, uniéndose consecutivamente con líneas líneas:

Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar parcialmente la misma técnica a una distribución acumulativa y de igual manera que éstas, existen las ojivas mayor que y las ojivas menor que.

Page 5: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por ésto la aplicación de la técnica es parcial): Un extremo de la ojiva no se "amarra" al eje horizontal, para la ojiva mayor que sucede con el extremo izquierdo; para la ojiva menor que, con el derecho. En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor. Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor que, utilizando los datos que se usaron para ejemplificar el histograma:

La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que está sobre la frontera de clase "4:00" se ven las visitas que se realizaron en una hora mayor que las 4:00 horas (en cuestiones temporales se diría: después de las 4:00 horas). De forma análoga, en la ojiva menor que la frecuencia que se representa en cada frontera de clase son el número de observaciones menores que la frontera señalada (en caso de tiempos sería el número de observaciones antes de la hora que señala la frontera). Si se utiliza una distribución porcentual acumulativa entonces se obtiene una ojiva (mayor que o menor que según sea el caso) cuyo eje vertical tiene una escala que va del 0% al 100%. El siguiente ejemplo es la misma ojiva menor que que se acaba de usar, pero con una distribución porcentual:

Cuando se pretende ilustrar la dispersión de las observaciones realizadas, y así trabajar algunas cosas como correlaciones se puede utilizar una gráfica de dispersión.

Page 6: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

Tablas Estadísticas A partir de este momento nos vamos a ocupar de las estadísticas de una sola variable, "Estadísticas Unidimensionales". Las tablas estadísticas según el número de observaciones y según el recorrido de la variable estadística, así tenemos los siguientes tipos de tablas estadísticas: Métodos de Agrupación de Datos Pueden utilizarse varias herramientas básicas para describir y resumir un conjunto grande de datos. La manera más simple, pero quizás la más significativa, es la serie ordenada (13, 23, 35, 47...). Distribución de frecuencias (o tabla de frecuencia) : ordenará los datos si estos se dividen en clases y se registrará el número de observaciones en cada clase.

Tabla Unidimensional

Variable Frecuencia Frecuencia Frec. obser. Frec. relativaX absoluta relativa acumulada acumulada

xi ni fi ó pi Ni Fi

x1 n1 f1 = n1 / n N1 = n1 F1 = f1x2 n2 f2 = n2 / n N2 = n1 + n2 F2 = f1 + f2x3 n3 f3 = n3 / n N3 = n1 + n2 + n 3 F3 = f1 + f2 + f 3. . . . .. . . . .

xp np fp = np / n Np = n Fp = 1n 1

Page 7: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

El número de clases En una tabla de frecuencia es algo arbitrario, pero demasiadas clases sería algo confuso. Se puede seguir una regla simple para determinar el número de clase a utilizar.

nc ⟩2 La Marca de la clase Se calcula como el promedio de los límites superior e inferior de dicha clase.

21 ii XXYi +

= −

Intervalos de clase : Es el rango de valores encontrados dentro de una clase. Se determina restando el límite superior (o inferior) de una clase del límite inferior (o superior) de la clase siguiente. Es deseable que todos los intervalos de clase sean de igual tamaño, ya que facilita interpretación estadística.

clasesNXX

icº

minmax −=

Las frecuencias ni = Frecuencia absoluta ni fi = Frecuencia relativa 0 < fi < 1 fi = ni / N Ni = Frecuencia absoluta acumulada Nj = Nj-1 + nj Fi = Frecuencia relativa acumulada Fj = Fj-1 + fj

Ejemplo Ilustrativo Distribución de los alumnos del curso según estatura en cm.

152 - 170 - 178 - 172 - 165 - 182 - 160 187 - 175 - 175 - 173 - 174 - 165 - 158

172 - 177 - 173 - 181 - 172 - 180

n = 20 Xmín = 152 cm. Xmáx = 187 cm Determinar número de clases:

In terva lo s M arcad e c lase d e c lases

x i-1 - x i x i

x 0 - x 1 x 1x 2 -1 - x 2 x 2x 3 -1 - x 3 x 3

. .

. .x p -1 - x p x p

Observe que cada clase tiene un límite inferior y unlímite superior. Los valores exactos de estos límitesson muy importantes. Si los datos en una tabla defrecuencia son continuos, es necesario permitirvalores fraccionarios.

Page 8: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

2 C > 20, despejando C = 4.3 lo que implica aproximar a 5 clases. Determinar el intervalo de clase:

ic = 187 - 152 = 7 cm. 5

Tabulación Bidimensional . Tablas de Contingencia

N.Clase Intervalo de clase

Marca clase F.Absoluta F.Absoluta Acumulada

F. relativa

F. Relativa Acumulada

ii XX −−1

iY Ni Ni fi Fi

1 152 –159 155.5 2 2 0.1 0.1

2 159 – 166 162.5 3 5 0.15 0.25

3 166 – 173 169.5 6 11 0.3 0.55

4 173 – 180 176.5 6 17 0.3 0.85

5 180 - 187 183.5 3 20 0.15 1

xi : nivel de ingreso i: 1 , 2 , ...., k (fila) yi : tipo de fabrica j: 1 , 2 , ...., l (columna)

X I Y 1 Y 2 Y 3 . . . . . . . . . . . . . . . . Y L n i .

x 1 n 1 1 n 1 2 . . . . . . . . . . . . . . . . . . . . . . . . n 1 L n 1 .

x 2 n 2 1 n 2 2 . . . . . . . . . . . . . . . . . . . . . . . . n 2 L n 2 .

.....

.....

.....

..... n 3 .

.....

.....

..... n i j .....

.....

.....

.....

.....

.....

.....

x k n k 1 n k 2 . . . . . . . . . . . . . . . . . . . . . . . . n k L n K .

n . j n .1 n .2 . . . . . . . . . . . . . . . . . . . . . . . . n .L n

Y j

nij : Frecuencia absoluta conjunta ni. : Frecuencia absoluta marginal de la variable Xi n.j : Frecuencia absoluta marginal de la variable Yi n : Número total de observaciones, igual a la suma de las frecuencias absolutas conjuntas fij = nij / n : Frecuencia relativa conjunta fi. : Frec. relativa marginal de la variable XI fi. = ni. / n n.j : Frec. relativa marginal de la variable YI f.j = n.j / n

n = n ; n . = n ; n . = nij i jj=1

L

i=1

k

j=1

L

i=1

k

∑∑∑∑

Page 9: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

Medidas de tendencia Central (posición) y de Dispersión Medida de la tendencia central (media) : ubica e identifica el punto alrededor del cual se centran los datos. Medidas de dispersión : indican el punto hasta el cual las observaciones individuales se esparcen alrededor de su punto central. Miden la dispersión o la variabilidad de los datos y reflejan la tendencia de las observaciones individuales a desviarse de dicho punto central. Características de los datos: medidas de resumen descriptivas Las medidas de resumen descriptivas son útiles para analizar e interpretar datos cuantitativos, ya sean recolectados en forma bruta (datos no agrupados) o resumidos en distribuciones de frecuencia (datos agrupados, que son de interés para el director e investigador). Propiedades de los datos En orden descendente de importancia, las tres propiedades o características mayores que describen un conjunto de datos pertenecientes a alguna variable numérica aleatoria o a un fenómeno de interés, son : 1.- Posición 2.- Dispersión 3.- Forma Si las medidas de resumen descriptivas se calculan con una muestra de datos se llama estadísticos, si estas medidas descriptivas se calculan a partir de toda una población de datos se llama parámetros.

MEDIDAS DE POSICIÓN

La característica más importante que describe o resume un grupo de datos es su posición. La mayor parte de los conjuntos de datos muestran una tendencia definida a agruparse o reunirse en torno a un cierto punto. Este valor típico descriptivo se llama promedio. Es una medida de tendencia central o posición.

Para datos No agrupados La media aritmética muestral : Se calcula a partir de datos, ya sea recopilados en forma bruta o colocados en arreglo ordenado.

n

XX

n

ii∑

== 1

: Media aritmética de la muestra n : Tamaño de la muestra Xi : iésima observación de la variable aleatoria X Propiedades

X

1 0

2

3

1

2 2

11

. ( )

. ( ) ( )

.

− − =

− − ≤ −

≠−

=

==

∑∑

X X

X X X A

Ii

n

I Ii

n

i

n

Donde X A Valor total de la poblacion

Total = N X4.- El calculo de la media se basa en cada observacion por esa razon X puede ser influenciado a subir o bajar segun sea el caso.

Page 10: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

La media aritmética Poblacional

N

XN

ii∑

== 1µ

La media Ponderada (caso especial de la media aritmética)

n

N

inn

w WWW

XWXWX

+++

++=∑=

.......

...........

21

111

La media Geométrica

nn XXXMG *......** 21=

La mediana Es una medida de tendencia central que aparece en el “medio” de una sucesión ordenada de valores. Dado que cualquier valor (o valores) extremo en un conjunto de datos distorsionan tanto la media aritmética, es más apropiado utilizar la mediana, ya que no se afecta con cualquiera valores extremos en un conjunto. Para calcular la mediana a partir de un conjunto de datos recopilados en forma bruta, primero hay que disponerlos en un arreglo ordenado. Caso A: Si es impar:

32 42 46 46 54 el valor de la mediana es 46 Caso B: Si es par:

2 8 9 12 13 18 21 25 Existen 2 valores intermedios

Mediana = ( 12 + 13) 2

Ubicación de la Mediana Si el número de observaciones en la muestra es un impar, la mediana se representa con el valor numérico de observación ordenada :

2)1( +

=nMe

Ejemplo:

Numero elementos 1 2 3 4 5 6

Valor elemento 25 29 30 32 35 35

( 6 + 1) = 3.5 2 3.5 ubicación, valor mediana de (30+32)/2 = 31

Page 11: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

Si el número de observaciones es par, la mediana se representa con la media o promedio de los dos valores intermedios en el arreglo ordenado. El modo : Es el valor más típico o más común en un conjunto de datos. No es afectado por la ocurrencia de cualquiera valores extremos. Se obtiene con facilidad en un arreglo ordenado. Cuando una observación no es común no hay modo. Es el valor que más se repite. Para datos agrupados La media aritmética

n

YnX

N

iii∑

== 1

ni : frecuencia Yi : marca de clase La mediana (Me):

icn

Nn

XMei

i

i *2.1

1

−+=

1−iX : frontera inferior del intervalo de clase que contiene la mediana ni : número de observaciones en el intervalo de clase que contiene la mediana Ni-1 : número total de observaciones antes del intervalo de clase que contiene la mediana ic : ancho de cada intervalo de clase n / 2 : observación mediana

Como el tamaño de la muestra es N=20, buscamos el intervalo en el que la Frecuencia acumulada es mayor que 20/2=10, que en este caso es el 3º y aplicamos la fórmula anterior. Luego la Mediana será:

83,1717*6

5220

166 =

−+=Me

Intervalo de clase

F. Absoluta

F.Absoluta Acumulada

ii XX −−1 ni Ni

152 –159 2 2

159 – 166 3 5

166 – 173 6 11

173 – 180 6 17

180 - 187 3 20

Page 12: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

Moda (Mo): observación que más se repite de las observaciones

icnnnn

nnXMo

iii

iii *

))((.

11

11

−−

−+=

+−

−−

Simetrías de distribución Asimetrías X > Mediana :Positivo o sesgamiento a la derecha (moda<mediana<media) X = Mediana :Simétricos o con sesgamiento cero X < Mediana :Negativos o sesgamiento a la izquierda (media<mediana<moda) Moda Mediana Media

1667*)66)(36(

36166 =

−−

−+=Mo

Intervalo de clase

F. Absoluta

F.Absoluta Acumulada

ii XX −−1 ni Ni

152 –159 2 2

159 – 166 3 5

166 – 173 6 11

173 – 180 6 17

180 - 187 3 20

Page 13: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

Cuartiles Divide los datos ordenados en cuatro cuartos Q1 = primer cuartil, el 25% de las observaciones son menores y el 75% son mayores. Q2 = segundo cuartil, el 50% de las observaciones son menores y el 50% son mayores. Q3 = tercer cuartil, el 75% de las observaciones son menores y el 25% son mayores. Para tener la posición aproximada a los cuartiles, se utilizan las siguientes fórmulas : Q1 = n / 4 Q2 = 2 (n ) / 4 Q3 = 3 (n ) / 4 a.- Valor entero, se selecciona la observación particular correspondiente al punto de posición. b.- Valor esta en la mitad entre dos puntos de posición, se selecciona la media. c.- Valor no es entero y no se encuentra en la mitad, se utiliza regla empírica para aproximar al cuartil particular y redondearlo al punto de posición del entero más cercano. Primer cuartil:

icn

Nn

XQiQ

i

Qi *4.1

1

111

−+=

Q1 : primer cuartil

1−iX : frontera inferior del intervalo de clase que contiene el primer cuartil

1iQn : número de observaciones en el intervalo de clase que contiene el primer cuartil

11QiN − : número total de observaciones antes del intervalo de clase que contiene el primer cuartil ic : ancho del intervalo de clase que contiene el primer cuartil n / 4 : observación del primer cuartil Q1 = 20 / 4 = 5

7*3

24

20

1591

−+=Q

Intervalo de clase

F. Absoluta

F.Absoluta Acumulada

ii XX −−1 ni Ni

152 –159 2 2

Q1 159 – 166 3 5

166 – 173 6 11

173 – 180 6 17

180 - 187 3 20

Page 14: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

Segundo cuartil:

icn

Nn

XQiQ

i

Qi *42

.2

1

212

−+=

Q1 = 2*20 / 4 = 10

Tercer cuartil:

icn

Nn

XQiQ

i

Qi *43

.3

1

313

−+=

83,1717*6

5420*2

1662 =

−+=Q

Intervalo de clase

F. Absoluta

F.Absoluta Acumulada

ii XX −−1 ni Ni

152 –159 2 2

159 – 166 3 5

Q2 166 – 173 6 11

173 – 180 6 17

180 - 187 3 20

66,1777*6

11420*3

1733 =

−+=Q

Intervalo de clase

F. Absoluta

F.Absoluta Acumulada

ii XX −−1 ni Ni

152 –159 2 2

159 – 166 3 5

166 – 173 6 11

Q3 173 – 180 6 17

180 - 187 3 20

Page 15: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

Percentiles: Medida de localización que divide la población o muestra en 100 partes iguales. No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver sólo para las variables continuas. pk = Percentil k-simo es aquel valor de la variable que deja a su izquierda el k % de la distribución.

icn

NNkXP

iPk

i

ik *100* 1

1

−+=

Por último veamos el percentil 45 (45·20/100 = 9) Corresponde al intervalo 3º.

Medidas de Dispersión Rango o recorrido Es la diferencia existente entre el valor mayor y el menor de la distribución. Para una muestra de tamaño n, el recorrido es la diferencia entre las observaciones más grande y la más pequeña :

minmax XXR −= El recorrido intercuartílico evita el problema de los valores extremos en los datos. Esta simple medida considera la extensión en el 50% medio de los datos y, por tanto, no sufre ninguna influencia de los valores extremos

Recorrido intercuartílico = Q3 - Q1 Para datos no agrupados La varianza de una muestra (S2) :

67,1707*6

510020*45

16645 =

−+=P

Intervalo de clase

F. Absoluta

F.Absoluta Acumulada

ii XX −−1 ni Ni

152 –159 2 2

159 – 166 3 5

P45 166 – 173 6 11

173 – 180 6 17

180 - 187 3 20

Page 16: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

mide el promedio del cuadrado de las diferencias entre cada observación y su media.

1

)(1

2

2

−=∑=

n

XXS

n

Ii

Desviación estándar muestra ( S ) : mide la raíz cuadrada del promedio del cuadrado de las diferencias alrededor de la media.

1

)(1

2

−=∑=

n

XXS

n

Ii

¿Que miden la varianza y la desviación estándar? : miden la dispersión promedio en torno a la media, es decir, cómo fluctúan las observaciones mayores por encima de ella y cómo se distribuyen las observaciones menores por debajo de ella. Nota: el denominador es ( n - 1 ) debido a la propiedad de los grados de liberta. En esencia, en la suma sólo n - 1 de los términos son independientes, porque el cálculo estadístico de S2 supone un conocimiento previo del estadístico X, es decir, si se conoce X se pierde 1 grado de libertad. La varianza de una poblacional ( 2σ ) :

N

XXN

Ii∑

=

−= 1

2

2)(

σ

Desviación estándar poblacional ( σ ):

N

XXN

Ii∑

=

−= 1

2)(σ

Coeficiente de variación: es otra de medida de dispersión. Es una medida relativa, al contrario de las anteriores. Se expresa como porcentaje en vez de en términos de las unidades de los datos particulares. Como medida relativa, es de particular utilidad al comparar la variabilidad de dos o más conjuntos de datos ( distribuciones ) que se expresan en distintas unidades de medida.

100*XSCV =

Fórmulas de varianza y desviación estándar para calculadoras electrónicas o computador

2 1

2

1

S i

n ii

n

X

n = X

n - 1

2i

=

=∑∑

−( )

S

X

ni

ni

ni

= X

n - 1

2 i

=

=∑ −∑

1

2

1( )

Page 17: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

Para datos agrupados La varianza de una muestra (S2) :

1

*)(1

2

2

−=∑=

n

nXXS

n

Iii

Desviación estándar muestra ( S ) :

1

*)(1

2

−=∑=

n

nXXS

n

Iii

La varianza de una poblacional ( 2σ ) :

N

nXXN

Iii∑

=

−= 1

2

2*)(

σ

Desviación estándar poblacional ( σ ):

N

nXXN

Iii∑

=

−= 1

2 *)(σ

Cuasivarianza: Es una medida de dispersión, cuya única diferencia con la varianza es que dividimos por

N-1, la representaremos por 2

1−NS o2

1−Nσ y la calcularemos de la siguiente forma:

∑=

−− −−

=−

==n

i

iixNN N

nXXSN

NS1

222

12

1 1*)(*

Page 18: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

Medidas de asociación de dos variables Análisis multivariado

Covarianza Para una muestra de n elementos, con sus parejas de valores de datos:

))(,( 2211 YXYX Covarianza Muestral

1

)()(1

−−=∑=

n

YYXXS

i

n

ii

xy

Covarianza Poblacional

N

YX yi

n

ixi

xy

)()(1

µµσ

−−=∑=

Interpretación de la covarianza de la muestra

XYS Positivo; X e Y tienen relación lineal positiva. Y

X

XYS Negativo; X e Y tienen relación lineal negativa. Y X La covarianza indica el tipo de relación lineal positiva o negativa entre la variable X e Y.

Page 19: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

Coeficiente de correlación El coeficiente de correlación como previamente se indicó oscila entre –1 y +1 encontrándose en medio el valor 0 que indica que no existe asociación lineal entre las dos variables a estudio. La estimación del coeficiente de determinación (r2) nos muestra el porcentaje de la variabilidad de los datos que se explica por la asociación entre las dos variables. Como previamente se indicó la correlación elevada y estadísticamente significativa no tiene que asociarse a causalidad. Cuando objetivamos que dos variables están correlacionadas diversas razones pueden ser la causa de dicha correlación: a) pude que X influencie o cause Y, b) puede que influencie o cause X, c) X e Y pueden estar influenciadas por terceras variables que hace que se modifiquen ambas a la vez. El coeficiente de correlación posee las siguientes características (4): -El valor del coeficiente de correlación es independiente de cualquier unidad usada para medir las variables. -El valor del coeficiente de correlación se altera de forma importante ante la presencia de un valor extremo, como sucede con la desviación típica. Ante estas situaciones conviene realizar una transformación de datos que cambia la escala de medición y modera el efecto de valores extremos (como la transformación logarítmica). -El coeficiente de correlación mide solo la relación con una línea recta. Dos variables pueden tener una relación curvilínea fuerte, a pesar de que su correlación sea pequeña. Por tanto cuando analicemos las relaciones entre dos variables debemos representarlas gráficamente y posteriormente calcular el coeficiente de correlación. -El coeficiente de correlación no se debe extrapolar más allá del rango de valores observado de las variables a estudio ya que la relación existente entre X e Y puede cambiar fuera de dicho rango. La correlación no implica causalidad. La causalidad es un juicio de valor que requiere más información que un simple valor cuantitativo de un coeficiente de correlación (5). Para los datos de una muestra, se define el Coeficiente de Pearson:

YX

XYXY SS

Sr

*=

Para los datos de una población, se define el Coeficiente de Pearson:

YX

XYXYr

σσσ

*=

Formula alternativa (se prefiere usar esta porque tiene menos errores de redondeo).

Page 20: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

∑∑

∑∑

∑∑ ∑

=

=

=

=

==

= =

−−

−=

m

j

m

jj

ji

n

i

n

ii

i

mn

Ji

n

i

m

jji

ji

XY

n

yY

n

XX

n

YXYX

r

1

1

2

2

1

1

2

2

,

1,1

1 1

)()(

)*(

Los valores cercanos a –1 y +1, indican una fuerte relación lineal. Mientras que un coeficiente cercano a cero, la relación es más débil. Ejercicio covarianza-correlación La industria textil “Proyecto Alfa”, posee los siguientes valores expresados en miles que corresponden a la cantidad de insumos y cantidad producida de tela en ciertos períodos. Los datos son de 5 períodos que a continuación se detallan:

Cantidad de Insumos (Miles) 4 12 16 16 24 Producción de Tela (Miles) 116 210 176 232 234

Ahora una vez expuesto el enunciado, usted es analista en producción en serie debe responder las siguientes preguntas: Determine la Covarianza muestral en la industria textil Determine el Coeficiente de Correlación y explique el resultado en la industria textil Grafique en un Diagrama de dispersión y explique la relación lineal que exista en Proyecto Alfa.

A) ∑= −

−−=

n

ixy n

YYiXXiS1 1

)(*)(

∑= nXX i / 4.14572

5241616124

==++++

=X

∑= nXY i / 6.1935

9685

234232176210116==

++++=Y

2.2974

8.118815

)6.193234(*)4.1424()6.193232(*)4.1416()6.193176(*)4.1416()6.193210(*)4.1412()6.193116(*)4.144(

S1

xy ==−

−−+−−+−−+−−+−−

=∑=

n

i

B) yx

xyXY SS

Sr

*= 8302615.0

26256.49*26636.72.297

==XYr

Page 21: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

∑= −

−=

n

iX n

XXiS1

2

1)(

∑= −

−=

n

iY n

YYiS1

2

1)(

2.297=XYS

26636.78.52

8.524

2.21115

)4.1424()4.1416()4.1416()4.1412()4.144(S1

22222

X

==

==−

−+−+−+−+−=∑

=

X

n

i

S

26256.498.2426

8.24264

2.970715

)6.193234()6.193232()6.193176()6.193210()6.193116(S1

22222

y

==

==−

−+−+−+−+−=∑

=

Y

n

i

S

C)

Industria Textil Proyectos Alfa

0

50

100

150

200

250

300

0 5 10 15 20 25 30Cantidad Insumos (MIles)

Prod

ucci

ón (M

Iles)

Propiedades de la media. La media aritmética tiene la gran desventaja de que se ve muy influenciada por los valores extremos, pero aún así es la medida de tendencia central que más se usa, ya que posee las siguientes propiedades: 1. La media aritmética de una constante k es igual a la misma constante, es decir,

M(k)=k. 2. La media del producto de una constante a por una variable X, es igual al producto de la

constante por la media de la variable, es decir, M(a⋅ X) = a ⋅ M(X). 3. La media del producto de una constante a por una variable X más otra constante,

digamos b, es igual a la constante a por la media de la variable X más la constante b, es decir, M(a⋅ X + b) = a ⋅ M(X) + b.

4. La media de la suma de dos variables X e Y, es igual a suma de las medias de cada una de esas variables, es decir, M ( X + Y ) = M( X ) + M( Y ).

5. xmín ≤ x ≤ xmáx.

Page 22: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

6. En toda distribución ∑=

=−n

ii xx

1

0)( .

7. En toda distribución ∑=

−n

ii ax

1

2)( es mínimo para a = x .

Propiedades de la mediana: 1. El cálculo de la mediana se ve afectado por el número de observaciones y no por la

magnitud de cualesquiera de los extremos, pero no utiliza toda la información como la media.

2. Cualquier observación seleccionada al azar es igual de fácil que supere a la mediana o que la mediana supere a la observación.

3. La suma de las diferencias absolutas en torno a la mediana es un mínimo, es decir,

MeasiMínimoaxn

ii ==−∑

=1

.

4. Escala de medición al menos ordinal. Propiedades de la varianza: Para presentar las propiedades tanto de la varianza poblacional como de la varianza maestral, se denotará con la letra V a la varianza. 1. La varianza de una constante es cero.⇒ V(a) = 0, si a es constante. 2. La varianza del producto de una constante por una variable es igual a la constante al

cuadrado multiplicada por la varianza de la variable. ⇒ V(b⋅X) = b2 ⋅ V(X). 3. De 1. y 2. podemos concluir lo siguiente:

a) V(a + b⋅X) = b2 ⋅ V(X) b) V(a - b⋅X) = b2 ⋅ V(X)

(Las demostraciones de estas propiedades se pueden obtener fácilmente aplicando la definición y las propiedades de la sumatoria y de la media aritmética). EJEMPLO: Usando los datos del ejemplo de la media, que se refería a la distribución del saldo de 120 cuentas de crédito, a) Obtenga la desviación estándar. b) Si se sabe que por las condiciones económicas los saldos han aumentado un 20%,

determine la nueva desviación estándar.

Page 23: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

Solución. a) Recordemos que los datos para los cálculos son: Saldo promedio(xi) Cantidad de cuentas (miles de $)

15 10 45 25 75 40

105 20 135 15 165 10

Suponiendo que los datos son de una muestra, la desviación estándar muestral se calcularía como sigue:

( )23,41

11975,83120)10165...1015( 222

=⋅−⋅++⋅

=s [miles de $]

b) Sea X: saldo antiguo e Y: saldo nuevo Y = X + 0,2 X = 1,2 X

Aplicando propiedades se tiene que s y = 1,2 s x = 49,48 [miles de $] MEDIDAS DESCRIPTIVAS EN DATOS AGRUPADOS. En ciertas ocasiones la información de un conjunto de datos se presenta para una cantidad L de grupos o estratos y de cada estrato se tiene la siguiente información: n i = tamaño del estrato i ó proporción del estrato i , con i = 1, 2, …, L

ix = media aritmética del estrato i, con i = 1, 2, …, L σ2

i = varianza del estrato i, con i = 1, 2, …, L En este caso podemos obtener dos medidas descriptivas para el total de los elementos: la media total y la varianza total. La media total ( Tx ) se obtiene como una media de las medias de los estratos, esto es:

Page 24: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

n

nx

x

L

1iii

T

∑=

= donde ∑=

=L

1hinn

La variación total de los datos tiene dos fuentes de variación, la variación que hay en las observaciones dentro de los estratos, que se mide con la intravarianza y se denota por 2

wσ , y la variación que se produce entre los distintos estratos, que se mide con la intervarianza y se denota por 2

Bσ . Por lo tanto, la varianza total 2Tσ se obtiene por:

2B

2W

2T σσσ +=

La intravarianza se define como el promedio de las varianzas de los estratos, esto significa que:

n

nL

1ii

2i

2W

∑=

⋅=

σσ

La intervarianza se define como la varianza de las medias de los estratos, es decir:

( )

n

nxxL

1ii

2Ti

2B

∑=

⋅−=σ

EJEMPLO: La siguiente información corresponde al contenido de folacina (Vitamina B) para especímenes escogidos al azar de cuatro marcas de té.

Marca Cantidad de especímenes Media Varianza (nh) ( hx ) ( 2

hs ) A 7 8,271 2,139 B 5 7,500 2,825 C 6 6,350 1,123 D 6 5,817 2,406 Obtener la varianza total e indicar dónde se produce mayor variación en el contenido de folacina, entre las distintas marcas o dentro de las marcas. Solución.

0166,724

6817,5635,655,77271,8=

⋅+⋅+⋅+⋅=Tx

Page 25: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

( ) 9785,00166,724

6817,5635,655,77271,8 22222

2 =−⋅+⋅+⋅+⋅

=Bσ

0947,224

6406,26123,15825,27139,22 =⋅+⋅+⋅+⋅

=Wσ

0732,30947,29785,02 =+=Tσ Existe mayor variabilidad en el contenido de folacina al interior de las marcas, ya

que22BW σσ > .

PRESENTACIÓN DE DATOS BIDIMENSIONALES Y DE MÁS DIMENSIONES. Hasta ahora se ha estudiado datos considerando una sola variable en ellos. En este capítulo estudiaremos dos ó más variables a cada observación; variables que tienen entre sí alguna relación. La presentación de estos datos puede hacerse mediante tablas de frecuencia bidimensionales para el caso de dos variables o multidimensionales si se han medido más de dos variables. Aquí se presentará sólo las tablas bidimensionales. VI.1 TABLAS DE FRECUENCIA BIDIMENSIONALES. El conjunto de datos {(x1, y1), (x2, y2), …, (xn, yn)}de la variable dimensional (X, Y) se debe presentar en una tabla de contingencia o de doble entrada con la siguiente estructura: Clases de Y Clases de X y1 y2 … yj … yk

x1 n11 n12 … n1j … n1k x2 n21 n22 … n2j … n2k M M M M M xi ni1 ni2 … nij … nik M M M M M xr nr1 nr2 … nrj … nrk

Esto indica que los datos de la variable X se han clasificado en r clases o intervalos y los datos de la variable Y en k clases o intervalos. Para la clasificación de las dos variables, se debe seguir el mismo procedimiento que para una variable unidimensional. Los valores nij de la tabla indican la frecuencia absoluta conjunta de la variable X en la clase i y de la variable Y en la clase j, es decir corresponde al número de veces que se repiten ambas

Page 26: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

clases en los n pares de datos. A estas r⋅ k frecuencias se acostumbra a llamarlas matriz de frecuencias absolutas conjuntas. A partir de esta primera tabla se pueden construir las tablas correspondientes a las frecuencias relativas y a las frecuencias acumuladas (absolutas y relativas). Por ejemplo, la estructura de la tabla de frecuencias conjuntas absolutas acumuladas, sería la siguiente: Clases de Y Clases de X y1 y2 … yj … yk

x1 N11 N12 … N1j … N1k x2 N21 N22 … N2j … N2k M M M M M xi Ni1 Ni2 … Nij … Nik M M M M M xr Nr1 Nr2 … Nrj … Nrk

En que los valores Nij indican la cantidad de observaciones que hay hasta la clase i de la

variable X y hasta la clase j de la variable Y; es decir ∑∑= =

=i

1l

j

1mmlij nN .

Además, de la tabla de frecuencias absolutas conjuntas se pueden obtener las frecuencias marginales y las frecuencias condicionales. Las frecuencias marginales son las frecuencias de una variable, independiente del valor que toma la otra variable. Por lo tanto, habrá frecuencias marginales para X y para Y, las que podrán ser absolutas, relativas, absolutas acumuladas o relativas acumuladas. Todas ellas se acostumbra a colocar al margen de la tabla de frecuencias absolutas, esto es:

Page 27: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

Clases de Y Clases de X y1 y2 … yj … yk n i . N i . h i . H i .

x1 n11 n12 … n1j … n1k n 1. N 1. h 1. H 1. x2 n21 n22 … n2j … n2k n 2. N 2. h 2. H 2. M M M M M M M M M xi ni1 ni2 … nij … nik n i. N i . h i. H i. M M M M M M M M M xr nr1 nr2 … nrj … nrk n r. N r. h r. H r. n . j n. 1 n. 2 … n. j … n. k h . j h. 1 h. 2 … h. j … h. k N . j N. 1 N. 2 … N. j … N. k H . j H. 1 H. 2 … H. j … H. k

En la notación usada para las frecuencias marginales el punto usado en el subíndice denota

que con respecto a esa variable se ha procedido a sumar. Es así como: ∑=

=k

1jij.i nn , es decir, la

suma de todas las frecuencias absolutas conjuntas de la fila i y ∑=

=r

1iijj. nn , es decir, la suma de

todas las frecuencias absolutas conjuntas de la columna j. El resto de las frecuencias marginales se obtienen a partir de las marginales absolutas como si se tratara de una variable unidimensional. Otro tipo de frecuencias que se pueden obtener son las frecuencias condicionales, que corresponden a las frecuencias de una variable condicionadas a uno o más valores de la otra variable. Por ejemplo, h i (X/ Y < M(Y)) indica la frecuencia relativa en la clase i de la variable X condicionada a todos los valores menores que el valor medio de Y. Nótese que para indicar condición se usa el símbolo " / ". EJEMPLO: Los siguientes datos corresponden a la cantidad de hijos (X) y a los ingresos mensuales, en miles de $, de un grupo de familias: X 1 0 2 4 1 2 0 1 3 5 4 3 2 1 2 3 2 4 3 2 Y 230 320 280 430 380 230 325 195 450 280 360 240 350 170 220 360 490 570 395 270 a) Construir una tabla de contingencia. b) Agregar en la tabla las frecuencias marginales absolutas. c) Indicar las frecuencias relativas de X condicionadas a los ingresos inferiores a

$410.000.

Page 28: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

Solución. a) Para construir la tabla se usarán 6 clases para X, ya que es una variable discreta y

asume valores desde 0 a 5; para Y se usarán 5 intervalos por ser una variable continua y tener sólo 20 datos.

Título: Distribución de las familias según número de hijos e ingresos mensuales. Y: Ingresos (m$) Cantidad de X: Cantidad de hijos 170 - 250 250 - 330 330 - 410 410 - 490 490 - 570 familias (n i. )

0 0 2 0 0 0 2 1 3 0 1 0 0 4 2 2 2 1 1 0 6 3 1 0 2 1 0 4 4 0 0 1 1 1 3 5 0 1 0 0 0 1 Cantidad de familias ( n . j ) 6 5 5 3 1 20

b) Son los valores n i. y n . j de la tabla. c) d) Para mostrar las frecuencias condicionales de X / Y<410, se hará una tabla

unidimensional.

X: Cantidad de hijos Proporción de familias con ingresos inferiores a $410.000.

0 2/16= 0,1250 1 4/16= 0,2500 2 5/16= 0,3125 3 3/16= 0,1875 4 1/16= 0,0625 5 1/16= 0,0625

GRAFICOS PARA DATOS BIDIMENSIONALES. La mejor manera de visualizar la relación entre dos variables cuantitativas es el diagrama de dispersión, que es una aplicación de la representación de funciones en el sistema de coordenadas cartesianas. EJEMPLO: El diagrama de dispersión para los datos del ejemplo anterior es el siguiente:

Page 29: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

Cuando el estudio es longitudinal, es decir, una de las variables es el tiempo, en el eje de las X se grafica la variable tiempo y la otra variable en el eje de las Y. En estos casos el diagrama de dispersión se llama gráfico secuencial o de línea. MEDIDAS MARGINALES Y CONDICIONALES. DISTRIBUCIONES BIDIMENSIONALES Cuando las observaciones bivariadas se han presentado en una tabla de frecuencias se puede obtener medidas de resumen marginales, condicionales y conjuntas. Las medidas de resumen marginales se calculan con las frecuencias marginales y las medidas condicionales se calculan con las frecuencias condicionales. Las medidas de resumen que se pueden calcular con ambos tipos de distribuciones son las mismas que para una variable unidimensional y se calculan tratando a la variable para la cual se tienen las frecuencias (marginales o condicionales) como si fuera una variable unidimensional. EJEMPLO: En la siguiente tabla la variable X representa el número de personas por hogar, de una muestra realizada en una comuna de Santiago y la variable Y representa el pago mensual en servicios básicos, en miles de pesos, de esa muestra.

Distribución de los hogares de acuerdo al número de personas y del pago mensual en servicios básicos.

Y 10 - 15 15 - 25 25 - 50

X

1 4 5 1 2 18 30 7 3 7 12 6 4 0 2 8

0100200300400500600

0 1 2 3 4 5 6

Cantidad de hijos

Ingr

esos

(mile

s de

$)

Page 30: CURSO PROBABILIDAD Y ESTADISTICAS FMS175 …r-toro-g.tripod.com/cgi-bin/ESTADISTICA_DESCRIPTIVA.pdf · hijos, numero de discos comprados, número de pulsaciones. Continuas: ... Las

a) Determine el pago medio por hogar en servicios básicos de la muestra. b) ¿Cuál es el pago mediano de los hogares con menos de 3 personas? Solución. a) En este caso se está preguntando por la media marginal de la variable Y.

Los datos a usar serán las frecuencias marginales de Y, esto es: Y: Pago mensual yi: Pago promedio Cantidad de hogares 10 - 15 12,5 29 15 - 25 20,0 49 25 - 50 37,5 22 Total 100

21,675100

2237,549202912,5M(Y) =⋅+⋅+⋅

= (miles de $)

b) La pregunta es Me (Y / X<3).

Para esto necesitamos la frecuencia de Y condicionada a los valores de X inferiores a 3. Esto es: Y: Pago mensual Cantidad de hogares 10 - 15 22 15 - 25 35 25 - 50 8 Total 65

Me (Y / X<3) = 15 + 10 ⋅35

225,32 − =18 (miles de $) El 50% de los hogares con menos

de tres hijos habrían tenido un gasto en servicios básicos igual o inferior a $18.000.