trabajo de probabilidad y estadistica 2011

29
TRABAJO DE PROBABILIDAD Y ESTADISTICA VALOR: 50% DE LA NOTA DEL SEGUNDO PARCIAL Fecha: 17 de Enero del 2011 Fernando A. Contreras J. INSTRUCCIONES Lea con detalle la presente guía, la misma comienza en la página 1 y termina en la página 23. Luego, resuelva las preguntas que vienen dadas al final, las mismas comienzan en la página 24 y terminan en la página 28. La resolución de estas preguntas son el trabajo, las cuales se deben presentar con su puño y letra (es decir, a mano escrita). Los trabajos que se realicen en letra de imprenta y/o en letra de computadora no serán recibidos. El trabajo es individual, el mismo se debe realizar en hojas blancas u otras, las cuales deben organizarse dentro de una carpeta. Se tomara en cuenta el orden y la presentación del trabajo.

Upload: rafael-hernandez

Post on 29-Jun-2015

3.880 views

Category:

Documents


7 download

TRANSCRIPT

Trabajo de la Unidad II Fernando A. Contreras J.

0

TRABAJO DE PROBABILIDAD Y ESTADISTICA VALOR: 50% DE LA NOTA DEL SEGUNDO PARCIAL

Fecha: 17 de Enero del 2011 Fernando A. Contreras J.

INSTRUCCIONES Lea con detalle la presente guía, la misma comienza en la página 1 y termina en la página 23. Luego, resuelva las preguntas que vienen dadas al final, las mismas comienzan en la página 24 y terminan en la página 28. La resolución de estas

preguntas son el trabajo, las cuales se deben presentar con su puño y letra (es decir, a mano escrita). Los trabajos que se realicen en letra de imprenta y/o en letra de computadora no serán recibidos. El trabajo es individual, el mismo se debe realizar en hojas blancas u otras, las cuales deben organizarse dentro de una carpeta. Se

tomara en cuenta el orden y la presentación del trabajo.

Trabajo de la Unidad II Fernando A. Contreras J.

1

“Estadística”

Todo aquello que se relaciona con la recolección, procesamiento, análisis e

interpretación de datos numéricos o cuantificables, pertenece al campo de la estadística.

De ahí que la estadística puede definirse como la ciencia o método de reunir, organizar y

analizar datos, para luego generalizar los resultados a toda la población que se está estudiando a partir de la información contenida en una muestra. La estadística se divide

en dos grandes apartados denominados: Estadística Descriptiva y Estadística

Inferencial.

“Estadística Descriptiva”

Se define como el conjunto de métodos que analizan una muestra conformada por una

colección de datos o determinadas características medibles, obtenidos de un colectivo de

personas u objetos de una naturaleza específica. El objetivo de la estadística descriptiva es describir los datos en forma conveniente, útil y comprensible de las diversas

características de mencionado conjunto de observaciones.

“Ejemplo 1”: ¿De qué manera un entrenador de Básquetbol describiría e ilustraría en

forma resumida, las mediciones de las estaturas de los miembros del equipo de su

selección?

“Desarrollo”

El entrenador obtiene las siguientes mediciones y las representa a través de un

cuadro:

Estaturas

1.93 1.97 1.84 1.90 2.01 1.95 2.05

Luego obtiene algunas medidas que resumen y aportan una mayor información del

conjunto de estaturas del equipo selección:

Universo

o

Población

Física

Muestra Aleatoria

Poblaciones Estadísticas

Peso Sexo Edad

“Estas características medibles de la población física van a generar dato que van a ser organizados por la estadística descriptiva”

Trabajo de la Unidad II Fernando A. Contreras J.

2

Jugadores del Equipo

7654321

Esta

tura

s de

los Ju

gado

res

2,1

2,0

1,9

1,8

Resumen Estadístico Descriptivo Elemental

Numero de Observaciones n = 7

Estatura Promedio 1.95

Mayor Estatura 2.05

Menor Estatura 1.84

Diferencia (Rango) 2.05 – 1.84 = 0.21

Luego realiza una representación gráfica que ilustra aún mejor el conjunto de datos

obtenidos:

Representación Gráfica

“Ejemplo 2”: Considérese una sección de 50 alumnos de estadística de la

Universidad Nacional Experimental del Táchira. Tome una muestra aleatoria de

tamaño 11 y obtenga los datos de las variables Edad, sexo, # de hermanos, Peso,

Estatura y Deporte.

“Desarrollo”

A través del mecanismo de la bolsa con los papelitos, supóngase que se obtuvo la

muestra de tamaño 11 a partir de la cual se han obtenidos los datos ilustrados en la

tabla adjunta:

X1 X2 X3 X4 X5 X6 Clases Selección al azar Edad Sexo # de Hermanos Peso Estatura Deporte Clase 1 07 (María) 17.8 F 3 60.5 1.65 Voleibol Clase 2 19 (Amelia) 19.3 F 4 64.8 1.70 Natación Clase 3 23 (Luís) 20.2 M 1 73.3 1.73 Básquet Clase 4 11 (Angélica) 19.1 F 4 58.9 1.66 Voleibol Clase 5 16 (José) 20.4 M 2 68.4 1.70 Fútbol Clase 6 34 (Jorge) 18.9 M 3 83.5 1.81 Fútbol Clase 7 03 (Alejandra) 19.4 F 0 68.6 1.73 Maratón Clase 8 45 (Andreina) 21.9 F 2 61.4 1.55 Básquet Clase 9 33 (Roberto) 23.5 M 1 75.7 1.67 Natación Clase 10 49 (Marta) 18.9 F 5 50.3 1.63 Voleibol Clase 11 17 (Paulina) 20.4 F 2 65.1 1.67 Básquet

Trabajo de la Unidad II Fernando A. Contreras J.

3

Universo: Curso de estadística de la Universidad Nacional Experimental del Táchira

(N = 50).

Poblaciones Estadísticas: Edad, Sexo, # de Hermanos, Peso, Estatura y Deporte.

Muestra: Parte del Universo, selección de 11 alumnos al azar (n = 11).

Datos: Información obtenida de la muestra sobre algunas características medibles de la

población física.

Datos Cualitativos: Sexo y Deporte.

Datos Cuantitativos: Edad, # de Hermanos, Peso y Estatura.

Variables: X1, X2, X3, X4, X5 y X6.

Variables Continuas: X1, X4 y X5.

Variables Discretas: X3.

Variables Cuantitativas: X1, X3, X4 y X5. Variables Cualitativas: X2 y X6.

“Las mediciones dan pie a variables continuas y los conteos a variables discretas”

“Forma de Organizar los Datos”

Orden Creciente y Decreciente: Las observaciones de una variable se ordenan tomando en cuenta la magnitud en forma creciente o decreciente.

“Ejemplo 3”: Considérese la variable peso en kilogramos de la muestra de 11 estudiantes

de estadística (n = 11), de la tabla de datos obtenida en el “Ejemplo 2.

Peso 60.5 64.8 73.3 58.9 68.4 83.5 68.6 61.4 75.7 50.3 65.1

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11

Realice un orden creciente y decreciente de la muestra. Luego realice una representación gráfica.

“Desarrollo”

Orden Creciente 50.3 58.9 60.5 61.4 64.8 65.1 68.4 68.6 73.3 75.7 83.5

X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10) X(11)

Orden Decreciente 83.5 75.7 73.3 68.6 68.4 65.1 64.8 61.4 60.5 58.9 50.3

X(11) X(12) X(9) X(8) X(7) X(6) X(5) X(4) X(3) X(2) X(1)

“Representación Gráfica” (Gráfico de Puntos)

Trabajo de la Unidad II Fernando A. Contreras J.

4

Clases o Categorías: Las observaciones de una variable se ordenan en clases o

categorías en las que se lleva a cabo un recuento de la frecuencia del número de

observaciones que pertenece a cada clase.

“Ejemplo 4”: Considérese las variables sexo y deporte de la muestra de 11 estudiantes de

estadística (n = 11), de la tabla de datos obtenida en el “Ejemplo 2”.

Sexo F F M F M M F F M F F

Deporte Voleibol Natación Básquet Voleibol Fútbol Fútbol Maratón Básquet Natación Voleibol Básquet

Organice estas observaciones en clases o categorías. Luego realice una representación gráfica de cada variable en cada caso.

“Desarrollo”

Para la variable “Sexo”, se tiene la tabla:

Clases Sexo Conteo Frecuencia (fi)

Clase 1 Femenino /////// 7

Clase 2 Masculino //// 4

Total ///////// 11

“Representación Gráfica” (Gráfico Circular)

El círculo se divide en sectores cuyas áreas son proporcionales a los datos que se

quieren representar. Normalmente se utiliza cuando hay pocas clases o categorías.

Área Porcentaje

Frecuencia de la Celda Área del Circulo en Grados Porcentaje Correspondiente al Área

Femenino 7 229º 63.6%

Masculino 4 131º 36.4%

Total 11 360º 100%

“Para Dividir el Área del Circulo”

Frecuencia de la Celda X

Tamaño de la Muestra 360º

“Para Determinar el Porcentaje del Área”

Frecuencia de la Celda X

Tamaño de la Muestra 100%

Trabajo de la Unidad II Fernando A. Contreras J.

5

Para la variable “Deporte”, se tiene:

Clases Deporte Conteo Frecuencia (fi)

Clase 1 Voleibol /// 3

Clase 2 Natación // 2

Clase 3 Básquet /// 3

Clase 4 Maratón / 1

Clase 5 Fútbol // 2

Total /////////// 11

“Representación Gráfica” (Gráfico Circular y Gráfico de Barras)

El gráfico de barras está formado por rectángulos en los que la base del rectángulo representa

una clase y la altura del rectángulo es la frecuencia de la clase.

Rol de Frecuencias: Las observaciones de una variable se agrupan en orden de

magnitud de manera creciente o decreciente, pero teniendo en cuenta la frecuencia (fi)

con que se repite cada observación. Además, se calcula la frecuencia acumulada (Fi), la

frecuencia relativa

n

f i, la frecuencia relativa acumulada

n

Fi, el porcentaje de la

frecuencia relativa 100.

n

f i y el porcentaje de la frecuencia relativa acumulada

100.

n

Fi.

“Ejemplo 5”: Considérese la variable “# de hermanos” de la muestra de 11 estudiantes de

estadística (n = 11), de la tabla de datos obtenida en el “Ejemplo 2”.

# de Hermanos 3 4 1 4 2 3 0 2 1 5 2

X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10) X(11)

Realice un rol de frecuencias en donde la variable a analizar sea “# de hermanos”.

Deporte que Practican

VoleibolNataciónMaratónFútbolBásquet

me

ro d

e A

lum

no

s

3,5

3,0

2,5

2,0

1,5

1,0

,5

Trabajo de la Unidad II Fernando A. Contreras J.

6

“Desarrollo”

Clases # de hermanos Conteo fi Fi fi/n Fi/n (fi/n).100 (Fi/n).100

Clase1 0 / 1 1 0.09 0.09 9 9

Clase 2 1 // 2 3 0.18 0.27 18 27

Clase 3 2 /// 3 6 0.27 0.55 27 55

Clase 4 3 // 2 8 0.18 0.73 18 73

Clase 5 4 // 2 10 0.18 0.91 18 91

Clase 6 5 / 1 11 0.09 1.00 9 100

Total /////////// 11 1.00 100

La nomenclatura de la tabla es: frecuencia (fi) con que se repite cada observación,

frecuencia acumulada (Fi), la frecuencia relativa (fi/n), la frecuencia relativa acumulada

(Fi/n), el porcentaje de la frecuencia relativa ((fi/n).100) y el porcentaje de la frecuencia

relativa acumulada ((Fi/n).100).

“Representación Gráfica”

Se realizaran distintas representaciones de barras y gráficos acumulativos.

Trabajo de la Unidad II Fernando A. Contreras J.

7

Distribución de Frecuencias: Las observaciones de una variable se agrupan clases o

categorías las cuales poseen límites o valores extremos (Li: Límite Inferior y Ls: Límite

Superior). Además se calcula la frecuencia (fi), la frecuencia acumulada (Fi), la marca de

clase

2

sii

LLX , la frecuencia relativa

n

f i , la frecuencia relativa acumulada

n

Fi

, el porcentaje de la frecuencia relativa 100.

n

f i y el porcentaje de la frecuencia relativa

acumulada 100.

n

Fi .

“Ejemplo 6”: Supóngase que un investigador desea describir las estaturas en pulgadas

de 50 estudiantes de un curso de “Estadística” de la Universidad Nacional Experimental

del Táchira dadas en el cuadro adjunto:

“n = 50”

Estaturas de los “50” estudiantes

de estadística de

la UNET.

61 63 65 63 69 67 53 58 60 65

64 65 64 72 68 66 55 57 66 62

62 65 64 71 68 66 56 59 61 64

63 65 63 62 67 60 57 59 61 62

64 64 63 69 67 66 58 60 61 70

Antes de construir la tabla de distribución de frecuencias se plantea la pregunta:

¿Cómo obtener el número de clases y intervalo de clase?

1.) Para obtener el # de clases, se puede usar la formula de Sturges:

Trabajo de la Unidad II Fernando A. Contreras J.

8

K = 1 + 3.322Log10(n)

En otro caso, usted mismo puede asignar el número de clases, el cual se recomienda este

comprendido entre 5 y 15 clases, cuando se tenga un número de datos mayor o igual a 30.

2.) Para obtener la longitud del intervalo de clases, se puede usar la formula:

lI.C. = K

A

Donde: A = VM – Vm

“f1, f2, f3, . . . , fk es la “frecuencia de las k clases”; es decir, los fi para i =

1, 2, 3, . . . , k”

“F1, F2, F3, . . . , Fk es la “frecuencia acumulada de las k clases”; es decir, los

Fi para i = 1, 2, 3, . . . , k”

“X1, X2, X3, . . . , Xk son las “marcas de clase de las k clases”; es decir, los Xi

para i = 1, 2, 3, . . . , k”

Para los demás elementos de la tabla, el análisis es análogo.

Continuando con el Ejemplo 6, para obtener el intervalo de clase usando la fórmula de Sturges), se tiene:

K = 1 + 3.322Log10(50) = 6.64 7

Luego, la longitud del intervalo de clase queda: lI.C. = 7

19 = 2.7 3 lI.C. 3

Se construye la tabla de “Distribución de Frecuencias”, la construcción del primer

intervalo se realiza comenzando desde el menor valor en la lista de datos (en este caso

53). A partir de este valor e incluyéndolo se cuenta tres valores (53, 54 y 55), de acuerdo

a la longitud del intervalo (en este caso 3) hasta llegar al extremo (en este caso 55). A

través de éste mecanismo, se obtiene el primer intervalo 53 – 55. Los demás intervalos se

obtienen siguiendo un proceso análogo.

VM : Valor Mayor Vm : Valor Menor

K : # de clases

Log10(n) : Logaritmo en base 10 de “n” (el número de

datos considerados)

K : # de clases A : Amplitud

lI.C. : Longitud del Intervalo de Clase para la Fórmula de

Sturges.

Trabajo de la Unidad II Fernando A. Contreras J.

9

“Tabla A”

Clases Intervalos Recuento fi Fi Xi fi/n Fi/n (fi/n).100 (Fi/n).100

Clase 1 53 – 55 // 2 2 54 0.04 0.04 4 4

Clase 2 56 – 58 ///// 5 7 57 0.10 0.14 10 14

Clase 3 59 – 61 ///////// 9 16 60 0.18 0.32 18 32

Clase 4 62 – 64 /////////////// 15 31 63 0.30 0.62 30 62

Clase 5 65 – 67 //////////// 12 43 66 0.24 0.86 24 86

Clase 6 68 – 70 ///// 5 48 69 0.10 0.96 10 96

Clase 7 71 – 73 // 2 50 72 0.04 1.00 4 100

A modo de observación se puede notar que:

f3 = 9 es la frecuencia de la Clase 3

F4 = 31 es la Frecuencia Acumulada de la Clase 4

X5 = 66 es la Marca de Clase de la Clase 5

Además, el número de datos obtenido (“n”), se puede expresar como se muestra a

continuación:

n = Fk =

7

1i

if = F7 = 50

“Representación Gráfica de una Distribución de Frecuencias”

Histograma y Polígono de Frecuencias: El histograma es un gráfico de barras

continuas en donde la base de cada barra es un intervalo de clase y la altura es la

frecuencia de la clase. El Polígono de Frecuencias es un diagrama de líneas que se obtiene

uniendo los puntos medios de cada rectángulo mediante semi-rectas.

“Ejemplo 7”: Realice el histograma y el polígono de frecuencia correspondiente a la

“Tabla A” de datos del “Ejemplo 2”.

“Desarrollo”

Nota: Para que exista continuidad en las barras del histograma, se utilizarán los límites

reales (L.r.) de cada clase. Obsérvese:

LI – LS

Clase i:

Lri – Lrs

Lri = LI – 0.5

Lrs = LS + 0.5

LI : Límite Inferior LS : Límite Superior

Lri : Límite Real Inferior

Lrs : Límite Real Superior.

(En el caso de estar trabajado con cantidades enteras)

Trabajo de la Unidad II Fernando A. Contreras J.

10

Para construir el histograma y el polígono de frecuencia es necesario construir una

tabla que contenga las clases, los intervalos de clase, los límites reales de cada intervalo,

la frecuencia de cada clase y la marca de clase.

Clases Intervalos Límites Reales fi Xi Clase 1 53 – 55 52.5 – 55.5 2 54

Clase 2 56 – 58 55.5 – 58.5 5 57

Clase 3 59 – 61 58.5 – 61.5 9 60

Clase 4 62 – 64 61.5 – 64.5 15 63

Clase 5 65 – 67 64.5 – 67.5 12 66

Clase 6 68 – 70 67.5 – 70.5 5 69

Clase 7 71 – 73 70.5 – 73.5 2 72

La Ojiva: Es un diagrama de semi-rectas que se utiliza para representar la frecuencia

acumulada de cada clase.

“Ejemplo 8”: Realice la ojiva correspondiente a la “Tabla A” de datos del “Ejemplo 2”.

“Desarrollo”

Para construir la ojiva y la curva percentilar es necesario construir una tabla que

contenga las clases, los intervalos de clase, los límites reales de cada intervalo, la

frecuencia acumulada y el porcentaje de frecuencia acumulada de cada clase.

Trabajo de la Unidad II Fernando A. Contreras J.

11

Clases Intervalos Límites Reales Fi Clase 1 53 – 55 52.5 – 55.5 2 Clase 2 56 – 58 55.5 – 58.5 7 Clase 3 59 – 61 58.5 – 61.5 16 Clase 4 62 – 64 61.5 – 64.5 31 Clase 5 65 – 67 64.5 – 67.5 43 Clase 6 68 – 70 67.5 – 70.5 48 Clase 7 71 – 73 70.5 – 73.5 50

“Estimadores Poblacionales”

Son medidas que se calculan a las muestras con la finalidad de aproximarse de alguna

manera a los parámetros poblacionales. Algunos de los estimadores más importantes son: La Media, La Mediana, la Moda, la Varianza y la Desviación Estándar.

La Media: Es aquella medida que representa un promedio o centro físico de los datos.

Esta se puede calcular cuando la variable en estudio es cuantificable numéricamente.

Cálculo de la Media en datos no agrupados: n

x

X

n

i

i 1

Cálculo de la Media en datos agrupados en clases o categorías: n

Xf

X

k

i

ii 1

.

Trabajo de la Unidad II Fernando A. Contreras J.

12

La Media se llama estadística o estimador poblacional (se denota X ), si se calcula a

partir de los datos de una muestra y se llama parámetro poblacional (se denota por ), si

se calcula a partir de los datos de toda la población en cuestión.

La Mediana: Es el valor de posición central, de un conjunto de observaciones que están ordenadas en forma creciente o decreciente. X(1), X(2), X(3), . . ., X(n) (Sucesión de observaciones ordenadas en orden creciente de magnitud). La mediana divide desde el

centro, el conjunto de observaciones en dos partes iguales, dos partes de 50% cada una.

)

2

1(nx ; si n es impar

Cálculo de la Mediana en X~

=

datos no agrupados: )

2(nx + )1)

2((

nx

; si n es par 2

Cálculo de la Mediana en datos X~

= m

m

f

Fn

Lri)1(

2

.lI.C.

agrupados en clases o categorías:

¿Cómo encontrar la clase que contiene la mediana (Clase Medianal)? Se efectúa el

cociente 2

n, el resultado se busca en la celda de la frecuencia acumulada que tenga la

menor valor que contenga a 2

n.

La Moda: Esta medida está muy relacionada con su nombre “Moda” (la tendencia más usada), ya que la misma está definida como la observación que más se repite o que se da

con mayor frecuencia. La moda es un valor descriptivo fácil de ver y entender.

Cálculo de la Moda en datos no agrupados: Se ordenan los datos en forma creciente

X(1), X(2), X(3), . . ., X(n), luego se ubica la moda por simple observación.

xi : representa la “i-ésima” variable de la colección de datos

n : representa el numero de datos

f1, f2, f3, ..., fk : son las frecuencias de las “k” clases

X1, X2, X3, …, Xk : son las marcas de las “k” clases

Lri: Límite real inferior de la clase medianal.

F(m – 1): Frecuencia acumulada que antecede a la frecuencia acumulada

de la clase medianal.

fm : Frecuencia de la clase medianal.

lI.C.: Longitud del intervalo de clase de la clase medianal.

Trabajo de la Unidad II Fernando A. Contreras J.

13

Cálculo de la Moda en datos X̂ = 21

1

dd

dLri

. lI.C.

agrupados en clases o categorías:

¿Cómo encontrar la clase que contiene la moda (Clase Modal)? La clase modal es aquella

que tiene la clase con mayor frecuencia (fi).

Entre la Media, la Moda y la Mediana existe una relación aritmética que es válida para

datos que provienen de poblaciones estadísticas que son moderadamente sesgadas; esta

relación es: XXXX~

La Varianza: Es aquella medida que nos proporciona un indicativo de la forma como se

distribuyen los datos en torno a la media.

Cálculo en datos no agrupados: Se utiliza la ecuación,

S2 =

n

i

n

i

i

in

x

xn 1

2

12

1

1

Cálculo en datos agrupados en clases o categorías: Se utiliza la ecuación,

S2 =

k

i

k

i

ii

iin

Xf

Xfn 1

2

12

.

.1

1

La varianza se llama estadística o estimador poblacional (se denota S2), si se

calcula a partir de los datos de una muestra y se llama parámetro poblacional (se

denota 2), si se calcula a partir de los datos de toda la población en cuestión.

La Desviación Estándar: Es la raíz cuadrada de la varianza. S = 2S

Lri : Límite real inferior de la clase modal.

d1 : Diferencia entre la frecuencia de la clase modal y la frecuencia que antecede a la de la clase modal.

d2 : Diferencia entre la frecuencia de la clase modal y la frecuencia que precede a la de

la clase modal.

lI.C.: Longitud del intervalo de clase de la clase modal.

Trabajo de la Unidad II Fernando A. Contreras J.

14

“Ejemplo 9”: Realice los dos apartados siguientes;

A) Considérese la colección de observaciones adjuntas que corresponde a las

calificaciones obtenidas por un grupo de 11 (n = 11) estudiantes en Estadística I.

Calificaciones

(n = 11)

44 59 36 55 47 61 53 36 65 32 51

x1 x2 x3 X4 x5 x6 x7 x8 x9 x10 x11

Calcule la media ( X ), la mediana ( X~

), moda ( X̂ ) y la varianza (S2) de las

observaciones dadas.

“Desarrollo”

Nótese que los datos dados corresponden a datos no agrupados; es decir, son pocos

(n < 15) y no están organizados en una tabla de de frecuencias.

Cálculo de la Media

Calificaciones

(n = 11)

44 59 36 55 47 61 53 36 65 32 51

x1 x2 x3 X4 x5 x6 x7 x8 x9 x10 x11

11

11

1

i

ix

X = 11

5132653653614755365944 = 49

Cálculo de la Mediana

Calificaciones

(Orden Creciente)

32 36 36 44 47 51 53 55 59 61 65

x(1) x(2) x(3) X(4) x(5) x(6) x(7) x(8) x(9) x(10) x(11)

Como n = 11 es impar se procede como sigue:

X~

=

2

111x = x(6) = 51

Cálculo de la Moda

Calificaciones

(Orden Creciente)

32 36 36 44 47 51 53 55 59 61 65

x(1) x(2) x(3) X(4) x(5) X(6) x(7) x(8) x(9) x(10) x(11)

Nótese que al ordenar los datos en forma creciente se puede observar que la moda es

36ˆ X , ya que es el dato que más se repite.

Trabajo de la Unidad II Fernando A. Contreras J.

15

“En una colección de observaciones puede haber dos o tres modas; en este caso se está en

presencia de distribuciones bi-modales o tri-modales respectivamente”

Cálculo de la Varianza y la desviación Estándar

Calificaciones

(Orden Creciente)

32 36 36 44 47 51 53 55 59 61 65

x(1) x(2) x(3) X(4) x(5) X(6) x(7) x(8) x(9) x(10) x(11)

Se tiene que: S2 =

11

1

211

12

11111

1

i

i

i

i

x

x

11

1

2

i

ix = x12 x2

2 x32 x4

2 x52 x6

2 x72 x8

2 x92 x10

2 x112 =

= 322 362 362 442 472 512 532 552 592 612 652 = 27623

211

1

i

ix = (32 36 36 44 47 51 53 55 59 61 65)2 = 539

Luego: S2 =

11

1

211

12

11111

1

i

i

i

i

x

x =

11

)539()27623(

111

1 2

S2 = 121.2 En consecuencia: S = 11.01

La Media Ponderada: Es aquella en la que cada elemento está afectado por un factor

de importancia o peso. Considérese la sucesión de datos x1, x2, x3, ..., xn y la sucesión de factores de peso w1, w2, w3, . . ., wn. Entonces la media aritmética ponderada está

dada por:

n

nn

wwww

xwxwxwxwpX

...

...

321

332211

“Ejemplo 10”: Considérese el cuadro adjunto que contiene las calificaciones de un

estudiante de la Universidad Nacional Experimental del Táchira de un semestre

culminado. Calcule el promedio ponderado de éstas calificaciones.

“Desarrollo”

Se tiene que: x1 = 5 ; x2 = 6 ; x3 = 8 ; x4 = 9 ; x5 = 7

w1 = 5 ; w2 = 4 ; w3 = 3 ; w4 = 3 ; w5 = 2

Trabajo de la Unidad II Fernando A. Contreras J.

16

(5)(5) + (6)(4) +(8)(3) + (9)(3) + (7)(2)

Luego: Xp = = 6.7

5 + 4 + 3 + 3 + 2

Se concluye que el promedio ponderado de las calificaciones del estudiante es de 6.7 puntos.

La Media Geométrica: Es aquella cuya utilidad es prestada en el promediar

proporciones de variación. Considérese la sucesión de datos x1, x2, x3, ..., xn. La media

geométrica se define como la raíz n-ésima del producto de los datos que conforman la

muestra:

nnxxxxG .,...,... 321

“Ejemplo 11”: Supóngase que las ventas de una empresa de telecomunicaciones se

ilustran en el cuadro adjunto,

Calcule la media geométrica de estos datos.

“Desarrollo”

x1 = 2 ; x2 = 3/2 ; x3 = 5/4

Luego: 3

4

5

2

3)2(

G = 1.55

Se concluye que la proporción promedio de crecimiento de la empresa en sus ventas es

de un 155% por año en el período de los años citados.

La Media Armónica: Es aquella que se utiliza si las observaciones se expresan

inversamente a como se expresa el promedio buscado. Considérese la sucesión de datos

x1, x2, x3, ..., xn. La media armónica es:

nxxxx

nH

1...

111

321

“Ejemplo 12”: Supóngase que un mayorista ha gastado Bs. 100.000 en carteras para

damas en cada una de tres tiendas diferentes, tal y como se ilustra en la tabla adjunta,

Tienda Precio por unidad

Tienda 1 Bs. 20.000

Tienda 2 Bs. 25.000

Tienda 3 Bs. 50.000

Año Ventas

2000 El doble (2) de las ventas de 1999

2001 Tres medios (3/2) de las ventas del 2000

2002 Cinco cuartos (5/4) de las ventas del 2001

Trabajo de la Unidad II Fernando A. Contreras J.

17

¿Cuál es el precio promedio que el mayorista ha pagado por estas carteras para dama?

“Desarrollo”

Nótese que los datos se expresan como “tantos artículos por peso” y lo que se

quiere saber es “la cuantía pagada por artículo”. En este caso se aplica la media

armónica y el precio promedio pagado por artículo es:

3

H = = 300.000/11 = 27.272,73

1 1 1

+ + 20000 25000 50000

Se concluye que el precio promedio que el mayorista ha pagado por cartera para damas

es de aproximadamente Bs. 27.273.

“Diagrama de Pareto”

Es una forma sencilla de graficar, que permite encontrar de manera rápida y practica

la incidencia de algunos factores que afectan o influyen de forma determinante en un

proceso. En esta representación, se ilustran los datos a través de un gráfico de barras las

cuales van ordenas de mayor frecuencia a menor frecuencia, determinándose así, de

acuerdo a la frecuencia de las barras, las causas más importantes que afectan el proceso.

“Ejemplo 13”: Supóngase que la mayoría de los estudiantes de una sección de

estadística salen reprobados en un examen parcial. Determine un orden de causas que

afectaron a esta evaluación.

“Desarrollo”

Se realiza una encuesta entre los estudiantes reprobados en el examen y se obtienen

algunos datos en los que se analizan algunos factores relacionados que incidieron

negativamente en esta evaluación.

Factores Relacionados Frecuencia

Grado de dificultad en la evaluación (A) 29

Falta de material de apoyo (E) 5

Falta de mas tiempo para responderla (B) 15

No haber estudiado lo suficiente (C) 9

Deficiencia en las explicaciones del profesor (D) 7

Otros (F) 3

Los mismos se ordenan de acuerdo a su frecuencia y se grafican en un diagrama de

pareto. Es decir, colocando de primero el que tenga mayor frecuencia y por tanto la barra

es más alta, se segundo el que tenga segunda mayor frecuencia y por tanto la segunda

barra más alta y así sucesivamente.

Trabajo de la Unidad II Fernando A. Contreras J.

18

Se pude observar que los factores determinantes de incidencia en el proceso (examen

de estadística) fueron el grado de dificultad de la evaluación y el tiempo que se dio para

responderla.

“Coeficiente de Variación”

Es una medida que permite comparar las variaciones proporcionales o dispersiones

entre dos o más conjuntos de datos. Esta medida no es afectada por los diferentes

sistemas de unidades de medida de donde fueron extraídos los datos de las muestras a

comparar. Este coeficiente se define por la ecuación:

C.V. = %100.

X

S

“Ejemplo 14”: Se tienen dos muestras de pesos; una de pesos de elefantes y otra de peso

de ratones. Se calculó el promedio del peso de los elefantes en donde se obtuvo un peso

de 24.000 libras con una desviación estándar de 1285 libras. Por otro lado se calculó el promedio del peso de los ratones en donde se obtuvo un peso de 1,05 libras con una

desviación estándar de 0,16 libras. ¿Quién presenta una mayor variación en los pesos,

los elefantes o los ratones?

Se calcula el coeficiente de variación de cada uno de ellos:

1285

C.V. Elefantes = x 100% = 5,4% 24000

0,16

C.V. Ratones = x 100% = 15,2% 1,05

Se concluye que se presenta mayor variación en los pesos de los ratones.

FEDCBA

Fre

cuen

cia

80

60

40

20

0

Porcentaje

100

50

057

9

15

29

Factores que inciden en el proceso

Trabajo de la Unidad II Fernando A. Contreras J.

19

“Estandarización de una Variable”

Supóngase que se consideran los datos de dos variables diferentes X1 y X2, las cuales

están expresadas en diferentes unidades, o simplemente sus centros físicos y sus

varianzas no son los mismos. Se plantea la interrogante: ¿Cómo comparar dos elementos

x1 y x2, tomados respectivamente, de cada una de estas variables mencionadas? La

respuesta es, estandarizando las variables para llevarlas a un mismo sistema, con una

escala de medida común. Esto es, la variable “X” se puede estandarizar convirtiéndose en

una variable estandarizada “Z”. La variable “Z” no tiene unidades y se utiliza para

realizar comparaciones relativas entre los elementos particulares de una distribución. El

valor de “Z” esta dado por la ecuación:

Z = S

Xx

“Ejemplo 15”: Se sabe que Alejandra obtuvo 84 puntos en un examen de estadística

donde el promedio del curso fue 76 puntos con una desviación estándar de 10 puntos.

En matemática Alejandra obtuvo una calificación de 90 puntos donde el promedio del

curso fue de 82 puntos con una desviación estándar de 16 puntos. ¿En qué asignatura,

Alejandra obtuvo una puntuación relativamente más alta?

Se tiene que las calificaciones de Alejandra son:

xEstadística = 84 puntos

xMatemática = 90 puntos

Se calculan los valores estandarizados “Z” que corresponden a las calificaciones

relativas obtenidas en cada asignatura.

x – X 84 – 76

ZEstadística = = = 0.80

S 10

x – X 90 – 82

ZMatemática = = = 0.50 S 16

Gráficamente, éstos resultados se pueden ilustrar a través de una curva normal:

Curva Normal Estandarizada

Z = 1

Z = 0 ZM = 0.5 ZE = 0.8 Z

Se concluye que la calificación en

Estadística estuvo relativamente

mejor que la calificación en Matemática.

Trabajo de la Unidad II Fernando A. Contreras J.

20

“Ejemplo 16”: Realice los dos apartados siguientes;

A) Utilice los datos tabulados de la distribución de frecuencias de la “Tabla A” del

“Ejemplo 6” para calcular la media ( X ), la mediana ( X~

), moda ( X̂ ) y la Varianza (S2).

“Desarrollo”

Nótese que los datos de la “Tabla A” del “Ejemplo 6” corresponden a datos

agrupados (n 30) y están organizados en una tabla de distribución de frecuencias.

Cálculo de la Media

Clases Intervalos Limites Reales fi Xi fi Xi

Clase 1 53 – 55 52.5 – 55.5 2 54 108

Clase 2 56 – 58 55.5 – 58.5 5 57 285

Clase 3 59 – 61 58.5 – 61.5 9 60 540

Clase 4 62 – 64 61.5 – 64.5 15 63 945

Clase 5 65 – 67 64.5 – 67.5 12 66 792

Clase 6 68 – 70 67.5 – 70.5 5 69 345

Clase 7 71 – 73 70.5 – 73.5 2 72 144

50

.7

1

i

ii Xf

X = 50

144345792945540285108 = 63.18

Se concluye que el promedio de las estaturas de los 50 alumnos del curso de

Estadística de la UNET es de 63.18 pulgadas aproximadamente.

Cálculo de la Mediana

Clases Intervalos Limites Reales fi Fi

Clase 1 53 – 55 52.5 – 55.5 2 2

Clase 2 56 – 58 55.5 – 58.5 5 7

Clase 3 59 – 61 58.5 – 61.5 9 16

Clase 4 62 – 64 61.5 – 64.5 15 31

Clase 5 65 – 67 64.5 – 67.5 12 43

Clase 6 68 – 70 67.5 – 70.5 5 48

Clase 7 71 – 73 70.5 – 73.5 2 50

Se calcula la clase medianal:

2

n =

2

50 = 25; se busca en la casilla de Fi de menor valor que la contenga. En éste

caso F4 = 31 la contiene 2

n = 25 F4 = 31; por lo tanto la “Clase 4” es la clase

Clase Medianal F(m – 1)

fm

Trabajo de la Unidad II Fernando A. Contreras J.

21

medianal. Luego se sustituye los valores de la formula usando los datos de la clase

medianal.

X~

= 3.15

162

50

5.61

= 63.3

Se concluye que el 50% de los estudiantes el curso de Estadística de la UNET tiene su

estatura por debajo o por encima de 63.3 pulgadas aproximadamente.

Cálculo de la Moda

Clases Intervalos Limites Reales fi

Clase 1 53 – 55 52.5 – 55.5 2

Clase 2 56 – 58 55.5 – 58.5 5

Clase 3 59 – 61 58.5 – 61.5 9

Clase 4 62 – 64 61.5 – 64.5 15

Clase 5 65 – 67 64.5 – 67.5 12

Clase 6 68 – 70 67.5 – 70.5 5

Clase 7 71 – 73 70.5 – 73.5 2

Se ubica la clase modal:

La casilla que posee la mayor frecuencia es f4 = 15. Por lo tanto la clase modal es la

“Clase 4”.

5.633.

36

65.61ˆ

X

Se concluye que la mayoría de los estudiantes del curso de Estadística de la UNET,

tienen una estatura aproximada a 63.5 pulgadas.

“Representación Gráfica de la Mediana (Ejemplo 6)”

La mediana se representa gráficamente a través de la ojiva. Para ello se ubica la

posición de la mediana en el eje vertical (Fi); luego desde la posición de la mediana y

perpendicular a ésta y al eje vertical, se traza una línea que corte la gráfica, luego desde

ese punto de corte se traza una línea que corte en forma perpendicular el eje horizontal

que es donde se encuentra la mediana ( X~

).

Clase Modal

Frecuencia que antecede a la clase modal

Frecuencia que precede a la clase modal

d1 = 15 – 9 = 5

d2 = 15 – 12 = 3

Trabajo de la Unidad II Fernando A. Contreras J.

22

“Representación Gráfica de la Moda (Ejemplo 6)”

La moda se representa gráficamente a través del histograma. Para ello se hacen dos

líneas rectas transversales que unen los vértices opuestos de las barras que están a cada

lado de la barra más alta con los vértices de la misma. Desde éste punto de corte se traza

una línea recta que corte el eje horizontal que es donde está la moda.

Trabajo de la Unidad II Fernando A. Contreras J.

23

Cálculo de la Varianza y la Desviación Estándar

Clases Intervalos fi Xi fi.Xi Xi2 fi.Xi2

Clase 1 53 – 55 2 54 108 2916 5832

Clase 2 56 – 58 5 57 285 3249 16245

Clase 3 59 – 61 9 60 540 3600 32400

Clase 4 62 – 64 15 63 945 3969 59535

Clase 5 65 – 67 12 66 792 4356 52272

Clase 6 68 – 70 5 69 345 4761 23805

Clase 7 71 – 73 2 72 144 5184 10368

S2 =

7

1

27

12

50

.

.150

1

i

i

ii

ii

Xf

Xf

Se calculan las partes de la fórmula por separado:

7

11

2.* ii Xf = 5832 + 16245 + 32400 + 59535 + 52272 + 23805 + 10368 = 200457

7

11

.* ii Xf = 108 + 285 + 540 + 945 + 792 + 345 + 144 = 3159

Luego :

S2 =

50

3159200457

150

12

= 17.80

Se concluye que la varianza es de 17.80 pulgadas cuadradas.

“La Desviación Estándar”

S = 80.17 = 4.22

Se concluye que la desviación estándar es de 4.22 pulgadas.

Trabajo de la Unidad II Fernando A. Contreras J.

24

UNIVERSIDAD NACIONAL EXPERIMENTAL DEL TÁCHIRA

DEPARTAMENTO DE MATEMÁTICA Y FÍSICA

“Trabajo del Segundo Parcial”

(Valor de 50 puntos)

“Instrucciones”

El Presente Trabajo Consta de 15 preguntas de desarrollo. Las preguntas se deben realizar a mano (con su puño y letra) y en hojas blancas tamaño carta, entregadas en una carpeta con sus datos. El Trabajo es individual y tiene fecha tope el día que se realice el segundo parcial de la asignatura.

1.) Las medidas realizadas a dos muestras de plantas de dos especies similares (en cm.) fueron las siguientes:

Especie A 8.2 7.9 10.0 9.4 7.8 9.1 6.5 9.5 10.0 10.0 10.0 9.9

Especie B 7.3 8.1 9.4 8.3 7.1 8.0 8.3 8.0 8.9 7.9 8.3 6.1

Ordene en forma creciente y decreciente; luego represente las medidas de éstas

muestras en un mismo gráfico de puntos. Utilice “” para la Especie A y “” para la Especie B.

2.) Se está estudiando la altura de los pinos de cierta edad en Mesa de Aura, una localidad turística del Estado Táchira. Para ello se elige una muestra de 24 árboles cuyas alturas (en pies) fueron:

64 73 68 68 76 62

67 71 69 70 68 60

65 68 66 68 67 71

66 72 66 72 67 65

Organice éstos datos en un Rol de Frecuencias. Luego represente gráficamente estos datos a través de:

a) Gráfico de Barras. b) Gráfico Acumulativo. c) Calcule: La Media, La Moda y La mediana.

3.) El número de empleados de una empresa de telecomunicaciones clasificados según su deporte favorito esta dado por la tabla adjunta:

Deporte Fútbol Básquetbol Béisbol Natación Maratón Voleibol Ninguno

Frecuencia (fi) 15 11 9 5 7 6 6

Población física: Árboles de Pino.

Población estadística: Altura. Muestra: 24 Pinos de Mesa de Aura.

Trabajo de la Unidad II Fernando A. Contreras J.

25

Represente estos datos en una tabla de frecuencia que contenga: frecuencia acumulada, frecuencia relativa, % de frecuencia relativa, % de frecuencia relativa acumulada. Luego represéntelos gráficamente a través de:

a) Un gráfico de torta (gráfico circular) b) Un gráfico de barras

4.) Realice un proceso análogo al anterior con los datos correspondientes al número de estudiantes de cierta universidad, clasificados de acuerdo a su lugar de origen:

Lugar de Origen Frecuencia (fi)

Norteamericano 11000

Centroamericano 3000

Suramericano 8000

Europeo 5000

Asiático 5000

Australiano 1000

5.) Se juegan dos dados regularmente 70 veces y se registra la suma de puntos obtenidos en cada jugada. Se dio la siguiente distribución de frecuencias: Suma de Puntos de las Caras Superiores 2 3 4 5 6 7 8 9 10 11 12 Total

Frecuencia (fi) 2 2 5 9 8 9 11 7 7 6 4 70

Organice éstos datos en un Rol de Frecuencias. Luego represente gráficamente estos datos a través de:

a) Gráfico de Barras.

b) Gráfico Acumulativo.

c) Calcule: La Media, La Moda y La Mediana.

6.) Suponga que se les realiza un test de Geometría a 50 aspirantes a estudiar Arquitectura en la Universidad Nacional Experimental del Táchira. Los resultados fueron los siguientes:

74 44 49 33 34 33 76 58 68 39

29 41 45 32 83 58 73 47 40 26

37 47 69 53 55 58 49 45 65 47

54 50 51 66 80 73 57 61 56 50

38 45 51 44 41 68 45 93 43 17

Realice lo siguiente:

a) Construya una tabla de distribución de frecuencias. b) Construya un histograma y el polígono de frecuencias c) Construya el histograma de frecuencia acumulada y la ojiva d) Calcule la media, la mediana, la moda, la varianza y desviación estándar.

Trabajo de la Unidad II Fernando A. Contreras J.

26

Luego, realice una representación gráfica de la mediana y la moda. 7.) Los siguientes datos corresponden a los pesos en Kg. de un grupo de 45 alumnos de Estadística de la Universidad Nacional Experimental del Táchira:

59.7 57.5 62.3 73.1 52.9 66.3 51.4 60.7 45.9

55.6 58.0 52.3 63.5 52.6 60.1 55.3 55.2 55.5

52.6 54.5 51.8 66.9 54.9 63.9 59.4 59.3 58.6

53.6 65.7 54.8 51.2 55.5 48.2 58.3 52.4 58.8

59.4 54.5 50.7 52.8 50.3 46.8 62.9 49.3 52.5

Realice un proceso análogo al anterior. 8.) Construya un diagrama de Pareto para representar los factores que influyeron en la venta de un producto de diferente marca, cuando se les preguntó a los consumidores del mismo, las causas de su falta de preferencia por el mismo:

Factores Relacionados Frecuencia

Presentación en su empaque (D) 15

Falta de mejora en su sabor (A) 35

Alto costo (B) 19

Poca cantidad del mismo (E) 11

Alto costo (C) 17

Otros (F) 5

9.) Considérese la tabla adjunta:

Estudiantes Color Preferido Índice Académico # de Asignaturas Inscritas Procedencia

María Azul 7.8 7 Táriba

Amelia Verde 5.3 6 Palmira

Luis Blanco 6.2 5 San Cristóbal

Angélica Azul 7.1 6 Rubio

José Rojo 6.4 4 Rubio

Jorge Amarillo 7.9 5 Palmira

Alejandra Verde 8.4 6 San Cristóbal

Andreina Rojo 6.9 4 Mérida

Roberto Azul 5.5 3 San Cristóbal

Marta Amarillo 6.9 5 Capacho

Paulina Blanco 6.4 6 San Cristóbal

Realice una representación gráfica adecuada de cada una de estas variables (un gráfico aparte por cada variable, elija el grafico de su preferencia).

10.) Considérese la tabla adjunta:

Trabajo de la Unidad II Fernando A. Contreras J.

27

Supermercado A Supermercado B Supermercado C Supermercado D

87 80 79 82

76 71 77 68

54 57 60 62

76 75 72 39

34 39 44 33

Realice una representación gráfica adecuada a los datos (puede ser un gráfico de

cuatro barras por cada supermercado dentro de un contexto grafico total que tendría 20 barras por todos).

11.) Supóngase que las ventas de una empresa de telecomunicaciones se ilustran en el cuadro adjunto,

Calcule la media geométrica (el promedio proporcional) de las ventas en estos años.

12.) Considérese el cuadro adjunto que contiene las calificaciones de un estudiante de la Universidad Nacional Experimental del Táchira de un semestre culminado.

Calcule el promedio ponderado de estas calificaciones.

13.) Supóngase que un mayorista ha gastado Bs. 300.000 en productos en cada

una de tres sucursales diferentes, tal y como se ilustra en la tabla adjunta,

Año Ventas

2001 El doble (2) de las ventas del 2000

2002 Tres medios (3/2) de las ventas del 2001

2003 Cuatro quintos (4/5) de las ventas del 2002

2004 Cinco cuartos (5/4) de las ventas del 2003

2005 Tres medios (3/2) de las ventas del 2004

2006 Siete tercios (7/3) de las ventas del 2005

2007 Tres medios (3/2) de las ventas del 2006

2008 Siete quintos (7/5) de las ventas del 2007

2009 El doble (2) de las ventas del 2008

2010 Cinco cuartos (5/4) de las ventas del 2009

Asignatura Calificación

Matemática I 5

Estudios Generales 8

Idiomas I 6

Lenguaje Y Comunicaciones 9

Lógica 7

Informática 6

Algebra 5

Trabajo de la Unidad II Fernando A. Contreras J.

28

Tienda Precio por producto

Sucursal 1 Bs. 27.000

Sucursal 2 Bs. 25.000

Sucursal 3 Bs. 20.000

Sucursal 4 Bs. 75.000

Sucursal 5 Bs. 40.000

Sucursal 6 Bs. 35.000

Sucursal 7 Bs. 15.000

¿Cuál es el precio promedio que el mayorista ha pagado por estos productos?

14.) Supóngase que se tienen dos muestras de estaturas (medidas a lo largo) de 2

especies de hormigas (en mm):

Especie A 1.2 0.9 1.0 1.4 0.8 1.1 0.5 1.5 1.0 1.0 1.2 0.9

Especie B 3.3 2.1 3.4 2.3 3.1 4.0 2.3 3.0 3.9 2.9 2.3 3.1

¿Qué especie presenta una mayor variación en las medidas, la hormiga de Especie A o la hormiga de Especie B?

15.) Supóngase que Luis obtuvo 63 puntos en un examen de Mecánica donde el promedio del curso fue 58 puntos con una desviación estándar de 7 puntos. En Termofluidos Luis obtuvo una calificación de 80 puntos donde el promedio del curso fue de 78 puntos con una desviación estándar de 11 puntos. ¿En qué asignatura, Luis obtuvo una puntuación relativamente más alta?