laboratorio de estadística
DESCRIPTION
Laboratorio de preguntas respecto a la parte introductoria y conceptos básico de estadísticaTRANSCRIPT
EJERCICIOS III
UNIVERSIDAD
PRIVADA
ANTENOR
ORREGOMAESTRA EN EDUCACINMENCIN: TUTORA Y ORIENTACIN EDUCATIVA
ESTADSTICA DESCRIPTIVAEJERCICIOS I, II y III
CURSO:ESTADSTICA APLICADA A LA EDUCACINPROFESOR:MS. VLADIMIRO A. SAMANAMUD RIOSINTEGRANTE:BENITES LUIS, FRANCISCO JAVIER
DAZ SNCHEZ, MANUEL JESS
TORNERO MENDOZA, LUDVER SANTIAGO
MOYA RONDO, RAFAEL MARTNTRUJILLO PER
2006
EJERCICIOS I1. Discuta entre una poblacin una muestra; entre un parmetro y una estadstica.
La poblacin es una categora que pude expresarse singular o particularmente. Esta se asocia al diverso. Por otra parte, una muestra es una denominacin que utilizamos para designar a una parte o sector seleccionado de la poblacin.
El parmetro es una medicin que sintetiza los valores de una poblacin; y denominamos estadstica a la medida que resume los valores de una muestra. 2. Cul es la diferencia entre una variable cuantitativa y una variable cualitativa? Proponga tres ejemplos. VARIABLE CUANTITATIVAVARIABLE CUALITATIVA
Se expresa por medios numricos.
Las subclases que presentan son continuas y discretas. Ejemplos:
Nmero de textos de una biblioteca universitaria
El peso de los estudiantes
El sueldo de los congresistas Se enuncia por medios no numricos.
Incluye a las subclases de nominales y ordinales.
Ejemplos :
El estrato social al que pertenecen unas personas
Una carrera universitaria
Nivel de instruccin
3. Distinguir entre una variable continua y una discreta. Ponga tres ejemplos de cada una.VARIABLE CONTINUAVARIABLE DISCRETA
Adquiere cualquier valor dentro de un intervalo.
Ejemplos:
Los sueldos del mes de junio de los profesores de la UPAO
La talla de los jugadores de la seleccin de bsquet
La distancia entre la ciudad de Trujillo y Chiclayo Slo toma valores determinados. Bsicamente, los valores que registra se expresan en nmeros enteros.
Ejemplos :
Nmero de llamadas telefnicas de una empresa
Nmero de autos construidos por la empresa Ferrari
Nmero de abogados penalistas del estudio Amaya
4. Seleccione cualquier universo que le interese. Identifique variables cuantitativas y cualitativas de dicho universo que pudieran ser seleccionadas para un estudio. Universo
Docentes universitarios de la facultad de Educacin de la UPAO
Variables cualitativas
Docente que se formaron en institutos pedaggicos
Docentes que egresaron de una universidad
Docentes con estudios de postgrado
Variables cuantitativas
Nmero de docente colegiados en el 2006
El nmero de aos de servicio de los docentes en la universidad
Nmero de docentes con horas en el rea de Tutora.
5. Determine si las variables son discretas o continuas (Pgina 30).A) Discreta
B) Discreta
C) Continua
D) Continua
E) Discreta
6. Suponga que tiene la siguiente informacin de Ral Ros (Pgina 30). Clasifique cada una de las 10 respuestas de acuerdo con el tipo de variable y el nivel de medicin.TIPO DE VARIABLENIVEL DE MEDICIN
A) Cualitativa
B) Cualitativa
C) Cualitativa
D) Cuantitativa
E) Cuantitativa
F) Cuantitativa
G) Cualitativa
H) Cualitativa
I) Cualitativa
J) CuantitativaA) Nominal
B) Nominal
C) Ordinal
D) Intervalo
E) Discreta
F) Intervalos
G) Nominal
H) Nominal
I) Nominal
J) Intervalos
7. Identifique el tipo de escala (nominal, ordinal, de intervalo o de proporcin) que se utiliza en cada uno de los siguientes casos. Explique su razonamiento
A) Escala Nominal. Slo se emplea para identificar y clasificar.
B) Escala de Proporcin. Expresa el cociente de dos valores. En otros trminos, compara dos valores.C) Escala Ordinal. Se busca determinar el grado relativo y las caractersticas del objeto.
D) Escala Ordinal. Se busca determinar el grado relativo y las caractersticas del objeto.
E) Escala de Proporcin. Expresa el cociente de dos valores. En otros trminos, compara dos valores.F) Escala de Proporcin. Expresa el cociente de dos valores. En otros trminos, compara dos valores.EJERCICIOS II
1. Los datos corresponden a las resistencias e tubos circulares con tapas selladas en los extremos: 164, 165, 168, 166, 165, 168, 167, 169, 167 y 170. Construya un diagrama de puntos para estos datos y d algunas caractersticas de los mismos.
Solucin
164165166167168169170
Se puede observar que el valor central de los datos es 167 y que las resistencias de los tubos varan entre 164 y 170. Adems se observa que los valores de resistencia 165, 167 y 168 se presentan en dos oportunidades cada uno.
2. El tiempo de terminacin de tarea en un experimento de aprendizaje se registra para dos grupos de individuos.
Grupo A:23,736,925,530,228,034,8
Grupo B:15,025,421,022,325,228,8
En un solo diagrama de puntos represente los tiempos de ambos grupos. Comente el diagrama.Solucin
Grupo B
Grupo A
1516171819202122232425262728293031323334353637
Se observa que para el grupo A el tiempo de terminacin de tarea vara entre 23,7 y 36,9 teniendo un valor central de 30,3; mientras que en el grupo B dicho tiempo vara entre 15,0 y 28,8 con un valor central de 21,9.
Aparte de ello, se interpreta que el Grupo B registra un tiempo mucho menor al del grupo A.
3. Los siguientes datos corresponden al costo por frasco de cuarto de litro (en soles) de 29 champs etiquetados para cabello delgado.
69912322812321218741963
493755854487171123506551
351420288
Forme el diagrama de tallos y hojas. Comente el diagrama.
Solucin
0|88
1|2289714
2|32308
3|275
4|94
5|501
6|935
7|4
8|57
9|1
El diagrama muestra que la mayora de los precios est entre 11 y 69; el valor medio est entre 32 y 35. Tambin se observa que no hay una distribucin simtrica de los datos alrededor del valor medio.
4. Un artculo sobre mantequilla de palta report las siguientes calificaciones para varias marcas:
Cremoso: 56446236395350654540
566841304350563022
Crujiente: 62537542474034625250
344236754380475662
Construya una presentacin comparativa de tallos y hojas, poniendo en lista de tallos en el centro y luego presentando las hojas cremosas a la derecha y las hojas crujientes a la izquierda. Describa las similitudes y diferencias para los dos tipos.
Solucin
CrujientesCremosas
|2|2
644|3|6900
732072|4|45013
6203|5|630606
222|6|258
55|7|
0|8|
Similitudes:
En ambos casos la mayora de calificativos est entre 40 y 56
En ambos casos el valor medio est entre 40 y 50.
En ambos casos hay una distribucin de las calificaciones que se aproxima a ser simtrica alrededor del valor medio.
Diferencias:
En caso de las hojas cremosas, las calificaciones varan entre 22 y 68; mientras en el caso de las hojas crujientes las calificaciones varan entre 34 y 80.5. La concentracin de slidos suspendidos en agua de ro es una caracterstica ambiental importante. Un artculo report sobre la concentracin (en partes por milln, o ppm) para varios ros diferentes. Supongamos que se obtuvieron las siguientes 50 observaciones para un ro en particular.
55.860.937.091.365.842.333.860.676.069.0
45.939.135.556.044.671.761.261.547.274.5
83.240.031.736.762.347.394.656.330.068.2
75.371.465.252.658.248.061.878.839.865.0
60.777.159.149.569.369.864.927.187.166.3
a) Construya una distribucin de frecuencias usando intervalos de clase:
20 30, 30 40, ..., 90 100.SolucinDISTRIBUCIN DE FRECUENCIAS DE LA CONCENTRACIN DE SLIDOS SUSPENDIDOS EN AGUAS DE ROSIntervalo de claseTarjasFrecuencia absolutaFrecuencia relativaFrec. Relativa acumulada
[20 30[10,020,02
[30 40[80,160,18
[40 50[80,160,34
[50 60[60,120,46
[60 70[160,320,78
[70 80[70,140,92
[80 90[20,040,96
[90 100]20,041,00
TOTAL501,00
b) Qu proporcin de las observaciones de concentracin fue menos de 50?, y por lo menos 60?SolucinMenos de 50: 1 + 8 + 8 = 17 ( Proporcin: 17/50
Por lo menos 60 (60 a ms): 16 + 7 + 2 + 2 = 27 ( Proporcin: 27/50c) Construya un histograma con las frecuencias porcentuales.
Solucin
d) Construya una ojiva con las frecuencias porcentuales.
Solucin
6. La figura contiene la ojiva porcentual de los ingresos de 200 trabajadores.
a) Cul es el porcentaje de trabajadores con ingresos menores a S/. 500?Solucin
En base a la Ojiva, construimos la tabla de frecuencias que nos permitir resolver las preguntas.
Intervalo de claseFrecuencia relativa acumuladaFrecuencia relativaFrecuencia porcentual (%)Frecuencia absoluta
[300 400[0,10,11020
[400 500[0,450,353570
[500 600[0,550,11020
[600 700[0,590,0448
[700 800[0,630,0448
[800 900[0,670,0448
[900 1000[0,710,0448
[1000 1100[0,750,0448
[1100 1200[0,790,0448
[1200 1300[0,830,0448
[1300 1400[0,870,0448
[1400 1500[0,880,0112
[1500 1600[0,930,05510
[1600 1700[0,980,05510
[1700 1800[10,0224
Total1,00100200
Ingresos menores a S/. 500:
De las frecuencias porcentuales: 10 + 35 = 45 %b) Cuntos trabajadores tienen ingresos de S/. 1200 o ms?Solucin
Ingresos de 1200 a ms:
De las frecuencias absolutas: 8 + 8 +2 + 10 +10 + 4 = 42 trabajadoresc) Qu porcentaje de trabajadores gana menos de S/. 600?Solucin
Ingresos menores a S/. 600:
De las frecuencias porcentuales: 10 + 35 + 10 = 55%
d) Construya la distribucin de frecuencias relativas.Solucin
Cuadro construido en tem (a)
7. El siguiente cuadro muestra el estado civil de los jefes de familia del Barrio III del Alto Trujillo en septiembre de 1998.
a) Cul es el porcentaje de trabajadores con ingresos menores a S/. 500?
b) Cuntos trabajadores tienen ingresos de S/. 1200 a ms?
c) Qu porcentaje de trabajadores ganan menos de S/. 600?
d) Construya la distribucin de frecuencias relativas.
Solucin
No es posible, porque en el mdulo no aparece el mencionado cuadro.
8. Considere los siguientes datos sobre el tipo de problemas de salud (J = articulacin hinchada, F = fatiga, B = dolor de espalda, M = debilidad muscular, T = tos, N = nariz con flujo e irritacin, O = otros), presentado por un grupo de ejecutivos. Obtenga frecuencias y frecuencias relativas para las diferentes categoras y dibuje un diagrama de barras.
OONJTFBBFOJOOOMOFFOON
ONJFJBOTJOJJFNOBMOJMO
BOFJOOBNTOOOMBFJFN
Solucin
FRECUENCIAS ABSOLUTAS Y FRECUENCIAS RELATIVAS PARA LOS TIPOS DE PROBLEMAS DE SALUD
Tipo de problemaTarjasFrecuencia absolutaFrecuencia relativa
J100,16
F90,15
B70,12
M40,07
T30,05
N60,1
O210,35
Total601,00
9. Los datos de la tabla siguiente representan el importe anual del impuesto sobre la renta a empresas pagadas (en miles de dlares) al gobierno por una compaa constructora de 1991 a 1997.
Ao1991199219931994199519961997
Impuestos38.642.655.754.960.065.764.6
pagados
Represente los datos en una grfica adecuada.
Solucin
10. La tabla presenta las defunciones por causas y sexo en la ciudad de Trujillo en 1996.Causas del accidenteSexo
HombresMujeres
Accidentes transportes1145432
Sumersin accidental348104
Cadas242120
Envenenamientos6046
Otros accidentes655320
Represente los datos en una grfica adecuada.
Solucin
EJERCICIOS III
01) Dadas las dos series de datos, cada una con muestras de tamao siete,A:10232425B:20121312141215
a) Para cada serie, calcule la media, mediana y moda.MEDIDAS DE TENDENCIA CENTRALSERIE ASERIA B
MODA212
MEDIA ARITMTICA414
MEDIANA313
b) Compare sus resultados y resuma sus hallazgos.
Analizando las medidas de tendencia central para la serie A y la serie B, se puede concluir que la mediana y la media aritmtica estn muy cerca al valor ms frecuente de ambas series llamado moda.c) Compare el primer elemento muestreado de cada serie, compare el segundo elemento muestreado de cada serie, etc. Describa brevemente sus hallazgos aqu a la luz de su resumen de la parte (b).
El primer valor de ambas series est muy lejos de las medidas de tendencia central, lo cual se interpreta que es un valor muy disperso, a partir del segundo elemento hasta el sptimo de ambas series, los valores estn muy prximos a las medidas de tendencia central.02) Un entrenador debe decidir cul de dos corredores de velocidad seleccionar para la carrera corta de 100 metros en una futura competencia. El entrenador, basar su decisin, en los resultados de cinco carreras corridas por dos atletas con intervalos de descanso de 15 minutos. Los siguientes tiempos (en segundos) se registraron para las cinco carreras:
CARRERAS
ATLETA12345
A12.112.012.016.812.1
B12.312.412.412.512.4
a) Basndose en estos datos, Cul de los corredores debe seleccionar el entrenador?, Por qu?ATLETAMEDIA ARITMTICA (5 datos)
A13.00
B12.40
Analizando la media aritmtica de ambos corredores, el entrenador debe seleccionar al atleta B.
b) Deber ser distinta la eleccin si el entrenador supiera que A se cay al inicio de la cuarta carrera?, Por qu?
ATLETAMEDIA ARITMTICA (4 datos)
A12.05
B12.38
Si anulamos la cuarta carrera, los valores de la media aritmtica varan y por lo tanto el entrenador debe seleccionar al atleta A.
c) Analice las diferencias en los conceptos de la media y la mediana como mediciones de tendencia central y cmo se relacionan estos con (a) y (b).CON CINCO DATOS
ATLETAMEDIA ARITMTICAMEDIANA MODA
A13.0012.1012.10
B12.4012.4012.40
CON CUATRO DATOS
ATLETAMEDIA ARITMTICAMEDIANA MODA
A12.0512.0512.10
B12.3812.4012.40
Tanto la media y la mediana en el anlisis de los puntos (a) y (b) reflejan la frecuencia de los datos y el acercamiento al trmino central, por lo que observando las anteriores tablas se puede concluir que la moda no se altera, pero la mediana sufre variaciones con el atleta A, puesto que se elimino un trmino.03) Un fabricante de bateras de linternas tom una muestra de 13 bateras de la produccin de un da y las prob continuamente hasta que fallaron. El nmero de horas que fueron probadas fue:3424263175452464511049631512266492562298
a) Calcule la media y la mediana. Observando la distribucin de tiempos, Qu medidas descriptivas parecen mejor? Por qu?MEDIDAS DE TENDENCIA CENTRALRESULTADO
MEDIA ARITMTICA (PROMEDIO)472
MEDIANA451
MEDIDAS DE DISPERSINRESULTADO
DESVIACIN ESTNDAR212
Observando los resultados de las medidas de tendencia central se puede concluir que tanto la media y la mediana nos reflejan un valor muy cercano y analizando la desviacin estndar se concluye que los datos estn muy dispersos.b) De qu manera sera til esta informacin para el fabricante? Analice
La informacin le puede servir como un antecedente, pero no para tomar decisiones, puesto que los datos estn muy dispersos.04) Dada la siguiente serie de datos:75118362198
a) Calcule la media, mediana y moda.MEDIDAS DE TENDENCIA CENTRALRESULTADOS
MODA8
MEDIA ARITMTICA6
MEDIANA6.50
b) Calcule el rango, varianza, desviacin estndar y coeficiente de variacin.
MEDIDAS DE DISPERSINRESULTADOS
RANGO10
DESVIACIN ESTNDAR3.23
COEFICIENTE DE VARIACIN53.86%
c) Estn sesgados estos datos? Si es as Cmo?
Analizando las medidas de tendencia central y las medidas de dispersin se concluye que los datos si estn sesgados, debido a que el coeficiente de variacin de la desviacin estndar de la media es ms del 50% y el valor de la desviacin estndar es ms de la mitad de la media aritmtica.05) Dada la siguiente serie de datos:
7566486936a) Calcule la media, mediana y moda.MEDIDAS DE TENDENCIA CENTRALRESULTADOS
MODA6
MEDIA ARITMTICA6
MEDIANA6
b) Calcule el rango, varianza, desviacin estndar y coeficiente de variacin.
MEDIDAS DE DISPERSINRESULTADOS
RANGO6
DESVIACIN ESTNDAR1.76
COEFICIENTE DE VARIACIN29.40%
c) Estn sesgados estos datos? Si es as Cmo?
Analizando ambas medidas que se muestran en las tablas anteriores, se concluye que los datos no estn tan dispersos y que los valores de la tendencia central son similares, lo cual se refleja en un valor muy bajo del coeficiente de variacin.d) Compare las medidas de tendencia central con aquellos del problema 4 (b)Los resultados del problema 4 (b) muestran una desviacin estndar casi la mitad de la media aritmtica y en el problema 5 (b) es la cuarta parte de la media aritmtica, lo cual nos quiere decir que los datos del problema 4 estn ms dispersos que los del problema 5.06) Dos marcas de competidores de calzado se sometieron a una prueba para comprobar el desgaste del calzado. Cada una de ellas indic el siguiente nmero de horas de uso para necesarias para que se detecte un desgaste significativo:Marca A:97837582986575Marca B:785687548965
a) Qu calzado parece presentar menor desgaste?
MARCA DE CALZADOMEDIA
ARITMTICADESVIACIN
ESTNDARCOEFICIENTE DE VARIACIN
A82,1412,0314,65%
B71,5015,3421,46%
La marca de calzado A presenta menor desgaste.b) Qu calzado parece tener el programa de control de calidad que produce un desgaste ms uniforme?El calzado A tiene un mejor programa de control de calidad, debido a que sus datos no estn muy dispersos.07) Mara trabaja como agente de bolsa. Sus anotaciones indican que las tasas de rendimiento (en porcentaje) de dos valores durante 10 meses seleccionados fueron:
Valor 1:5.67.26.36.37.18.27.95.36.26.2Valor 2:7.57.36.28.38.28.08.17.35.95.3
a) Qu valor podra ser mejor para los clientes interesados en un rendimiento ms alto?
VALORMEDIA
ARITMTICADESVIACIN
ESTNDARCOEFICIENTE DE VARIACIN
16,940,9313,43%
27,660,749,68%
El valor con mayor rendimiento para los clientes interesados en las inversiones es el valor 2, debido a que tiene un mayor promedio y adems no estn muy dispersos, lo cual refleja un rendimiento constante en las inversiones.b) Qu valor debera recomendar Mara a los clientes que prefieren menor riesgos?
El valor que debera recomendar Mara es el valor 2, debido a que su rendimiento al cabo de los 10 meses no es muy disperso.08) El jefe de personal de un banco tiene que contratar a una secretaria por su eficiencia en escritura. Una candidata al trabajo escribe 6 veces un manuscrito con el siguiente nmero de errores: 5, 6, 2, 1 , 2 y 0. Otra candidata escribe el mismo manuscrito seis veces con 3, 4, 5, 3, 4 y 5 faltas. Qu candidata debe contratar el jefe de personal?CANDIDATAMEDIA
ARITMTICADESVIACIN
ESTNDARCOEFICIENTE DE VARIACIN
12.672.3487,68%
240.8922,36%
La candidata que deber elegir el jefe de personal es la candidata 2, debido a que ofrece una menor frecuencia en cometer errores, lo cual se refleja en el coeficiente de variacin, a pesar de tener un promedio ms alto en cometer errores.La candidata 1 sus errores estn ms dispersos.
09) Una supervisora de una factora de montaje recibi las siguientes puntuaciones de eficiencia a lo largo de los 12 ltimos meses.
566948756572814361423652a) Si desea producir la impresin ms favorable, debera informar sobre la media aritmtica, la mediana o la moda de las puntuaciones en su auto evaluacin anual?
MEDIDAS DE TENDENCIA CENTRALRESULTADOS
MEDIA ARITMTICA58.33
MEDIANA58.50
MODA
Los resultados de las medidas de tendencia central nos dicen que las puntuaciones de eficiencia en los 12 ltimos meses es alrededor de 58.b) Hasta qu punto han sido consistentes sus puntuaciones?
MEDIDAS DE DISPERSINRESULTADOS
RANGO45
DESVIACIN ESTNDAR14.45
COEFICIENTE DE VARIACIN24.77%
Las puntuaciones han sido consistentes hasta un 24.77 %010) Para las puntuaciones de la supervisin del ejercicio (9), calcule e interprete el cuartil 3.
566948756572814361423652
Este valor nos indica que el percentil 75 cuartil 3 est situado entre los lugares 9 y 10, es decir entre las observaciones 61 y 42.
As el 75% de los datos estn por debajo de 56.25 y el 25% de los datos por encima de este valor. EMBED Equation.3
EMBED Equation.3
EMBED Equation.3
EMBED Equation.3
23,7
25,5
28,0
30,2
34,8
36,9
15,0
21,0
22,3
25,4
28,8
25,2
PAGE
_1212064063.unknown
_1212064139.unknown
_1212064275.unknown
_1212064080.unknown
_1212063632.bin