figueroa sanchez rubeola
TRANSCRIPT
-
8/17/2019 Figueroa Sanchez Rubeola
1/17
TRABAJO PR CTICO INTEGRADOR GRUPAL
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información TRABAJO PRÁCTICO INTEGRADOR GRUPAL 2015
1
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información
Probabilidad y EstadísticaTrabajo Práctico Integrador
Apellido y Nombre N° de Legajo
Figueroa, Constanza 60724Sánchez, Celeste 54379
Rubeola, Viviana
Profesores
Ing. Savi, Cecilia
Lic. Garibaldi, Carlos
Curso: 2k9
Turno: Noche
Año Lectivo 2015
-
8/17/2019 Figueroa Sanchez Rubeola
2/17
TRABAJO PR CTICO INTEGRADOR GRUPAL
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información TRABAJO PRÁCTICO INTEGRADOR GRUPAL 2015
2
Índice
Caso de estudio………………………………………………………………… Pág.3
Consignas………………………………………………………………………. Pág.4
Desarrollo……………………………………………………………………….. Pág.5
Anexo……………………………………………………………………………. Pág.16
-
8/17/2019 Figueroa Sanchez Rubeola
3/17
TRABAJO PR CTICO INTEGRADOR GRUPAL
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información TRABAJO PRÁCTICO INTEGRADOR GRUPAL 2015
3
TRABAJO PRÁCTICO 2015
La Universidad Autónoma de Málaga desea realizar un estudio de las características
personales, el nivel de rendimiento y la satisfacción académica de sus estudiantes
luego de haber cursado un año de la Licenciatura en Ingeniería de Software, de manera
tal que se puedan analizar y obtener conclusiones que permitan tomar medidas para
mejoramiento de la calidad académica y para la determinación de las condiciones y
asignaciones de las becas universitarias.
El estudio se basó en los datos recogidos en la siguiente encuesta efectuada por el
Instituto de Estadística de la referida casa de altos estudios al 01 de marzo de 2015, a
los 105 alumnos de segundo año de la Licenciatura en Ingeniería de Software de la
Universidad Autónoma de Málaga.
Encuesta a alumnos de la Licenciatura en Ingeniería de Software -UAM
(Inserte una marca o ponga un círculo a la opción según sea apropiado)
Código Número de encuestado ………………….
1. ¿Cuál es su edad? (en años cumplidos) …………………
2. ¿Cuál es su género?
Femenino Masculino
3. ¿Cuál es su peso? …………………
4. ¿Cuál es su estatura? …………………
5. ¿Cuántos hermanos tiene? …………………
6. ¿Cuántas horas estudia en su hogar semanalmente? ……………
7. ¿Trabaja?
Si
No
8. ¿Cuáles son sus gastos mensuales? (En pesos) ………………
9. ¿Qué cantidad de materias tiene aprobadas? .................…..
10. En general, ¿qué tan satisfecho/insatisfecho está con la carrera?
Muy satisfecho Moderadamente satisfecho
Un poco insatisfecho Muy insatisfecho
-
8/17/2019 Figueroa Sanchez Rubeola
4/17
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información
Probabilidades y Estadística
TRABAJO PRÁCTICO INTEGRADOR GRUPAL 2015
4
Como resultado de la recolección de los datos se presenta la siguiente Base de Datos:
BASE DE DATOS adjunta.También puede obtener la base en formato Excel. Dicho archivo posee dos hojas: en la
primera están los datos y en la segunda hoja está la codificación de las variables.
Consignas del trabajo:
1) Defina población, muestra, unidad estadística, unidad de relevamiento y características
analizadas de los alumnos detallando el tipo de dato estadístico que se presente.
2) Construya la/s tabla/s de Distribución de Frecuencias con agrupación en lista (D.F.V.D.)
o por intervalos (D.F.V.C.), según corresponda. Calcule todas las frecuencias que conozcade las siguientes variables:
Nivel de satisfacción con la carrera.
Número de hermanos.
Gastos mensuales (trabaje con 5 intervalos).
IMPORTANTE: Recuerde diseñar las tablas, teniendo presente los criterios de
construcción, trabajados en el material teórico. Utilice la simbología adecuada.
3) Seleccione un renglón de la tabla de distribución de frecuencia e Interprete en
términos del problema planteado, para cada variable del punto 2), las frecuencias
obtenidas (para un valor o un intervalo de la variable).
4) Grafique e interprete las variables del punto 2). Para cada variable elija un gráfico para
frecuencias simples y uno para frecuencias acumuladas).
5) Conteste en forma completa y clara, utilizando vocabulario técnico adecuado en la
explicación:
a) ¿Qué proporción de alumnos tienen gastos mensuales inferiores a los $2000?
b) ¿Cuántos alumnos tiene más de 4 materias aprobadas?
c) ¿Cuántos alumnos tienen más de 3 hermanos?
d) ¿Qué porcentaje de alumnos están un Poco insatisfechos con la carrera?
e) ¿Qué proporción de alumnos tiene entre 2 y 5 materias aprobadas?
6) Calcule para las variables definidas en el punto 2), las medidas descriptivas de posición,
dispersión y simetría interpretando sus resultados en términos del problema planteado:
Realice los cálculos trabajando cada variable:
a) Como serie simple (directamente sobre la BD utilizando las funciones
estadísticas de Excel).
b) Trabajando la variable en forma de lista y/o de intervalos según corresponda.
c) Compare resultados entre los puntos a) y b) y explique.
-
8/17/2019 Figueroa Sanchez Rubeola
5/17
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información
Probabilidades y Estadística
TRABAJO PRÁCTICO INTEGRADOR GRUPAL 2015
5
7) Un posterior relevamiento de datos nos lleva a pensar que hubo un error y nos
propone la siguiente situación:
a) Calcule la nueva media aritmética y la varianza si se ha cometido un error porexceso de 2 en la cantidad de materias aprobadas al efectuar la transcripción de
los datos.
b) Calcule la nueva media aritmética y la varianza si se ha cometido un error por
defecto en los gastos mensuales de un 10,3%.
Soluciones:
1) Población: Todos los alumnos de la Universidad Autónoma de Málaga que
cursaron primer año de la Licenciatura en Ingeniería en Software en el año
2014.
Muestra: 105 alumnos que cursaron en el 2014 su primer año de Licenciatura
en Ingeniería de Software en la Universidad Autónoma de Málaga.
Unidad Estadística: Cada estudiante encuestado.
Unidad de Relevamiento: Universidad autónoma de Málaga.
Características de los alumnos y tipo de dato estadístico:
Edad: Variable cuantitativa-discreta.
Género: Variable cualitativa o atributo.
Peso: Variable cuantitativa-continua.
Estatura: Variable cuantitativa-continua.
Cantidad de hermanos: Variable cuantitativa-discreta.
Horas de estudio en el hogar (por semana): Variable cuantitativa-
continua.
Si trabaja o no: Variable cualitativa o atributo.
Gastos mensuales (en pesos): Variable cuantitativa-continua.
Cantidad de materias aprobadas: Variable cuantitativa-discreta.
Satisfecho/insatisfecho con la carrera (4 opciones categóricas): Variable
cualitativa o atributo.
-
8/17/2019 Figueroa Sanchez Rubeola
6/17
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información
Probabilidades y Estadística
TRABAJO PRÁCTICO INTEGRADOR GRUPAL 2015
6
2) Variable “Nivel de satisfacción con la carrera”:
Tabla de distribución categórica de frecuencias agrupadas en lista de la
variable “Nivel de satisfacción con la carrera”:
Variable “Número de hermanos”:
Tabla de distribución de frecuencias agrupadas en lista de la variable “Número
de hermanos”:
Nivel de Frecuencia Frecuencia Frecuencia Frecuencia
satisfacción Absoluta Absoluta Relativa Relativa Porcentaje
Acumulada Acumulada
yᵢ nᵢ Nᵢ hᵢ Hᵢ %
1- Muy satisfecho 61 61 0,58095238 0,58095238 58,10
2- Moderadamente satisfecho 32 93 0,3047619 0,88571429 30,48
3- Un poco insatisfecho 6 99 0,05714286 0,94285714 5,714- Muy insatisfecho 6 105 0,05714286 1 5,71
105 1 100
Número Frecuencia Frecuencia Frecuencia Frecuencia
de Absoluta Absoluta Relativa Relativa
hermanos Acumulada Acumulada
yᵢ nᵢ Nᵢ hᵢ Hᵢ
0 4 4 0,03809524 0,03809524
2 32 36 0,3047619 0,34285714
3 36 72 0,34285714 0,68571429
4 17 89 0,16190476 0,84761905
5 8 97 0,07619048 0,92380952
6 6 103 0,05714286 0,980952387 2 105 0,01904762 1
105 1
-
8/17/2019 Figueroa Sanchez Rubeola
7/17
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información
Probabilidades y Estadística
TRABAJO PRÁCTICO INTEGRADOR GRUPAL 2015
7
Variable “Gastos mensuales”:
Tabla de distribución de frecuencias agrupadas en intervalos de la variable
“Gastos mensuales”:
3) Interpretaciones del renglón coloreado de cada una de las variables del punto 2.
a. Variable “Nivel de satisfacción con la carrera”:
i. Renglón Moderadamente satisfecho: Existen 32 personas queestán moderadamente satisfechos con el nivel de la carrera
licenciatura en ing. de software. Hay 93 personas que están
satisfechas con el nivel de la carrera. El 30% de los estudiantes
está moderadamente satisfecho con el nivel de la carrera. El 88%
de los estudiantes está moderadamente o muy satisfecho con el
nivel de la carrera.
b. Variable “Número de hermanos” :i. Renglón yᵢ=5: Existen al menos 8 alumnos que tienen 5
hermanos, 97 alumnos que tienen 5 hermanos o menos, un 7,6%
de estudiantes de licenciatura en ing. de software tiene 5
hermanos y un 92% de alumnos tiene 5 hermanos o menos
mientras un 8% de alumnos tiene 6 o 7 hermanos.
c. Variable “Gastos mensuales” :
i. Renglón del cuarto intervalo: 15 alumnos encuestados tienen un gasto
mensual que ronda entre los $2120 y $2537. 103 alumnos gastan
Gastos Marca Frecuencia Frecuencia Frecuencia Frecuencia
mensuales de Absoluta Absoluta Relativa Relativa
personales Clase Acumulada Acumulada
y'ᵢ-1 - y'ᵢ yᵢ nᵢ Nᵢ hᵢ Hᵢ
869-1286 1077,5 48 48 0,45714286 0,45714286
1286-1703 1494,5 34 82 0,32380952 0,78095238
1703-2120 1911,5 6 88 0,05714286 0,83809524
2120-2537 2328,5 15 103 0,14285714 0,98095238
2537-2954 2745,5 2 105 0,01904762 1
105 1
-
8/17/2019 Figueroa Sanchez Rubeola
8/17
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información
Probabilidades y Estadística
TRABAJO PRÁCTICO INTEGRADOR GRUPAL 2015
8
mensualmente $2537 o menos. 0.14 es la proporción de alumnos que
gastan entre $2120 y $2537 mensualmente. El 98% (0.98) de los
alumnos gastan mensualmente menos de $2537.
4) Gráficos
Nivel de satisfacción con la carrera:
Interpretación del gráfico círculo radiado: 58% de los estudiantes encuestados
está muy satisfecho con la carrera, el 30% está moderadamente satisfecho y el 12%
se encuentra un poco o muy insatisfecho con la misma. Como más de la mitad está
muy satisfecho, podemos afirmar que la mayoría de alumnos está muy satisfecho
con la carrera. También podemos observar en la Distribución categórica de
frecuencias que un alto porcentaje de alumnos (88%) esta moderadamente o muy
satisfecho con la carrera. Mientras que un minimo porcentaje (6%) está muy
insatisfecho. Por lo que podemos ver, en general, la carrera Licenciatura en
Ingenieria de Software ha generado gran satisfaccion en la mayoría de los
estudiantes encuestados.
Fuente: BD de la cátedra Probabilidad Estadística 2015
-
8/17/2019 Figueroa Sanchez Rubeola
9/17
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información
Probabilidades y Estadística
TRABAJO PRÁCTICO INTEGRADOR GRUPAL 2015
9
Grafico acumulativo de frecuencias de la variable “Nivel de satisfaccion”:
Número de hermanos
Gráfico de frecuencias absolutas de la variable “Número de hermanos”:
Interpretación del gráfico de frecuencia absoluta: La barra más alta en el número
3, nos indica que un gran número de alumnos tienen 3 hermanos. Gran parte de los
alumnos encuestados tienen entre 2 y 3 hermanos.
Fuente: BD de la cátedra Probabilidad Estadística 2015
Fuente: BD de la cátedra Probabilidad Estadística 2015
-
8/17/2019 Figueroa Sanchez Rubeola
10/17
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información
Probabilidades y Estadística
TRABAJO PRÁCTICO INTEGRADOR GRUPAL 2015
10
Gráfico acumulativo de frecuencias relativas de la variable “Número de
hermanos”:
Interpretación del gráfico de frecuencia relativa acumulada: Una gran proporciónde alumnos (0.68) tiene hasta 3 hermanos. Una proporción pequeña de alumnos no
tiene hermanos.
Fuente: BD de la cátedra Probabilidad Estadística 2015
-
8/17/2019 Figueroa Sanchez Rubeola
11/17
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información
Probabilidades y Estadística
TRABAJO PRÁCTICO INTEGRADOR GRUPAL 2015
11
Gastos mensuales
Gráfico de frecuencias absolutas de los gastos mensuales de los alumnos:
0
10
20
30
40
50
60
86 9-1286 12 86-1703 17 03-2120 21 20-2537 25 37-295 4
C a n t i d a d
d e a l u m n o s
Gastos mensuales personales por
cantidad de alumnos
Gráfico acumulativo de proporciones de los gastos mensuales de los alumnos:
Fuente: BD de la cátedra Probabilidad Estadística 2015
Fuente: BD de la cátedra Probabilidad Estadística 2015
-
8/17/2019 Figueroa Sanchez Rubeola
12/17
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información
Probabilidades y Estadística
TRABAJO PRÁCTICO INTEGRADOR GRUPAL 2015
12
5) Respuestas
a. ¿Quéproporc ión de al umnos t ien en gas tos men suales in fer iores a
los $2000? Según la distribución de intervalos elegida, podemos
responder que 0.78 (78%) es la proporción de alumnos que gastan
$1703 o menos y 0.83 es la proporción de alumnos que gastan $2120 o
menos.
b. ¿Cuántos al umnos t ien en más de 4 mater ias ap robad as? 60
alumnos tienen más de 4 materias aprobadas.
c. ¿Cuántos al umnos tien en más de 3 herman os? Según nuestro
análisis de la Tabla de distribución de frecuencias, 72 alumnos tienen 3
hermanos o menos, por lo tanto 33 alumnos tienen más de 3
hermanos.
d. ¿Quéporcen taj e de alumnos es tán un Poco insat is fec hos con la
carrera? Según nuestro análisis, el 5.71% (en gráfico redondeado a
6%) de alumnos encuestados están un Poco insatisfechos con la
carrera.
e. ¿Qué proporc ión de al umnos tien e en tre 2 y 5 mat er ias
aprobadas? La proporción de alumnos que tiene entre 2 y 5 materias
aprobadas es de 0,561904762.
6) Medidas descriptivas de posición, dispersión y asimetría:
a. Trabajando las variables como series simples, realizando cálculos sobre
la BD de la cátedra Probabilidad y estadística 2015, obtuvimos lassiguientes medidas:
i. Variable “Nivel de satisfacción de la carrera:
1. Media aritmética: = 1,59047619.
2. Mediana: me = 1.
3. Moda: md = 1.
4. Varianza: V(x) = 0,70567766.
5. Desviación estándar: DS(x) = 0,84004622.
6. Coeficiente de variación: CV(x) = 0,52817277.
-
8/17/2019 Figueroa Sanchez Rubeola
13/17
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información
Probabilidades y Estadística
TRABAJO PRÁCTICO INTEGRADOR GRUPAL 2015
13
7. Asimetría: : > me = md
> me = md
ii. Variable “Número de hermanos”:
1. Media aritmética: = 3,14285714.
2. Mediana: me = 3.
3. Moda: md = 3.
4. Recorrido: R = 7 – 0 = 7.
5. Varianza: V(x) = 1,93131868.
6. Desviación estándar: DS(x) = 1,38971892.
7. Coeficiente de variación: CV(x) = 0,44218329.
8. Asimetría: : = me = md
= me = md
iii. Variable “Gastos mensuales”:
1. Media aritmética: = 1436,41905.
2. Mediana: me = 1322.
3. Moda: md = 2243.
4. Recorrido: R = 2085.
5. Varianza: V(x) = 224049,303.
6. Desviación estándar: DS(x) = 473,338466.
7. Coeficiente de variación: CV(x) = 0,32952673.
8. Asimetría: : = me < md
-
8/17/2019 Figueroa Sanchez Rubeola
14/17
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información
Probabilidades y Estadística
TRABAJO PRÁCTICO INTEGRADOR GRUPAL 2015
14
: = me < md
b. Análisis según cada variable:
i. Variables “Nivel de satisfacción”:
1. Medidas de posición: Al ser la variable un atributo, no
resulta lógico decir que en promedio el nivel de satisfacción
es 1.59. Conviene analizar que el nivel de satisfacción más
frecuente o modal es el primero “Muy satisfecho con la
carrera”.
ii. Variable “Número de hermanos”:
1. Medidas de posición: En esta distribución en lista, las
fórmulas de Excel son las más indicadas. En promedio, los
alumnos tienen 3 hermanos. El valor central o media es 3
hermanos y el valor más frecuente o modal es 3 hermanos
(distribución unimodal). Se observa Simetría en la
distribución.
2. Medidas de dispersión: Se observan variaciones respecto
de la media aritmética, pero analizaremos el coeficiente de
variación. En este caso es de 0.44 o 44%, lo cual nos indica
que estamos frente a una variable heterogénea, mucha
variabilidad pero tolerable. El promedio, en este caso no es
representativo de los datos.
iii. Variable “Gastos mensuales”:
1. Medidas de posición: En esta oportunidad, realizamos el
cálculo manual de la media con marca de clase y obtuvimos
= 1470.67, diferente a la que obtuvimos con Excel que sin
-
8/17/2019 Figueroa Sanchez Rubeola
15/17
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información
Probabilidades y Estadística
TRABAJO PRÁCTICO INTEGRADOR GRUPAL 2015
15
duda es más precisa. La mediana nos dio me = 1116,59 y
la moda md = 1400,33.
2. Medidas de dispersión: El coeficiente de variación
proporcionado por Excel nos dio 33%. Esta es una
variabilidad aceptable y moderada, aun así no podemos
afirmar que la media sea representativa ya que sigue siendo
un porcentaje elevado.
c. Comparando los resultados obtenidos en los dos puntos anteriores,
podemos observar algunas diferencias a nivel de precisión entre el
cálculo que nos brinda Excel trabajando con toda la base de datos y los
cálculos que podemos realizar manualmente, puntualmente cuando
trabajamos con la variable “Gastos mensuales” en donde trabajamos con
marca de clase. Pero hay que destacar que no sirven los resultados
solos del Excel sin una interpretación adecuada. Pudimos realizar tal
interpretación en el punto b de algunos de los resultados.
7) Variable “Cantidad de materias aprobadas”:
a. Utilizando la función AVERAGE (PROMEDIO) y VAR (VARIANZA) que
nos proporciona Excel pudimos obtener la media aritmética y la varianza
para esta variable, trabajando con la BD. Obtuvimos una media de 4,96 y
una varianza de 5,69. Utilizando una propiedad de la media y la varianza,
calculamos:
i. Nueva media aritmética: (x+k) = k + ; por lo tanto = 4,96 – 2
= 2,96.
ii. Varianza. V(k+x) = V(x) ; por lo tanto la varianza no se altera.b. Del mismo modo, utilizando propiedades de la media y la varianza
podemos calcular lo siguiente:
i. Nueva media aritmética: (x+k) = k + ; por lo tanto
1. = 1436,42 + (1436,42 * 0,103) = 1584,37
ii. Nueva varianza: V(x* k) = * V(x) ; por lo tanto
1. V(x) = 1,103^2 * 224049,3 = 272580,4.
-
8/17/2019 Figueroa Sanchez Rubeola
16/17
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información
Probabilidades y Estadística
TRABAJO PRÁCTICO INTEGRADOR GRUPAL 2015
16
Anexo
Variable “Nivel de satisfacción”:
Nivel de Frecuencia Frecuencia Frecuencia Frecuencia
satisfacción Absoluta Absoluta Relativa Relativa Porcentaje
Acumulada Acumulada
yᵢ nᵢ Nᵢ hᵢ Hᵢ %
1- Muy sati sfecho =COUNTIF(A6:A110;"=1") =COUNTIF(A6:A110;"=8 =COUNTIF(A2:A106;"=1 =COUNTIF(A2:A106;"=1 =COUNTIF(A2:A106;"=2 =COUNTIF(A2:A106;"=2 =COUNTIF(A2:A106;"
-
8/17/2019 Figueroa Sanchez Rubeola
17/17
Universidad Tecnológica Nacional
Facultad Regional Córdoba
Ingeniería en Sistemas de Información
Probabilidades y Estadística
TRABAJO PRÁCTICO INTEGRADOR GRUPAL 2015
17
Intervalos 5
Recorrido =MAX(A2:A106)-MIN(A2:A
Amplitud =L7/5
Valor mínimo =MIN(A2:A106)
Valor máximo =MAX(A2:A106)
Media =AVERAGE(A2:A106)
Me di ana =MEDIAN( A2:A106)
Moda =MODE.SNG L(A2:A106)
Varianza =VAR(A2:A106)
Desviación =STDEV(A2:A106)
Coeficiente =L25/L20
Variable “Cantidad de materias”:
Alumnos que aprobaron mas de 4
materiasAlumnos entre 2 y 5 materias
aprobadas
Proporción de alumnos que tienen entre 2 y 5
materias aprobadas
=COUNTIF(A2:A106;">4") =COUNTIFS(A2:A106;">1";A2:A106;"