ocw 2019: curso práctico para el análisis e inferencia ... · carga del paquete para funciones de...
TRANSCRIPT
Autoevaluación
OCW 2019: Curso práctico para el
análisis e inferencia estadística con
Mathematica
Ejercicios propuestos resueltos (2 de 2)
Equipo docente del curso
Arrospide Zabala, Eneko
Martín Yagüe, Luis
Unzueta Inchaurbe, Aitziber
Soto Merino, Juan Carlos
Durana Apaolaza, Gaizka
Bikandi Irazabal, Iñaki
Departamento de Matemática Aplicada
Escuela de Ingeniería de Bilbao, Edificio II-I
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
EJERCICIOS DEL BLOQUE III. VARIABLES ALEATORIAS
Ejercicio nº6
Enunciado
Sea una variable aleatoria X que se distribuye según la siguiente función de densidad:
f �x� �k � �x� 1�k � �3 � x�3 k � �x� 3�3 k � �5 � x�
1 � x � 2
2 � x � 3
3 � x � 4
4 � x � 5
� a) Calcule el valor del parámetro k y represente gráficamente la función de densidad
� b) Obtenga la correspondiente función de distribución de probabilidad de la variable aleatoria X y
represéntela gráficamente
� c) Calcule el valor esperado, la mediana y la moda de la distribución de la variable aleatoria X
� d) Calcule P �3 � X � 6�� e) Calcule P �X � 3.5�
Resolución
� a) Calcule el valor del parámetro k y represente gráficamente la función de densidad
� Definición de la función a trozos
dist6 � ProbabilityDistribution�Piecewise���k �x � 1�, 1 � x � 2,
�k �3 � x�, 2 � x � 3, �3 k �x � 3�, 3 � x � 4, �3 k �5 � x�, 4 � x � 5, �x, 0, 5;
PDF�dist6, x �� TraditionalForm
k �3 � x� 2 � x � 33 k �5 � x� 4 � x � 53 k �x� 3� 3 � x � 4k �x� 1� 1 � x � 2
� Para que f �x� sea una función de densidad, el área limitada bajo la curva tiene que ser igual
a la unidad:
Solve�Integrate�PDF�dist6, x, �x, 1, 5 � 1
k �1
4
� Solución: k � 14
� Utilizando el método “Normalize”:
dist6n � ProbabilityDistribution�Piecewise���k �x � 1�, 1 � x � 2, �k �3 � x�, 2 � x � 3,
�3 k �x � 3�, 3 � x � 4, �3 k �5 � x�, 4 � x � 5, �x, 0, 5, Method "Normalize";
1
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
PDF�dist6n, x �� TraditionalForm
3�x
42 � x � 3
3 �5�x�4
4 � x � 5
3 �x�3�4
3 � x � 4
x�1
41 � x � 2
� Representación gráfica de la función de probabilidad
Plot�PDF�dist6n, x, �x, 0, 6, Filling Axis, AxesLabel �HoldForm�"x", HoldForm�" f �x�"
� b) Obtenga la correspondiente función de distribución de probabilidad de la variable aleatoria X y
represéntela gráficamente
CDF�dist6n, x �� TraditionalForm
1
8x 2
1
4x 3
5
8x 4
1 x 51
8�3 x2 � 30 x � 67 4 � x� 5
1
8�x2 � 6 x � 7 2 � x� 3
1
8x2 � 2 x � 1 1 � x� 2
1
83 x2 � 18 x � 29 3 � x� 4
Plot�CDF�dist6n, x, �x, 0, 7, Filling Axis,
PlotRange �0, 1, AxesLabel �HoldForm�"x", HoldForm�"F�x�"
2
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
� c) Calcule el valor esperado, la mediana y la moda de la distribución de la variable aleatoria X
� Cálculo del valor esperado
Expectation�x, x � dist6n
7
2
� Cálculo de la varianza
StandardDeviation�dist6n �� N
0.957427
� Cálculo de la mediana
Median�dist6n �� N
3.8165
� Solución: E�X� � 3.5
Var�X� � 0.957427
Me�X� � 3.8165
� d) Calcule P �3 � X � 6�Probability�3 � x � 6, x � dist6n
3
4
� Solución: P �3 � X � 6� � 0.75
� e) Calcule P �X � 3.5�CDF�dist6n, 3.5
0.34375
� Solución: P �X � 3.5� � 0.34375
Ejercicio nº7
Enunciado
Un nuevo tratamiento para las infecciones de la vesícula biliar presenta una probabilidad de cura del
60%. Se ha aplicado el tratamiento a 4 pacientes.
� a) Obtenga la función de probabilidad de la variable X que representa el número de pacientes
curados
� b) Calcule el número de pacientes que se espera se cure con el tratamiento
� c) Calcule P �3 � X � 4 X � 1�
Resolución
Se define la variable aleatoria X=”número de pacientes curados al aplicar el tratamiento a 4 pacientes”.
La variable X sigue una distribución binomial: X � B �4, 0.60�n � 4; p � 0.60;
3
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
� a) Obtenga la función de probabilidad de la variable X que representa el número de pacientes
curados
Table�PDF� BinomialDistribution�n, p, x, �x, 0, 4
�0.0256, 0.1536, 0.3456, 0.3456, 0.1296�
� Solución: nº pacientes curados : xi 0 1 2 3 4
probabilidad : p�xi� 0.0256 0.1536 0.3456 0.3456 0.1296
� b) Calcule el número de pacientes que se espera se cure con el tratamiento
distb � BinomialDistribution�n, p;
Mean�distb
2.4
� Solución: E�X� � 2.4
� c) Calcule P �3 � X � 4 X � 1�Probability�Conditioned�3 � x � 4, x � 1, x � distb
0.578947
� Solución: P �3 � X � 4 X � 1� � 0.578947
EJERCICIOS DEL BLOQUE IV. INFERENCIA ESTADÍSTICA
Ejercicio nº8
Enunciado
Se cree que el número de caracteres del código Morse que son capaces de enviar por minuto los
alumnos y alumnas de un instituto sigue una distribución normal de media 75 y desviación típica 7.
Para confirmarlo se ha considerado una muestra seleccionando doce alumnos al azar. El número de
caracteres enviados en un minuto por cada estudiante se recoge en la siguiente lista
�1 � �82, 74, 80, 61, 74, 91, 94, 63, 68, 76, 83, 79�� a) Utilizando un intervalo de confianza con una significación Α � 0.02, �se puede aceptar la
hipótesis de que la media de caracteres enviados por el alumnado es 75?
� b) Realice un contraste con una significación Α � 0.02 para comprobar si la desviación típica del
número de caracteres enviados es igual a 7
Resolución
� Carga del paquete para funciones de Estadística Inferencial para la sesión
Needs�"HypothesisTesting`"
� Introducción de la muestra
caracteres � �82, 74, 80, 61, 74, 91, 94, 63, 68, 76, 83, 79;
4
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
� a) Utilizando un intervalo de confianza con una significación Α � 0.02, �se puede aceptar la
hipótesis de que la media de caracteres enviados por el alumnado es 75?
� Hipótesis: H0 : Μ � 75 � Μ0
H1 : Μ � 75 � Μ0
� Intervalo para la media poblacional con una confianza del 98%
MeanCI�caracteres, ConfidenceLevel �� .98, KnownVariance None
�69.1981, 84.9686�
� Solución: Μ0 � 75 � I�0.90 � �69.1981, 84.9686�
� Por lo tanto, con una confianza del 98%, puede afirmarse que la media de caracteres enviados
por el alumnado es 75 ya que ese valor pertenece al intervalo calculado
� b) Realice un contraste con una significación Α � 0.02 para comprobar si la desviación típica del
número de caracteres enviados es igual a 7
� Hipótesis: H0 : Σ2 � 72 � 49 � Σ0
2
H1 : Σ2 � 72 � 49 � Σ02
VarianceTest�caracteres, 7^2, "TestDataTable",
AlternativeHypothesis "Unequal", SignificanceLevel 0.1
Statistic P-Value
Fisher Ratio 22.6718 0.039312
� Solución: Α � 0.02 � p�valor � 0.039312
� El nivel de significación es menor que el p-valor, por lo que no hay evidencia suficiente para
refutar la hipótesis nula con una confianza del 98%; por lo tanto, se acepta que la desviación
típica del número de caracteres enviados es igual a 7
� Representando gráficamente (no se adjunta código) el contraste se observa que el estadísticode contraste se encuentra en la región de aceptación:
5
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
Ejercicio nº9
Enunciado
El concejal de infraestructuras de un municipio asegura que el tiempo que tardan las bombillas de las
farolas del municipio en alcanzar su máximo brillo no es mayor que 50 segundos con un nivel de
significación del 0.05. Para corroborarlo se han seleccionado al azar 20 farolas y el tiempo en segun-
dos que tardan las bombillas en dar el 100% de luz se muestra en la siguiente tabla:
56.5 54.3 48.8 61.6 62.4 40.5 48.6 51.6 45.9 57.2
62.4 54.2 47.3 62.7 50.2 53.4 54.1 42.5 46.8 42.2
Con el nivel de significación indicado anteriormente y suponiendo normalidad en el tiempo que
tardan las bombillas hasta alcanzar el máximo brillo:
� a) Realice un contraste para verificar si es cierta la afirmación del concejal
� b) Calcule un intervalo de confianza para la varianza del tiempo necesario para que las bombillas
se enciendan al 100% de su capacidad
Resolución
� Introducción de la muestra
tiempo � �56.5, 54.3, 48.8, 61.6, 62.4, 40.5, 48.6, 51.6,
45.9, 57.2, 62.4, 54.2, 47.3, 62.7, 50.2, 53.4, 54.1, 42.5, 46.8, 42.2;
� a) Realice un contraste para verificar si es cierta la afirmación del concejal
� Hipótesis: H0 : Μ � 50 � Μ0
H1 : Μ � 50 � Μ0
� Usando la función LocationTest
Α � 0.05;
LocationTest�tiempo, Μ0 � 50, "TestDataTable",
AlternativeHypothesis "Greater", SignificanceLevel Α
Statistic P-Value
T 1.39098 0.0901543
� Representando gráficamente (no se adjunta código) el contraste se observa que el estadísticode contraste se encuentra en la región de aceptación:
� Solución: Α � 0.05 � p�valor � 0.0901543
6
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
� El nivel de significación es menor que el p-valor, por lo que no hay evidencia suficiente para
refutar la hipótesis nula con una confianza del 95%; por tanto, se acepta la afirmación del
concejal
� b) Calcule un intervalo de confianza para la varianza del tiempo necesario para que las bombillas
se enciendan al 100% de su capacidad
� cálculo de valores muestrales
n � Length�tiempo;
S � StandardDeviation�tiempo;
� obtención del intervalo
ChiSquareCI�S^2, n � 1, ConfidenceLevel 1 � Α
�27.8923, 102.883�
� Solución: IΣ20.95 � �27.8923, 102.883�
7