complet a

34
UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/ EJERCICIOS PROPUESTOS EN EXÁMENES 1/34EJERCICIOS PROPUESTOS EN EXÁMENES ÍNDICE Pág.: - DISTRIBUCIONES - PREGUNTAS TEÓRICAS ... 1 UNIDIMENSIONALES - PROBLEMAS ....................... 8 - DISTRIBUCIONES BIDIMENSIONALES ...................... 14 - NÚMEROS ÍNDICES ........................................................ 26 - SERIES TEMPORALES .................................................... 28 - PROBABILIDAD ............................................................... 30 - INFERENCIA ESTADÍSTICA .......................................... 32 DISTRIBUCIONES UNIDIMENSIONALES (CAPÍTULOS 2, 3 Y 4) PREGUNTAS TEÓRICAS .- 1. Señale las ventajas e inconvenientes de la media aritmética como medida de posición de una distribución. Respuesta.- En el texto base podemos leer: Las principales ventajas de la media aritmética son las siguientes: - Es calculable en todas las variables, es decir siempre que nuestras observaciones sean cuantitativas. - Para su cálculo se utilizan todos los valores de la distribución. - Es única para cada distribución de frecuencias. - Tiene un claro significado, ya que al ser el centro de gravedad de la distribución representa todos los valores observados. El principal inconveniente es que es un valor muy sensible a los valores extremos, con lo que en las distribuciones con gran dispersión de datos puede llegar a perder totalmente su significado. Recordemos aquí la famosa anécdota del pollo, si una persona se come un pollo y otra no come pollo, como media, entre las dos se habrán comido medio pollo cada una. 2. Se atribuye al dramaturgo irlandés Bernard Shaw la siguiente frase:"Si yo me como dos pollos y tu ninguno, la Estadística afirma que cada uno de nosotros, en promedio, nos comemos un pollo". Utilice Vd. la metodología estadística para precisar el alcance y crítica de la anterior afirmación. Solución.- Si X = “nº de pollos que se come cada persona”, podemos construir la siguiente tabla de frecuencia: x i n i x i n i x i 2 x i 2 n i 0 1 0 0 0 2 1 2 4 4 Totales: 2 2 4 De donde: Media = 2 2 = 1; Varianza = 4 2 – 1 = 1; Desviación típica =1; Coeficiente de variación = = 1 1 = 1

Upload: edwin-yair

Post on 24-Oct-2015

19 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−1/34–

EJERCICIOS PROPUESTOS EN EXÁMENES

ÍNDICE Pág.: - DISTRIBUCIONES - PREGUNTAS TEÓRICAS ... 1 UNIDIMENSIONALES - PROBLEMAS ....................... 8 - DISTRIBUCIONES BIDIMENSIONALES ...................... 14 - NÚMEROS ÍNDICES ........................................................ 26 - SERIES TEMPORALES .................................................... 28 - PROBABILIDAD ............................................................... 30 - INFERENCIA ESTADÍSTICA .......................................... 32 DISTRIBUCIONES UNIDIMENSIONALES (CAPÍTULOS 2, 3 Y 4) PREGUNTAS TEÓRICAS.- 1. Señale las ventajas e inconvenientes de la media aritmética como medida de posición de una distribución. Respuesta.- En el texto base podemos leer: Las principales ventajas de la media aritmética son las siguientes: - Es calculable en todas las variables, es decir siempre que nuestras observaciones sean cuantitativas. - Para su cálculo se utilizan todos los valores de la distribución. - Es única para cada distribución de frecuencias. - Tiene un claro significado, ya que al ser el centro de gravedad de la distribución representa todos los valores observados. El principal inconveniente es que es un valor muy sensible a los valores extremos, con lo que en las distribuciones con gran dispersión de datos puede llegar a perder totalmente su significado. Recordemos aquí la famosa anécdota del pollo, si una persona se come un pollo y otra no come pollo, como media, entre las dos se habrán comido medio pollo cada una. 2. Se atribuye al dramaturgo irlandés Bernard Shaw la siguiente frase:"Si yo me como dos pollos y tu ninguno, la Estadística afirma que cada uno de nosotros, en promedio, nos comemos un pollo". Utilice Vd. la metodología estadística para precisar el alcance y crítica de la anterior afirmación. Solución.- Si X = “nº de pollos que se come cada persona”, podemos construir la siguiente tabla de frecuencia:

xi ni xini xi2 xi

2ni 0 1 0 0 0 2 1 2 4 4

Totales: 2 2 4

De donde: Media = 22

= 1; Varianza = 42

– 1 = 1; Desviación típica =1; Coeficiente de

variación =

= 11

= 1

Page 2: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−2/34–

Así pues, aunque la media aritmética es 1, un coeficiente de variación igual a 1 supone una dispersión grande y debemos considerar que la media aritmética no es representativa de la población. 3. Señale las ventajas e inconvenientes de la media geométrica como medida de posición de una distribución. Solución.- En el texto base podemos leer: Las principales ventajas: - Es más representativa que la media aritmética cuando la variable evoluciona de

forma acumulativa con efectos multiplicativos. - Cuando existe, es decir cuando la distribución no tiene valores negativos, y cuando

está definida, es decir cuando la distribución no tiene valores nulos, su valor está definido de forma objetiva y es único.

- Para su cálculo se tiene en cuenta todos los valores de la distribución. - Los valores extremos tienen una menor influencia que en la media aritmética. Los principales inconvenientes: - La mayor complicación de los cálculos.

- Su indefinición (da números con naturaleza imaginaria) cuando tiene valores negativos y su valor nulo cuando una observación toma este valor.

4. Explique el significado del coeficiente de variación de Pearson en dos variables que tienen como media 110 y 30, respectivamente y, como varianza 1024 en el primer caso y 196 en el segundo. Solución.-

1ª variable: coeficiente de variación = 1024 32110 110

= ≅ 0,291

2ª variable: coeficiente de variación = 196 1430 30

= ≅ 0,467

El coeficiente de variación de Pearson es una medida relativa de la dispersión mientras que la varianza (o la desviación típica) es una medida absoluta. En este caso, tiene mayor dispersión absoluta la 1ª variable pero, no obstante, posee menos dispersión relativa 5. Indique razonadamente cómo se comporta la media aritmética ante un cambio de escala y un cambio de origen en una variable. Solución.- Supongamos que sobre una variable Xi efectuamos un cambio de origen y de escala:

Yi = aXi + b (multiplicar por a es un cambio de escala y sumar b es un cambio de origen) La media aritmética de Yi sería:

( )r r r r

i i i i i i ii 1 i 1 i 1 i 1

1 1 1 1Y Y n aX b n a· X n b· n aX bN N N N= = = =

= = + = + = +∑ ∑ ∑ ∑

es decir, la media aritmética queda afectada por el mismo cambio de origen y de escala. 6. Defina los conceptos estadísticos de población, marco estadístico, muestra e individuo o unidad estadística. Respuesta.- Población: Conjunto de elementos que cumplen una determinada característica (ej.: clientes de un hotel en una determinada fecha).

Page 3: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−3/34–

Individuo o Unidad de investigación. Cada uno de los elementos de la Población (ej.: personas, edificios, oficinas, hoteles, campos de golf, etc.). Muestra: Cualquier subconjunto de individuos pertenecientes a una población determinada. Marco estadístico. Es el conjunto de información (ficheros, listados, etc.) que permite identificar a todos los individuos de la población. Es la base informativa que empleamos para seleccionar la muestra. En el marco estadístico no siempre está contenido todo el universo (por las omisiones, duplicaciones, unidades mal clasificadas, etc.) 7. Defina y explique el significado de los conceptos estadísticos de varianza y desviación típica Respuesta.- La varianza de una distribución se define como la media aritmética de los cuadrados de las

desviaciones respecto a la media. Se representa por s2 o por σ2. Se expresa: σ2 = ( )∑=

−n

1ii

2i nXX

N1 .

Se llama desviación típica o estándar a la raíz cuadrada de la varianza. Es más útil que la varianza ya que tiene las mismas dimensiones que la media. 8. Defina el concepto y significado de las medidas de curtosis de una distribución estadística. Respuesta.- Las medidas de apuntamiento o curtosis tratan de estudiar la distribución de frecuencias en la zona media. El mayor o menor número de valores de la variable alrededor de la media dará lugar a una distribución más o menos apuntada. Para estudiar el apuntamiento compararemos el perfil de la distribución (polígono de

frecuencias o histograma) con la denominada campana de Gauss de ecuación y = 2x2

e21 −

π cuya

gráfica es:

0

0.1

0.2

0.3

0.4

0.5

0.6

-4 -2 2 4x Ello se hace calculando el denominado coeficiente de curtosis de Fisher

Según el valor de esta expresión, tendremos una distribución mesocúrtica (normal), si g2 = 0; leptocúrtica, si g2 > 0, o platicúrtica, si g2 < 0.

Page 4: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−4/34–

9. Defina la mediana y la moda de una distribución unidimensional de frecuencias e indique el inconveniente de ambas 10. ¿Cuál es el objetivo de las medidas de dispersión estadística? ¿cuáles son las principales que conoce?

11. ¿Es posible obtener la media geométrica de una distribución unidimensional de frecuencias en la que la variable toma algún valor nulo? Razone la respuesta

Respuesta.- Puede obtenerse pero carece de significado ya que, al haber un valor nulo, el resultado es

cero. 12. Defina el concepto de moda relativa y ponga un ejemplo de distribución unidimensional

con una moda relativa Respuesta.- Un valor de la variable es moda relativa cuando su frecuencia es mayor o igual que la de sus

valores contiguos. Ejemplo: xi ni 1 20 2 10 3 16 4 12 5 15

El 3 es moda relativa pues su frecuencia es mayor que las de sus valores contiguos. El 5 no es moda relativa pues, aunque su frecuencia es mayor que la de su valor contiguo por

la izquierda, carece de valor contiguo por la derecha. El 1 tampoco es moda relativa por la misma razón anterior. Sin embargo es la moda, pues su

frecuencia es mayor que las demás. 13. Defina el Coeficiente de Variación de Pearson y explique su significado. Respuesta.-

Se define el coeficiente de variación de Pearson CV = Xaritméticamedia

típicaDesviación σ= , y se trata de

una medida de dispersión relativa. Cuanto menor sea su valor absoluto, menor será la dispersión de los valores de la variable y, por tanto, mayor será la representatividad de la media aritmética.

Se considera que si dicho valor es mayor que la unidad, la media debe descartarse como representativa de la población. 14. Defina los conceptos de parámetro, variable y atributo 15. Defina el concepto de mediana de una distribución de frecuencias y ponga un sencillo ejemplo de cálculo en una distribución unidimensional de tipo 1 con un número impar de observaciones

Page 5: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−5/34–

16. Defina el concepto de varianza de una distribución. 17. ¿En qué casos es preferible, por ser más representativa, utilizar la media geométrica en vez de la media aritmética? Respuesta.- Cuando los valores a promediar tengan entre sí una relación multiplicativa en lugar de aditiva. Por ejemplo cuando se trate de tasas de crecimiento. Ejemplo: las tasas de crecimiento de determinada magnitud a lo largo de cuatro periodos de tiempo han sido respectivamente 1,2; 1,5; 1,1 y 1,3 (esto quiere decir que la magnitud ha aumentado sucesiva y respectivamente el 20%, el 50% el 10% y el 30%). Entonces la tasa media habrá sido la media geométrica 27,13,1·1,1·5,1·2,14 ≅ . 18. Sí a una variable Xi la sometemos al mismo tiempo a un cambio de origen O y a un cambio de escala C ¿cuál o cuáles de las siguientes afirmaciones son falsas o correctas y por qué? - Los cambios de origen afectan a la media aritmética - Los cambios de escala afectan a la media aritmética - La varianza y la desviación típica sólo se ven afectadas por los cambios de escala. Respuesta.-

Las tres afirmaciones son correctas. En efecto, sea C

OXY i

i

−= . Entonces

( )C

OXOXC1n

n1·OnX

n1

C1n

COX

n1Y

ii

iii

ii

i −=−=

−=

−= ∑∑∑

∀∀∀

, es decir, la media se ve

afectada por el cambio de origen y de escala.

Además, Var(Y) = ( ) =

−=

−−

−=− ∑∑∑

∀∀∀ ii

2

i

ii

2i

ii

2

i nC

XXn1n

COX

COX

n1nYY

n1

= ( )XVarC1

2

19. Explique cuándo y por qué es conveniente introducir ponderaciones en la media aritmética. Respuesta.- Cuando los valores de la variable a ponderar no se consideren todos igualmente importantes. Por ejemplo, la nota final de una asignatura obtenida promediando las notas obtenidas dos exámenes parciales, uno de ellos de más importancia que el otro 20. Explique los conceptos estadísticos de Rango, Recorrido, Amplitud total y Coeficiente de Apertura . Respuesta.- Ver U.D. pág. 90 y 91. 21. Indique las diferencias entre los conceptos estadísticos de Parámetro, Variable y Atributo Respuesta.- En el texto base explica que se denominan parámetros a las características poblacionales que deseamos investigar y que suelen ser desconocidas a priori. Por ejemplo, la edad de los viajeros de una compañía aérea, la nacionalidad de los visitantes un museo, el motivo de los viajes contratados en una agencia, etc. Cuando estas características son numéricas, es decir, cuando se pueden medir, se denominan variables (años de edad, renta anual en euros, etc.); por el contrario, cuando las características de la población no son susceptibles de medirse numéricamente reciben el nombre de atributos (el color del pelo, el sexo, la profesión, el estado civil, el grado de satisfacción del cliente con un servicio, etc...).

Page 6: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−6/34–

Los atributos, a diferencia de las variables, presentan modalidades o categorías (el atributo sexo puede adoptar las modalidades de varón o mujer, el atributo intención de voto se concreta en los nombres de los partidos políticos que se presenten a las elecciones sondeadas y el de opinión sobre la satisfacción de un cliente con el servicio de limpieza de un hotel puede adoptar las modalidades que se determinen: excelente, bueno, malo, regular, etc.). 22. Defina el concepto de mediana y ponga un ejemplo de cálculo de la misma para el caso de una distribución unidimensional de tipo I en la que el número de observaciones es impar Respuesta.- Mediana de una distribución de frecuencias, es aquel valor que divide a la distribución, previamente ordenada en forma creciente, en dos partes iguales, dejando el mismo número de valores de la variable a su izquierda que a su derecha. Veamos un ejemplo para una distribución del tipo I (la frecuencia de cada valor es la unidad), con un número de observaciones impar, que escribiremos ya ordenados:

{2, 3, 5, 6, 8, 9, 13, 15, 16, 17, 19, 22, 25, 26, 29, 31, 33} en total 17. La mediana será el valor que ocupa el lugar 9 (pues tiene 8 a su izquierda y 8 a su derecha), a saber: Me = 16. 23. Tenemos una distribución con los siguientes datos: 1 €, 8 €, 9 € y 85 €. Indique a simple vista si considera que para esta distribución es representativa la media aritmética; ¿Qué debería hacerse para valorar adecuadamente esta representatividad? ¿Qué medidas deberían calcularse? Respuesta.- A simple vista no parece que la media aritmética vaya a ser representativa puesto que hay un valor (85 €) que se aleja mucho de los otros tres. Para valorar la representatividad adecuadamente,

hay que calcular el coeficiente de variación de Pearson, CV = Xσ . Calculemos entonces la media y

la desviación típica:

485981X +++

= = 25,75; ( ) ≅=−+++

=−=σ 1179,687575,254

722581641XX 222 34,35.

De aquí obtenemos que CV ≅ 1,33 y al ser mayor que la unidad, debemos descartar la media aritmética como parámetro adecuado. 24. Señale las ventajas e inconvenientes de la media armónica como medida de posición de una distribución ¿En que casos es adecuado utilizarla? Respuesta.- En las U.D. (pág.:50) podemos leer que la media armónica sólo se puede calcular si no hay observaciones iguales a cero. Es una medida estadística que se emplea cuando se quieren promedias rendimientos, velocidades, productividades, etc. Sus principales ventajas son: • Es más representativa que otras medidas en los casos de obtener promedios de velocidades, rendimientos, productividades, etc. • Está definida de forma objetiva y es única. • Su cálculo es sencillo. • Para su cálculo tiene en cuenta todos los valores de la distribución. • Los valores extremos tienen una menor influencia que en la media aritmética. El principal inconveniente se produce cuando se utiliza para variables en los que hay valores muy pequeños; en estos casos sus inversos pueden aumentar casi hasta el infinito, eliminando el efecto del resto de los valores. Por esta misma razón no es posible calcularla cuando algún valor es cero, ya que se produce una indeterminación matemática.

Page 7: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−7/34–

25. Indique un ejemplo en el que sea aconsejable introducir ponderaciones para el cálculo de la media aritmética. Respuesta.- En la página 47 de las U.D. proponen el siguiente ejemplo: supongamos que queremos hacer una selección de personas para la recepción de un hotel en el que se considera muy importante el conocimiento de inglés y menos importante el de otras materias como la estadística o el marketing; en el currículum vitae de un candidato tenemos información sobre las notas medias obtenidas en distintos bloques de conocimientos; se considera que la calificación de inglés debe ponderarse el doble que la del resto de materias:

Materias Calificaciones

Coeficientes de ponderación

Inglés 8 2 Marketing 6 1 Estadística 10 1

Entonces la nota media sería: 8112

1·101·62·8x =++++

=

26. Defina las medidas de simetría y apuntamiento de una distribución de frecuencias. Respuesta.- En el libro de texto (pág.: 87) se proponen cuatro medidas de asimetría:

El coeficiente de asimetría de Fisher: ( )

( ) 23

n

1ii

2i

n

1ii

3i

3x

31

nxxN1

nxxN1

mg

−=

σ=

=

=

El coeficiente de asimetría de Pearson: Ap = x

Mexσ−

El coeficiente de asimetría de Bowley: Ca = 13

13

QQMe2QQ

−+

El coeficiente de asimetría de la hoja de cálculo Excel: ( )( )∑=

−−=

n

1I

3i

sxx

2n1nnA

En todos los casos, si el coeficiente es positivo hay asimetría a la derecha, si es negativo, hay asimetría a la izquierda y si es cero la distribución es simétrica.

Respecto a las medidas de apuntamiento, tenemos el coeficiente de Fisher, g2 = 3m

4

4 −σ

y el

que usa la hoja de cálculo Excel: C = ( )( )( )( )

( ) ( )( )( )3n2n

1n3s

xx3n2n1n

1nn 2n

1i

4i

−−−

−−−− ∑

=. En ambos

casos, si el coeficiente es positivo, la forma de la distribución es más apuntada que la normal (leptocúrtica), si es cero es como la normal (mesocúrtica) y si es negativo es menos apuntada (platicúrtica). 27. Indique las ventajas e inconvenientes de la media aritmética como medida de posición de una distribución ¿En que casos no es posible utilizarla? 28. ¿Existe siempre la moda en una distribución unidimensional de frecuencias? Razone la respuesta.

Page 8: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−8/34–

29. ¿Qué diferencia existe entre la desviación tlpica y la cuasi-desviación típica? ¿Qué propiedades poseen? 30. Indique las ventajas e inconvenientes de la media geométrica como medida de posición de una distribución ¿En que casos no es posible calcularla? 31. ¿Qué son los cuantiles de una distribución unidimensional de frecuencias? ¿Cuáles son los cuantiles más habituales? 32. Defina el concepto de tipificación de una variable ¿Cuál es la media aritmética de una variable tipificada? PROBLEMAS.- 1. En la siguiente distribución determinar los tres cuartiles, el séptimo decil y el 99º percentil.

xi 1 3 4 5 7 9 ni 10 20 30 20 27 13

Solución.- Añadamos la columna de frecuencias acumuladas:

xi ni Ni 1 10 10 3 20 30 4 30 60 5 20 80 7 27 107 9 13 120 120

Tendremos:

Q1 = 2

432

xx 3130 +=

+ = 3,5; Q2 = Me = 2

542

xx 6160 +=

+ = 4,5; Q3 = 2

xx 9190 + = 7;

D7 = =+2

xx 8584 7; P99 = x119 = 9.

2. Calcular la mediana en las siguientes distribuciones: xi 4 8 12 20 25

xi 3 1 5 7

xi 0 1 2 3 4 ni 4 10 4 1 1

Solución.-En el primer caso la mediana es 12; en el segundo caso es 2

53+ = 4; en el tercer

caso: xi ni Ni 0 4 4 1 10 14 2 4 18 3 1 19 4 1 20

→ Mediana = 12

112

xx 1110 =+

=+

Page 9: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−9/34–

3. Las ventas medias diarias de los 16 vendedores de una agencia de viajes durante un determinado período fueron las siguientes:

Vendedor n° 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Ventas diarias en miles de € 2 2,5 3 2 2,3 2,1 2,5 2 2 1,5 2 2 1,7 1,5 2,5 3

a) ¿Cuál es la cifra más común de ventas de los vendedores? b) ¿Cuál es la venta media por empleado de la agencia? e) ¿Cuál es la mediana de esta distribución? Solución.- Escribamos la tabla de frecuencias:

xi ni xi·ni Ni 1,5 2 3 2 1,7 1 1,7 3 2 6 12 9 2,1 1 2,1 10 2,3 1 2,3 11 2,5 3 7,5 14 3 2 6 16 16 34,6

a) La cifra más común de ventas (la moda) es Mo = 2 (miles de €)

b) La venta media 16

6,34x = ≅ 2,16 (miles de €)

c) Por tratarse de un número par de individuos, la mediana es la media aritmética de los dos

valores centrales (el 8º y el 9º): Me = 2

22 + = 2 (miles de €).

4. Utilizando el cambio de escala Yi = Xi/l000, calcule la media aritmética y las modas absolutas y relativas de la siguiente distribución de frecuencias:

Ventas anuales en € de una cadena de agencias de viajes

(Xi)

N° de agencias

(ni) 93.000 2 98,000 3

112.000 4 118.000 5 165.000 6 190.000 8 225.000 4 265.000 3 350.000 4 400.000 6 425.000 2 526.000 2 575.000 1

N° Total de Agencias de Viaje 50

Page 10: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−10/34–

Solución.- Ventas anuales en € de una Yi N° de agencias Yi·ni

93.000 93 2 186 98000 98 3 294

112.000 11 4 448 118.000 11 5 590 165.000 16 6 990 190.000 19 8 1520 225.000 22 4 900 265.000 26 3 795 350.000 35 4 1400 400.000 40 6 2400 425.000 42 2 850 526.000 52 2 1052 575.000 57 1 575

50 1200 media aritmética de Yi = 240 → media de Xi = 240·1000 = 240000 moda absoluta de Yi= 190 → moda absoluta de Xi= 190000 moda relativa de Yi = 400 → moda relativa de Xi= 400000 moda relativa de Yi = 526 → moda relativa de Xi= 526000 5. Calcular el coeficiente de variación de Pearson de la siguiente distribución de frecuencias

Li-Li+1 n 0-10 20 10-20 50 20-30 60 30-40 40 40-50 30 50-60 10

Solución.- De la tabla:

Li-Li+1 ni xi xini xi2 xi

2·ni 0-10 20 5 100 25 500 10-20 50 15 750 225 11250 20-30 60 25 1500 625 37500 30-40 40 35 1400 1225 49000 40-50 30 45 1350 2025 60750 50-60 10 55 550 3025 30250 210 5650 189250

obtenemos: X = 26,90

2X = 901,19 σ2 = ( )22 XX − =177,32 σ = 13,32

CV = Xσ = 0,49

Dado que el coeficiente de variación es < 0,5, podemos considerar que la media tiene una aceptable representatividad.

Page 11: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−11/34–

6. Con los siguientes datos referidos a una muestra de visitantes de un establecimiento hotelero.

Datos de edad Número de visitantes menos de 10 años 2 de 10 a 15 años 35 de 15 a 25 años 45 de 25 a 35 años 33 de 35 a 45 años 35 de 45 a 55 años 50 de 55 a 65 años 40 más de 65 años 60

Total 300 Obtener: a) Las frecuencias acumuladas, las frecuencias relativas y las frecuencias relativas acumuladas. b) Las principales medidas de posición (media, mediana y modas absolutas y relativas) Solución.- Para precisar, supondremos los intervalos cerrados por la izquierda y abiertos por la derecha. Además, tomaremos el último intervalo igual a [65, 75]. Así tendremos: a)

Datos de

edad

Número de

visitantes (ni)

Marcas de

clase (xi)

Frecuenciasacumulada

s (Ni)

Frecuencias relativas

(fi)

Frecuencias relativas

acumuladas (Fi)

xi·ni Densidades

de frecuencia

[0, 10[ 2 5 2 60,0300

2 )= 60,0

300

2 )= 10 2,0

10

2=

[10, 15[ 35 12,5 37 611,0300

35 )= 312,0

300

37 )= 437,5 7

5

35=

[15, 25[ 45 20 82 15,0300

45= 327,0

300

82 )= 900 5,4

10

45=

[25, 35[ 33 30 115 11,0300

33= 338,0

300

115 )= 990 3,3

10

33=

[35, 45[ 35 40 150 611,0300

35 )= 5,0

300

150= 1400 5,3

10

35=

[45, 55[ 50 50 200 61,0300

50 )= 6,0

300

200 )= 2500 5

10

50=

[55, 65[ 40 60 240 31,0300

40 )= 8,0

300

240= 2400 4

10

40=

[65, 75] 60 70 300 2,0300

60= 1 4200 6

10

60=

Total 300 12837,5

b) De la tabla obtenemos la media 642,791300

12837,5x)

== ; la mediana Me = 45; la clase

modal absoluta es [10, 15] (la de mayor densidad de frecuencia) luego la moda absoluta:

Page 12: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−12/34–

Mo = 10 + 5·5,42,0

5,4+

≅ 14,79; modas relativas: una en la clase [45, 55[, una estimación de la cual

sería 45+ 105,34

4+

≅ 50,33; otra en la clase [65, 75], una estimación de la cual sería 65.

7. Entre los clientes de un hotel se hace una Encuesta sobre control de calidad de los servicios. De los 100 clientes entrevistados 25 expresaron algún tipo de queja sobre el funcionamiento de uno o varios de los departamentos o unidades de servicio sobre los que fue preguntado; en referencia a las 5 unidades de servicio del hotel, se obtuvo la siguiente relación de quejas:

• El Departamento 1 tuvo 10 quejas; • El Departamento 2 tuvo 15 quejas; • El Departamento 3 tuvo 1 quejas; • El Departamento 4 tuvo 8 quejas; • El Departamento 5 tuvo 2 quejas;

a) Organice la información en una tabla de frecuencias. b) Represéntela gráficamente en un diagrama de barras. c) Valore las conclusiones obtenidas, indicando:

• La proporción total de de quejas • La proporción de quejas que obtuvo cada Departamento • ¿Cómo expresaría la moda de la distribución? • ¿Cómo expresaría la media aritmética de la distribución? ¿Tiene sentido hablar de la misma?

Solución:

a) Tabla de frecuencias:

Departamento

Nº de quejas

1 10 2 15 3 1 4 8 5 2

Total 36

b) diagrama de barras:

0

2

4

6

8

10

12

14

16

1 2 3 4 5

Departamento

Nº d

e qu

ejas

Page 13: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−13/34–

c) La proporción total de quejas: puesto que se ha entrevistado a 100 clientes que hubieran podido presentar un máximo de 500 quejas (una por departamento) y sólo se han presentado 36, la proporción total de

quejas sería 50036 = 0,072 es decir, un 7,2

% de los clientes (en la muestra considerada) presenta alguna queja. La proporción de quejas que obtuvo cada departamento: La moda sería el departamento número 2, que es le que obtiene mayor número de quejas. Los distintos departamentos son modalidades de un atributo, no constituyendo una variable cuantitativa y por tanto el cálculo de la media aritmética no tiene sentido. 8. Calcular la media, la mediana y la moda de la masa salarial de una empresa con 1000 trabajadores que tiene la distribución adjunta de salarios por intervalos: Solución.- Construimos la tabla:

Salario Mensual en

euros Marcas de

clase Nº de

trabajadores xi·ni

Frecuencia acumulada

Ni Li–1–Li (xi) (ni) 600-800 € 700 160 112000 160

Clase modal → 800-1000 € 900 200 180000 360 1000-1200 € 1100 100 110000 460

Clase mediana → 1200-1400 € 1300 110 143000 570 1400-1600 € 1500 100 150000 670 1600-1800 € 1700 85 144500 755 1800-2000 € 1900 10 19000 765 2000-2200 € 2100 14 29400 779 2200-2400 € 2300 25 57500 804 2400-2600 € 2500 47 117500 851 2600-2800 € 2700 24 64800 875 2800-3000 € 2900 40 116000 915 3200-3400 € 3300 85 280500 1000

Departamento Nº de quejas Proporción

1 10 3610 ≅ 0,28 → 28%

2 15 3615 ≅ 0,42 → 42%

3 1 361 ≅ 0,03 → 3%

4 8 368 ≅ 0,22 → 22%

5 2 362 ≅ 0,06 → 6%

Salario Mensual en euros

Li–1–Li

Nº de trabajadores

(ni) 600-800 € 160

800-1000 € 200 1000-1200 € 100 1200-1400 € 110 1400-1600 € 100 1600-1800 € 85 1800-2000 € 10 2000-2200 € 14 2200-2400 € 25 2400-2600 € 47 2600-2800 € 24 2800-3000 € 40 3200-3400 € 85

Page 14: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−14/34–

1000 1524200 de donde se obtiene:

Media = 1524,21000

1524200= €; Mediana = Li–1 + 1272,73200·

1104605001200c

n

N2N

ii

1i≅

−+=

−−

;

Moda = Li–1 + i1i1i

1i c·nn

n

+−

+

+= 800 + 200·

100160100+

≅ 876,92

9. La valoración de 0 a 10 del grado de satisfacción con los servicios recibidos por una agencia mayorista a partir de una muestra de 500 agencias minoristas es la siguiente:

Obtener la media aritmética de la valoración de los servicios ponderada por la importancia de las ventas de cada estrato y por el número de agencias e interpretar el significado de los resultados obtenidos. DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES (CAPÍTULO 5 )

1º) Razone brevemente sobre los conceptos de Casualidad, Causalidad y Especificación de modelos estadísticos.(Junio 2003) Respuesta.- Consideremos en una población dos o más variables: - Es posible que exista relación entre ellas de modo que una variación de una o varias produzca como consecuencia una variación en otras, explicable mediante alguna teoría general (por ejemplo, de la teoría de la demanda se deduce que si aumentamos el precio, disminuye la demanda). En este caso decimos que existe relación de causalidad. - Es posible no obstante que encontremos relación entre las variables pero no exista modelo teórico lógico que fundamente la relación (por ejemplo, calificaciones obtenidas por 50 alumnos en una asignatura y producción de cereales de 50 provincias). Hablaremos en este caso de casualidad. - Así pues, al estudiar la relación entre variables, debemos especificar previamente un modelo teórico que recoja las principales relaciones de causalidad (por ejemplo, el nº de clientes de una cadena hotelera puede venir explicado por los precios de alojamiento, el número de turistas que visitan la localidad, etc.) 2º) En una distribución de frecuencias para 2 variables (x, y), se ha obtenido la siguiente tabla de correlaciones:

3 4 8 TOTAL 5 4 2 2 8 6 2 1 2 5 7 1 2 4 7

TOTAL 7 5 8 20

Y X

Page 15: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−15/34–

Obtenga: a) La regresión lineal simple de Y/ X (Y sobre X) y de X sobre Y (X/ Y). b) El coeficiente de determinación de ambas rectas de regresión. (Junio 2003) Solución.- Efectuamos los cálculos necesarios para obtener las medias y las varianzas:

De la tabla se obtiene: a10 = 11920

= 5,95; a01 = 10520

= 5,25;

a20 = 72320

= 36,15; a02 = 65520

= 32,75 y de aquí:

m20 = 36,15 – 5,952 = 0,7475; m02 = 32,75 – 5,252 = 5,1875

Por otra parte, si multiplicamos cada valor de X por cada valor de Y y por su respectiva frecuencia, obtenemos la tabla

60 40 8036 24 9621 56 224

cuya suma de elementos da 637, de donde obtenemos: a11 = 63720

= 31,85 y de aquí:

m11 = 31,85 – 5,95·5,25 = 0,6125. Se tendrá pues: a) la recta de regresión de Y/X es:

y – 5,25 = ( )0,6125 x 5,950,7475

− ↔ y ≅ 0,82x + 0,37

y la recta de regresión de X/Y:

x – 5,95 = ( )0,6125 y 5,955,1875

− ↔ x ≅ 0,12y + 5,33

b) el coeficiente de determinación: R2 = 211

20 02

mm ·m

=20,6125

0,7475·5,1875 ≅ 0,0967

3º) Explique y valore el significado del coeficiente de correlación lineal de Pearson. (Junio 2003 reserva) Solución.- Consideremos una variable bidimensional (Xi, Yi), siendo Xi la variable independiente (exógena) e Yi la dependiente (endógena). Sea y = a+bx la recta de regresión de Y/X. Tenemos entonces las tres varianzas: S2

Y = m02, varianza de la variable Yi; S2Yt = varianza de la variable a+bXi, (varianza explicada por

la regresión); S2rY varianza de la variable Yi–a–bXi, (varianza residual). Se demuestra que

S2Y = S2

Yt + S2rY

Llamamos coeficiente de determinación R2 a la proporción (tanto por uno) de varianza explicada que forma parte de la varianza de la variable:

R2 = 2Yt2Y

SS

demostrándose que 2

2 11

20 02

mRm ·m

= y, obviamente, 0 ≤ R2 ≤ 1.

Llamamos coeficiente de correlación al cociente:

3 4 8 ni· xi·ni· xi2·ni·

5 4 2 2 8 40 200 6 2 1 2 5 30 180 7 1 2 4 7 49 343

n·j 7 5 8 20 119 723

yj·n·j 21 20 64 105 yj

2·n·j 63 80 512 655

Page 16: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−16/34–

R = 11

20 02

mm · m

cumpliéndose que –1 ≤ R ≤ 1. Si es 1 ó –1, la varianza se compone exclusivamente de la varianza explicada, es decir, la varianza residual es nula y el ajuste de la nube de puntos a la recta de regresión es perfecto; si es cero entonces la varianza se compone exclusivamente de la varianza residual y la ecuación de regresión no es representativa. 4º) Una empresa quiere realizar un estudio sobre la influencia de las campañas publicitarias en sus cifras de ventas. Para ello dispone del gasto destinado a publicidad y sus ventas en los últimos 5 años: Años Gastos publicidad Ventas 1997 2,2 195 1998 2,5 200 1999 2,8 221 2000 2,9 230 2001 3,1 239 2002 3,5 248 a) Obtener un modelo lineal que permita predecir las ventas en función de los gastos en publicidad. b) Predecir las ventas de 2003 si se piensa invertir en publicidad 5 millones de euros. e) Valorar los errores obtenidos por la recta de regresión. (Junio 2003 reserva) Solución.- a) Consideramos la variable bidimensional (xi, yi) donde xi = “gastos en publicidad”; yi = “ventas”, tenemos la tabla:

xi yi x2i y2

i xi·yi 2,2 195 4,84 38025 429 2,5 200 6,25 40000 500 2,8 221 7,84 48841 618,8 2,9 230 8,41 52900 667 3,1 239 9,61 57121 740,9 3,5 248 12,25 61504 868

Totales: 17 1333 49,2 298391 3823,7 de donde se deduce:

a10= 2,83333333 m20= 0,17222222 a01= 222,166667 m02= 373,805556

m11= 7,81111111 de donde la recta de regresión de Y/X:

y – 222,17 = 7,81 (x 2,83)0,172

− ↔ y ≅ 45,35x + 93,66

b) sustituyendo en la recta x = 5 → y ≅ 320,43

c) El coeficiente de determinación R2 = 27,81

0,17·373,80≅ 0,9477, lo que indica que la recta de

regresión es representativa para realizar interpolaciones o extrapolaciones.

Page 17: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−17/34–

5º) Elabore una tabla tipo de una distribución bidimensional (X, Y) indicando el significado de los términos x1 , x2. ........ xr ; y1, y2 ......ys ; ni1, ni2, .....n is ; n1j, n2j, ...., nrj; ni·; n·j ; N. (Septiembre 2003) Respuesta.-

y x y1 y2 ..... ys

x1 n11 n12 ..... n1s n1·x2 n21 n22 ..... n2s n2·. . .

. . . . . . .....

. . . . . .

xr nr1 nr2 ..... nrs nr· n·1 n·2 ..... n·s N

x1, x2, ..., xr : valores de la variable X y1, y2, ..., yr : valores de la variable Y nij: frecuencia del punto (xi, yj), i = 1, 2, ..., 3; j = 1, 2, ..., s

ni· = ∑=

s

1jijn es la frecuencia marginal de xi.

n·j = ∑=

r

1iijn es la frecuencia marginal de yj.

N = ∑=

s

1jjn =∑

=•

r

1iin =∑

∀∀ j,iijn es el total de individuos.

6º) Defina el coeficiente de correlación lineal e indique los valores que puede tomar y su significado. (Septiembre 2003) Respuesta.-

R = 0220

11

m·mm . Se cumple que –1 ≤ R ≤ 1. Si R = ±1, la correlación es máxima y los puntos (xi, yj)

están en línea recta (las dos rectas de regresión coinciden), de pendiente positiva si R = 1 y de pendiente negativa si R = –1. Cuanto menor, en valor absoluto, sea R, mayor será el ángulo que formen entre sí las rectas de regresión. Si R = 0, no existe correlación y las rectas de regresión y = a01, x = a10, son perpendiculares. 7º) Se ha efectuado una encuesta a 20 agencias de viaje preguntando por su situación respecto a dos variables de interés (nº de clientes diarios y nº de trabajadores); en estas encuestas se han obtenido los siguientes resultados

Nº de trabajadores

Nº de clientes 1 2 3 total

5 4 2 2 8 6 2 1 2 5 7 1 2 4 7

total 7 5 8 20 Obtener los momentos de orden 1 y 2 respeto a la media y respecto al origen de esta distribución y estudiar la posible dependencia entre ambas variables. (Septiembre 2003)

Page 18: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−18/34–

Solución.- Ampliemos la tabla con los cálculos que se indican:

Nºde trabajadores Nºde clientes

1 2 3 total xi·ni· x2i·ni·

5 4 2 2 8 40 200 6 2 1 2 5 30 180 7 1 2 4 7 49 343

total 7 5 8 20 119 723 yj·n·j 7 10 24 41 y2

j·n·j 7 20 72 99 Además, sustituyendo nij por el producto xi·yj·nij, obtenemos

1 2 35 20 20 30

6 12 12 36

7 7 28 84

obteniéndose una suma ∑∀∀ j,i

ijji n·y·x = 249. Ya podemos calcular los momentos:

a10 = 20

119n·x201 3

1iii =∑

=• = 5,95

a20 = 20

723n·x201 3

1ii

2i =∑

=• =36,15 m11 = a11–a10·a01 = 0,2525

a01 = 2041n·y

201 3

1ijj =∑

=• = 2,05

a02 = 20

99n·y201 3

1ij

2j =∑

=• = 4,95 m20 = a20 – a10

2= 0,7475

a11 = ∑∀∀ j,i

ijji n·y·x201 = 12,45

m10 = m01 = 0 m02 = a02 – a01

2 = 0,7475

El coeficiente de correlación sería: R = 7475,0·7475,0

2525,0≅ 0,3378. Por tanto existe una

correlación que puede considerarse pequeña entre las dos variables. 8º.- Razone brevemente sobre los conceptos de Casualidad, Causalidad y Especificación de

modelos estadísticos. (Junio 2004) Respuesta.- Cuando en una distribución bidimensional (X, Y) pueda considerarse que los valores de la

variable independiente o exógena X son la causa de los valores de la variable dependiente o endógena Y, diremos que existe causalidad. Por ejemplo, el precio de un producto y las cantidades vendidas del mismo.

No obstante, puede haber relación entre los valores de las variables, sin que sea probable que unos valores sean la causa de los otros. Por ejemplo, la evolución del precio del metro cuadrado de la vivienda en los últimos cinco años, y la estatura de mi sobrino en el mismo periodo. Diremos en ese caso que existe casualidad.

Al estudiar la relación entre variables, debemos especificar, mediante un modelo teórico, en qué medida una variable endógena es la causa de las variables exógenas que intervienen en el proceso.

Page 19: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−19/34–

9º.- En una distribución de frecuencias para 2 variables (x, y), se ha obtenido la siguiente tabla de correlaciones:

yixj

1 2 3 TOTAL

0 3 0 1 4 3 0 4 2 6 5 1 1 6 8

TOTAL 4 5 9 18

Se pide: a) Construya las distribuciones marginales de frecuencias de las variables x e y b) Calcule la media aritmética, la desviación típica y el coeficiente de variación de Pearson c) Calcule la covarianza de la distribución conjunta de ambas variables (Junio 2004) Solución.- a) y b)

Distribución marginal de la x Distribución marginal de la y xj nj· xj·nj· xj

2 xj2nj· yj n·i yj·n·i yj

2 yj2n·i

0 4 0 0 0 1 4 4 1 4 3 6 18 9 54 2 5 10 4 20 5 8 40 25 200 3 9 27 9 81 18 58 254 18 41 105

x = a10 = 1858

≅ 3,22 y = a01 = 1841

≅2,28

2x = a20 = 18254

≅ 14,11 2y = a02 = 18105

≅ 5,83

Sx = 2102020 aam −= ≅ 1,93 Sy = 2

010202 aam −= ≅ 0,80

CVx = xSx ≅ 0,60 CVy =

ySy ≅ 0,35

c) Calculamos xj·yi·nji,

yixj

1 2 3

0 0 0 0 3 0 24 18 5 5 10 90 147

y sumando obtenemos ∑i,j

jiij nyx = 147, de donde 18

147ay·x 11 == ≅ 8,17. Así pues,

Cov(X,Y) = m11 = a11 – a10·a01 ≅ 0,83 10º.- La siguiente tabla de distribución de frecuencias indica, para 2 variables, la relación

existente entre las ventas medias de un complejo turístico y las temperaturas medias observadas durante un conjunto de años.

Page 20: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−20/34–

Temperatura media durante

el verano en grados centesimales (Xi)

Ventas en euros de un

complejo turístico (Yi)

25 6,5 27 7,0 30 9,0 28 8,5 31 9,0 30 8,2

Obtener:

a) Un diagrama o gráfico de dispersión b) La recta de regresión entre la variable dependiente Yi y la independiente Xi (Jun. 2004-2ª)

Solución.- a) Representaremos la nube de puntos:

66,5

77,5

88,5

99,5

24 25 26 27 28 29 30 31 32

Temperatura

Ven

tas

b) La recta de regresión entre la variable dependiente Yi y la independiente Xi es la recta

X/Y: x–a10 = 02

11

mm (y–a01)

Temperatur

a media durante

el verano en grados

centesimales (Xi)

Ventas en euros de un

complejo turístico

(Yi)

Xi·Yi Xi2

25 6,5 162,5 625 27 7 189 729 30 9 270 900 28 8,5 238 784 31 9 279 961 30 8,2 246 900

171 48,2 1384,5 4899

a10 = 28,5 m11= 1,8 20

11

mm

= 0,4235

a01= 8,03 m20 = 4,25 a11= 230,75 a20= 816,5

Page 21: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−21/34–

Luego la recta de regresión será: y – 8,03= 0,4235 (x – 28,5) ↔ y = 0,4235x – 4,0373 11º.- Se desea estudiar la repercusión que tienen los días de lluvia en la afluencia de visitantes a una determinada actividad turística; para ello se dispone de los siguientes datos medios:

Año Días de lluvia al año Miles de visitantes al año 1994 26 80 1995 30 85 1996 35 100 1997 45 120 1998 55 150 1999 45 140 2000 20 60 2001 15 35 2002 28 60 2003 40 100

a) Obtenga la recta de regresión que mejor explique el número de visitas anuales en función de los días de lluvia b) Valore la bondad del ajuste, indicando sí puede considerarse la lluvia como una variable significativa para explicar la afluencia de público a la actividad turística analizada c) Calcule los ingresos previstos para el año 2004 sí los meteorólogos prevén 60 días de lluvia y la entrada a la actividad cuesta 10 euros (Sep. 2004) Solución.- Considerando las variables X = “Días de lluvia al año” e Y = “Miles de visitantes al año”, de la tabla:

xi yi xi2 yi

2 xi·yi 26 80 676 6400 2080 30 85 900 7225 2550 35 100 1225 10000 3500 45 120 2025 14400 5400 55 150 3025 22500 8250 45 140 2025 19600 6300 20 60 400 3600 1200 15 35 225 1225 525 28 60 784 3600 1680 40 100 1600 10000 4000 339 930 12885 98550 35485

obtenemos los momentos: a10 = 33,9 a01 = 93 m20=139,29 a11 = 3548,5 m02=1206 a20 = 1288,5 m11=395,8 a02 = 9855

a) La recta de regresión de Y/X:

( )9,33x29,1398,39593y −=− ↔ y = 2,84x – 3,33

Page 22: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−22/34–

b) El coeficiente de determinación: R2 = ( )1206·29,1398,395 2

≅ 0,93. Por lo tanto sí que puede

considerarse la lluvia como una variable significativa para explicar la afluencia de público. c) Haciendo x = 60 en el recta de regresión, se obtiene y = 167,1673, luego los ingresos previstos serían de 1671,67 €. 12.- Defina el concepto de Coeficiente de Correlación Lineal de Pearson y su significado (Sep 2004. Res) Respuesta.- Consideremos una variable bidimensional (Xi, Yi), siendo Xi la variable independiente (exógena) e Yi la dependiente (endógena). Sea y = a+bx la recta de regresión de Y/X. Tenemos entonces las tres varianzas: S2

Y = m02, varianza de la variable Yi; S2Yt = varianza de la variable a+bXi, (varianza explicada por

la regresión); S2rY varianza de la variable Yi–a–bXi, (varianza residual). Se demuestra que

S2Y = S2

Yt + S2rY

Llamamos coeficiente de determinación R2 a la proporción (tanto por uno) de varianza explicada que forma parte de la varianza de la variable:

R2 = 2Yt2Y

SS

demostrándose que 2

2 11

20 02

mRm ·m

= y, obviamente, 0 ≤ R2 ≤ 1.

Llamamos coeficiente de correlación al cociente:

R = 11

20 02

mm · m

cumpliéndose que –1 ≤ R ≤ 1. Si es 1 ó –1, la varianza se compone exclusivamente de la varianza explicada, es decir, la varianza residual es nula y el ajuste de la nube de puntos a la recta de regresión es perfecto; si es cero entonces la varianza se compone exclusivamente de la varianza residual y la ecuación de regresión no es representativa. 13.- La siguiente tabla relaciona las ventas mensuales de una agencia de viajes mayorista (yj) y el número de trabajadores contratados (xi) en distintos períodos de actividad (los meses que la empresa tuvo 3 trabajadores contratados vendió, como media, 100.000 euros, cuando tuvo 4 vendió 125.000, etc.):

N° de trabajadores (xi)

Ventas en miles de euros (y)

3 100 4 125 5 150 6 160 7 170

a) Ajuste una recta que exprese una relación causal entre ambas variables. b) Con la función obtenida en el apartado anterior, estime las ventas mensuales de la empresa si su plantilla pasa a ser de 9 trabajadores (Sep. 2004. Res)

Page 23: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−23/34–

Solución.- a) De la siguiente tabla.

N° de trabajadore

s (xi)

Ventas en miles de

euros (yi) xi

2 yi2 xiyi

3 100 9 10000 300 4 125 16 15625 500 5 150 25 22500 750 6 160 36 25600 960 7 170 49 28900 1190

25 705 135 102625 3700 obtenemos los momentos

a10 = 5 a01 = 141 m20 = 2 a11 = 740 m11 = 35 a20 = 27

de donde la recta de regresión de Y/X:

y – 141 = ( )5x2

35− ↔ y = 17,5x + 53,5

b) Haciendo x = 9 en la recta de regresión se obtiene y = 211 miles de euros. 14.- Una agencia de viajes ha comprobado experimentalmente que sus ventas (en miles de euros por semana) están relacionadas con el número de trabajadores disponibles para atender a la clientela; dispone a tal fin de los siguientes datos:

N° de trabajadores (Xi) Ventas (Yi)5 20 6 25 7 29 8 33 9 37

10 41 Ajústese la función que mejor exprese la relación entre ambas variables y examínese su

potencial de predicción. (Jun. 2005) Solución.- De la representación gráfica de la nube de puntos:

19

24

29

34

39

4 6 8 10 12

deducimos que la función que mejor expresa la relación entre ambas variables es una función lineal. Ajustaremos pues la recta de regresión de Y/X.

Page 24: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−24/34–

De los cálculos: N° de trabajadores (Xi) Ventas (Yi) Xi

2 Yi2 Xi·Yi

5 20 25 400 100 6 25 36 625 150 7 29 49 841 203 8 33 64 1089 264 9 37 81 1369 333

10 41 100 1681 410 45 185 355 6005 1460

deducimos los momentos: a10 = 7,5 m1 1= 12,08 a01 = 30,83 m20 = 2,917 a11 = 243,33 m02 = 50,139 a2 = 59,17 a02 = 1000,83

y de aquí obtenemos la ecuación de la recta de regresión:

y = 4,143x – 0,238

El coeficiente de determinación R2 = 0220

211

m·mm

≅ 0,9984 nos indica que el potencial de predicción

de la recta de regresión es elevado. 15.- Explique brevemente la teoría de la correlación y la teoría de la regresión estadística entre variables. (Junio 2005. 2ª) Respuesta.- En el caso de distribuciones de dos o más variables, la teoría de la correlación tiene por objeto determinar las relaciones de dependencia estadística y reflejarlas numéricamente, esto es, medir el grado de dicha dependencia. La teoría de regresión tiene por objeto determinar qué función (lineal, cuadrática, logarítmica, exponencial,….) se ajusta mejor a los valores dados para explicar la dependencia estadística. 16.- Una compañía quiere realizar un estudio sobre la influencia del gasto en I+D sobre sus ventas. Para ello dispone de los siguientes datos sobre los últimos años;

Años Gastos millones Ventas millones1998 3,0 130 1999 3,3 155 2000 3,8 175 2001 4,2 210

a) Realice un gráfico de dispersión. b) Obtenga un modelo lineal que permita predecir las ventas a partir de los gastos en I+D. Comente los resultados. c) Prediga las ventas del 2002 sabiendo que el gasto en I+D será de 4,5 millones. d) Juzgue la bondad del modelo estimado. (Jun. 2005. 2ª) Solución.- a) Representaremos la nube de puntos:

Page 25: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−25/34–

125135145155165175185195205215

2,5 3 3,5 4 4,5

Gastos

Vent

as

b) Construimos la tabla:

Años Gastos

millones Ventas

millones xi2 yi

2 xiyi

1998 3 130 9 16900 390

1999 3,3 155 10,89 24025 511,5

2000 3,8 175 14,44 30625 665

2001 4,2 210 17,64 44100 882 14,3 670 51,97 115650 2448,5

de donde obtenemos los momentos. a10 = 3,575 a01 = 167,5 m20 = 0,211875 a11 = 612,125 m02 = 856,25 a20 = 12,9925 m11 = 13,3125 a02 = 28912,5

y de aquí la recta de regresión de Y/X:

y – 167,5 = ( ))575,3x212,031,13

− ↔ y = 62,832x – 57,124

c) La predicción de ventas para el año 2002 la obtendremos sustituyendo en la recta de regresión, la x por 4,5, obteniéndose unas ventas aproximadas de 225,62 millones de €.

d) El coeficiente de determinación resulta: R2 = 0220

211

m·mm

≅ 0,977, lo cual establece que la

ecuación de la recta de regresión es suficientemente representativa.

Page 26: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−26/34–

(Sep 2005)

(Sep 2005. Res) NÚMEROS ÍNDICES (CAPÍTULO 6) 1º) Los precios de un determinado bien en los cuatro años 1999-2003 son, respectivamente, 11, 14, 20, 23 y 25 euros. Calcular los números índices simples de dicho precio tomando 1999 como período base y el incremento anual de precios del citado bien. (Junio 2003) Solución.-

Años Precios Índices Incrementos

anuales (en base al año 1999)

1999 11 100 –

2000 14 14·10011

= 127,27 27,27 %

2001 20 20·10011

= 181,82 54,55%

2002 23 23·10011

= 209,09 27,27%

2003 25 25·10011

= 227,27 18,18%

Page 27: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−27/34–

2º) Dados los siguientes datos de un índice de precios, obtenga la serie homogénea del índice en base 1988

Año I. base 1988

I. base 1993

I. base 1997

1988 100 1989 150 1990 145 1991 154 1992 132 1993 165 100 1994 112 1995 106 1996 122 1997 140 100 1998 112 1999 114 2000 116 2001 118 2002 144 2003 155

(Junio 2003 reserva) Solución.- Lo haremos en dos etapas: - primero convertiremos los números índices en base 1997 a base 1993, multiplicando cada índice en base 1997 por 140 y dividiéndolo por 100 - y en segundo lugar convertiremos los números índices en base 1993 a base 1988, multiplicando cada índice en base 1993 por 165 y dividiéndolo por 100:

Año I. base 1988

I. base 1993

I. base 1997

1988 100 1989 150 1990 145 1991 154 1992 132 1993 165 100 1994 184,8 112 1995 174,9 106 1996 201,3 122 1997 231 140 100 1998 258,72 156,8 112 1999 263,34 159,6 114 2000 267,96 162,4 116 2001 272,58 165,2 118 2002 332,64 201,6 144 2003 358,05 217 155

Page 28: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−28/34–

3º) Indique las principales propiedades de los números índices. (Junio 2004, 2ª semana) Respuesta.- Veanse las unidades didácticas. 4º) Defina el concepto de número índice, precisando, en particular, el concepto de “año base”. Ponga un sencillo ejemplo de número índice con 5 datos.( Junio 2006. 2ª semana) Respuesta.- Dada una serie de valores, por ejemplo anuales, de una determinada magnitud (precios, cantidades, etc) un índice simple se obtiene dividiendo cada valor por el de un determinado año que se toma como base. Así pues, para cada año, el índice toma un valor. Si el cociente mencionado se multiplica por 100, el índice correspondiente al año base será 100. En el ejemplo adjunto se ha construido un índice para una determinada magnitud de valores anuales xt, tomando el año 2001 como base: 5º) Defina el concepto de Número Índice, indicando su clasificación y principales propiedades (Septiembre 2006) Respuesta.- Un índice simple para una determinada magnitud es el cociente (generalmente multiplicado por 100) entre el valor de esa magnitud en el periodo actual y el valor en un periodo que se toma como base. Un índice complejo para un conjunto de magnitudes es, generalmente un promedio de índices simples de esas magnitudes, pudiendo ser ponderado o no. Las principales propiedades que pueden cumplir los índices son: existencia, identidad, inversión, proporcionalidad, homogeneidad y propiedad circular. 6º) Defina el Índice de Laspeyres e indique si lo considera adecuado para elaborar índices de precios tales como el IPC. ¿Por qué lo considera o no lo considera adecuado? (Septiembre 2006 Reserva) Respuesta.-

El índice de precios de Laspeyres se calcula mediante la fórmula LP = 100·qp

qp

n

1i0i0i

n

1i0iit

=

= , donde

pi0 y pit son los precios del producto i-ésimo respectivamente en el periodo base y en el periodo corriente y qi0 es la cantidad del producto i-ésimo el periodo base. Es adecuado para calcular el IPC por razones prácticas pues, para cada periodo sólo es necesario calcular los precios pit en el periodo corriente. SERIES TEMPORALES (CAPÍTULO 7) 1º) Enumere y describa brevemente los componentes de las series temporales y mencione las hipótesis de trabajo más habituales para relacionar las mismas a fin de que resulte el dato observado. Respuesta.- Son cuatro: -Tendencia (T): evolución de la serie a largo plazo. - Fluctuación cíclica (C): fluctuaciones de la tendencia a corto y medio plazo. - Variación estacional (S): comportamiento regular y repetitivo a lo largo de un año. - Fluctuaciones irregulares (I): fluctuaciones irregulares o aleatorias.

Año xt It = 100xx

0

t

2001 436 100,00 2002 450 103,21 2003 460 105,50 2004 475 108,94 2005 480 110,09

Page 29: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−29/34–

La asociación de las cuatro componentes para que resulte el dato observado Y, puede ser: Aditiva: Y = T + C + S + I Multiplicativa: Y = T·C·S·I Combinación de ambas: p. ej. Y = T + C + S·I

2º) Describa los componentes de una serie temporal y sus posibles asociaciones (Sep. 2003, res) 3º) Obtener, por el método de los momentos y realizando un cambio de variable, la tendencia de la serie temporal adjunta (Sep. 2003, res) Solución.- Efectuaremos el correspondiente cálculo de los momentos y representaremos la tendencia por la línea de regresión mínimo-cuadrática:

Años xi yi xi2 xi·yi

1992 1 50 1 50 a10= 6 1993 2 60 4 120 a01= 78 1994 3 65 9 195 a11= 518,91 1995 4 70 16 280 a20= 46 1996 5 75 25 375 1997 6 75 36 450

De donde obtenemos la recta de regresión y = 5,09x + 47,45

1998 7 80 49 560 m20= 10 1999 8 85 64 680 m11= 50,91 2000 9 90 81 810 2001 10 100 100 1000 2002 11 108 121 1188

66 858 506 5708 Representada gráficamente:

y = 5,09x + 47,45

40

50

60

70

80

90

100

110

0 2 4 6 8 10 12

4ª. Explique el concepto de desestacionalización de una serie temporal (Junio 2005, 2ª) Respuesta.-

Años Ventas 1992 50 1993 60 1994 65 1995 70 1996 75 1997 75 1998 80 1999 85 2000 90 2001 100 2002 108

Page 30: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−30/34–

La variación que presenta una serie temporal es el resultado de cuatro componentes que están presentes en cada uno de los valores de la serie, a saber, la tendencia, la componente estacional, la componente cíclica y la componente irregular. Desestacionalizar una serie consiste en determinar, mediante la construcción de un índice, cuál es la componente estacional para, a continuación, eliminar de cada valor de la serie dicha componente. Si la asociación de las cuatro componentes tiene carácter aditivo, la desestacionalización se hará restando la correspondiente componente estacional; si la asociación tiene carácter multiplicativo, la desestacionalización se hará dividiendo por la componente estacional. 5ª) Explique en qué consisten las variaciones estacionales de una serie temporal. Proponga un ejemplo de variación estacional y enumere los métodos que se utilizan para analizarlas. (Sep. 2005) 6ª) Defina variación estacional de una serie temporal y explique qué diferencia existe entre variación estacional y variación cíclica. Asimismo, indique qué variaciones estacionales son más importantes para el análisis del sector turístico y señale cómo se denomina al procedimiento por el que se “descuentan” las variaciones estacionales y los métodos que se utilizan para ello. (Junio 2006) Respuesta.- Variaciones estacionales de una serie temporal son las oscilaciones periódicas que se producen, de periodo inferior a un año. Variaciones cíclicas son aquellas oscilaciones de periodo superior a un año. Variaciones estacionales importantes en el sector turístico pueden ser por ejemplo la distinta afluencia de turistas en verano o en invierno, oscilación del número de visitantes a museos u otras atracciones turísticas entre semana o en fines de semana, etc. El procedimiento por el que se “descuentan” las variaciones estacionales se denomina desestacionalización y los dos métodos más importantes que se utilizan para ello son el del “porcentaje promedio” y el del “porcentaje promedio móvil”. 7ª) Defina los componentes de una serie temporal. (Junio 06, 2ª) Respuesta.- Son cuatro: - componente secular o tendencia que viene determinada por la evolución de la serie a largo plazo; - componente estacional, determinada por las variaciones periódicas de periodo igual o inferior a un año; - componente cíclica, determinada por las variaciones periódicas no regulares de la serie, de periodo superior al año; .-componente irregular determinada por las oscilaciones ocasionales que se producen de forma aleatoria. 8ª) Explique el concepto de desestacionalización de una serie temporal. (Sep. 06 res) Respuesta.- Es el proceso por el cual eliminamos de los valores de la serie temporal el contenido estacional. Existen diversos métodos para desestacionalizar una serie, siendo dos de los más sencillos el del porcentaje promedio y el del porcentaje promedio móvil. PROBABILIDAD (CAPÍTULO 8) 1.- Defina y caracterice un experimento aleatorio. (Sep 04) Respuesta.- Es aquel que, repetido en idénticas condiciones, no siempre proporciona el mismo resultado. Por ejemplo, extraer una bola de una bolsa que contiene 10 bolas numeradas del 1 al 10. Las características que debe tener el experimento para considerarse aleatorio son:

Page 31: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−31/34–

- Puede repetirse indefinidamente bajo las mismas o parecidas condiciones. - Pueden conocerse los posibles resultados pero no se puede saber cual se producirá si no se realiza el experimento. - La frecuencia relativa de un resultado al repetir indefinidamente el experimento, tiende a estabilizarse. 2.- Indique y explique la denominada Regla de Laplace sobre la probabilidad y su relación con la ley del azar .(Sep 04 res y Sep 05 res) Respuesta.- La regla de Laplace proporciona la probabilidad de un suceso A de un espacio muestral finito E para el que pueda suponerse que los sucesos elementales son “equiprobables”. En tal caso,

P(A) = E. de posibles casos de NúmeroA de favorables casos de Número

Es posible que puedan suponerse equiprobables los sucesos elementales (lanzamiento de un dado, lanzamiento de una moneda…) y sin embargo exista contradicción con la ley del azar (puede ser que al lanzar un número creciente de veces una moneda aparentemente equilibrada, la frecuencia relativa del número de caras no se estabilice alrededor del 0,5, si no de otro valor, a causa de algún defecto inapreciable). 3.- Indique las diferencias entre experimentos o fenómenos determinísticos y aleatorios. (Jun. 05 y Jun 06) Respuesta.- Un experimento es de carácter determinístico cuando al repetirlo en idénticas condiciones da siempre el mismo resultado y de carácter aleatorio cuando al intentar reproducirlo en las mismas condiciones no siempre se obtiene un mismo resultado. Ejemplos: si unimos en laboratorio dos partes de hidrógeno y una de oxígeno en ciertas condiciones siempre obtendremos agua (es un experimento determinístico), pero si se repite un partido de fútbol entre dos equipos con los mismos jugadores no siempre se obtiene el mismo resultado (es un experimento aleatorio). 4. Explique en qué consiste la denominada Ley del Azar o Ley de la Regularidad Estadística. (Sep 05) Respuesta.- La frecuencia relativa de un suceso aleatorio tiende hacia un número fijo, cuando el número de veces que se repite el experimento aumenta indefinidamente. 5.- ¿Qué interés tiene en estadística la distribución normal de probabilidad? ¿Qué significa “tipificar” o “reducir” esta distribución? (Sep 06) Respuesta.- Entre las distribuciones de las variables aleatorias, la más frecuente es la denominada distribución normal, cuya función de densidad es la “campana de Gauss”. En teoría de muestras, para muestras grandes (n≥30) e independientemente de cómo se distribuya la variable, la media muestral sigue aproximadamente una distribución normal. Una variable aleatoria X que se distribuya de forma normal está caracterizada por su media µ y su desviación típica σ. Tipificar tal variable consiste en restarle la media y dividir por la

desviación típica, construyéndose otra variable Z = σµ−X que se denomina tipificada, que tiene por

media 0 y por desviación típica 1.

Page 32: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−32/34–

INFERENCIA ESTADÍSTICA (CAPÍTULO 9) 1º) Señale las condiciones que debe cumplir un muestreo probabilístico y las ventajas que aporta este tipo de muestreo. (Junio 2003) Respuesta.- Podemos leer en el texto base: Un muestreo es probabilístico si cumple las siguientes condiciones: 1. Se conoce la población objeto de estudio y es posible tener enumerados inequívocamente todos sus elementos; si ello es así, es posible obtener un conjunto de muestras S1, S2, ... Sn e indicar con precisión las unidades de muestreo que pertenecen a cada una de ellas. 2. A cada elemento de la población puede asignársele una probabilidad de selección Pi conocida y mayor de cero de estar en cada posible muestra, Si. 3. La selección de una determinada muestra Si, debe llevarse a cabo por procedimientos aleatorios. Entre las ventajas que aporta este tipo de muestreo puede señalarse que las muestras aleatorias son las únicas que son estadísticamente representativas, es decir, las únicas que permiten obtener conclusiones de tipo probabilístico, infiriendo resultados, con un determinado grado de error y nivel de confianza, sobre las características de las poblaciones investigadas. 2º) Describa brevemente los diferentes tipos de muestreo no probabilístico que conozca. (Junio 2003 reserva) Solución.- - El muestreo sin norma o muestreo de conveniencia, es decir, dejando a la comodidad del encuestador la elección de los entrevistados, de forma que en dicha selección prime la rapidez y la reducción de coste. Ejemplos de este método serían: el profesor que para realizar una investigación elige a su clase como muestra porque es la que le resulta más accesible; elegir los 80 primeros cuestionarios; entrevistar en la calle a quién pase, buscar colaboraciones voluntarias, etc. Con estos procedimientos se busca información rápida y con un coste mínimo. Se utiliza en la primera fase del estudio para determinar si merece la pena iniciar una investigación con muestreo aleatorio. - El muestreo opinático o subjetivo, en el que el propio responsable de la investigación o un grupo de expertos, (muestreo según criterio de expertos), deciden la forma de escoger los elementos de la muestra y su composición. - El diseño de bola de nieve, empleado para localizar unidades de difícil localización o sobre las que se carece a priori de información; en este muestreo se trata de localizar una unidad poblacional o muestral, por ejemplo una empresa partidora y envasadora de almendras, y pedirle información para localizar a otra unidad con las mismas o parecidas características. - El muestreo por cuotas, en el que se le dan a los entrevistadores unas cuotas, de edad o sexo de los individuos o de tamaño y grupo de actividad de las empresas, dejándole mayor o menor grado de libertad para que seleccionen las unidades muestrales en campo. El muestreo por cuotas puede hacerse relativamente aleatorio mediante procedimientos como el «random route» por el cual se le obliga al encuestador a seguir una determinada ruta (situado en la puerta del Ayuntamiento de un determinado pueblo, tómese la primera calle a la izquierda y entrevístese la primera vivienda de la acera de la derecha, tómese posteriormente la segunda calle a la izquierda y entrevístese la segunda vivienda de la acera derecha, etc.). 3º) Defina los conceptos estadísticos de población, marco estadístico, muestra e individuo o unidad estadística. (Sep 03) Respuesta.- Población: Conjunto de elementos que cumplen una determinada característica (ej.: clientes de un hotel en una determinada fecha).

Page 33: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−33/34–

Individuo o Unidad de investigación. Cada uno de los elementos de la Población (ej.: personas, edificios, oficinas, hoteles, campos de golf, etc.). Muestra: Cualquier subconjunto de individuos pertenecientes a una población determinada. Marco estadístico. Es el conjunto de información (ficheros, listados, etc.) que permite identificar a todos los individuos de la población. Es la base informativa que empleamos para seleccionar la muestra. En el marco estadístico no siempre está contenido todo el universo (por las omisiones, duplicaciones, unidades mal clasificadas, etc.) 4º) Defina las principales ventajas e inconvenientes de una operación muestral frente a una operación censal. (Sep 03 res) Respuesta.- Ventajas: - Supone un considerable ahorro de tiempo y de recursos - puede mejorar la exactitud de la medición pues es posible preparar mejor al personal, al ser en menor número que para una operación censal; Inconvenientes: - no es útil cuando se necesita información de todos los elementos de la población (por ejemplo para determinar impuestos a individuos o sociedades por parte de Hacienda) 5º) Señale los tipos de muestreo probabilístico que conozca y explique muy brevemente en qué consisten. (Jun 04)

Respuesta.- Muestreo aleatorio simple con o sin reposición. La muestra se obtiene unidad a unidad.

Todas las unidades tienen la misma probabilidad de ser seleccionadas. No importa el orden de elección.

Muestreo estratificado. La población se agrupa en estratos con características similares. La probabilidad de que un individuo sea seleccionado dependerá del estrato al que pertenezca.

Muestreo por conglomerados o áreas. Dividimos la población en grupos heterogéneos de individuos (conglomerados), normalmente áreas geográficas. Únicamente se estudia una muestra de conglomerados. Dentro del conglomerado se analizan todas las unidades del mismo.

Muestreo bietápico. En una primera etapa seleccionamos los conglomerados y en una segunda etapa elegimos aleatoriamente una muestra dentro de los conglomerados.

Muestreo polietápico. Generalización a n etapas del procedimiento anterior. Muestreos especiales. Como por ejemplo la técnica de estimación de pesca y repesca

(p. ej. la estimación del número de animales en un determinado espacio por el sistema de captura y recaptura, marcando los animales de una primera muestra, y una vez mezclados con toda la población se vuelve a coger una segunda muestra) o la técnica de respuesta aleatorizada (cuando los encuestados están inclinados a negarse a contestar o a distorsionar la realidad dado el carácter personal de las preguntas). 6º) Defina el concepto de acuracidad en una inferencia estadística (Jun 04 2ª) Respuesta.- La acuracidad en un proceso de muestreo representa la proximidad de los cálculos estadísticos a los valores verdaderos o exactos de la población. El grado de acuracidad o de acierto de una estimación es algo que siempre será desconocido, ya que desconocemos los verdaderos valores de los parámetros. 7º) Indique los factores con los que está relacionado el tamaño de la muestra en una operación estadística por muestreo (Sep 04)

Page 34: Complet A

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS PROPUESTOS EN EXÁMENES

−34/34–

Respuesta.- -El tipo de muestreo empleado: para cada tipo de muestreo existe una expresión distinta para calcular el tamaño de la muestra con la que efectuar las estimaciones con un determinado grado de error. - La dispersión o varianza de la variable que se investiga. Cuanto mayor sea la dispersión, mayor tendrá que ser el tamaño de la muestra. - La fiabilidad mínima que se desee conseguir (nivel o coeficiente de confianza). - Sin embargo, no depende del tamaño de la población. 8º) Indique las diferencias entre un muestreo aleatorio simple con reemplazamiento y un muestreo aleatorio simple sin reemplazamiento (Sep 04 res) Respuesta.- En el muestreo con reemplazamiento, las unidades muestrales se eligen de una en una y se devuelven a la población una vez anotadas. En el muestreo sin reemplazamiento, las unidades, se eligen de la misma forma que en el muestreo con reemplazamiento, pero no se reintegran a la población. 9º) El 10% de los españoles que viajaron al extranjero durante el año 2004 prefirieron no contratar ningún seguro de viaje. Reflexione acerca de cómo pudo llegarse a esta conclusión: ¿qué tipo de estudio estadístico se utilizó?, ¿se trabajó con una muestra o con una población?. (Jun 06) Respuesta.- A esta conclusión pudo llegarse sin duda como resultado de una encuesta realizada a cierto número individuos (una muestra) elegidos entre la población total de españoles que viajaron al extranjero en 2004. El parámetro a estimar en este caso fue la proporción poblacional, estimada mediante la proporción muestral. 10º) Explique la diferencia entre los muestreos probabilísticos y los no probabilísticos; indique un tipo de muestreo no probabilístico. (Jun 06 2ª) Respuesta.- Los muestreos probabilísticos se caracterizan porque las unidades muestrales se seleccionan al azar, mediante un procedimiento aleatorio, mientras que en los muestreos no probabilísticos la muestra no se extrae por procedimientos aleatorios. Un tipo de muestreo no probabilístico es por ejemplo el muestreo por cuotas, en el que se le dan a los entrevistadores unas cuotas, de edad o sexo de los individuos o de tamaño y grupo de actividad de las empresas, dejándole mayor o menor grado de libertad para que seleccionen las unidades muestrales en campo.