conceptos importantes de estadisticas

9
ACTIVIDAD N° 01 1.- Precisar brevemente el concepto estadística descriptiva y estadística inferencial. La estadística descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables. Las variables pueden ser de dos tipos: Variables cualitativas o atributos: No se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas: Tienen valor numérico (edad, precio de un producto, ingresos anuales). Las variables también se pueden clasificar en: Variables unidimensionales: Sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase). Variables bidimensionales: Recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase). Variables pluridimensionales: rRecogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase). Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas: Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45). Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc. Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:

Upload: nickvega

Post on 09-Dec-2015

2 views

Category:

Documents


0 download

DESCRIPTION

Aqui os dejo teoria de teoria para poder repasar y poder resolver ejercicios.

TRANSCRIPT

Page 1: Conceptos Importantes de Estadisticas

ACTIVIDAD N° 01

1.- Precisar brevemente el concepto estadística descriptiva y estadística inferencial.

La estadística descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables.

Las variables pueden ser de dos tipos:

Variables cualitativas o atributos: No se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).

Variables cuantitativas: Tienen valor numérico (edad, precio de un producto, ingresos anuales).

Las variables también se pueden clasificar en:

Variables unidimensionales: Sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase).

Variables bidimensionales: Recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase).

Variables pluridimensionales: rRecogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).

Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:

Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45).

Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.

Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:

Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo.

Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeo que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.

Muestra: subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo.

Page 2: Conceptos Importantes de Estadisticas

Estadística Inferencial:

Es una parte de la estadística que comprende los métodos y procedimientos que por

medio de la inducción determina propiedades de una población estadística, a partir de

una pequeña parte de la misma. La estadística inferencial comprende como aspectos

importantes:

La toma de muestras o muestreo.

La estimación de parámetros o variables estadísticas.

El contraste de hipótesis.

El diseño experimental.

La inferencia bayesiana.

Los métodos no paramétricos

2.-Eligiendo una variable de la Especialidad.

a) Dar un ejemplo de cómo obtener una muestra, aplicando el muestreo estratificado:

Es una forma de representación estadística que muestra como se comporta una característica o variable en una población a través de hacer evidente el cambio de dicha variable en sub-poblaciones o estratos.

Consiste en la división previa de la población de estudio en grupos o clases que se suponen homogéneos respecto a característica a estudiar y que no se solapen.

Según la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos técnicas de muestreo estratificado:

1. Asignación proporcional: el tamaño de cada estrato en la muestra es

proporcional a su tamaño en la población.

2. Asignación óptima: la muestra recogerá más individuos de aquellos estratos

que tengan más variabilidad. Para ello es necesario un conocimiento previo de

la población.

Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por separado las opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta homogeneidad. Así, si la población está compuesta de un 55% de mujeres y un 45% de hombres, se tomaría una muestra que contenga también esa misma proporción.

En general, el tamaño de la muestra en cada estrato se toma en proporción con el

tamaño del estrato. Eso se llama asignación proporcional. Supóngase que en una

empresa se encuentran los siguientes funcionarios :1

Page 3: Conceptos Importantes de Estadisticas

hombre, jornada completa: 90

hombre, media jornada: 18

mujer, jornada completa: 9

mujer, media jornada: 63

Total: 180

Se pide tomar una muestra de 40 personas, estratificada según las categorías

anteriores.

El primer paso es encontrar el número total de funcionarios (180) y calcular el

porcentaje de cada grupo.

% hombre, jornada completa = 90 / 180 = 50%

% hombre, media jornada = 18 / 180 = 10%

% mujer, jornada completa = 9 / 180 = 5%

% mujer, media jornada = 63 / 180 = 35%

Esto dice que nuestra muestra de 40:

50% debe ser hombre, jornada completa

10% debe ser hombre, media jornada

5% debe ser mujer, jornada completa

35% debe ser mujer, media jornada

50% de 40 es 20

10% de 40 es 4

5% de 40 es 2

35% de 40 es 14

Otra manera fácil sin necesidad de calcular el porcentaje es multiplicar cada tamaño

de grupo por el tamaño de la muestra y se dividen por el tamaño total de la población

(tamaño de todo el personal):

hombre, jornada completa = 90 x (40 / 180) = 20

hombre, media jornada = 18 x (40 / 180) = 4

mujer, jornada completa = 9 x (40 / 180) = 2

mujer, media jornada = 63 x (40 / 180) = 14

Page 4: Conceptos Importantes de Estadisticas

b) Dar un ejemplo como obtener una muestra, aplicando el muestreo

conglomerado:

En el muestreo por conglomerados, en lugar de seleccionar a todos los sujetos de la población inmediatamente, el investigador realiza varios pasos para reunir su muestra de la población.

En primer lugar, el investigador selecciona grupos o conglomerados y de cada grupo selecciona a los sujetos individuales, ya sea por muestreo aleatorio simple o muestreo aleatorio sistemático. El investigador también puede optar por incluir a todo el conglomerado, no sólo a un subconjunto.El conglomerado más utilizado en la investigación es un conglomerado geográfico. Por ejemplo, un investigador desea estudiar el rendimiento académico de los estudiantes secundarios en España.

1. Puede dividir a toda la población (población de España) en diferentes

conglomerados (ciudades).

2. Luego, el investigador selecciona una serie de conglomerados en función de su

investigación, a través de un muestreo aleatorio simple o sistemático.

3. Luego, de los conglomerados seleccionados (ciudades seleccionadas al azar) el

investigador puede incluir a todos los estudiantes secundarios como sujetos o

seleccionar un número de sujetos de cada conglomerado a través de un muestreo

aleatorio simple o sistemático.

Lo más importante sobre esta técnica de muestreo es dar a todos los conglomerados iguales posibilidades de ser seleccionados.

3.- Escriba 8 variables cuantitativas continuas, 8 variables cuantitativas discretas y 8 variables cualitativas que corresponden a su especialidad.

Cuantitativas continuas:

Tiempo diario de transporte. El área de las distintas baldosas de un edificio. Número de Alumnos de un salón de clases. Velocidad de un vehículo: puede ser 20; 54,2; 100 ; … km/h Temperaturas registradas en un observatorio cada hora. Peso en kg de los recién nacidos en un día en España. Consumo de combustible. Distancia al trabajo.

Cuantitativas discretas:

Número de libro en un estante de librería. Suma de puntos tenidos en el lanzamiento de un par de dados. Número de hermanos: pueden ser 1, 2, 3 …, pero nunca podrá ser 3,45.

Número de hijos. Número de empleados de una fábrica.

Page 5: Conceptos Importantes de Estadisticas

Número de goles marcados por un equipo de futbol en la liga. Número de litros de agua contenidos en un depósito. Número de profesores de un instituto.

Cualitativas:

La nacionalidad de una persona. La profesión de una persona. Color de los ojos. Bondad de una persona. Profesión de una persona. Color de pelo. Color de piel. Alegría de una persona.

4.- Escriba las ventajas y desventajas de cada tipo de los muestreos probabilísticos.

Muestreo probabilístico

El método otorga una probabilidad conocida de integrar la muestra a cada elemento

de la población, y dicha probabilidad no es nula para ningún elemento.

Los tipos de muetreo probabilístico son:

Muestreo aleatorio simple. Muestreo sistemático. Muestreo aleatorio estratificado. Muestreo por conglomerados (clusters).

Muestreo aleatorio simple

Muestreo equiprobabilístico: Si se selecciona una muestra de tamaño n de una población de N

unidades, cada elemento tiene una probabilidad de inclusión

igual y conocida de n/N.

Ventajas:

Sencillo y de fácil comprensión. Cálculo rápido de medias y varianzas. Se basa en la teoría estadística, y por tanto existen paquetes

informáticos para analizar los datos.

Desventajas:

Page 6: Conceptos Importantes de Estadisticas

Requiere que se posea de antemano un listado completo de toda la población.

Sencillo y de fácil comprensión. Cálculo rápido de medias y varianzas. Se basa en la teoría estadística, y por tanto existen paquetes

informáticos para analizar los datos. Desventajas:

Requiere que se posea de antemano un listado completo de toda la población.

Cuando se trabaja con muestras pequeñas es posible que no represente a la población adecuadamente.

Muestreo sistemático

Procedimiento:

Conseguir un listado de N elementos.

Determinar un tamaño de muestra n.

Elegir un número aleatorio, r, entre 1 y k (r=arranque aleatorio).

Seleccionar los elementos de la lista.

Ventajas:

Fácil de aplicar. No siempre es necesario tener un listado de toda la población. Cuando la población está ordenada siguiendo una tendencia

conocida, asegura una cobertura de unidades de todos los tipos.

Desventajas:

Si la constante de muestreo está asociada con el fenómeno de interés, se pueden hallar estimaciones sesgadas.

Muestreo aleatorio estratificado

El azar no es una garantía de representatividad. Este muestreo pretende asegurar la representación de cada grupo en la muestra. Cuanto más homogéneos sean los estratos, más precisas resultarán las estimaciones.

Ventajas:

Page 7: Conceptos Importantes de Estadisticas

Tiende a asegurar que la muestra represente adecuadamente a la

población en función de unas variables seleccionadas. Se obtienen estimaciones más precisas.

Desventajas:

Los análisis son complicados, en muchos casos la muestra tiene que ponderarse (asignar pesos a cada elemento).

Muestreo por conglomerados

Los conglomerados se caracterizan porque la variación en cada grupo es menor que la variación entre grupos.

La necesidad de listados de las unidades de una etapa se limita a aquellas unidades de muestreo seleccionadas en la etapa anterior.

Ventajas:

Es muy eficiente cuando la población es muy grande y dispersa. Reduce costes.

No es preciso tener un listado de toda la población, sólo de las unidades primarias de muestreo.

Desventajas:

El error estandar es mayor que en el muestreo aleatorio simple o estratificado.

El cálculo del error estándar es complejo.