presentación de powerpoint · • métodos inferencia: diferentes . se toma al azar una muestra de...

47
Muestras probabilísticas

Upload: hoangkhue

Post on 27-Jan-2019

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Muestras probabilísticas

Page 2: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Muestreo aleatorio simple

• Mecanismo ideal para la mejor muestra posible: el muestreo aleatorio simple, muestreo en el que

– Cada elemento de la población tiene la misma probabilidad de ser escogido

– Todas las posibles muestras del tamaño muestral escogido (n) tienen la misma probabilidad de ser seleccionadas

Page 3: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Es la más sencilla, solo el azar decide. Se utilizan los métodos de la lotería, ó los

números aleatorios para seleccionar los elementos; las conclusiones pueden ser para

toda la población si la muestra es representativa.

Page 4: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

• Ejemplo teórico:

– Todos los nombres en una lista

– Papeleta o bola por cada nombre

– Mezcla y extracción de las n bolas o papeletas

• Cumple las dos condiciones

Page 5: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

• En la práctica: – Numerar todos los sujetos de la población

– Obtener lista de números aleatorios. • En libros: ejemplo, Apéndice B, Tabla 6

• Por ordenador (Excel)

• www.random.org

– Propiedades: • Cada número elegido separadamente

• Igual probabilidad de ser 0, 1, 2, ... 9

• Ninguna influencia de unos números en otros

– Escoger los n primeros números aleatorios

Page 6: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Ejemplo con EXCEL

• A =aleatorio.entre(número;número) da un número aleatorio entre los valores mínimo y máximo indicados

• Si número de sujetos en población es 3000 y quiero 30 casos en la muestra

– A 30 celdas =aleatorio, entre (1;3000)

• Si población=40.000.000 y necesito 1.000 casos para la muestra

– A 1.000 celdas =aleatorio.entre(1;40000000)

Page 7: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

• Este es el mecanismo ideal

• Estadística inferencial: se basa en este modelo ideal de muestreo aleatorio simple

• Casi todos los métodos de inferencia: suponen que la muestra se ha obtenido por este método

• En la vida real: pocas veces aplicamos este método estrictamente.

• Aplicamos más habitualmente otros métodos de muestreo probabilísticos.

Page 8: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

001 009 017 025 033 041

002 010 018 026 034 042

003 011 019 027 035 043

004 012 020 028 036 044

005 013 021 029 037 045

006 014 022 030 038 046

007 015 023 031 039 047

008 016 024 032 040 048

** registros seleccionados al azar, por diferentes métodos

Requiere tener un listado de los elementos de la población o un mapa.

Page 9: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

En este tipo de muestreo, teniendo los datos del total de población (N) y el tamaño muestral (n) se obtiene el salto muestral que consiste en la comparación de estos dos valores (N / n).

Muestreo Sistemático

Page 10: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

001 009 017 025 033 041

002 010 018 026 034 042

003 011 019 027 035 043

004 012 020 028 036 044

005 013 021 029 037 045

006 014 022 030 038 046

007 015 023 031 039 047

008 016 024 032 040 048

Requiere tener un listado de los elementos de la población o un mapa.

Page 11: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Con número aleatorio de la calculadora o el

computador se selecciona el primer elemento

de la muestra, a este número se le suma el salto

muestral y da el número del segundo elemento:

n1 + (N / n) = n2 +(N / n)= ......n.

018 Al azar

N = 48 n = 6

N/n = 8

Page 12: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

001 009 017 025 033 041

002 010 018 026 034 042

003 011 019 027 035 043

004 012 020 028 036 044

005 013 021 029 037 045

006 014 022 030 038 046

007 015 023 031 039 047

008 016 024 032 040 048

Page 13: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Esta muestra se debe evitar cuándo se sabe o se

sospecha que las características que se estudian,

presentan ciclos en la población.

Se puede inferir a la población si es una muestra

representativa

.

Page 14: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

• Se utiliza cuando se dispone del marco muestral y la población es homogénea.

• I. Proceso de selección

• Si N = 120 y n = 10, se tiene que: k 120/10 12 • Por consiguiente, el intervalo que se obtiene está entre 1 y

12 (No siempre k resulta un entero y se recomienda redondear al entero inmediato).

• Se elige un número al azar que esté comprendido entre 1 y k inclusive. El número elegido se denota por r y se le denomina arranque aleatorio. La muestra queda constituída como:

r, r + k, r + 2k,...., r + (n - 1)k

n

Nk

Page 15: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

este tipo de muestra se utiliza

generalmente para control de

variables de confusión (sesgos)

Muestro Estratificado

Page 16: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

• Se definen los estratos o categorías de la variable que se quiere controlar (edad, estado socioeconómico, escolaridad).

• Se debe conocer la proporción (%) de cada estrato con respecto a la población. Si no conocen se puede asignar igual porcentaje a cada categoría, obteniéndose una muestra estratificada no proporcional.

Page 17: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Aplicando esta proporción al tamaño muestral se obtiene el tamaño de cada submuestra en cada estrato.

• Utilizando el método aleatorio simple se seleccionan los elementos de cada submuestra.

• Por último se combinan las submuestras.

Page 18: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

• Se divide la población en diferentes grupos, o estratos, y se toma cada uno de ellos una muestra aleatoria simple;

• Se hace cuando se conoce que la población contiene grupos o subpoblaciones que son homogéneos internamente (estratos), pero se sospecha que son muy diferentes entre ellos respecto a la característica estudiada.

Page 19: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Los estratos son "homogéneos" dentro de sí,

y "heterogéneos" entre sí.

Page 20: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Es útil en investigaciones que abarcan extensas

zonas geográficas. Utilizando un mapa, se divide

el total de la población en conglomerados, por

ejemplo las comunas en una ciudad o los

municipios en un departamento.

MUESTRA POR CONGLOMERADOS

Page 21: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

• A veces muestreo aleatorio simple, sistemático o estratificado no es posible;

• Requieren listas (totales o por estratos);

• En muchos casos: esas listas no existen (o no son accesibles legalmente);

• Pero sí existen listas de “grupos heterogéneos de

• sujetos”, o conglomerados;

• Hacemos muestreo aleatorio de conglomerados;

• Dentro de los conglomerados elegidos: todos los

• elementos, o muestreo aleatorio simple.

Page 22: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

• Ejemplo: estudio sobre estudiantes universitarios españoles

• No hay lista de todos los estudiantes, ni por estratos

• Pero sí: lista de universidades y facultades • Muestreo por conglomerados:

– Muestreo aleatorio simple de universidades – Idem de facultades – Idem de grupos – Dentro del grupo (ya hay lista): todos, o muestreo

aleatorio simple

Page 23: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

• Solución muy práctica cuando conglomerados definidos geográficamente: enorme reducción costes extracción datos (viajes, tiempo, etc...)

• Diferencia con estratos:

– Estratos son homogéneos internamente; interesa conocer diferencias entre estratos

– Conglomerados son heterogéneos internamente; no interesa particularmente diferencias; es sólo un medio de tomar datos más económico y simple

Page 24: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

• Requisitos: los conglomerados lo más heterogéneos posibles (como la población) internamente; muy parecidos entre sí

• Esto nunca es del todo así

• Sobre todo conglomerados geográficos: gente igual vive junta (barrios, ciudades)

• Resultados: más error muestral que muestra aleatoria simple

• Métodos inferencia: diferentes

Page 25: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Se toma al azar una muestra de esos conglomerados. De cada uno de los conglomerados escogidos, se toman al azar los elementos de la muestra.

Page 26: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Los conglomerados son "homogéneos" entre sí,

y "heterogéneos" dentro de sí.

Page 27: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Muestras No probabilísticas

Page 28: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

“Las muestras NO PROBABILÍSTICAS o también llamadas dirigidas suponen un procedimiento de selección informal y un poco arbitrario”, son utilizadas en muchas investigaciones, sobretodo las que requieren la selección de sujetos con una determinada característica, especificadas en el planteamiento del problema.

Page 29: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

• Aquellos en los que no es posible calcular la probabilidad de las diferentes muestras

• NO ES POSIBLE aplicar métodos de estadística inferencial cuando usamos estos muestreos

• Típico ejemplo: muestra voluntaria – Cupón en revista, que pide contestación por correo

– Oyentes de programa de radio o televisión, a los que se pide que llamen a un teléfono. • Doble distorsión: el programa y el sentimiento intenso sobre el

tema.

– NO es una muestra representativa: es una muestra sesgada.

– AUNQUE LLAMEN CIENTOS DE MILES DE PERSONAS!!!!

Page 30: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

• Otro ejemplo: muestreo “de calle”: entrevistador se planta en una esquina y entrevista a gente que pasa

• Muestra sesgada: lugar, hora, día de la semana, proceso de “selección” por el entrevistador de a quién parar...

• Otro ejemplo: Muestreo de conveniencia: • empresa que encuesta a sus clientes para conocer las

opiniones de los compradores de un producto; • Sindicato que encuesta a sus afiliados para conocer

opiniones de los trabajadores • Todos estos ejemplos: error o sesgo de selección • NO se pueden aplicar métodos de estadística

inferencial • NO son muestras representativas

Page 31: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Muestras fortuitas, utilizadas con frecuencia en Medicina.

Sujetos que acceden voluntariamente a participar en un estudio que monitorea los efectos de un medicamento.

No se puede inferir, ya que las características de los sujetos de la muestra pueden ser diferentes al total de la población.

MUESTRA DE SUJETOS VOLUNTARIOS o de selección

Page 32: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Muestra fortuita, se selecciona de acuerdo a la intención del investigador por ejemplo estudios en pacientes hospitalizados, siempre que el hospital no atienda al total de la población.

MUESTRA POR CONVENIENCIA

Page 33: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

De acuerdo a las definiciones del investigador se seleccionan los participantes, quienes cumplan con los requisitos pueden ser seleccionados.

MUESTRA POR CRITERIOS

Page 34: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

La proporción de participantes en las encuestas lo decide el investigador de acuerdo, al comportamiento de ciertas variables demográficas en la población.

MUESTRA POR CUOTAS

Page 35: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Se le dice a un entrevistador que en la calle entreviste a 200 personas (50%) mujeres y (50%) hombres, ó proporciones iguales por grupo etáreo. La decisión de quién participa es del entrevistador.

MUESTRA POR CUOTAS

Page 36: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

• Conceptos relacionados con Muestra:

–Población ……Parámetro

–Muestra………Estimador

–Inferencia

–Tamaño de muestra

–Método de selección

–Variabilidad

Page 37: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

En la vida real se trabaja con una única muestra.

Se debe tener una idea de qué tanta variabilidad existe entre las diferentes muestras del mismo tamaño que se pueden sacar de esa población.

Page 38: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

n

SEEM

3

4

5

34

4

5

3

5

Población

Muestra 1

Muestra 2

Muestra 3

= 3.5

= 4.5

= 4

Page 39: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

El Error Estándar (EE) es un estimativo de la variabilidad de las posibles muestras de n individuos que puedo sacar de toda la población, calculado a partir de una sola muestra.

Page 40: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Limitaciones de los cálculos de tamaños

de muestras Las fórmulas sólo dan una aproximación (aunque cercana) al número real de pacientes necesarios. La atracción que ejerce una cifra exacta como las que resultan de las fórmulas revisten a estos cálculos de un rigor falso que puede prestarse a engaño.

Page 41: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

¿No se conoce el tamaño de la población?

• Si no se conoce el tamaño de la población las fórmulas dadas anteriormente se pueden expresar de la siguiente manera:

• 1. Para la media:

• 2. Para la proporción:

2

22/

2

E

.Zn

2

.2/2

E

)P1(PZn

Page 42: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Ejemplo:

De una población de 20000 ciudadanos se desea obtener una muestra para conocer la estatura promedio. La estimación muestral deberá tener un error máximo de 1 cm, respecto del verdadero promedio, con un nivel de confianza del 95%.. Un estudio preliminar nos indica que la desviación estándar será de 5 cm.

Page 43: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

solución

• Desviación estándar : s = 5 cm.

• Para un N.C. del 95% le corresponde un Z/2 = 1.96

• Error absoluto: E = 1 cm

• Tamaño de la Población: N = 20000

¿Cuál formula?

Page 44: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Ejemplo 2

• Un sondeo previo indica que la proporción de pacientes con lesiones articulares de una población es de 30%. ¿Qué tamaño debe tener la muestra para estimar, con una precisión del 5% y un nivel de confianza del 95%, la proporción de afectados si el tamaño de la poblacional es de 10000?

• Rpta: 313

Page 45: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Ejemplo 3

• Determinar el tamaño de la muestra para estimar la proporción de hogares sin dotación de cepillos dentales con un error relativo no superior a 0.10 y un nivel de confianza del 95%, en un pueblo joven de 1600 hogares. Se sabe que por un sondeo previo que el 56% de los hogares no tenían ni hacían uso de cepillos dentales.

• Rpta: 255

Page 46: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Ejemplo 4

• Para un estudio sobre ulcera aftosa fue necesario extraer una muestra aleatoria. Para tal fin se fijo una confianza del 95% y un error del 5%. De acuerdo las estadísticas de hospital DAC, se estimó una prevalencia de lesiones ulcerosas en el 3% de los pacientes que acuden a consulta.

– Entonces el tamaño muestral será:

• Rpta: 45

Page 47: Presentación de PowerPoint · • Métodos inferencia: diferentes . Se toma al azar una muestra de esos conglomerados. ... 3 4 4 5 3 5 Población Muestra 1 Muestra 2 Muestra 3 P

Ejemplo 5

• Se desea realizar un estudio sobre pacientes con anquilosis lingual en el Distrito de Yanacancha. Con ese propósito se desea extraer una muestra que tenga una confianza al 97% y un error del 3%. De Acuerdo a un estudio anterior se determino que la prevalencia de anquilosis lingual es de 8,4%

Rpta: 403