presentación de powerpoint · • métodos inferencia: diferentes . se toma al azar una muestra de...

Post on 27-Jan-2019

216 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Muestras probabilísticas

Muestreo aleatorio simple

• Mecanismo ideal para la mejor muestra posible: el muestreo aleatorio simple, muestreo en el que

– Cada elemento de la población tiene la misma probabilidad de ser escogido

– Todas las posibles muestras del tamaño muestral escogido (n) tienen la misma probabilidad de ser seleccionadas

Es la más sencilla, solo el azar decide. Se utilizan los métodos de la lotería, ó los

números aleatorios para seleccionar los elementos; las conclusiones pueden ser para

toda la población si la muestra es representativa.

• Ejemplo teórico:

– Todos los nombres en una lista

– Papeleta o bola por cada nombre

– Mezcla y extracción de las n bolas o papeletas

• Cumple las dos condiciones

• En la práctica: – Numerar todos los sujetos de la población

– Obtener lista de números aleatorios. • En libros: ejemplo, Apéndice B, Tabla 6

• Por ordenador (Excel)

• www.random.org

– Propiedades: • Cada número elegido separadamente

• Igual probabilidad de ser 0, 1, 2, ... 9

• Ninguna influencia de unos números en otros

– Escoger los n primeros números aleatorios

Ejemplo con EXCEL

• A =aleatorio.entre(número;número) da un número aleatorio entre los valores mínimo y máximo indicados

• Si número de sujetos en población es 3000 y quiero 30 casos en la muestra

– A 30 celdas =aleatorio, entre (1;3000)

• Si población=40.000.000 y necesito 1.000 casos para la muestra

– A 1.000 celdas =aleatorio.entre(1;40000000)

• Este es el mecanismo ideal

• Estadística inferencial: se basa en este modelo ideal de muestreo aleatorio simple

• Casi todos los métodos de inferencia: suponen que la muestra se ha obtenido por este método

• En la vida real: pocas veces aplicamos este método estrictamente.

• Aplicamos más habitualmente otros métodos de muestreo probabilísticos.

001 009 017 025 033 041

002 010 018 026 034 042

003 011 019 027 035 043

004 012 020 028 036 044

005 013 021 029 037 045

006 014 022 030 038 046

007 015 023 031 039 047

008 016 024 032 040 048

** registros seleccionados al azar, por diferentes métodos

Requiere tener un listado de los elementos de la población o un mapa.

En este tipo de muestreo, teniendo los datos del total de población (N) y el tamaño muestral (n) se obtiene el salto muestral que consiste en la comparación de estos dos valores (N / n).

Muestreo Sistemático

001 009 017 025 033 041

002 010 018 026 034 042

003 011 019 027 035 043

004 012 020 028 036 044

005 013 021 029 037 045

006 014 022 030 038 046

007 015 023 031 039 047

008 016 024 032 040 048

Requiere tener un listado de los elementos de la población o un mapa.

Con número aleatorio de la calculadora o el

computador se selecciona el primer elemento

de la muestra, a este número se le suma el salto

muestral y da el número del segundo elemento:

n1 + (N / n) = n2 +(N / n)= ......n.

018 Al azar

N = 48 n = 6

N/n = 8

001 009 017 025 033 041

002 010 018 026 034 042

003 011 019 027 035 043

004 012 020 028 036 044

005 013 021 029 037 045

006 014 022 030 038 046

007 015 023 031 039 047

008 016 024 032 040 048

Esta muestra se debe evitar cuándo se sabe o se

sospecha que las características que se estudian,

presentan ciclos en la población.

Se puede inferir a la población si es una muestra

representativa

.

• Se utiliza cuando se dispone del marco muestral y la población es homogénea.

• I. Proceso de selección

• Si N = 120 y n = 10, se tiene que: k 120/10 12 • Por consiguiente, el intervalo que se obtiene está entre 1 y

12 (No siempre k resulta un entero y se recomienda redondear al entero inmediato).

• Se elige un número al azar que esté comprendido entre 1 y k inclusive. El número elegido se denota por r y se le denomina arranque aleatorio. La muestra queda constituída como:

r, r + k, r + 2k,...., r + (n - 1)k

n

Nk

este tipo de muestra se utiliza

generalmente para control de

variables de confusión (sesgos)

Muestro Estratificado

• Se definen los estratos o categorías de la variable que se quiere controlar (edad, estado socioeconómico, escolaridad).

• Se debe conocer la proporción (%) de cada estrato con respecto a la población. Si no conocen se puede asignar igual porcentaje a cada categoría, obteniéndose una muestra estratificada no proporcional.

Aplicando esta proporción al tamaño muestral se obtiene el tamaño de cada submuestra en cada estrato.

• Utilizando el método aleatorio simple se seleccionan los elementos de cada submuestra.

• Por último se combinan las submuestras.

• Se divide la población en diferentes grupos, o estratos, y se toma cada uno de ellos una muestra aleatoria simple;

• Se hace cuando se conoce que la población contiene grupos o subpoblaciones que son homogéneos internamente (estratos), pero se sospecha que son muy diferentes entre ellos respecto a la característica estudiada.

Los estratos son "homogéneos" dentro de sí,

y "heterogéneos" entre sí.

Es útil en investigaciones que abarcan extensas

zonas geográficas. Utilizando un mapa, se divide

el total de la población en conglomerados, por

ejemplo las comunas en una ciudad o los

municipios en un departamento.

MUESTRA POR CONGLOMERADOS

• A veces muestreo aleatorio simple, sistemático o estratificado no es posible;

• Requieren listas (totales o por estratos);

• En muchos casos: esas listas no existen (o no son accesibles legalmente);

• Pero sí existen listas de “grupos heterogéneos de

• sujetos”, o conglomerados;

• Hacemos muestreo aleatorio de conglomerados;

• Dentro de los conglomerados elegidos: todos los

• elementos, o muestreo aleatorio simple.

• Ejemplo: estudio sobre estudiantes universitarios españoles

• No hay lista de todos los estudiantes, ni por estratos

• Pero sí: lista de universidades y facultades • Muestreo por conglomerados:

– Muestreo aleatorio simple de universidades – Idem de facultades – Idem de grupos – Dentro del grupo (ya hay lista): todos, o muestreo

aleatorio simple

• Solución muy práctica cuando conglomerados definidos geográficamente: enorme reducción costes extracción datos (viajes, tiempo, etc...)

• Diferencia con estratos:

– Estratos son homogéneos internamente; interesa conocer diferencias entre estratos

– Conglomerados son heterogéneos internamente; no interesa particularmente diferencias; es sólo un medio de tomar datos más económico y simple

• Requisitos: los conglomerados lo más heterogéneos posibles (como la población) internamente; muy parecidos entre sí

• Esto nunca es del todo así

• Sobre todo conglomerados geográficos: gente igual vive junta (barrios, ciudades)

• Resultados: más error muestral que muestra aleatoria simple

• Métodos inferencia: diferentes

Se toma al azar una muestra de esos conglomerados. De cada uno de los conglomerados escogidos, se toman al azar los elementos de la muestra.

Los conglomerados son "homogéneos" entre sí,

y "heterogéneos" dentro de sí.

Muestras No probabilísticas

“Las muestras NO PROBABILÍSTICAS o también llamadas dirigidas suponen un procedimiento de selección informal y un poco arbitrario”, son utilizadas en muchas investigaciones, sobretodo las que requieren la selección de sujetos con una determinada característica, especificadas en el planteamiento del problema.

• Aquellos en los que no es posible calcular la probabilidad de las diferentes muestras

• NO ES POSIBLE aplicar métodos de estadística inferencial cuando usamos estos muestreos

• Típico ejemplo: muestra voluntaria – Cupón en revista, que pide contestación por correo

– Oyentes de programa de radio o televisión, a los que se pide que llamen a un teléfono. • Doble distorsión: el programa y el sentimiento intenso sobre el

tema.

– NO es una muestra representativa: es una muestra sesgada.

– AUNQUE LLAMEN CIENTOS DE MILES DE PERSONAS!!!!

• Otro ejemplo: muestreo “de calle”: entrevistador se planta en una esquina y entrevista a gente que pasa

• Muestra sesgada: lugar, hora, día de la semana, proceso de “selección” por el entrevistador de a quién parar...

• Otro ejemplo: Muestreo de conveniencia: • empresa que encuesta a sus clientes para conocer las

opiniones de los compradores de un producto; • Sindicato que encuesta a sus afiliados para conocer

opiniones de los trabajadores • Todos estos ejemplos: error o sesgo de selección • NO se pueden aplicar métodos de estadística

inferencial • NO son muestras representativas

Muestras fortuitas, utilizadas con frecuencia en Medicina.

Sujetos que acceden voluntariamente a participar en un estudio que monitorea los efectos de un medicamento.

No se puede inferir, ya que las características de los sujetos de la muestra pueden ser diferentes al total de la población.

MUESTRA DE SUJETOS VOLUNTARIOS o de selección

Muestra fortuita, se selecciona de acuerdo a la intención del investigador por ejemplo estudios en pacientes hospitalizados, siempre que el hospital no atienda al total de la población.

MUESTRA POR CONVENIENCIA

De acuerdo a las definiciones del investigador se seleccionan los participantes, quienes cumplan con los requisitos pueden ser seleccionados.

MUESTRA POR CRITERIOS

La proporción de participantes en las encuestas lo decide el investigador de acuerdo, al comportamiento de ciertas variables demográficas en la población.

MUESTRA POR CUOTAS

Se le dice a un entrevistador que en la calle entreviste a 200 personas (50%) mujeres y (50%) hombres, ó proporciones iguales por grupo etáreo. La decisión de quién participa es del entrevistador.

MUESTRA POR CUOTAS

• Conceptos relacionados con Muestra:

–Población ……Parámetro

–Muestra………Estimador

–Inferencia

–Tamaño de muestra

–Método de selección

–Variabilidad

En la vida real se trabaja con una única muestra.

Se debe tener una idea de qué tanta variabilidad existe entre las diferentes muestras del mismo tamaño que se pueden sacar de esa población.

n

SEEM

3

4

5

34

4

5

3

5

Población

Muestra 1

Muestra 2

Muestra 3

= 3.5

= 4.5

= 4

El Error Estándar (EE) es un estimativo de la variabilidad de las posibles muestras de n individuos que puedo sacar de toda la población, calculado a partir de una sola muestra.

Limitaciones de los cálculos de tamaños

de muestras Las fórmulas sólo dan una aproximación (aunque cercana) al número real de pacientes necesarios. La atracción que ejerce una cifra exacta como las que resultan de las fórmulas revisten a estos cálculos de un rigor falso que puede prestarse a engaño.

¿No se conoce el tamaño de la población?

• Si no se conoce el tamaño de la población las fórmulas dadas anteriormente se pueden expresar de la siguiente manera:

• 1. Para la media:

• 2. Para la proporción:

2

22/

2

E

.Zn

2

.2/2

E

)P1(PZn

Ejemplo:

De una población de 20000 ciudadanos se desea obtener una muestra para conocer la estatura promedio. La estimación muestral deberá tener un error máximo de 1 cm, respecto del verdadero promedio, con un nivel de confianza del 95%.. Un estudio preliminar nos indica que la desviación estándar será de 5 cm.

solución

• Desviación estándar : s = 5 cm.

• Para un N.C. del 95% le corresponde un Z/2 = 1.96

• Error absoluto: E = 1 cm

• Tamaño de la Población: N = 20000

¿Cuál formula?

Ejemplo 2

• Un sondeo previo indica que la proporción de pacientes con lesiones articulares de una población es de 30%. ¿Qué tamaño debe tener la muestra para estimar, con una precisión del 5% y un nivel de confianza del 95%, la proporción de afectados si el tamaño de la poblacional es de 10000?

• Rpta: 313

Ejemplo 3

• Determinar el tamaño de la muestra para estimar la proporción de hogares sin dotación de cepillos dentales con un error relativo no superior a 0.10 y un nivel de confianza del 95%, en un pueblo joven de 1600 hogares. Se sabe que por un sondeo previo que el 56% de los hogares no tenían ni hacían uso de cepillos dentales.

• Rpta: 255

Ejemplo 4

• Para un estudio sobre ulcera aftosa fue necesario extraer una muestra aleatoria. Para tal fin se fijo una confianza del 95% y un error del 5%. De acuerdo las estadísticas de hospital DAC, se estimó una prevalencia de lesiones ulcerosas en el 3% de los pacientes que acuden a consulta.

– Entonces el tamaño muestral será:

• Rpta: 45

Ejemplo 5

• Se desea realizar un estudio sobre pacientes con anquilosis lingual en el Distrito de Yanacancha. Con ese propósito se desea extraer una muestra que tenga una confianza al 97% y un error del 3%. De Acuerdo a un estudio anterior se determino que la prevalencia de anquilosis lingual es de 8,4%

Rpta: 403

top related