apuntes+de+bioestadística+-+supo

31
SOCIEDAD PERUANA DE BIOESTADISTICA E INVESTIGACIÓN EN SALUD División de Investigación en Medicina Programa de Apoyo a las Sociedades Científica de Estudiantes de Medicina (PASCEM) SEPARATA: BASES PARA EL ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS EXTRACTO Dr. José Antonio Supo Condori www.josesupo.com Arequipa 1 de Enero del 2010 Claves Pastilla: Temas resumidos en una sola hoja Sinopsis: Los cuadros sinópticos utilizan el razonamiento por analogía Formulario: Algoritmos más comunes en epidemiología Práctica: Ejercicio a desarrollar en 15 minutos Nota: El desarrollo estadístico es explicado en vídeotutoriales, para lo cual deben ingresar a bioestadistico.com Arequipa - Perú 201o 01 Pastilla - Tipos de investigación 02 Pastilla - Niveles en investigación 03 Pastilla - Diseños en investigación 04 Pastilla - Variables e Indicadores 05 Pastilla - Escalas de medición 06 Pastilla - Las variables según su relación 07 Pastilla - Criterios de Causalidad 08 Pastilla - Formulación del problema 09 Pastilla - Hipótesis metodológica 10 Pastilla - Hipótesis estadística 11 Pastilla - Objetivo estadístico 12 Pastilla - Ritual de la significancia estadística 13 Pastilla - Significancia estadística 14 Pastilla - Objetivo Estadístico (cualitativo) 15 Pastilla - Objetivo Estadístico (cuantitativo) 16 Pastilla - Objetivo comparativo 17 Pastilla - Técnicas de recolección de datos 18 Pastilla - Instrumentos de medición 19 Pastilla - Sesgos de selección 20 Pastilla - Sesgos de medición 21 Pastilla - Correlación de Pearson y Spearman 22 Pastilla - Validez de un estudio 23 Pastilla - Control de un estudio 24 Pastilla - Tendencia central y dispersión 25 Pastilla - Medidas de posición y de Forma 26 Pastilla - Gráficas univariables 27 Pastilla - Error tipo I y II 28 Pastilla - Población y muestra 29 Pastilla - Muestreo probabilistico 30 Pastilla - Validación de test psicométricos

Upload: mely-ruiz

Post on 24-Oct-2015

69 views

Category:

Documents


9 download

TRANSCRIPT

Page 1: Apuntes+de+Bioestadística+-+Supo

SOCIEDAD PERUANA DE BIOESTADISTICA

E INVESTIGACIÓN EN SALUD

División de Investigación en Medicina

Programa de Apoyo a las Sociedades Científica de Estudiantes de Medicina (PASCEM)

SEPARATA: BASES PARA EL ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS

EXTRACTO

Dr. José Antonio Supo Condori

www.josesupo.com

Arequipa 1 de Enero del 2010

Claves

Pastilla: Temas resumidos en una sola hoja

Sinopsis: Los cuadros sinópticos utilizan el razonamiento por analogía

Formulario: Algoritmos más comunes en epidemiología

Práctica: Ejercicio a desarrollar en 15 minutos

Nota: El desarrollo estadístico es explicado en vídeotutoriales, para lo cual deben ingresar a bioestadistico.com

Arequipa - Perú

201o

01 Pastilla - Tipos de investigación

02 Pastilla - Niveles en investigación

03 Pastilla - Diseños en investigación

04 Pastilla - Variables e Indicadores

05 Pastilla - Escalas de medición

06 Pastilla - Las variables según su relación

07 Pastilla - Criterios de Causalidad

08 Pastilla - Formulación del problema

09 Pastilla - Hipótesis metodológica

10 Pastilla - Hipótesis estadística

11 Pastilla - Objetivo estadístico

12 Pastilla - Ritual de la significancia estadística

13 Pastilla - Significancia estadística

14 Pastilla - Objetivo Estadístico (cualitativo)

15 Pastilla - Objetivo Estadístico (cuantitativo)

16 Pastilla - Objetivo comparativo

17 Pastilla - Técnicas de recolección de datos

18 Pastilla - Instrumentos de medición

19 Pastilla - Sesgos de selección

20 Pastilla - Sesgos de medición

21 Pastilla - Correlación de Pearson y Spearman

22 Pastilla - Validez de un estudio

23 Pastilla - Control de un estudio

24 Pastilla - Tendencia central y dispersión

25 Pastilla - Medidas de posición y de Forma

26 Pastilla - Gráficas univariables

27 Pastilla - Error tipo I y II

28 Pastilla - Población y muestra

29 Pastilla - Muestreo probabilistico

30 Pastilla - Validación de test psicométricos

Page 2: Apuntes+de+Bioestadística+-+Supo

SPBIS.ORG SOCIEDAD PERUANA DE BIOESTADISTICA E INVESTIGACIÓN EN SALUD Pág. 1

TIPOS DE ESTUDIO

1. Según la intervención del Investigador:

OBSERVACIONAL: No existe intervención del investigador; los datos reflejan la

evolución natural de los eventos, ajena a la voluntad del investigador.

EXPERIMENTAL: Siempre son prospectivos, longitudinales, analíticos y de nivel

investigativo “explicativo” (causa – efecto); además de ser “controlados”.

2. Según la planificación de la toma de datos

PROSPECTIVO: Los datos necesarios para el estudio son recogidos a propósito de la

investigación (primarios). Por lo que, posee control del sesgo de medición.

RETROSPECTIVO: Los datos se recogen de registros donde el investigador no tuvo

participación (secundarios). No podemos dar fe de la exactitud de las mediciones.

3. Según el número de ocasiones en que mide la variable de estudio

TRANSVERSAL: Todas las variables son medidas en una sola ocasión; por ello de

realizar comparaciones, se trata de muestras independientes.

LONGITUDINAL: La variable de estudio es medida en dos o más ocasiones; por ello,

de realizar comparaciones (antes – después) son entre muestras relacionadas.

4. Según el número de muestras a estudiar

DESCRIPTIVO: El análisis estadístico, es univariado porque solo describe (finalidad

cognoscitiva); o estima parámetros (propósito estadístico) en la población de estudio

a partir de una muestra.

ANALÍTICO: El análisis estadístico por lo menos bivariado; por que plantea y pone a

prueba hipótesis explicativas (finalidad cognoscitiva); su nivel más básico establece

la asociación entre factores (propósito estadístico).

IMPORTANTE: “Descriptivo no es sinónimo de observacional”. Un estudio observacional

puede ser analítico. Ejm: El estudio de los casos y controles.

Page 3: Apuntes+de+Bioestadística+-+Supo

Pág. 2 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)

NIVELES EN INVESTIGACIÓN

1. EXPLORATORIO: Se plantean cuando el objetivo es examinar un tema o problema de investigación poco estudiado o que no ha sido abordado antes; su finalidad es establecer prioridades para investigaciones posteriores o sugerir afirmaciones verificables.

No hay preguntas que conduzcan a problemas precisos, se exploran áreas problemáticas. Se trata de investigación cualitativa; por lo que no se requiere de manejo estadístico.

2. DESCRIPTIVO: Describe fenómenos sociales o clínicos en una circunstancia temporal y geográfica determinada. Desde el punto de vista cognoscitivo su finalidad es describir y desde el punto de vista estadístico su propósito estimar parámetros.

La estadística consiste en estimar frecuencias y/o promedios; y otras medidas univariadas. Ejm. los estudios de frecuencia de la enfermedad: Incidencia y Prevalencia.

3. RELACIONAL: No son estudios de causa y efecto; porque las pruebas estadísticas solo demuestran dependencia entre diferentes eventos; aquí podemos encontrar los estudios de asociación sin relación de dependencia; y las correlaciones espurias.

La estadística es bivariada; podemos hacer asociaciones y medidas de asociación; correlaciones y medidas de correlación. Ejm. Chi Cuadrado y R de Pearson.

4. EXPLICATIVO: Su finalidad es explicar el comportamiento de una variable en función de otra(s); aquí se plantea una relación de causa-efecto, y tiene que cumplir otros criterios de causalidad (Bradford Hill); requiere de control tanto metodológico como estadístico.

En los estudios observacionales la estadística multivariada; tiene por finalidad descartar asociaciones aleatorias, casuales o espurias. Ejm. Chi 2 de Mantel-Haenszel.

5. PREDICTIVO: Se encarga de la estimación probabilística de eventos generalmente adversos, como puede ser las complicaciones de la enfermedad, la mortalidad, etc. La línea investigativa debe haber pasado previamente por los otros niveles.

Se aplican un conjunto de técnicas estadísticas. Ejm. La validación de una prueba diagnóstica requiere: Alfa de Cronbach, Índice Kappa, ANOVA, Curvas ROC.

6. APLICATIVO: Plantea resolver problemas de la vida cotidiana o a controlar situaciones prácticas. Puede ser programática o no programática, de manera que enmarca a la innovación técnica, artesanal e industrial como la propiamente científica.

Las técnicas estadísticas apuntan a evaluar el éxito de la intervención, como medidas de impacto sobre los principales indicadores de salud: tasas, coberturas, rendimiento, etc.

Page 4: Apuntes+de+Bioestadística+-+Supo

SPBIS.ORG SOCIEDAD PERUANA DE BIOESTADISTICA E INVESTIGACIÓN EN SALUD Pág. 3

DISEÑOS EN INVESTIGACIÓN

1. EPIDEMIOLÓGICOS: Describir la distribución de las enfermedades y eventos de salud en poblaciones humanas y descubren las leyes que gobiernan estas condiciones.

Descriptivo: Pueden ser transversal (Ej. Estudio de prevalencia) y longitudinal (Ej. Estudio de incidencia):

Observacional Analítico: No solo buscan demostrar dependencia entre eventos; sino la fuerza de asociación entre ellos, y plantea la relación de causalidad como una medida de riesgo. Ej. Casos y controles Cohortes.

De intervención: No llegan a ser experimentos verdaderos, porque se ven limitados por las normas éticas. Ej. Ensayos clínicos y ensayos de población.

2. EXPERIMENTALES: Requiere de dos condiciones básicas: intervención y asignación aleatoria. Siendo de nivel investigativo explicativo tienen control metodológico.

Pre-experimento: La intervención sobre las unidades de estudio, no es apropósito de la investigación; sino que obedece a las necesidades terapéuticas del sujeto.

Cuasi-experimento: Cuando no hay grupo control, no es posible realizar la asignación aleatoria de los sujetos, puesto que no se puede dejar sin tratamiento a los pacientes.

Experimento verdadero: Cumple con la asignación aleatoria e intervención.

3. COMUNITARIOS O ECOLÓGICOS: La unidad de análisis es la población y generalmente la fuente de datos suelen ser las estadísticas de morbilidad y mortalidad rutinarias.

Exploratorios: El único propósito es buscar patrones espaciales o temporales que podrían sugerir temas de investigación. Aquí se encuentran los estudios cualitativos.

De comparaciones múltiples: Este es diseño el ecológico más común. En un estudio analítico de comparación de grupos múltiples. La estadística varía solo por este hecho.

Series temporales: Analiza las variaciones temporales de los niveles de exposición con otra serie de tiempo que refleja los cambios en la frecuencia de la enfermedad.

4. ENSAYOS CLÍNICOS: Experimentos en seres humanos para evaluar métodos de prevención, diagnóstico, tratamiento o manejo de las enfermedades que les aquejan.

Terapéuticos: Suelen ser estudios individuales y son los más comunes; su propósito es curar, aliviar y/o prolongar la vida del paciente. Ej. Excéresis de un tumor localizado.

De intervención: Su propósito es modificar el curso natural de la enfermedad. Ej. Tratamiento de la diabetes para prevenir nefropatía diabética.

Prevención: Suelen ser comunitarios; su propósito es determinar la eficacia de un

Page 5: Apuntes+de+Bioestadística+-+Supo

Pág. 4 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)

VARIABLES E INDICADORES

1. VARIABLES Y CONSTRUCTOS 1.1. VARIABLES Son propiedades, características o atributos que se dan en las unidades de estudio

(personas, grupos, etc.) o por derivación de ellas; siempre deben ser medibles.

Las variables individuales corresponden a las unidades de estudio individuales, ejm.

el nivel de instrucción de las personas. Las variables colectivas son propiedades de

grupos y su medición se basa en las propiedades individuales que poseen sus

miembros, por ejemplo el índice de analfabetismo.

El análisis estadístico de las variables individuales y las variables colectivas; incluso

dentro de un mismo objetivo, no siempre es el mismo.

1.2. CONSTRUCTOS

Un constructo es una propiedad que se supone posee una persona (unidad de

estudio individual), es un concepto teórico, hipotético. Por ejemplo, la inteligencia,

la motivación, la creatividad, las actitudes, etc.

Los constructos se definen como propiedades subyacentes, que no pueden medirse

de manera directa, sino mediante manifestaciones externas de su existencia, es

decir, mediante indicadores. Los constructos son variables subyacentes, por lo cual,

reciben la denominación común de variables.

2. INDICADORES E INDICES

2.1. INDICADORES

Cuando las variables no presentan ninguna dificultad para su identificación se dice

que tienen indicadores directos o unidimensionales.

Las variables subyacentes (constructos) que no pueden medirse de manera directa

como, requieren de indicadores que permitan su medición. En este caso estamos

hablando de indicadores indirectos o multidimensionales.

Los instrumentos utilizados para medir variables subyacentes, deben tener una

validez de constructo que corresponde su definición operacional. Así, el estrés de

Burnout queda definido operacionalmente cuando es medido por el test de Maslach.

2.2. INDICES

Es una combinación de dos o más variables o de sus indicadores elegidos por el

investigador que propone como procedimiento para medir una cierta variable.

Un índice puede estar representado por los indicadores de su definición operacional.

Así tenemos que, el índice de la función sexual esta constituida por las

dimensiones: el deseo, la función eréctil, función orgásmica y la satisfacción.

Reciben también el nombre de índices los valores que toma una variable (por

ejemplo, la tasa de mortalidad) en un período determinado, valores que son

reducidos a porcentaje o a una cantidad exponencial de base 10.

Page 6: Apuntes+de+Bioestadística+-+Supo

SPBIS.ORG SOCIEDAD PERUANA DE BIOESTADISTICA E INVESTIGACIÓN EN SALUD Pág. 5

Escalas de Medición de las variables

1. Variables Categóricas o Cualitativas

1.1. Escala NOMINAL: (ningún atributo)

Posee categorías a las que se asigna un nombre sin que exista ningún orden

implícito entre ellas. Ejemplos:

Género: Masculino – Femenino

Estado Civil: Soltero - Casado – Conviviente

1.2. Escala ORDINAL: (un atributo - Orden)

Posee categorías ordenadas, pero no permite cuantificar la distancia entre una

categoría y otra. Ejemplos:

Intensidad del dolor: Leve - Moderado – Intenso

Instrucción: Primaria - Secundaria – Superior

Observaciones

Dicotómicas: Tienen solamente dos categorías.

Politómicas: Tienen más de dos categorías.

2. Variables Numéricas o Cuantitativas

2.1. Escala de INTERVALO: (dos atributos - Orden y Distancia)

Tiene intervalos iguales y medibles. No tiene un origen real, por lo que puede

asumir valores negativos. Ejemplos:

Temperatura: -10°C, 0°C, 20°C, etc.

Hora del día: 00 Horas, 10 Horas, 20 Horas, etc.

2.2. Escala de RAZÓN: (tres atributos - Orden, Distancia y Origen)

Tiene intervalos constantes entre valores; además de un origen real. El cero

significa la ausencia del individuo. Ejemplos:

Peso: 00.00Kg, 10.24Kg, 20.00Kg, etc.

Número de Hijos: Uno, Dos, Tres, etc.

Observaciones

Continuas: Provienen de medir y se pueden representar con números enteros o

fraccionarios

Discretas: Provienen de contar y solamente pueden ser representados con números

enteros.

Page 7: Apuntes+de+Bioestadística+-+Supo

Pág. 6 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)

LAS VARIABLES SEGÚN SU RELACIÓN

Esta clasificación de las variables se fundamenta en la búsqueda de obtener explicación

causal que puede ser observacional o experimental y correspondiente al nivel

investigativo explicativo. Su estructura responde a la necesidad de realizar el control

metodológico y/o estadístico de la relación causa-efecto.

1. Variable dependiente

En este sistema de variables representa a la variable de interés o variable de estudio,

es la que para su existencia y desenvolvimiento depende de otra independiente, su

modo de ser, está condicionada por otros aspectos de la realidad. Es la que mide o

describe el problema que se estudia.

2. Variable independiente

Es aquella cuya existencia es autónoma, no depende de otra, más bien de ella

dependen otras, representa los factores que constituirían la causa, siendo que

previamente ha demostrado ser factor de riesgo para el problema que se estudia. En

este sistema de variables se plantea solamente una variable independiente.

3. Variables intervinientes

a. Variable intermedia

Esta variable aparece de manera incalculada durante el proceso de una observación o

inesperada dentro de un experimento, entre el factor causal y el efecto. Ocurre

cuando no ha habido una buena elección de los factores de riesgo. El procedimiento

más idóneo para su neutralizar su participación es el análisis multivariado.

b. Variable de control

Es una variable con una fuerte influencia sobre la variable dependiente, pero ningún

efecto reconocido sobre la variable independiente; habitualmente se reconoce su

participación en el momento de la planeación; por ello su control se realiza

metodológicamente mediante los criterios de exclusión.

c. Variables de confusión

Su participación puede intensificar o antagonizar la relación aparente entre el

problema y una posible causa, creando confusión en el investigador. Su influencia se

da tanto sobre la variable independiente como en la dependiente. Su control se debe

realizar mediante análisis estratificado.

Page 8: Apuntes+de+Bioestadística+-+Supo

SPBIS.ORG SOCIEDAD PERUANA DE BIOESTADISTICA E INVESTIGACIÓN EN SALUD Pág. 7

CRITERIOS DE CAUSALIDAD

Criterios de Bradford Hill (1965)

1. Asociación estadística: Se trata de averiguar si existe relación entre el supuesto factor causal y el efecto estudiado. Para esto hay que buscar estudios epidemiológicos (Cohortes o Caso - Control) que indiquen el riesgo significativo (Riesgo Relativo o Razón de Momios).

2. Constancia o Consistencia: Consiste en conocer si la relación entre las dos variables, a las que investigamos una posible relación causa-efecto, ha sido confirmada por más de un estudio, en poblaciones y circunstancias distintas por autores diferentes.

3. Especificidad: Es más fácil aceptar una relación causa-efecto cuando para un efecto

sólo se plantea una sola etiología, que cuando para un determinado efecto se han propuesto múltiples causas. En este caso lo apropiado sería hablar de Especificidad de la causa.

4. Temporalidad: Se trata de asegurar que el factor de riesgo ha aparecido antes que el

supuesto efecto. Puede ser difícil de demostrar cuando no se puede asegurar si la presunta causa apareció con anterioridad al presunto efecto. (Equivale a la cronología de Simonin)

5. Relación dosis-respuesta: Denominada “gradiente biológico”, La frecuencia de la

enfermedad aumenta con la dosis o el nivel de exposición. (Equivale a la Intensidad de Simonin). Sin embargo, hay casos en que el gradiente biológico no se cumple (en una reacción alérgica).

6. Plausibilidad biológica: El contexto biológico existente debe explicar lógicamente la

etiología por la cual una causa produce un efecto a la salud. Esta característica viene limitada por los conocimientos científicos que se tengan al respecto en el momento del estudio.

7. Coherencia: la interpretación de causas y efectos no puede entrar en contradicción con

el comportamiento propio de la enfermedad o lesión. Este criterio combina aspectos de consistencia y plausibilidad biológica (Corresponde a la evolución de Simonin)

8. Experimentación: Es un criterio deseable de alta validez. Se trata de reproducir

experimentalmente la asociación causa-efecto, o incidir en la causa para alterar el efecto cuando no sea posible o no se considere ética otra modalidad de experimentación.

9. Analogía: Se fundamenta en relaciones de causa-efecto establecidas, con base a las

cuales si un factor de riesgo produce un efecto a la salud, otro con características similares debiera producir el mismo impacto a la salud.

NOTA: Bradford Hill no considera el criterio de topografía introducido por Simonin, aunque no es aplicable en todos los casos. Por ejemplo, en cuando tratamos de encontrar la lesión topográfica que provoca la anorexia nerviosa es un esfuerzo inútil.

Page 9: Apuntes+de+Bioestadística+-+Supo

Pág. 8 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)

FORMULACIÓN DEL PROBLEMA

Se trata de sintetizar la cuestión proyectada a investigar, generalmente a

través de un interrogante. Los problemas de Investigación se formulan

con los 5 componentes a continuación:

VARIABLES: Debe mencionarse al menos la variable de estudio; pueden

también mencionarse todas las variables involucradas; o cuando son las

variables son muy numerosas suele usarse términos que resuman de

manera lógica un grupo de variables.

UNIDADES DE ESTUDIO:

Unidades de observación, unidades experimentales, unidades de análisis.

Reciben distintos nombres según el diseño de la investigación; y deben

mencionarse, aunque a veces su presencia en el enunciado resulta

implícita.

DISEÑO DEL ESTUDIO:

Propósito estadístico, Especificidad, etc. Es muy variable de acuerdo a la

investigación; es importante utilizar términos que den por aludido el

diseño de la investigación, el nivel investigativo, el tipo de estudio, etc.

UBICACIÓN ESPACIAL:

Es ineludible cuando se tratan de estudios descriptivos y se encuentra

relacionado con el tamaño de la muestra; siendo que los fenómenos

varían de un lugar a otro; se debe especificar sobre que población se

realizará la inferencia estadística.

UBICACIÓN TEMPORAL:

Al igual que en el criterio espacial, se requiere especificarlo cuando el

fenómeno varía según el tiempo. En los estudios descriptivos sobre

poblaciones infinitas o desconocidas habitualmente se encuentra

relacionado con el muestreo accidental.

Page 10: Apuntes+de+Bioestadística+-+Supo

BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS

HIPÓTESIS METODOLÓGICAS

Definición:

Son conjeturas que plantea el investigador; afirmaciones aun no demostradas y que

nacen de la experiencia (David Hume: empirismo) o de la deducción luego del análisis de

los antecedentes investigativos (René Descartes: racionalismo). Deben referirse a una

situación real, en términos comprensibles, precisos, concretos y deben estar

relacionadas con técnicas disponibles para probarlas.

Estructura:

Fundamento: Es lo que nos lleva a sostener la hipótesis planteada. Las hipótesis

relacionales carecen de fundamento porque nacen de la subjetividad de una observación;

mientras que las hipótesis explicativas se fundamentan en los antecedentes

investigativos.

Deducción: Es la hipótesis misma, denominada hipótesis del investigador;

estadísticamente es la hipótesis alterna y se debe someter a contraste. Cuando se la

plantea en forma de interrogante es la que da respuesta al enunciado.

Hipótesis según el nivel Investigativo:

Descriptiva: Los estudios descriptivos no suelen contener hipótesis, así como tampoco

los estudios exploratorios; porque no se puede presuponer sobre algo que apenas se

comienza a conocer. En estos casos lo que si procede, es trabajar con objetivos

descriptivos debidamente declarados. Su función es precisamente generar hipótesis.

Relacional: Las hipótesis relacionales o empíricas son afirmaciones respecto a las

relaciones entre dos o más variables sin fundamento, porque nacen de la observación y

la experiencia, siempre deben estar sujetas a comprobación empírica. Solamente buscan

concordancia entre hechos y generan la necesidad de plantear hipótesis explicativas.

Explicativa: Las hipótesis explicativas o racionales son consideradas como explicaciones

tentativas respecto al problema planteado. Cumple su función sólo si está relacionada

con el conocimiento existente; nacen del razonamiento por analogía (Bradford Hill). Sin

antecedentes investigativos no es posible plantear hipótesis explicativas.

Page 11: Apuntes+de+Bioestadística+-+Supo

Pág. 10 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)

HIPÓTESIS ESTADÍSTICAS

(De trabajo)

Ho: Hipótesis Nulas: Es la hipótesis de trabajo.

Niegan lo que afirman las hipótesis de investigación y existen tantas hipótesis nulas

como hipótesis de investigación. Es a la Nula a la que se le rechaza o no se le rechaza:

Si el p-valor es menor a 0.05; rechazamos Ho por lo tanto concluimos en que hipótesis

alterna es verdadera.

Si el p-valor no es menor a 0.05; no rechazamos Ho; sin embargo esto no significa que

debemos aceptarla; sino que, simplemente no hemos podido rechazarla.

H1: Hipótesis Alternas: Es la hipótesis del investigador.

Esta hipótesis se da por verdadera cuando rechazamos la hipótesis de trabajo (Ho) o

cuando por alguna razón no podemos aceptar la nula.

En el ritual de la significancia, procedemos a establecer las hipótesis estadísticas

comenzando por al del investigador (H1) y luego la Nula (Ho); para proceder a trabajar

con la Nula. El investigador procede a rechazar la Nula (Ho); para quedarse con la

Alterna (H1), que es su planteamiento original; siendo que puede cometer un, entonces

la estadística consiste en calcular ese error al tomar tal decisión. Ese es el p-valor

Hipótesis estadísticas

De estimación: Del valor de una o varias variables que se van a observar en un

contexto. Señalan la presencia de cierto hecho o fenómeno.

De correlación: El cambio de una variable va acompañado de un cambio en otra

correspondiente. Puede ser una correlación simple o múltiple. El orden en que se

coloquen las variables no es importante, no hay una relación de causa-efecto; por lo

mismo, no se habla de variables dependientes e independientes.

De Diferencias: Dirigidas a comparar grupos y puede ser simple si no determina a cuál

grupo favorece la diferencia o direccional en el caso contrario. Pueden ser parte de

estudios relacionales si se limitan a establecer la diferencia, pero si además pretenden

explicar el por qué de la diferencia, son hipótesis de estudios explicativos.

De Causalidad: Buscan demostrar la relación de causalidad entre la variable

independiente y dependiente; teniendo en cuenta que la existencia de una correlación no

necesariamente establece una relación de causalidad; no se puede plantear una de estas

hipótesis si no se ha realizado el control metodológico; caso contrario se debe realizar el

control estadístico y plantearse una hipótesis con variables intervinientes.

Page 12: Apuntes+de+Bioestadística+-+Supo

BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS

OBJETIVO ESTADÍSTICO

Uno de los criterios más importantes a la hora de escoger el estadístico de prueba, se

encuentra intrínsecamente relacionado al nivel investigativo; en esta pastilla se ha

omitido intencionalmente el objetivo estadístico comparar por ser el mas usado y

encontrarse en todos los niveles merece una mención aparte.

1. A nivel descriptivo

� Estimar: Usado frecuentemente para la estimación puntual de un parámetro y

los intervalos de confianza del mismo.

� Determinar. Cuando buscamos en obtener el resultado de una variable

subyacente o constructo y utilizamos un instrumento documental.

� Describir: Para las variables que no son de estudio y que no involucra la

utilización de instrumentos pues se tratan de variables unidimensionales o

directas.

2. A nivel relacional

� Asociar: Plantea que dos sucesos ocurren de manera simultánea en repetidas

ocasiones y que tal concurrencia no puede atribuirse al azar.

� Concordar: Sucesos concurrentes que corresponden a diferentes observadores

o al mismo observador pero con diferentes instrumentos.

� Correlacionar: Plantea que en un mismo individuo las unidades de una de sus

variables se correlaciona con otra diferente.

3. A nivel explicativo

� Evidenciar: Propio de los estudios observacionales donde el análisis

estratificado busca descartar asociaciones aleatorias, casuales o espurias.

� Demostrar: Cuando el origen de los datos corresponde a un experimento,

pretendemos demostrar algo que hemos evidenciado observacionalmente.

� Probar: Luego de haber demostrado mediante un estudio experimental se

tiene que repetir para probar consistencia o coherencia (Bradford Hill 1965)

4. A nivel predictivo

� Predecir: Calcular la probabilidad de ocurrencia de un suceso en una serie de

eventos por consecuencia la variable a predecir es dicotómica.

� Pronosticar: Calcular la probabilidad de ocurrencia de un suceso en función al

tiempo por consecuencia la variable pronosticada es numérica.

� Preveer: Calcular la probabilidad de necesitar, disponer o preparar medios

contra futuras contingencias.

Page 13: Apuntes+de+Bioestadística+-+Supo

Pág. 12 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)

RITUAL DE LA SIGNIFICANCIA ESTADÍSTICA

1. Formulación de Hipótesis

Consiste en traducir la hipótesis metodológica en una hipótesis estadística de acuerdo al

siguiente sistema:

Ho: Hipótesis nula ó hipótesis de trabajo

H1: Hipótesis alterna ó hipótesis del investigador

El primer paso es colocar la hipótesis del investigador como Hipótesis Alterna (H1) y

formular la Hipótesis Nula (Ho) que viene a ser la negación de la alterna. Se precisa este

artificio porque es a la Hipótesis Nula a la que se le somete a contraste.

2. Establecer el nivel de significancia.

El nivel de significancia denotado por la letra griega alfa es la probabilidad de rechazar la

hipótesis nula cuando es verdadera a lo cual se le denomina error de tipo I, Según

Fisher, el nivel de significación estadística equivale a la magnitud del error que se está

dispuesto a correr de rechazar una hipótesis nula verdadera. Para la mayoría de los

propósitos, el nivel de significación previamente establecido suele ser de 0.05.

3. Elección de la prueba estadística.

El estadístico de prueba elegido está intrínsecamente relacionado con el objetivo

estadístico correspondiente para su nivel investigativo; para esto debemos considerar la

naturaleza de las variables y el comportamiento de los datos que corresponde a su

distribución para los de naturaleza cuantitativa y las frecuencias esperadas para los de

naturaleza cualitativa.

4. Toma de la decisión

Luego de desarrollar la prueba estadística elegida se toma una decisión en función a la

regla previamente establecida según las que se acepta o se rechaza la hipótesis nula

para lo cual es imprescindible determinar el Valor critico, que es un número que divide la

región de aceptación y la región de rechazo, según el valor de la probabilidad que se

haya adoptado como nivel de significación estadística.

5. Interpretación del p-valor.

Este último paso en el ritual de la significancia estadística no fue planteado originalmente

por Fisher, pero cobra vital importancia con la aparición de los software estadísticos que

nos calculan directamente el p-valor, el cual cuantifica el error tipo I y nos ayuda a tomar

una decisión de rechazo a la hipótesis nula (Ho) cuando es menor al nivel de significancia

y de no rechazo cuando su valor es mayor al alfa planteado.

Page 14: Apuntes+de+Bioestadística+-+Supo

BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS

NIVEL DE SIGNIFICANCIA

Al plantear un estudio sobre una población, idealmente debemos estudiar a todos los

individuos que la conforman; pero no siempre podemos acceder a todos, entonces

tenemos que escoger una muestra; sin embargo los resultados obtenidos de esta manera

nunca serán exactamente iguales, a los que se obtendrían de estudiar a toda la

población; es decir, siempre va a haber un margen de error.

Nivel de Significancia. Antes de realizar el estudio debemos plantearnos; que

proporción de error estamos dispuestos a aceptar para dar por válido nuestro. El error es

el objetivo principal del estudio. El análisis estadístico consiste en calcular la probabilidad

de cometer este error y esperamos que sea menor al planteado preliminarmente como

nivel significancia.

Nivel de confianza. Es la confianza que debemos alcanzar para generalizar el resultado

de una muestra hacia toda la población. Es el complemento del nivel de significancia; es

la confianza que tenemos, de que la conclusión a la que hemos llegado es cierta. Una

probabilidad elevada nos da la tranquilidad de que lo que hemos calculado es cercano a

lo real y no debida al azar

Niveles convenidos:

a) α = 5%. Existe 5% (0.05) de probabilidad de equivocarse y 95% (0.95) de confianza.

b) α = 1%. Existe 1% (0.01) de probabilidad de equivocarse y 99% (0.99) de confianza.

Definición de términos.

El error tipo I: Ocurre cuando afirmamos la hipótesis del investigador, siendo que es

falsa. Por lo tanto, es un juicio de valor equivocado.

El p-valor: Es la probabilidad de equivocarse al aceptar nuestra hipótesis del

investigador como verdadera; es decir la probabilidad de cometer un error tipo I.

El nivel de significancia: Es la máxima probabilidad de error que estamos dispuestos

aceptar para dar como válida nuestra hipótesis del investigador.

Page 15: Apuntes+de+Bioestadística+-+Supo

Pág. 14 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)

OBJETIVO ESTADÍSTICO

NIVEL INVESTIGATIVO RELACIONAL: VAR CATEGÓRICA

1. COMPARAR (Grupos): Es el objetivo estadístico más básico del análisis bivariado; aunque

algunos autores piensan que es univariado, porque habitualmente involucra un solo evento

aleatorio (diseños ecológicos), donde los grupos se construyen previamente a la ejecución del

estudio; Sin embargo, su análisis involucra a dos variables y por ello corresponde al nivel

investigativo relacional. Su finalidad es identificar las diferencias entre los grupos participantes.

La prueba de hipótesis se realiza con el estadístico: Chi cuadrado de Homogeneidad.

Ho: Las proporciones de los grupos no son diferentes.

H1: Las proporciones de los grupos son diferentes.

2. COMPARAR (Antes-Después): Es la comparación de un mismo grupo antes y después de una

intervención o de un acontecimiento; la idea de hacer dos medidas sobre el mismo grupo, es

verificar los cambios producidos entre una medida y otra; donde las variaciones pueden

adjudicarse a la intervención o al periodo de seguimiento; por ello corresponden a estudios

longitudinales. Estas comparaciones siempre son de individuo a individuo.

La prueba de hipótesis se realiza con el estadístico: Chi cuadrado de Mc Nemar.

Ho: No existe diferencia entre las dos medidas.

H1: Existe diferencia entre las dos medidas.

3. ASOCIAR (Categorías): Solamente la comparación de una variable dicotómica en dos grupos

nos puede llevar a la asociación; y aunque se puede identificar en las tablas 2 x 2, debemos

hacer una medida asociación. Para asociar hay que definir los factores de interés en ambas

variables; y es que habitualmente la asociación involucra dos eventos aleatorios. Desde el punto

de vista epidemiológico tenemos dos medidas de asociación relevantes: Riesgo Relativo y el

Odds Ratio.

La prueba de hipótesis se realiza con el estadístico: Chi cuadrado de Independencia.

Ho: Existe independencia entre los dos eventos (variables).

H1: Existe dependencia entre los dos eventos (variables).

4. CONCORDAR: Es una medida de acuerdo entre dos observaciones donde el requisito

fundamental es que se trata de un solo grupo y los resultados de la observación tienen las

mismas opciones. Tenemos dos casos frecuentes: Cuando las observaciones corresponde a

diferentes observadores y cuando las observaciones corresponden a diferentes instrumentos. En

este caso el estadístico, es también un índice de concordancia.

La prueba de hipótesis se realiza con el estadístico: Índice Kappa de Cohen.

Ho: No existe concordancia entre las dos observaciones.

H1: Existe concordancia entre las dos observaciones.

Page 16: Apuntes+de+Bioestadística+-+Supo

BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS

OBJETIVO ESTADÍSTICO

NIVEL INVESTIGATIVO RELACIONAL: VAR NUMÉRICA

1. COMPARAR (Grupos): Su finalidad es identificar las diferencias entre los grupos participantes;

se puede comparar dos o más grupos y habitualmente estos grupos se construyen en la etapa

de planificación del estudio. La comparación inicial es a dos colas; pero debe complementarse

con un test de una sola cola. Cuando se comparan mas de dos grupos, debe realizarse una

prueba post Hoc, con la finalidad de detectarse diferencias entre cada uno de los grupos.

La prueba de hipótesis se realiza con el estadístico: t de Student para muestras independientes.

Ho: Los promedios de los grupos no son diferentes.

H1: Los promedios de los grupos son diferentes.

2. COMPARAR (Antes-Después): Siempre corresponde a estudios individuales, es la

comparación de un mismo grupo antes y después de una intervención o de un acontecimiento; la

idea de hacer dos medidas sobre el mismo grupo, es detectar cambios entre una medida y otra;

donde las variaciones pueden adjudicarse a la intervención o al periodo de seguimiento; por ello

corresponden a estudios longitudinales. La hipótesis habitualmente es de una sola cola.

La prueba de hipótesis se realiza con el estadístico: t de Student para muestras relacionadas.

Ho: No existe variación entre las medidas antes y después de la intervención.

H1: Existe variación entre las medidas antes y después de la intervención.

3. CORRELACIONAR (Unidades): Se puede correlacionar las unidades de dos variables, incluso

de diferente dimensión, para ello hay que definir las unidades en ambas variables; que

habitualmente esta involucra dos eventos aleatorios. La correlación puede significar el primer

paso para la asociación, muy útil cuando se realiza minería de datos. Ejm.: Correlacionar los

niveles séricos de sodio con los valores de presión arterial en un grupo de pacientes

hospitalizados.

La prueba de hipótesis se realiza con el estadístico: Correlación R de Pearson.

Ho: Existe independencia entre las dos variables.

H1: Existe dependencia entre las dos variables.

4. CORRELACIONAR (Como valor predictivo): Aquí se tiene por descontado la presencia de

correlación; por lo que su fin es medir el grado de correlación. Desde el punto de vista de la

evaluación de pruebas diagnósticas se utiliza la correlación para evaluar el valor predictivo de

una variable sobre la otra. Ejm. Hallar el valor predictivo del ponderado fetal recién nacidos a

término. En general para la validación de instrumentos se puede utilizar para calcular el Alfa de

Cronbach: Correlación Ítem-Total

La prueba estadística es el Índice Correlación R de Pearson ó el R2

Ho: No existe correlación entre las dos medidas.

H1: Existe correlación entre las dos medidas.

Page 17: Apuntes+de+Bioestadística+-+Supo

Pág. 16 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)

OBJETIVO COMPARATIVO

1. EXPLORATORIO.

Aquí agrupamos a las comparaciones sin métodos estadísticos, siendo que la investigación cualitativa no hace uso de las herramientas estadísticas, el principal diseño encontrado aquí son las comparaciones múltiples enmarcadas en los diseños comunitarios o ecológicos. Como ejemplo podemos mencionar la comparación de las costumbres a la hora del parto en la Región Quechua y Aymara. Comparación por juicio de expertos en la validación cualitativa de un instrumento. La comparación cualitativa es una opinión.

2. DESCRIPTIVO.

Las comparaciones descriptivas ocurren cuando evaluamos dos poblaciones en los estudios comunitarios o ecológicos, en este caso no se requiere aplicar pruebas estadísticas puesto que precisamente estamos estudiando a la población y no hay inferencia estadística. La comparación del rendimiento académico de dos estudiantes al momento de la graduación tampoco requiere de pruebas de hipótesis sino solamente de ver quién es el que tiene el mayor promedio. El objetivo estadístico describir según las variables epidemiológicas es el primer punto de partida para la verdadera comparación.

3. RELACIONAL.

Recordemos que el contraste de independencia entre dos variables responde a tres modelos matemáticos: modelo con los totales marginales de ambos factores fijos (modelo I), modelo con los totales marginales de uno de los factores fijos (modelo II), y el modelo con el total muestral fijo (modelo III); pues bien el objetivo comparativo a nivel bivariado (nivel relacional) corresponde al modelo II con un factor fijo y uno aleatorio. Dependiendo de la naturaleza de la variable se elegirá un determinado estadístico. La comparación puede ser de grupos independientes o de muestras relacionadas.

4. EXPLICATIVO.

La finalidad de este nivel es descartar asociaciones aleatorias, casuales o espurias sobre todo cuando hacemos análisis comparativo estratificado cuando queremos realizar el control estadístico en un estudio observacional, ésta es la función del test de Mantel-Haenszel. A nivel experimental podemos plantear objetivos comparativos de grupo aleatorizados; como por ejemplo comparar el efecto sobre la variable efecto en el grupo experimental y el grupo blanco, hablando de estudios epidemiológicos. Dentro de los experimentos verdaderos la factorización de las causas también corresponde al objetivo comparativo

5. PREDICTIVO:

Podemos comparar el valor predictivo de dos procedimientos diagnósticos o de dos formas de evaluar una variable predictiva; por ejemplo podemos comparar la eficiencia diagnóstica de dos métodos de detección de una enfermedad. En otro momento podemos comparar el pronóstico de la enfermedad o del tiempo de supervivencia de dos tratamientos en pacientes con cáncer. Incluso hay técnicas comparativas para el análisis de supervivencia de Kaplan-Meier.

Page 18: Apuntes+de+Bioestadística+-+Supo

BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS

TÉCNICAS DE RECOLECCIÓN DE DATOS

No es lo mismo que registro de datos

1. Documentación

Constituye la técnica de recolección de datos más básica y a la vez la más inexacta;

sin embargo en ocasiones es la única disponible para recopilar la información;

Habitualmente la información fue recolectada con fines distintos al estudio en curso;

por ello los estudios realizados con esta técnica siempre son retrospectivos. Ejm.

Análisis de contenido

2. Observación:

La observación científica se caracteriza por ser sistemática, controlada y con

mecanismos destinados a evitar errores de subjetividad, confusiones, etc. Es una

observación simple cuando no perturba la acción o situación que se está

investigando. Por otro lado la observación participante puede ser natural cuando el

observador pertenece al conjunto humano que investiga y artificial, cuando la

integración del observador al grupo se hace con el objeto de desarrollar un trabajo

de investigación. La experimentación es una observación participante artificial.

3. Entrevista

Consiste en una interacción entre dos personas, una de las cuales -el investigador-

formula determinadas preguntas relativas al tema en investigación, mientras la otra

-el investigado- proporciona la información que le es solicitada. La entrevista puede

ser estructuradas y no estructurada; en la investigación cuantitativa se apoya en un

cuestionario al cual se le denomina heteroadministrado.

4. Encuesta

La palabra "encuesta" se usa más frecuentemente para describir un método de

obtener información de una muestra de individuos. Esta "muestra" es usualmente

sólo una fracción de la población bajo estudio. Cuando se aplica al total de la

población se llama censo y siempre es parametrada. Se apoya en un cuestionario

que casi siempre es autoadministrado. La ventaja principal de tal procedimiento

radica en la gran economía de tiempo y personal que implica, ya que los

cuestionarios pueden enviarse por correo, dejarse en algún lugar apropiado, o

pueden administrarse a grupos reunidos al efecto.

5. Psicometría

Los test psicológicos emplean una gran variedad de técnicas específicas, que se

combinan según los objetivos deseados. Una gran proporción de ellos acude a la

formulación de preguntas ya anotadas en algún cuestionario apropiado, que es el

test mismo, y que se autoadministra.

Page 19: Apuntes+de+Bioestadística+-+Supo

Pág. 18 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)

INSTRUMENTOS DE MEDICIÓN

1. Instrumentos lógicos o Documentales: Subjetivos

Cuestionario. Los términos cuestionarios e inventarios se suelen utilizar como

sinónimos a pesar de que hay diferencias marcadas en la forma de su presentación.

Un cuestionario supone un conjunto de preguntas que el sujeto tiene que responder

a fin de evaluar alguna capacidad, generalmente cognitiva, lo cual debe ser

calificado por el evaluador.

Como ejemplo podemos citar a los exámenes para evaluar rendimiento académico

Escalas. Los evaluados indican su acuerdo o desacuerdo con una serie de

afirmaciones sobre el objeto en estudio. Por lo general, arrojan una calificación total

que indica la dirección e intensidad de la actitud del individuo hacia una categoría de

estímulos, por lo que las escalas requieren de una respuesta ordinal o de intervalo.

Se han elaborado procedimientos especiales para alcanzar la unidimensionalidad o

homogeneidad de los reactivos, la igualdad de las distancias entre las unidades de la

escala y la comparabilidad de las calificaciones.

El ejemplo más básico es la escala visual análoga.

Inventario. Conjunto de frases o palabras a las que el sujeto tiene que responder

eligiendo o marcando su posición ante ellas (por ejemplo, al ítem “Me gustan las

revistas de mecánica, decoración o computadoras”, notemos que ninguna respuesta

es calificada como correcta e incorrecta.

Los inventarios cuentan con distintas posibilidades de respuesta

Por ejemplo un test de inteligencias múltiples puede indicarnos inteligencia: Lingüística,

Lógicomatemática, Musical, Naturalista, etc.

2. Mecánicos: Objetivos

Las técnicas objetivas hacen referencia a aquellas tareas o procedimientos

estructurados que recogen las respuestas de un participante, respuestas que no

pueden ser modificadas en la dirección deseada y cuya puntuación es independiente

de la persona que evalúa.

Las medidas que realizan mediante este método son por ejemplo las mediciones

fisiológicas.

Los instrumentos de evaluación cognitiva son aquellos instrumentos o aparatos que

sirven para evaluar características cognitivas que se consideran observables (por

ejemplo, el tiempo de reacción). La imagen más habitual de estas técnicas es la de

una persona sentada frente a la pantalla de un ordenador que espera con atención la

aparición de una serie de estímulos para apretar rápidamente un botón o una

palanca.

Page 20: Apuntes+de+Bioestadística+-+Supo

BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS

SESGOS DE SELECCIÓN

1. Sesgo de prevalencia o incidencia (de Neymann):

Se produce cuando la condición en estudio determina pérdida prematura

por fallecimiento de los sujetos afectados por ella. La exclusión de los

pacientes que fallecen determina este tipo de sesgo. Por ejemplo la

duración del tratamiento del cáncer en nuestro medio es corto porque se

diagnostican en estadios avanzados.

2. Sesgo de admisión (de Berkson).

En un estudio relacional ocurre cuando hay una mala selección del grupo de

estudio y/o control. Ejm. cuando asociamos el hábito de fumar al cáncer

broncogénico; los pacientes con diagnóstico de Ca ya han dejado de fumar;

por lo que se observará menor frecuencia de fumadores en pacientes con

este tipo de cáncer.

3. Sesgo de no respuesta o efecto del voluntario.

El grado de interés o motivación que pueda tener un individuo que participa

voluntariamente en una investigación puede diferir sensiblemente en

relación con otros sujetos. Igualmente, la negativa de algunos sujetos para

ser incluidos en un estudio puede estar dada por motivaciones sistemáticas

experimentadas por ellos.

4. Sesgo de pertenencia (membresía)

Se produce cuando entre los sujetos evaluados se presentan subgrupos de

sujetos que comparten algún atributo en particular, relacionado positiva o

negativamente con la variable en estudio. Ejemplo: Nivel de conocimientos

sobre signos de alarma en las gestantes debe excluir a las gestantes que

son profesionales de la salud.

5. Sesgo del procedimiento de selección

Puede observarse en diseños de investigación experimentales (ensayos

clínicos controlados), en los cuales no se respeta el principio de aleatoriedad

en la asignación a los grupos de experimentación y de estudio. En los pre-

experimentos la administración del medicamento responde a las

necesidades terapéuticas del paciente y no a la del investigador.

Page 21: Apuntes+de+Bioestadística+-+Supo

Pág. 20 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)

SESGOS DE MEDICIÓN

1. Sesgo de procedimientos

Ocasionalmente el grupo que presenta la variable dependiente resulta ser

más interesante para el investigador que el grupo que participa como

control. Por esta circunstancia, en el procedimiento de observación suele ser

mas detenido. En el caso de un estudio en el que exista intervención, el

sujeto del grupo experimental puede verse beneficiado con una mayor

acuciosidad en la observación.

2. Sesgo de memoria o de información

Frecuente de observar en estudios retrospectivos, en los cuales se pregunta

por antecedente de exposición a determinadas circunstancias en diferentes

períodos de la vida, existiendo la posibilidad de olvido. Por ejemplo,

exposiciones inadvertidas a diversos factores y que pueden afectar la

medición ya sea por su omisión absoluta o en la determinación de niveles

de exposición.

3. Sesgo por falta de sensibilidad de un instrumento.

Si no se cuenta con adecuados métodos de recolección de la información, es

posible que la sensibilidad de los instrumentos empleados en tales

mediciones carezca de la sensibilidad necesaria para poder detectar la

presencia de la variable en estudio. Una consecuencia es que encontremos

una frecuencia de la enfermedad inferior a la real.

4. Sesgo de detección

Su ocurrencia se explica por la introducción de metodologías diagnósticas

diferentes a las inicialmente utilizadas al comienzo de un estudio. Es

conocido que no existe coincidencia absoluta entre dos instrumentos de

medición; por ello los estudios deben realizarse con un solo instrumento y

un solo observador.

5. Sesgo de adaptación

En los estudios de intervención (experimentales), a veces los cuales

individuos asignados inicialmente a un grupo deciden migrar de grupo por

preferir un tipo de intervención por sobre otro. En un ensayo clínico

controlado la ocurrencia de este tipo de sesgo se neutraliza mediante la

asignación aleatoria de los sujetos y por la presencia del llamado "doble

ciego”.

Page 22: Apuntes+de+Bioestadística+-+Supo

BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS

EL COEFICIENTE DE CORRELACION La correlación es una prueba de hipótesis que debe ser sometida a contraste y el coeficiente de correlación cuantifica la correlación entre dos variables, cuando ésta existe. El coeficiente r de Pearson, por ser una prueba paramétrica requiere de variables numéricas con distribución normal; mientras que el coeficiente de correlación no paramétrica rho de Spearman acepta variables de libre distribución e incluso ordinales. INTERPRETACIÓN El coeficiente correlación varía entre 0 y 1, pudiendo ser positivo o negativo. El valor numérico indica la magnitud de la correlación.

Sin correlación 0.0

0.2

0.4

0.6

0.8

Correlación perfecta

1.0

Correlación

mínima Correlación

baja Correlación moderada

Correlación buena

Correlación muy buena

El signo indica la dirección de la correlación Correlación directa (+) Signo positivo � “a mayor X, mayor Y” ó � “a menor X, menor Y”

Correlación inversa (-) Signo negativo � “a mayor X, menor Y” ó � “a menor X, mayor Y”

Significancia estadística Solo interpretamos el coeficiente si “p” es menor de 0.05, (Nivel de significancia). Se puede indicar la significancia así: r = 0.48 (p<0.05). Coeficiente de determinación Cuando el coeficiente se eleva al cuadrado (r2), asume varias interpretaciones Por ejemplo. La correlación entre “El ponderado fetal” y “El Peso al nacer” es de 0.80. r = 0.80 r2 = 0.64

Page 23: Apuntes+de+Bioestadística+-+Supo

Pág. 22 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)

VALIDEZ DE UN ESTUDIO

Desde la revolución científica ocurrida en el renacimiento en el siglo XV hasta nuestros

días, el hombre se ha valido de la investigación científica para identificar las causas de

las enfermedades o las mejores formas de tratarlas.

Este elemento es parte integral del paradigma conocido como la Medicina Basada en la

Evidencia. Este paradigma postula que las decisiones médicas deben basarse en la mejor

evidencia científica disponible, adaptada al caso individual del paciente mediante la

experiencia clínica.

3. La validez interna

Es la credibilidad de sus resultados, o dicho de otra manera la capacidad de

demostrar o refutar la hipótesis propuesta. Es máxima cuando el estudio carece de

sesgos. En términos generales, los sesgos que afectan la validez interna surgen

siempre que los grupos estudiados difieren en más características que la exposición.

Por ejemplo, si se está estudiando la frecuencia de infarto de miocardio en un grupo

de sujetos obesos o de peso normal, cualquier diferencia en la edad de los grupos

podría afectar la relación entre la obesidad y la ocurrencia de infarto de miocardio.

Asimismo, existe sesgo siempre que los grupos de sujetos no son evaluados de la

misma manera.

4. La validez externa

La aplicabilidad de los resultados del estudio se relaciona con la validez externa del

estudio.

En muchas ocasiones el universo e incluso el marco muestral es demasiado grande

como para ser estudiado e incluso muestreado; es estos casos se realiza el estudio

en una porción deliberada de la población; teniendo en cuenta que el conglomerado

seleccionado es lo suficientemente homogéneo con el resto de la población; los

resultados encontrados en este grupo podrán ser extrapolados a la población objeto

del estudio.

Por ejemplo si tratamos de conocer la satisfacción de la atención en los pacientes de

un servicio de salud; bastará con estudiar a los pacientes que acudan durante un

mes a dicho servicio; otro ejemplo más claro es cuando tomamos una muestra de

sangre con la finalidad de conocer concentración de gases y asumimos que lo

encontrado en 10 mililitros corresponde a los 5 litros de sistema circulatorio.

Page 24: Apuntes+de+Bioestadística+-+Supo

BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS

CONTROL DE UN ESTUDIO

6. CONTROL METODOLÓGICO

a. Sesgo de selección

Se produce cuando la condición en estudio determina pérdida prematura

por fallecimiento de los sujetos afectados por ella. La exclusión de los

pacientes que fallecen determina este tipo de sesgo.

• Criterios de inclusión

• Criterios de exclusión

b. Sesgo de medición

Por ejemplo la duración del tratamiento del cáncer en nuestro medio es

corto porque se diagnostican en estadios avanzados.

• Validación de instrumentos

• Calibración de instrumentos

7. CONTROL ESTADÍSTICO

a. Análisis estratificado

Se produce cuando la condición en estudio determina pérdida prematura

por fallecimiento de los sujetos afectados por ella. La exclusión de los

pacientes que fallecen determina este tipo de sesgo.

• Categóricos: Chi cuadrado de Mantel-Haenszel

• Numéricas: ANOVA Factorial

b. Análisis multivariado

Por ejemplo la duración del tratamiento del cáncer en nuestro medio es

corto porque se diagnostican en estadios avanzados.

• Categóricos: Regresión logística

• Numéricas: Regresión lineal múltiple

Page 25: Apuntes+de+Bioestadística+-+Supo

Pág. 24 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN

Medidas de resumen para variables numéricas

MEDIDAS DE TENDENCIA CENTRAL

Media: Media aritmética, es la que se obtiene sumando los datos y dividiéndolos

por el número de ellos. Se aplica por ejemplo para resumir el número de

pacientes promedio que se atiende en un turno. Otro ejemplo, es el número

promedio de controles prenatales que tiene una gestante.

Mediana: Corresponde al percentil 50%. Es decir, la mediana Divide a la

población exactamente en dos. Por ejemplo el número mediana de hijos en el

centro de salud “X” es dos hijos. Otro ejemplo es el número medina de

atenciones por paciente en un consultorio.

Moda: Valor o (valores) que aparece(n) con mayor frecuencia. Una distribución

unimodal tiene una sola moda y una distribución bimodal tiene dos. Útil como

medida resumen para las variables nominales. Por ejemplo, el color del uniforme

quirúrgico en sala de operaciones es el verde; por lo tanto es la moda en colores

del uniforme quirúrgico.

MEDIDAS DE DISPERSIÓN

Desviación Estándar: Llamada también desviación típica; Es una medida que

informa sobre la media de distancias que tienen los datos respecto de su media

aritmética, expresada en las mismas unidades que la variable.

La varianza: Es el valor de la desviación estándar al cuadrado; su utilidad radica

en que su valor es requerido para todos los procedimientos estadístico.

Error típico: Llamado también error estándar de la media. Se refiere a una

medida de variabilidad de la media; sirve para calcular cuan dispersa estaría la

media de realizar un nuevo cálculo.

Page 26: Apuntes+de+Bioestadística+-+Supo

BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS

MEDIDAS DE POSICIÓN Y DE FORMA

MEDIDAS DE POSICIÓN: Cuantiles

Percentiles: Son 99 valores que dividen en cien partes iguales el conjunto de datos

ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las

observaciones, y por encima queda el 85%.

Cuartiles: Son los tres valores que dividen al conjunto de datos ordenados en cuatro

partes iguales, son un caso particular de los percentiles. Se denotan como: Q1 o primer

cuartil, Q2 segundo cuartil (la mediana) y Q3 tercer cuartil.

Deciles: Son los nueve valores que dividen al conjunto de datos ordenados en diez

partes iguales, son también un caso particular de los percentiles.

MEDIDAS DE FORMA

Asimetría: una distribución es simétrica cuando su mediana, su moda y su media

aritmética coinciden. Existen varias medidas de la asimetría de una distribución de

frecuencias. Una de ellas es el Coeficiente de Asimetría de Pearson: Su valor es cero

cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y

negativo cuando existe asimetría a la izquierda.

Asimetría Derecha (+) Simétrica (0) Asimetría Izquierda (-)

Apuntamiento o Curtosis: la curtosis es una medida de la forma que busca cuantificar

la mayor o menor concentración de frecuencias alrededor de la media y en la zona

central de la distribución. Se mide con el coeficiente de apuntamiento o curtosis: Su valor

es cero cuando la distribución es mesocúrtica, positivo cuando es leptocúrtica y negativo

cuando es platicúrtica

Leptocúrtica (+) Mesocurtica (0) Platicurtica (-)

Page 27: Apuntes+de+Bioestadística+-+Supo

Pág. 26 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)

GRÁFICAS UNIVARIABLES

1. Para variables categóricas

a. Diagrama de sectores

Se toma un círculo y se divide en tantos sectores

como categorías tenga nuestra variable, siendo el

arco del círculo proporcional a las frecuencias

absolutas (también lo podemos hacer con las

frecuencias relativas o porcentajes)

Es ideal para variables dicotómicas o politómicas de

menos cuatro o menos categorías.

b. Gráfico de barras

Es una representación bidimensional con las

categorías dispuestas paralelamente de manera

que la extensión de cada barra es proporcional a la

magnitud que se quiere representar.

Es ideal para variables politómicas de o incluso

para variables de categorías no excluyentes.

2. Para variables numéricas

a. Histograma

Se utiliza cuando se estudia una variable continua,

como la edad o la talla y, por comodidad, sus

valores se agrupan en clases, es decir, valores

continuos. En los casos en los que los datos son

cualitativos (no-numéricos), como sexto grado de

acuerdo o nivel de estudios, es preferible un gráfico

de barras.

b. Diagrama de Caja y Bigotes

Gráfico basado en cuartiles, compuesto por un

rectángulo, la "caja", y dos brazos, los "bigotes".

Es un gráfico que suministra información sobre los

valores mínimo y máximo, los cuartiles Q1, Q2 o

mediana y Q3, y sobre la existencia de valores

atípicos y la simetría de la distribución.

Page 28: Apuntes+de+Bioestadística+-+Supo

BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS

ERROR TIPO I Y II

Al establecer un criterio de decisión sobre la hipótesis nula, el investigador puede

ponderar los errores que podría cometer en su decisión sobre la hipótesis nula. Una

primer forma de error (se conoce como el error tipo I) consiste en rechazar una

hipótesis nula verdadera, es decir, descartar el azar como explicación cuando los

resultados podrían explicarse razonablemente con base en el mismo. Este es el error que

comete el investigador que ve más lo que hay en los datos; es decir, el investigador

concluye en que existe una relación real o verdadera entre las variables independiente y

dependiente de la investigación, cuando en realidad la relación observada se puede

explicar razonablemente como resultado del azar.

El llamado error tipo I es el error del investigador que se apresura a concluir a favor de

su hipótesis de investigación. Fisher no habló de ningún otro error, pues la prueba de la

hipótesis nula para él no era otra cosa que un freno a la tendencia natural de un

investigador a creer que hipótesis ha sido confirmada por el simple hecho de que los

resultados de la investigación siguen la misma dirección de la hipótesis. En la estrategia

de Fisher, sólo hay un error posible: rechazar una hipótesis nula verdadera.

Una segunda forma de error (se conoce como el error tipo II), introducida por Egon

Pearson y Jerzy Neyman consiste en no rechazar una hipótesis nula falsa, es decir, no

descartar el azar aun cuando éste no constituye una explicación razonable de los datos.

Este es el error que comete el investigador que ve menos que lo que hay en los datos;

por miedo a rechazar incorrectamente el azar, el investigador puede exponerse al riesgo

de pasar por alto una relación real o verdadera entre las variables de su investigación.

Fueron Pearson y Neyman los que, al introducir un segundo tipo de error, bautizaron

como error tipo uno al error de que había hablado Fisher.

Según Fisher, el nivel de significación estadística equivale a la magnitud del riesgo que

está dispuesto a correr el investigador, de cometer el error de rechazar una hipótesis

nula verdadera (el llamado error tipo I). Para la mayoría de los propósitos, el nivel de

significación previamente establecido suele ser de 0.05, aunque en áreas de

investigación más rigurosas se trabaja con un nivel de significación de 0.01. Suponiendo

que se trabaja con un nivel de significación de 0.05, se rechazaría la hipótesis nula

siempre que la probabilidad de explicar los resultados obtenidos en una investigación

como si fueran obra del azar sea igual o menor que 0.05.

En la perspectiva de Pearson y Neyman, para establecer el nivel de significación

estadística habría que atender al impacto de cada tipo de error en el objetivo del

investigador, y a partir de ahí se decidiría cuál de ellos es preferible minimizar. Pearson y

Neyman llamaron alfa al error tipo I y beta al error tipo II; a partir de este último tipo de

error, introdujeron el concepto de "poder de una prueba estadística", el cual se refiere a

su capacidad para evitar el error tipo II, y está definido por 1-beta, y en estrecha

relación con éste se ha desarrollado el concepto de "tamaño del efecto" que algunos han

Page 29: Apuntes+de+Bioestadística+-+Supo

Pág. 28 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)

POBLACIÓN Y MUESTRA

UNIDAD DE ESTUDIO Conocido también como unidad de análisis, unidad de observación, unidad experimental, o unidad de población, son cada uno de los sujetos u objetos de estudio de la población del que hay que obtener la información. POBLACION Conjunto de todos los casos o grupo de unidades (sujetos u objetos de estudio) con alguna característica común. Las poblaciones deben situarse claramente en torno a sus características de contenido, lugar y tiempo. La delimitación de la población que va ser estudiada y sobre la cual se pretende generalizar los resultados, es un paso importante en una investigación. Si se dispone de una lista de unidades o elementos de muestreo se dice que es conocida; sino se dispone de tal listado se dice que es desconocida. La medición completa de todos los elementos que constituyen la población constituye el censo, mientras que cuando no podemos acceder a ella podemos hacer el análisis de una parte de esta. MUESTRA Una muestra representativa debe tener un tamaño mínimo calculado y responder a una selección parametrada (muestreo probabilístico). Así podemos conocer la parte de una población que debe examinarse con la finalidad de hacer inferencias sobre dicha población. El muestreo otorga una probabilidad conocida de integrar la muestra a cada elemento de la población, y dicha probabilidad no es nula para ningún elemento. Unidad de muestreo: Elementos de la población que se van a estudiar. Cada unidad de estudio pertenece sólo una unidad de muestreo. PARAMETRO Es la medida estadística que describe un determinado aspecto de una población. Los parámetros más usuales en una investigaron son: La media poblacional (µ), la varianza poblacional (s). ESTADIGRAFO Es la media estadística que describe un determinado aspecto de una muestra. Así, la media muestral (x), la varianza muestral (σ), etc., son estadígrafos porque se calculan para una muestra. “Un parámetro es una constante, mientras que un estadígrafo es una variable.”

Page 30: Apuntes+de+Bioestadística+-+Supo

BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS

MUESTREO PROBABILISTICO

1. Muestreo aleatorio simple

Denominado también muestreo equiprobabilístico, porque si se selecciona una

muestra de tamaño n de una población de N unidades, cada elemento tiene una

probabilidad de inclusión igual y conocida de n/N.

Ventaja: Se desarrolla en software porque se basa en la teoría estadística

Desventaja: Precisa un marco muestral o listado de todas las unidades

2. Muestreo sistemático

Para determinar una muestra de tamaño n conseguimos una lista de N elementos,

definimos un intervalo de salto k=N/n y elegimos un número aleatorio entre 1 y k

con el que comenzamos la selección de la muestra.

Ventaja: No es necesario tener un marco muéstralo listado de unidades.

Desventaja: La constante podría asociarse con el fenómeno de interés

3. Muestreo aleatorio estratificado

Como el azar no es una garantía de representatividad, aquí se pretende asegurar la

representación de cada grupo en la muestra. Cuanto más homogéneos sean los

estratos, más precisas resultarán las estimaciones.

Ventaja: La muestra es homogénea en función a la variable involucrada.

Desventaja: Se debe conocer la distribución en la población de la variable utilizada

para la estratificación.

4. Muestreo por conglomerados

Denominado también muestreo por clusters aprovecha se caracterizan porque la

variación en cada grupo es menor que la variación entre grupos lo cual resulta

ventajoso en los estudios comunitarios o poblacionales.

Ventaja: Muy eficiente cuando las unidades están muy dispersas

Desventaja: Requiere un manejo estadístico mas complejo que el resto

Page 31: Apuntes+de+Bioestadística+-+Supo

Pág. 30 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)

VALIDACIÓN DE TEST PSICOMÉTRICOS

1. Validez de contenido (Juicio de Expertos o validación por jueces) Un instrumento de medición debe contener representados a todos los ítems del dominio de contenido de las variables a medir. Se refiere al grado en que la medición representa al concepto medido. Es decir, que el instrumento debe contener todos los aspectos o ítems del dominio de la variable que se esta midiendo, y se construye de acuerdo con la teoría.

2. Consistencia interna (Alfa de Cronbach) Su valor aumenta cuando las correlaciones ítem – total son altas, por ello, mejores correlaciones, dan mayor fiabilidad al instrumento. Se puede decir también que es un índice de discriminación. El coeficiente de fiabilidad es afectado por la heterogeneidad de los individuos que contestan la prueba; cuanto más heterogéneo es el grupo de encuestados, mayor es el coeficiente de fiabilidad.

3. Validez de constructo (Rotación de Varimax)

El procedimiento consiste en aplicar el instrumento a dos o más grupos y ver si discrimina. Para ello hay que contar con una estructura Factorial del cuestionario. Por ejemplo en los instrumentos para medir variables psicológicas no podemos garantizar la existencia de un constructo psicológico que subyaga y dé sentido y significado a las puntuaciones del test; por lo mismo que no tenemos una prueba patrón.

4. Estabilidad (ANOVA) Se refiere a la confianza que se concede a los datos; requiere de un retest en condiciones similares a la primera evaluación y está relacionada con la estabilidad o constancia test-retest. Se trata de ver hasta que punto un conjunto de medidas son reproducibles en el tiempo, el grado en que las puntuaciones son estables sería el grado de fiabilidad. Por ello es sinónimo de estabilidad.

5. Punto de corte (Curvas ROC). Habitualmente requerimos que el instrumento nos conduzca a una decisión dicotómica (positivo-negativo) para tratar o no a alguien; Se realizan trazando un diagrama en el que la ordenada es la sensibilidad y la abscisa la especificidad. En este sentido la curva ROC nos muestra en un gráfico todos los pares sensibilidad-especificidad resultantes de la variación continua de los puntos de corte en todo el rango de resultados observados. Las Curvas de Roc optimizan el punto de corte.