apuntes+de+bioestadística+-+supo
TRANSCRIPT
SOCIEDAD PERUANA DE BIOESTADISTICA
E INVESTIGACIÓN EN SALUD
División de Investigación en Medicina
Programa de Apoyo a las Sociedades Científica de Estudiantes de Medicina (PASCEM)
SEPARATA: BASES PARA EL ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
EXTRACTO
Dr. José Antonio Supo Condori
www.josesupo.com
Arequipa 1 de Enero del 2010
Claves
Pastilla: Temas resumidos en una sola hoja
Sinopsis: Los cuadros sinópticos utilizan el razonamiento por analogía
Formulario: Algoritmos más comunes en epidemiología
Práctica: Ejercicio a desarrollar en 15 minutos
Nota: El desarrollo estadístico es explicado en vídeotutoriales, para lo cual deben ingresar a bioestadistico.com
Arequipa - Perú
201o
01 Pastilla - Tipos de investigación
02 Pastilla - Niveles en investigación
03 Pastilla - Diseños en investigación
04 Pastilla - Variables e Indicadores
05 Pastilla - Escalas de medición
06 Pastilla - Las variables según su relación
07 Pastilla - Criterios de Causalidad
08 Pastilla - Formulación del problema
09 Pastilla - Hipótesis metodológica
10 Pastilla - Hipótesis estadística
11 Pastilla - Objetivo estadístico
12 Pastilla - Ritual de la significancia estadística
13 Pastilla - Significancia estadística
14 Pastilla - Objetivo Estadístico (cualitativo)
15 Pastilla - Objetivo Estadístico (cuantitativo)
16 Pastilla - Objetivo comparativo
17 Pastilla - Técnicas de recolección de datos
18 Pastilla - Instrumentos de medición
19 Pastilla - Sesgos de selección
20 Pastilla - Sesgos de medición
21 Pastilla - Correlación de Pearson y Spearman
22 Pastilla - Validez de un estudio
23 Pastilla - Control de un estudio
24 Pastilla - Tendencia central y dispersión
25 Pastilla - Medidas de posición y de Forma
26 Pastilla - Gráficas univariables
27 Pastilla - Error tipo I y II
28 Pastilla - Población y muestra
29 Pastilla - Muestreo probabilistico
30 Pastilla - Validación de test psicométricos
SPBIS.ORG SOCIEDAD PERUANA DE BIOESTADISTICA E INVESTIGACIÓN EN SALUD Pág. 1
TIPOS DE ESTUDIO
1. Según la intervención del Investigador:
OBSERVACIONAL: No existe intervención del investigador; los datos reflejan la
evolución natural de los eventos, ajena a la voluntad del investigador.
EXPERIMENTAL: Siempre son prospectivos, longitudinales, analíticos y de nivel
investigativo “explicativo” (causa – efecto); además de ser “controlados”.
2. Según la planificación de la toma de datos
PROSPECTIVO: Los datos necesarios para el estudio son recogidos a propósito de la
investigación (primarios). Por lo que, posee control del sesgo de medición.
RETROSPECTIVO: Los datos se recogen de registros donde el investigador no tuvo
participación (secundarios). No podemos dar fe de la exactitud de las mediciones.
3. Según el número de ocasiones en que mide la variable de estudio
TRANSVERSAL: Todas las variables son medidas en una sola ocasión; por ello de
realizar comparaciones, se trata de muestras independientes.
LONGITUDINAL: La variable de estudio es medida en dos o más ocasiones; por ello,
de realizar comparaciones (antes – después) son entre muestras relacionadas.
4. Según el número de muestras a estudiar
DESCRIPTIVO: El análisis estadístico, es univariado porque solo describe (finalidad
cognoscitiva); o estima parámetros (propósito estadístico) en la población de estudio
a partir de una muestra.
ANALÍTICO: El análisis estadístico por lo menos bivariado; por que plantea y pone a
prueba hipótesis explicativas (finalidad cognoscitiva); su nivel más básico establece
la asociación entre factores (propósito estadístico).
IMPORTANTE: “Descriptivo no es sinónimo de observacional”. Un estudio observacional
puede ser analítico. Ejm: El estudio de los casos y controles.
Pág. 2 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
NIVELES EN INVESTIGACIÓN
1. EXPLORATORIO: Se plantean cuando el objetivo es examinar un tema o problema de investigación poco estudiado o que no ha sido abordado antes; su finalidad es establecer prioridades para investigaciones posteriores o sugerir afirmaciones verificables.
No hay preguntas que conduzcan a problemas precisos, se exploran áreas problemáticas. Se trata de investigación cualitativa; por lo que no se requiere de manejo estadístico.
2. DESCRIPTIVO: Describe fenómenos sociales o clínicos en una circunstancia temporal y geográfica determinada. Desde el punto de vista cognoscitivo su finalidad es describir y desde el punto de vista estadístico su propósito estimar parámetros.
La estadística consiste en estimar frecuencias y/o promedios; y otras medidas univariadas. Ejm. los estudios de frecuencia de la enfermedad: Incidencia y Prevalencia.
3. RELACIONAL: No son estudios de causa y efecto; porque las pruebas estadísticas solo demuestran dependencia entre diferentes eventos; aquí podemos encontrar los estudios de asociación sin relación de dependencia; y las correlaciones espurias.
La estadística es bivariada; podemos hacer asociaciones y medidas de asociación; correlaciones y medidas de correlación. Ejm. Chi Cuadrado y R de Pearson.
4. EXPLICATIVO: Su finalidad es explicar el comportamiento de una variable en función de otra(s); aquí se plantea una relación de causa-efecto, y tiene que cumplir otros criterios de causalidad (Bradford Hill); requiere de control tanto metodológico como estadístico.
En los estudios observacionales la estadística multivariada; tiene por finalidad descartar asociaciones aleatorias, casuales o espurias. Ejm. Chi 2 de Mantel-Haenszel.
5. PREDICTIVO: Se encarga de la estimación probabilística de eventos generalmente adversos, como puede ser las complicaciones de la enfermedad, la mortalidad, etc. La línea investigativa debe haber pasado previamente por los otros niveles.
Se aplican un conjunto de técnicas estadísticas. Ejm. La validación de una prueba diagnóstica requiere: Alfa de Cronbach, Índice Kappa, ANOVA, Curvas ROC.
6. APLICATIVO: Plantea resolver problemas de la vida cotidiana o a controlar situaciones prácticas. Puede ser programática o no programática, de manera que enmarca a la innovación técnica, artesanal e industrial como la propiamente científica.
Las técnicas estadísticas apuntan a evaluar el éxito de la intervención, como medidas de impacto sobre los principales indicadores de salud: tasas, coberturas, rendimiento, etc.
SPBIS.ORG SOCIEDAD PERUANA DE BIOESTADISTICA E INVESTIGACIÓN EN SALUD Pág. 3
DISEÑOS EN INVESTIGACIÓN
1. EPIDEMIOLÓGICOS: Describir la distribución de las enfermedades y eventos de salud en poblaciones humanas y descubren las leyes que gobiernan estas condiciones.
Descriptivo: Pueden ser transversal (Ej. Estudio de prevalencia) y longitudinal (Ej. Estudio de incidencia):
Observacional Analítico: No solo buscan demostrar dependencia entre eventos; sino la fuerza de asociación entre ellos, y plantea la relación de causalidad como una medida de riesgo. Ej. Casos y controles Cohortes.
De intervención: No llegan a ser experimentos verdaderos, porque se ven limitados por las normas éticas. Ej. Ensayos clínicos y ensayos de población.
2. EXPERIMENTALES: Requiere de dos condiciones básicas: intervención y asignación aleatoria. Siendo de nivel investigativo explicativo tienen control metodológico.
Pre-experimento: La intervención sobre las unidades de estudio, no es apropósito de la investigación; sino que obedece a las necesidades terapéuticas del sujeto.
Cuasi-experimento: Cuando no hay grupo control, no es posible realizar la asignación aleatoria de los sujetos, puesto que no se puede dejar sin tratamiento a los pacientes.
Experimento verdadero: Cumple con la asignación aleatoria e intervención.
3. COMUNITARIOS O ECOLÓGICOS: La unidad de análisis es la población y generalmente la fuente de datos suelen ser las estadísticas de morbilidad y mortalidad rutinarias.
Exploratorios: El único propósito es buscar patrones espaciales o temporales que podrían sugerir temas de investigación. Aquí se encuentran los estudios cualitativos.
De comparaciones múltiples: Este es diseño el ecológico más común. En un estudio analítico de comparación de grupos múltiples. La estadística varía solo por este hecho.
Series temporales: Analiza las variaciones temporales de los niveles de exposición con otra serie de tiempo que refleja los cambios en la frecuencia de la enfermedad.
4. ENSAYOS CLÍNICOS: Experimentos en seres humanos para evaluar métodos de prevención, diagnóstico, tratamiento o manejo de las enfermedades que les aquejan.
Terapéuticos: Suelen ser estudios individuales y son los más comunes; su propósito es curar, aliviar y/o prolongar la vida del paciente. Ej. Excéresis de un tumor localizado.
De intervención: Su propósito es modificar el curso natural de la enfermedad. Ej. Tratamiento de la diabetes para prevenir nefropatía diabética.
Prevención: Suelen ser comunitarios; su propósito es determinar la eficacia de un
Pág. 4 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
VARIABLES E INDICADORES
1. VARIABLES Y CONSTRUCTOS 1.1. VARIABLES Son propiedades, características o atributos que se dan en las unidades de estudio
(personas, grupos, etc.) o por derivación de ellas; siempre deben ser medibles.
Las variables individuales corresponden a las unidades de estudio individuales, ejm.
el nivel de instrucción de las personas. Las variables colectivas son propiedades de
grupos y su medición se basa en las propiedades individuales que poseen sus
miembros, por ejemplo el índice de analfabetismo.
El análisis estadístico de las variables individuales y las variables colectivas; incluso
dentro de un mismo objetivo, no siempre es el mismo.
1.2. CONSTRUCTOS
Un constructo es una propiedad que se supone posee una persona (unidad de
estudio individual), es un concepto teórico, hipotético. Por ejemplo, la inteligencia,
la motivación, la creatividad, las actitudes, etc.
Los constructos se definen como propiedades subyacentes, que no pueden medirse
de manera directa, sino mediante manifestaciones externas de su existencia, es
decir, mediante indicadores. Los constructos son variables subyacentes, por lo cual,
reciben la denominación común de variables.
2. INDICADORES E INDICES
2.1. INDICADORES
Cuando las variables no presentan ninguna dificultad para su identificación se dice
que tienen indicadores directos o unidimensionales.
Las variables subyacentes (constructos) que no pueden medirse de manera directa
como, requieren de indicadores que permitan su medición. En este caso estamos
hablando de indicadores indirectos o multidimensionales.
Los instrumentos utilizados para medir variables subyacentes, deben tener una
validez de constructo que corresponde su definición operacional. Así, el estrés de
Burnout queda definido operacionalmente cuando es medido por el test de Maslach.
2.2. INDICES
Es una combinación de dos o más variables o de sus indicadores elegidos por el
investigador que propone como procedimiento para medir una cierta variable.
Un índice puede estar representado por los indicadores de su definición operacional.
Así tenemos que, el índice de la función sexual esta constituida por las
dimensiones: el deseo, la función eréctil, función orgásmica y la satisfacción.
Reciben también el nombre de índices los valores que toma una variable (por
ejemplo, la tasa de mortalidad) en un período determinado, valores que son
reducidos a porcentaje o a una cantidad exponencial de base 10.
SPBIS.ORG SOCIEDAD PERUANA DE BIOESTADISTICA E INVESTIGACIÓN EN SALUD Pág. 5
Escalas de Medición de las variables
1. Variables Categóricas o Cualitativas
1.1. Escala NOMINAL: (ningún atributo)
Posee categorías a las que se asigna un nombre sin que exista ningún orden
implícito entre ellas. Ejemplos:
Género: Masculino – Femenino
Estado Civil: Soltero - Casado – Conviviente
1.2. Escala ORDINAL: (un atributo - Orden)
Posee categorías ordenadas, pero no permite cuantificar la distancia entre una
categoría y otra. Ejemplos:
Intensidad del dolor: Leve - Moderado – Intenso
Instrucción: Primaria - Secundaria – Superior
Observaciones
Dicotómicas: Tienen solamente dos categorías.
Politómicas: Tienen más de dos categorías.
2. Variables Numéricas o Cuantitativas
2.1. Escala de INTERVALO: (dos atributos - Orden y Distancia)
Tiene intervalos iguales y medibles. No tiene un origen real, por lo que puede
asumir valores negativos. Ejemplos:
Temperatura: -10°C, 0°C, 20°C, etc.
Hora del día: 00 Horas, 10 Horas, 20 Horas, etc.
2.2. Escala de RAZÓN: (tres atributos - Orden, Distancia y Origen)
Tiene intervalos constantes entre valores; además de un origen real. El cero
significa la ausencia del individuo. Ejemplos:
Peso: 00.00Kg, 10.24Kg, 20.00Kg, etc.
Número de Hijos: Uno, Dos, Tres, etc.
Observaciones
Continuas: Provienen de medir y se pueden representar con números enteros o
fraccionarios
Discretas: Provienen de contar y solamente pueden ser representados con números
enteros.
Pág. 6 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
LAS VARIABLES SEGÚN SU RELACIÓN
Esta clasificación de las variables se fundamenta en la búsqueda de obtener explicación
causal que puede ser observacional o experimental y correspondiente al nivel
investigativo explicativo. Su estructura responde a la necesidad de realizar el control
metodológico y/o estadístico de la relación causa-efecto.
1. Variable dependiente
En este sistema de variables representa a la variable de interés o variable de estudio,
es la que para su existencia y desenvolvimiento depende de otra independiente, su
modo de ser, está condicionada por otros aspectos de la realidad. Es la que mide o
describe el problema que se estudia.
2. Variable independiente
Es aquella cuya existencia es autónoma, no depende de otra, más bien de ella
dependen otras, representa los factores que constituirían la causa, siendo que
previamente ha demostrado ser factor de riesgo para el problema que se estudia. En
este sistema de variables se plantea solamente una variable independiente.
3. Variables intervinientes
a. Variable intermedia
Esta variable aparece de manera incalculada durante el proceso de una observación o
inesperada dentro de un experimento, entre el factor causal y el efecto. Ocurre
cuando no ha habido una buena elección de los factores de riesgo. El procedimiento
más idóneo para su neutralizar su participación es el análisis multivariado.
b. Variable de control
Es una variable con una fuerte influencia sobre la variable dependiente, pero ningún
efecto reconocido sobre la variable independiente; habitualmente se reconoce su
participación en el momento de la planeación; por ello su control se realiza
metodológicamente mediante los criterios de exclusión.
c. Variables de confusión
Su participación puede intensificar o antagonizar la relación aparente entre el
problema y una posible causa, creando confusión en el investigador. Su influencia se
da tanto sobre la variable independiente como en la dependiente. Su control se debe
realizar mediante análisis estratificado.
SPBIS.ORG SOCIEDAD PERUANA DE BIOESTADISTICA E INVESTIGACIÓN EN SALUD Pág. 7
CRITERIOS DE CAUSALIDAD
Criterios de Bradford Hill (1965)
1. Asociación estadística: Se trata de averiguar si existe relación entre el supuesto factor causal y el efecto estudiado. Para esto hay que buscar estudios epidemiológicos (Cohortes o Caso - Control) que indiquen el riesgo significativo (Riesgo Relativo o Razón de Momios).
2. Constancia o Consistencia: Consiste en conocer si la relación entre las dos variables, a las que investigamos una posible relación causa-efecto, ha sido confirmada por más de un estudio, en poblaciones y circunstancias distintas por autores diferentes.
3. Especificidad: Es más fácil aceptar una relación causa-efecto cuando para un efecto
sólo se plantea una sola etiología, que cuando para un determinado efecto se han propuesto múltiples causas. En este caso lo apropiado sería hablar de Especificidad de la causa.
4. Temporalidad: Se trata de asegurar que el factor de riesgo ha aparecido antes que el
supuesto efecto. Puede ser difícil de demostrar cuando no se puede asegurar si la presunta causa apareció con anterioridad al presunto efecto. (Equivale a la cronología de Simonin)
5. Relación dosis-respuesta: Denominada “gradiente biológico”, La frecuencia de la
enfermedad aumenta con la dosis o el nivel de exposición. (Equivale a la Intensidad de Simonin). Sin embargo, hay casos en que el gradiente biológico no se cumple (en una reacción alérgica).
6. Plausibilidad biológica: El contexto biológico existente debe explicar lógicamente la
etiología por la cual una causa produce un efecto a la salud. Esta característica viene limitada por los conocimientos científicos que se tengan al respecto en el momento del estudio.
7. Coherencia: la interpretación de causas y efectos no puede entrar en contradicción con
el comportamiento propio de la enfermedad o lesión. Este criterio combina aspectos de consistencia y plausibilidad biológica (Corresponde a la evolución de Simonin)
8. Experimentación: Es un criterio deseable de alta validez. Se trata de reproducir
experimentalmente la asociación causa-efecto, o incidir en la causa para alterar el efecto cuando no sea posible o no se considere ética otra modalidad de experimentación.
9. Analogía: Se fundamenta en relaciones de causa-efecto establecidas, con base a las
cuales si un factor de riesgo produce un efecto a la salud, otro con características similares debiera producir el mismo impacto a la salud.
NOTA: Bradford Hill no considera el criterio de topografía introducido por Simonin, aunque no es aplicable en todos los casos. Por ejemplo, en cuando tratamos de encontrar la lesión topográfica que provoca la anorexia nerviosa es un esfuerzo inútil.
Pág. 8 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
FORMULACIÓN DEL PROBLEMA
Se trata de sintetizar la cuestión proyectada a investigar, generalmente a
través de un interrogante. Los problemas de Investigación se formulan
con los 5 componentes a continuación:
VARIABLES: Debe mencionarse al menos la variable de estudio; pueden
también mencionarse todas las variables involucradas; o cuando son las
variables son muy numerosas suele usarse términos que resuman de
manera lógica un grupo de variables.
UNIDADES DE ESTUDIO:
Unidades de observación, unidades experimentales, unidades de análisis.
Reciben distintos nombres según el diseño de la investigación; y deben
mencionarse, aunque a veces su presencia en el enunciado resulta
implícita.
DISEÑO DEL ESTUDIO:
Propósito estadístico, Especificidad, etc. Es muy variable de acuerdo a la
investigación; es importante utilizar términos que den por aludido el
diseño de la investigación, el nivel investigativo, el tipo de estudio, etc.
UBICACIÓN ESPACIAL:
Es ineludible cuando se tratan de estudios descriptivos y se encuentra
relacionado con el tamaño de la muestra; siendo que los fenómenos
varían de un lugar a otro; se debe especificar sobre que población se
realizará la inferencia estadística.
UBICACIÓN TEMPORAL:
Al igual que en el criterio espacial, se requiere especificarlo cuando el
fenómeno varía según el tiempo. En los estudios descriptivos sobre
poblaciones infinitas o desconocidas habitualmente se encuentra
relacionado con el muestreo accidental.
BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
HIPÓTESIS METODOLÓGICAS
Definición:
Son conjeturas que plantea el investigador; afirmaciones aun no demostradas y que
nacen de la experiencia (David Hume: empirismo) o de la deducción luego del análisis de
los antecedentes investigativos (René Descartes: racionalismo). Deben referirse a una
situación real, en términos comprensibles, precisos, concretos y deben estar
relacionadas con técnicas disponibles para probarlas.
Estructura:
Fundamento: Es lo que nos lleva a sostener la hipótesis planteada. Las hipótesis
relacionales carecen de fundamento porque nacen de la subjetividad de una observación;
mientras que las hipótesis explicativas se fundamentan en los antecedentes
investigativos.
Deducción: Es la hipótesis misma, denominada hipótesis del investigador;
estadísticamente es la hipótesis alterna y se debe someter a contraste. Cuando se la
plantea en forma de interrogante es la que da respuesta al enunciado.
Hipótesis según el nivel Investigativo:
Descriptiva: Los estudios descriptivos no suelen contener hipótesis, así como tampoco
los estudios exploratorios; porque no se puede presuponer sobre algo que apenas se
comienza a conocer. En estos casos lo que si procede, es trabajar con objetivos
descriptivos debidamente declarados. Su función es precisamente generar hipótesis.
Relacional: Las hipótesis relacionales o empíricas son afirmaciones respecto a las
relaciones entre dos o más variables sin fundamento, porque nacen de la observación y
la experiencia, siempre deben estar sujetas a comprobación empírica. Solamente buscan
concordancia entre hechos y generan la necesidad de plantear hipótesis explicativas.
Explicativa: Las hipótesis explicativas o racionales son consideradas como explicaciones
tentativas respecto al problema planteado. Cumple su función sólo si está relacionada
con el conocimiento existente; nacen del razonamiento por analogía (Bradford Hill). Sin
antecedentes investigativos no es posible plantear hipótesis explicativas.
Pág. 10 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
HIPÓTESIS ESTADÍSTICAS
(De trabajo)
Ho: Hipótesis Nulas: Es la hipótesis de trabajo.
Niegan lo que afirman las hipótesis de investigación y existen tantas hipótesis nulas
como hipótesis de investigación. Es a la Nula a la que se le rechaza o no se le rechaza:
Si el p-valor es menor a 0.05; rechazamos Ho por lo tanto concluimos en que hipótesis
alterna es verdadera.
Si el p-valor no es menor a 0.05; no rechazamos Ho; sin embargo esto no significa que
debemos aceptarla; sino que, simplemente no hemos podido rechazarla.
H1: Hipótesis Alternas: Es la hipótesis del investigador.
Esta hipótesis se da por verdadera cuando rechazamos la hipótesis de trabajo (Ho) o
cuando por alguna razón no podemos aceptar la nula.
En el ritual de la significancia, procedemos a establecer las hipótesis estadísticas
comenzando por al del investigador (H1) y luego la Nula (Ho); para proceder a trabajar
con la Nula. El investigador procede a rechazar la Nula (Ho); para quedarse con la
Alterna (H1), que es su planteamiento original; siendo que puede cometer un, entonces
la estadística consiste en calcular ese error al tomar tal decisión. Ese es el p-valor
Hipótesis estadísticas
De estimación: Del valor de una o varias variables que se van a observar en un
contexto. Señalan la presencia de cierto hecho o fenómeno.
De correlación: El cambio de una variable va acompañado de un cambio en otra
correspondiente. Puede ser una correlación simple o múltiple. El orden en que se
coloquen las variables no es importante, no hay una relación de causa-efecto; por lo
mismo, no se habla de variables dependientes e independientes.
De Diferencias: Dirigidas a comparar grupos y puede ser simple si no determina a cuál
grupo favorece la diferencia o direccional en el caso contrario. Pueden ser parte de
estudios relacionales si se limitan a establecer la diferencia, pero si además pretenden
explicar el por qué de la diferencia, son hipótesis de estudios explicativos.
De Causalidad: Buscan demostrar la relación de causalidad entre la variable
independiente y dependiente; teniendo en cuenta que la existencia de una correlación no
necesariamente establece una relación de causalidad; no se puede plantear una de estas
hipótesis si no se ha realizado el control metodológico; caso contrario se debe realizar el
control estadístico y plantearse una hipótesis con variables intervinientes.
BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
OBJETIVO ESTADÍSTICO
Uno de los criterios más importantes a la hora de escoger el estadístico de prueba, se
encuentra intrínsecamente relacionado al nivel investigativo; en esta pastilla se ha
omitido intencionalmente el objetivo estadístico comparar por ser el mas usado y
encontrarse en todos los niveles merece una mención aparte.
1. A nivel descriptivo
� Estimar: Usado frecuentemente para la estimación puntual de un parámetro y
los intervalos de confianza del mismo.
� Determinar. Cuando buscamos en obtener el resultado de una variable
subyacente o constructo y utilizamos un instrumento documental.
� Describir: Para las variables que no son de estudio y que no involucra la
utilización de instrumentos pues se tratan de variables unidimensionales o
directas.
2. A nivel relacional
� Asociar: Plantea que dos sucesos ocurren de manera simultánea en repetidas
ocasiones y que tal concurrencia no puede atribuirse al azar.
� Concordar: Sucesos concurrentes que corresponden a diferentes observadores
o al mismo observador pero con diferentes instrumentos.
� Correlacionar: Plantea que en un mismo individuo las unidades de una de sus
variables se correlaciona con otra diferente.
3. A nivel explicativo
� Evidenciar: Propio de los estudios observacionales donde el análisis
estratificado busca descartar asociaciones aleatorias, casuales o espurias.
� Demostrar: Cuando el origen de los datos corresponde a un experimento,
pretendemos demostrar algo que hemos evidenciado observacionalmente.
� Probar: Luego de haber demostrado mediante un estudio experimental se
tiene que repetir para probar consistencia o coherencia (Bradford Hill 1965)
4. A nivel predictivo
� Predecir: Calcular la probabilidad de ocurrencia de un suceso en una serie de
eventos por consecuencia la variable a predecir es dicotómica.
� Pronosticar: Calcular la probabilidad de ocurrencia de un suceso en función al
tiempo por consecuencia la variable pronosticada es numérica.
� Preveer: Calcular la probabilidad de necesitar, disponer o preparar medios
contra futuras contingencias.
Pág. 12 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
RITUAL DE LA SIGNIFICANCIA ESTADÍSTICA
1. Formulación de Hipótesis
Consiste en traducir la hipótesis metodológica en una hipótesis estadística de acuerdo al
siguiente sistema:
Ho: Hipótesis nula ó hipótesis de trabajo
H1: Hipótesis alterna ó hipótesis del investigador
El primer paso es colocar la hipótesis del investigador como Hipótesis Alterna (H1) y
formular la Hipótesis Nula (Ho) que viene a ser la negación de la alterna. Se precisa este
artificio porque es a la Hipótesis Nula a la que se le somete a contraste.
2. Establecer el nivel de significancia.
El nivel de significancia denotado por la letra griega alfa es la probabilidad de rechazar la
hipótesis nula cuando es verdadera a lo cual se le denomina error de tipo I, Según
Fisher, el nivel de significación estadística equivale a la magnitud del error que se está
dispuesto a correr de rechazar una hipótesis nula verdadera. Para la mayoría de los
propósitos, el nivel de significación previamente establecido suele ser de 0.05.
3. Elección de la prueba estadística.
El estadístico de prueba elegido está intrínsecamente relacionado con el objetivo
estadístico correspondiente para su nivel investigativo; para esto debemos considerar la
naturaleza de las variables y el comportamiento de los datos que corresponde a su
distribución para los de naturaleza cuantitativa y las frecuencias esperadas para los de
naturaleza cualitativa.
4. Toma de la decisión
Luego de desarrollar la prueba estadística elegida se toma una decisión en función a la
regla previamente establecida según las que se acepta o se rechaza la hipótesis nula
para lo cual es imprescindible determinar el Valor critico, que es un número que divide la
región de aceptación y la región de rechazo, según el valor de la probabilidad que se
haya adoptado como nivel de significación estadística.
5. Interpretación del p-valor.
Este último paso en el ritual de la significancia estadística no fue planteado originalmente
por Fisher, pero cobra vital importancia con la aparición de los software estadísticos que
nos calculan directamente el p-valor, el cual cuantifica el error tipo I y nos ayuda a tomar
una decisión de rechazo a la hipótesis nula (Ho) cuando es menor al nivel de significancia
y de no rechazo cuando su valor es mayor al alfa planteado.
BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
NIVEL DE SIGNIFICANCIA
Al plantear un estudio sobre una población, idealmente debemos estudiar a todos los
individuos que la conforman; pero no siempre podemos acceder a todos, entonces
tenemos que escoger una muestra; sin embargo los resultados obtenidos de esta manera
nunca serán exactamente iguales, a los que se obtendrían de estudiar a toda la
población; es decir, siempre va a haber un margen de error.
Nivel de Significancia. Antes de realizar el estudio debemos plantearnos; que
proporción de error estamos dispuestos a aceptar para dar por válido nuestro. El error es
el objetivo principal del estudio. El análisis estadístico consiste en calcular la probabilidad
de cometer este error y esperamos que sea menor al planteado preliminarmente como
nivel significancia.
Nivel de confianza. Es la confianza que debemos alcanzar para generalizar el resultado
de una muestra hacia toda la población. Es el complemento del nivel de significancia; es
la confianza que tenemos, de que la conclusión a la que hemos llegado es cierta. Una
probabilidad elevada nos da la tranquilidad de que lo que hemos calculado es cercano a
lo real y no debida al azar
Niveles convenidos:
a) α = 5%. Existe 5% (0.05) de probabilidad de equivocarse y 95% (0.95) de confianza.
b) α = 1%. Existe 1% (0.01) de probabilidad de equivocarse y 99% (0.99) de confianza.
Definición de términos.
El error tipo I: Ocurre cuando afirmamos la hipótesis del investigador, siendo que es
falsa. Por lo tanto, es un juicio de valor equivocado.
El p-valor: Es la probabilidad de equivocarse al aceptar nuestra hipótesis del
investigador como verdadera; es decir la probabilidad de cometer un error tipo I.
El nivel de significancia: Es la máxima probabilidad de error que estamos dispuestos
aceptar para dar como válida nuestra hipótesis del investigador.
Pág. 14 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
OBJETIVO ESTADÍSTICO
NIVEL INVESTIGATIVO RELACIONAL: VAR CATEGÓRICA
1. COMPARAR (Grupos): Es el objetivo estadístico más básico del análisis bivariado; aunque
algunos autores piensan que es univariado, porque habitualmente involucra un solo evento
aleatorio (diseños ecológicos), donde los grupos se construyen previamente a la ejecución del
estudio; Sin embargo, su análisis involucra a dos variables y por ello corresponde al nivel
investigativo relacional. Su finalidad es identificar las diferencias entre los grupos participantes.
La prueba de hipótesis se realiza con el estadístico: Chi cuadrado de Homogeneidad.
Ho: Las proporciones de los grupos no son diferentes.
H1: Las proporciones de los grupos son diferentes.
2. COMPARAR (Antes-Después): Es la comparación de un mismo grupo antes y después de una
intervención o de un acontecimiento; la idea de hacer dos medidas sobre el mismo grupo, es
verificar los cambios producidos entre una medida y otra; donde las variaciones pueden
adjudicarse a la intervención o al periodo de seguimiento; por ello corresponden a estudios
longitudinales. Estas comparaciones siempre son de individuo a individuo.
La prueba de hipótesis se realiza con el estadístico: Chi cuadrado de Mc Nemar.
Ho: No existe diferencia entre las dos medidas.
H1: Existe diferencia entre las dos medidas.
3. ASOCIAR (Categorías): Solamente la comparación de una variable dicotómica en dos grupos
nos puede llevar a la asociación; y aunque se puede identificar en las tablas 2 x 2, debemos
hacer una medida asociación. Para asociar hay que definir los factores de interés en ambas
variables; y es que habitualmente la asociación involucra dos eventos aleatorios. Desde el punto
de vista epidemiológico tenemos dos medidas de asociación relevantes: Riesgo Relativo y el
Odds Ratio.
La prueba de hipótesis se realiza con el estadístico: Chi cuadrado de Independencia.
Ho: Existe independencia entre los dos eventos (variables).
H1: Existe dependencia entre los dos eventos (variables).
4. CONCORDAR: Es una medida de acuerdo entre dos observaciones donde el requisito
fundamental es que se trata de un solo grupo y los resultados de la observación tienen las
mismas opciones. Tenemos dos casos frecuentes: Cuando las observaciones corresponde a
diferentes observadores y cuando las observaciones corresponden a diferentes instrumentos. En
este caso el estadístico, es también un índice de concordancia.
La prueba de hipótesis se realiza con el estadístico: Índice Kappa de Cohen.
Ho: No existe concordancia entre las dos observaciones.
H1: Existe concordancia entre las dos observaciones.
BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
OBJETIVO ESTADÍSTICO
NIVEL INVESTIGATIVO RELACIONAL: VAR NUMÉRICA
1. COMPARAR (Grupos): Su finalidad es identificar las diferencias entre los grupos participantes;
se puede comparar dos o más grupos y habitualmente estos grupos se construyen en la etapa
de planificación del estudio. La comparación inicial es a dos colas; pero debe complementarse
con un test de una sola cola. Cuando se comparan mas de dos grupos, debe realizarse una
prueba post Hoc, con la finalidad de detectarse diferencias entre cada uno de los grupos.
La prueba de hipótesis se realiza con el estadístico: t de Student para muestras independientes.
Ho: Los promedios de los grupos no son diferentes.
H1: Los promedios de los grupos son diferentes.
2. COMPARAR (Antes-Después): Siempre corresponde a estudios individuales, es la
comparación de un mismo grupo antes y después de una intervención o de un acontecimiento; la
idea de hacer dos medidas sobre el mismo grupo, es detectar cambios entre una medida y otra;
donde las variaciones pueden adjudicarse a la intervención o al periodo de seguimiento; por ello
corresponden a estudios longitudinales. La hipótesis habitualmente es de una sola cola.
La prueba de hipótesis se realiza con el estadístico: t de Student para muestras relacionadas.
Ho: No existe variación entre las medidas antes y después de la intervención.
H1: Existe variación entre las medidas antes y después de la intervención.
3. CORRELACIONAR (Unidades): Se puede correlacionar las unidades de dos variables, incluso
de diferente dimensión, para ello hay que definir las unidades en ambas variables; que
habitualmente esta involucra dos eventos aleatorios. La correlación puede significar el primer
paso para la asociación, muy útil cuando se realiza minería de datos. Ejm.: Correlacionar los
niveles séricos de sodio con los valores de presión arterial en un grupo de pacientes
hospitalizados.
La prueba de hipótesis se realiza con el estadístico: Correlación R de Pearson.
Ho: Existe independencia entre las dos variables.
H1: Existe dependencia entre las dos variables.
4. CORRELACIONAR (Como valor predictivo): Aquí se tiene por descontado la presencia de
correlación; por lo que su fin es medir el grado de correlación. Desde el punto de vista de la
evaluación de pruebas diagnósticas se utiliza la correlación para evaluar el valor predictivo de
una variable sobre la otra. Ejm. Hallar el valor predictivo del ponderado fetal recién nacidos a
término. En general para la validación de instrumentos se puede utilizar para calcular el Alfa de
Cronbach: Correlación Ítem-Total
La prueba estadística es el Índice Correlación R de Pearson ó el R2
Ho: No existe correlación entre las dos medidas.
H1: Existe correlación entre las dos medidas.
Pág. 16 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
OBJETIVO COMPARATIVO
1. EXPLORATORIO.
Aquí agrupamos a las comparaciones sin métodos estadísticos, siendo que la investigación cualitativa no hace uso de las herramientas estadísticas, el principal diseño encontrado aquí son las comparaciones múltiples enmarcadas en los diseños comunitarios o ecológicos. Como ejemplo podemos mencionar la comparación de las costumbres a la hora del parto en la Región Quechua y Aymara. Comparación por juicio de expertos en la validación cualitativa de un instrumento. La comparación cualitativa es una opinión.
2. DESCRIPTIVO.
Las comparaciones descriptivas ocurren cuando evaluamos dos poblaciones en los estudios comunitarios o ecológicos, en este caso no se requiere aplicar pruebas estadísticas puesto que precisamente estamos estudiando a la población y no hay inferencia estadística. La comparación del rendimiento académico de dos estudiantes al momento de la graduación tampoco requiere de pruebas de hipótesis sino solamente de ver quién es el que tiene el mayor promedio. El objetivo estadístico describir según las variables epidemiológicas es el primer punto de partida para la verdadera comparación.
3. RELACIONAL.
Recordemos que el contraste de independencia entre dos variables responde a tres modelos matemáticos: modelo con los totales marginales de ambos factores fijos (modelo I), modelo con los totales marginales de uno de los factores fijos (modelo II), y el modelo con el total muestral fijo (modelo III); pues bien el objetivo comparativo a nivel bivariado (nivel relacional) corresponde al modelo II con un factor fijo y uno aleatorio. Dependiendo de la naturaleza de la variable se elegirá un determinado estadístico. La comparación puede ser de grupos independientes o de muestras relacionadas.
4. EXPLICATIVO.
La finalidad de este nivel es descartar asociaciones aleatorias, casuales o espurias sobre todo cuando hacemos análisis comparativo estratificado cuando queremos realizar el control estadístico en un estudio observacional, ésta es la función del test de Mantel-Haenszel. A nivel experimental podemos plantear objetivos comparativos de grupo aleatorizados; como por ejemplo comparar el efecto sobre la variable efecto en el grupo experimental y el grupo blanco, hablando de estudios epidemiológicos. Dentro de los experimentos verdaderos la factorización de las causas también corresponde al objetivo comparativo
5. PREDICTIVO:
Podemos comparar el valor predictivo de dos procedimientos diagnósticos o de dos formas de evaluar una variable predictiva; por ejemplo podemos comparar la eficiencia diagnóstica de dos métodos de detección de una enfermedad. En otro momento podemos comparar el pronóstico de la enfermedad o del tiempo de supervivencia de dos tratamientos en pacientes con cáncer. Incluso hay técnicas comparativas para el análisis de supervivencia de Kaplan-Meier.
BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
TÉCNICAS DE RECOLECCIÓN DE DATOS
No es lo mismo que registro de datos
1. Documentación
Constituye la técnica de recolección de datos más básica y a la vez la más inexacta;
sin embargo en ocasiones es la única disponible para recopilar la información;
Habitualmente la información fue recolectada con fines distintos al estudio en curso;
por ello los estudios realizados con esta técnica siempre son retrospectivos. Ejm.
Análisis de contenido
2. Observación:
La observación científica se caracteriza por ser sistemática, controlada y con
mecanismos destinados a evitar errores de subjetividad, confusiones, etc. Es una
observación simple cuando no perturba la acción o situación que se está
investigando. Por otro lado la observación participante puede ser natural cuando el
observador pertenece al conjunto humano que investiga y artificial, cuando la
integración del observador al grupo se hace con el objeto de desarrollar un trabajo
de investigación. La experimentación es una observación participante artificial.
3. Entrevista
Consiste en una interacción entre dos personas, una de las cuales -el investigador-
formula determinadas preguntas relativas al tema en investigación, mientras la otra
-el investigado- proporciona la información que le es solicitada. La entrevista puede
ser estructuradas y no estructurada; en la investigación cuantitativa se apoya en un
cuestionario al cual se le denomina heteroadministrado.
4. Encuesta
La palabra "encuesta" se usa más frecuentemente para describir un método de
obtener información de una muestra de individuos. Esta "muestra" es usualmente
sólo una fracción de la población bajo estudio. Cuando se aplica al total de la
población se llama censo y siempre es parametrada. Se apoya en un cuestionario
que casi siempre es autoadministrado. La ventaja principal de tal procedimiento
radica en la gran economía de tiempo y personal que implica, ya que los
cuestionarios pueden enviarse por correo, dejarse en algún lugar apropiado, o
pueden administrarse a grupos reunidos al efecto.
5. Psicometría
Los test psicológicos emplean una gran variedad de técnicas específicas, que se
combinan según los objetivos deseados. Una gran proporción de ellos acude a la
formulación de preguntas ya anotadas en algún cuestionario apropiado, que es el
test mismo, y que se autoadministra.
Pág. 18 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
INSTRUMENTOS DE MEDICIÓN
1. Instrumentos lógicos o Documentales: Subjetivos
Cuestionario. Los términos cuestionarios e inventarios se suelen utilizar como
sinónimos a pesar de que hay diferencias marcadas en la forma de su presentación.
Un cuestionario supone un conjunto de preguntas que el sujeto tiene que responder
a fin de evaluar alguna capacidad, generalmente cognitiva, lo cual debe ser
calificado por el evaluador.
Como ejemplo podemos citar a los exámenes para evaluar rendimiento académico
Escalas. Los evaluados indican su acuerdo o desacuerdo con una serie de
afirmaciones sobre el objeto en estudio. Por lo general, arrojan una calificación total
que indica la dirección e intensidad de la actitud del individuo hacia una categoría de
estímulos, por lo que las escalas requieren de una respuesta ordinal o de intervalo.
Se han elaborado procedimientos especiales para alcanzar la unidimensionalidad o
homogeneidad de los reactivos, la igualdad de las distancias entre las unidades de la
escala y la comparabilidad de las calificaciones.
El ejemplo más básico es la escala visual análoga.
Inventario. Conjunto de frases o palabras a las que el sujeto tiene que responder
eligiendo o marcando su posición ante ellas (por ejemplo, al ítem “Me gustan las
revistas de mecánica, decoración o computadoras”, notemos que ninguna respuesta
es calificada como correcta e incorrecta.
Los inventarios cuentan con distintas posibilidades de respuesta
Por ejemplo un test de inteligencias múltiples puede indicarnos inteligencia: Lingüística,
Lógicomatemática, Musical, Naturalista, etc.
2. Mecánicos: Objetivos
Las técnicas objetivas hacen referencia a aquellas tareas o procedimientos
estructurados que recogen las respuestas de un participante, respuestas que no
pueden ser modificadas en la dirección deseada y cuya puntuación es independiente
de la persona que evalúa.
Las medidas que realizan mediante este método son por ejemplo las mediciones
fisiológicas.
Los instrumentos de evaluación cognitiva son aquellos instrumentos o aparatos que
sirven para evaluar características cognitivas que se consideran observables (por
ejemplo, el tiempo de reacción). La imagen más habitual de estas técnicas es la de
una persona sentada frente a la pantalla de un ordenador que espera con atención la
aparición de una serie de estímulos para apretar rápidamente un botón o una
palanca.
BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
SESGOS DE SELECCIÓN
1. Sesgo de prevalencia o incidencia (de Neymann):
Se produce cuando la condición en estudio determina pérdida prematura
por fallecimiento de los sujetos afectados por ella. La exclusión de los
pacientes que fallecen determina este tipo de sesgo. Por ejemplo la
duración del tratamiento del cáncer en nuestro medio es corto porque se
diagnostican en estadios avanzados.
2. Sesgo de admisión (de Berkson).
En un estudio relacional ocurre cuando hay una mala selección del grupo de
estudio y/o control. Ejm. cuando asociamos el hábito de fumar al cáncer
broncogénico; los pacientes con diagnóstico de Ca ya han dejado de fumar;
por lo que se observará menor frecuencia de fumadores en pacientes con
este tipo de cáncer.
3. Sesgo de no respuesta o efecto del voluntario.
El grado de interés o motivación que pueda tener un individuo que participa
voluntariamente en una investigación puede diferir sensiblemente en
relación con otros sujetos. Igualmente, la negativa de algunos sujetos para
ser incluidos en un estudio puede estar dada por motivaciones sistemáticas
experimentadas por ellos.
4. Sesgo de pertenencia (membresía)
Se produce cuando entre los sujetos evaluados se presentan subgrupos de
sujetos que comparten algún atributo en particular, relacionado positiva o
negativamente con la variable en estudio. Ejemplo: Nivel de conocimientos
sobre signos de alarma en las gestantes debe excluir a las gestantes que
son profesionales de la salud.
5. Sesgo del procedimiento de selección
Puede observarse en diseños de investigación experimentales (ensayos
clínicos controlados), en los cuales no se respeta el principio de aleatoriedad
en la asignación a los grupos de experimentación y de estudio. En los pre-
experimentos la administración del medicamento responde a las
necesidades terapéuticas del paciente y no a la del investigador.
Pág. 20 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
SESGOS DE MEDICIÓN
1. Sesgo de procedimientos
Ocasionalmente el grupo que presenta la variable dependiente resulta ser
más interesante para el investigador que el grupo que participa como
control. Por esta circunstancia, en el procedimiento de observación suele ser
mas detenido. En el caso de un estudio en el que exista intervención, el
sujeto del grupo experimental puede verse beneficiado con una mayor
acuciosidad en la observación.
2. Sesgo de memoria o de información
Frecuente de observar en estudios retrospectivos, en los cuales se pregunta
por antecedente de exposición a determinadas circunstancias en diferentes
períodos de la vida, existiendo la posibilidad de olvido. Por ejemplo,
exposiciones inadvertidas a diversos factores y que pueden afectar la
medición ya sea por su omisión absoluta o en la determinación de niveles
de exposición.
3. Sesgo por falta de sensibilidad de un instrumento.
Si no se cuenta con adecuados métodos de recolección de la información, es
posible que la sensibilidad de los instrumentos empleados en tales
mediciones carezca de la sensibilidad necesaria para poder detectar la
presencia de la variable en estudio. Una consecuencia es que encontremos
una frecuencia de la enfermedad inferior a la real.
4. Sesgo de detección
Su ocurrencia se explica por la introducción de metodologías diagnósticas
diferentes a las inicialmente utilizadas al comienzo de un estudio. Es
conocido que no existe coincidencia absoluta entre dos instrumentos de
medición; por ello los estudios deben realizarse con un solo instrumento y
un solo observador.
5. Sesgo de adaptación
En los estudios de intervención (experimentales), a veces los cuales
individuos asignados inicialmente a un grupo deciden migrar de grupo por
preferir un tipo de intervención por sobre otro. En un ensayo clínico
controlado la ocurrencia de este tipo de sesgo se neutraliza mediante la
asignación aleatoria de los sujetos y por la presencia del llamado "doble
ciego”.
BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
EL COEFICIENTE DE CORRELACION La correlación es una prueba de hipótesis que debe ser sometida a contraste y el coeficiente de correlación cuantifica la correlación entre dos variables, cuando ésta existe. El coeficiente r de Pearson, por ser una prueba paramétrica requiere de variables numéricas con distribución normal; mientras que el coeficiente de correlación no paramétrica rho de Spearman acepta variables de libre distribución e incluso ordinales. INTERPRETACIÓN El coeficiente correlación varía entre 0 y 1, pudiendo ser positivo o negativo. El valor numérico indica la magnitud de la correlación.
Sin correlación 0.0
0.2
0.4
0.6
0.8
Correlación perfecta
1.0
Correlación
mínima Correlación
baja Correlación moderada
Correlación buena
Correlación muy buena
El signo indica la dirección de la correlación Correlación directa (+) Signo positivo � “a mayor X, mayor Y” ó � “a menor X, menor Y”
Correlación inversa (-) Signo negativo � “a mayor X, menor Y” ó � “a menor X, mayor Y”
Significancia estadística Solo interpretamos el coeficiente si “p” es menor de 0.05, (Nivel de significancia). Se puede indicar la significancia así: r = 0.48 (p<0.05). Coeficiente de determinación Cuando el coeficiente se eleva al cuadrado (r2), asume varias interpretaciones Por ejemplo. La correlación entre “El ponderado fetal” y “El Peso al nacer” es de 0.80. r = 0.80 r2 = 0.64
Pág. 22 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
VALIDEZ DE UN ESTUDIO
Desde la revolución científica ocurrida en el renacimiento en el siglo XV hasta nuestros
días, el hombre se ha valido de la investigación científica para identificar las causas de
las enfermedades o las mejores formas de tratarlas.
Este elemento es parte integral del paradigma conocido como la Medicina Basada en la
Evidencia. Este paradigma postula que las decisiones médicas deben basarse en la mejor
evidencia científica disponible, adaptada al caso individual del paciente mediante la
experiencia clínica.
3. La validez interna
Es la credibilidad de sus resultados, o dicho de otra manera la capacidad de
demostrar o refutar la hipótesis propuesta. Es máxima cuando el estudio carece de
sesgos. En términos generales, los sesgos que afectan la validez interna surgen
siempre que los grupos estudiados difieren en más características que la exposición.
Por ejemplo, si se está estudiando la frecuencia de infarto de miocardio en un grupo
de sujetos obesos o de peso normal, cualquier diferencia en la edad de los grupos
podría afectar la relación entre la obesidad y la ocurrencia de infarto de miocardio.
Asimismo, existe sesgo siempre que los grupos de sujetos no son evaluados de la
misma manera.
4. La validez externa
La aplicabilidad de los resultados del estudio se relaciona con la validez externa del
estudio.
En muchas ocasiones el universo e incluso el marco muestral es demasiado grande
como para ser estudiado e incluso muestreado; es estos casos se realiza el estudio
en una porción deliberada de la población; teniendo en cuenta que el conglomerado
seleccionado es lo suficientemente homogéneo con el resto de la población; los
resultados encontrados en este grupo podrán ser extrapolados a la población objeto
del estudio.
Por ejemplo si tratamos de conocer la satisfacción de la atención en los pacientes de
un servicio de salud; bastará con estudiar a los pacientes que acudan durante un
mes a dicho servicio; otro ejemplo más claro es cuando tomamos una muestra de
sangre con la finalidad de conocer concentración de gases y asumimos que lo
encontrado en 10 mililitros corresponde a los 5 litros de sistema circulatorio.
BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
CONTROL DE UN ESTUDIO
6. CONTROL METODOLÓGICO
a. Sesgo de selección
Se produce cuando la condición en estudio determina pérdida prematura
por fallecimiento de los sujetos afectados por ella. La exclusión de los
pacientes que fallecen determina este tipo de sesgo.
• Criterios de inclusión
• Criterios de exclusión
b. Sesgo de medición
Por ejemplo la duración del tratamiento del cáncer en nuestro medio es
corto porque se diagnostican en estadios avanzados.
• Validación de instrumentos
• Calibración de instrumentos
7. CONTROL ESTADÍSTICO
a. Análisis estratificado
Se produce cuando la condición en estudio determina pérdida prematura
por fallecimiento de los sujetos afectados por ella. La exclusión de los
pacientes que fallecen determina este tipo de sesgo.
• Categóricos: Chi cuadrado de Mantel-Haenszel
• Numéricas: ANOVA Factorial
b. Análisis multivariado
Por ejemplo la duración del tratamiento del cáncer en nuestro medio es
corto porque se diagnostican en estadios avanzados.
• Categóricos: Regresión logística
• Numéricas: Regresión lineal múltiple
Pág. 24 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN
Medidas de resumen para variables numéricas
MEDIDAS DE TENDENCIA CENTRAL
Media: Media aritmética, es la que se obtiene sumando los datos y dividiéndolos
por el número de ellos. Se aplica por ejemplo para resumir el número de
pacientes promedio que se atiende en un turno. Otro ejemplo, es el número
promedio de controles prenatales que tiene una gestante.
Mediana: Corresponde al percentil 50%. Es decir, la mediana Divide a la
población exactamente en dos. Por ejemplo el número mediana de hijos en el
centro de salud “X” es dos hijos. Otro ejemplo es el número medina de
atenciones por paciente en un consultorio.
Moda: Valor o (valores) que aparece(n) con mayor frecuencia. Una distribución
unimodal tiene una sola moda y una distribución bimodal tiene dos. Útil como
medida resumen para las variables nominales. Por ejemplo, el color del uniforme
quirúrgico en sala de operaciones es el verde; por lo tanto es la moda en colores
del uniforme quirúrgico.
MEDIDAS DE DISPERSIÓN
Desviación Estándar: Llamada también desviación típica; Es una medida que
informa sobre la media de distancias que tienen los datos respecto de su media
aritmética, expresada en las mismas unidades que la variable.
La varianza: Es el valor de la desviación estándar al cuadrado; su utilidad radica
en que su valor es requerido para todos los procedimientos estadístico.
Error típico: Llamado también error estándar de la media. Se refiere a una
medida de variabilidad de la media; sirve para calcular cuan dispersa estaría la
media de realizar un nuevo cálculo.
BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
MEDIDAS DE POSICIÓN Y DE FORMA
MEDIDAS DE POSICIÓN: Cuantiles
Percentiles: Son 99 valores que dividen en cien partes iguales el conjunto de datos
ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las
observaciones, y por encima queda el 85%.
Cuartiles: Son los tres valores que dividen al conjunto de datos ordenados en cuatro
partes iguales, son un caso particular de los percentiles. Se denotan como: Q1 o primer
cuartil, Q2 segundo cuartil (la mediana) y Q3 tercer cuartil.
Deciles: Son los nueve valores que dividen al conjunto de datos ordenados en diez
partes iguales, son también un caso particular de los percentiles.
MEDIDAS DE FORMA
Asimetría: una distribución es simétrica cuando su mediana, su moda y su media
aritmética coinciden. Existen varias medidas de la asimetría de una distribución de
frecuencias. Una de ellas es el Coeficiente de Asimetría de Pearson: Su valor es cero
cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y
negativo cuando existe asimetría a la izquierda.
Asimetría Derecha (+) Simétrica (0) Asimetría Izquierda (-)
Apuntamiento o Curtosis: la curtosis es una medida de la forma que busca cuantificar
la mayor o menor concentración de frecuencias alrededor de la media y en la zona
central de la distribución. Se mide con el coeficiente de apuntamiento o curtosis: Su valor
es cero cuando la distribución es mesocúrtica, positivo cuando es leptocúrtica y negativo
cuando es platicúrtica
Leptocúrtica (+) Mesocurtica (0) Platicurtica (-)
Pág. 26 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
GRÁFICAS UNIVARIABLES
1. Para variables categóricas
a. Diagrama de sectores
Se toma un círculo y se divide en tantos sectores
como categorías tenga nuestra variable, siendo el
arco del círculo proporcional a las frecuencias
absolutas (también lo podemos hacer con las
frecuencias relativas o porcentajes)
Es ideal para variables dicotómicas o politómicas de
menos cuatro o menos categorías.
b. Gráfico de barras
Es una representación bidimensional con las
categorías dispuestas paralelamente de manera
que la extensión de cada barra es proporcional a la
magnitud que se quiere representar.
Es ideal para variables politómicas de o incluso
para variables de categorías no excluyentes.
2. Para variables numéricas
a. Histograma
Se utiliza cuando se estudia una variable continua,
como la edad o la talla y, por comodidad, sus
valores se agrupan en clases, es decir, valores
continuos. En los casos en los que los datos son
cualitativos (no-numéricos), como sexto grado de
acuerdo o nivel de estudios, es preferible un gráfico
de barras.
b. Diagrama de Caja y Bigotes
Gráfico basado en cuartiles, compuesto por un
rectángulo, la "caja", y dos brazos, los "bigotes".
Es un gráfico que suministra información sobre los
valores mínimo y máximo, los cuartiles Q1, Q2 o
mediana y Q3, y sobre la existencia de valores
atípicos y la simetría de la distribución.
BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
ERROR TIPO I Y II
Al establecer un criterio de decisión sobre la hipótesis nula, el investigador puede
ponderar los errores que podría cometer en su decisión sobre la hipótesis nula. Una
primer forma de error (se conoce como el error tipo I) consiste en rechazar una
hipótesis nula verdadera, es decir, descartar el azar como explicación cuando los
resultados podrían explicarse razonablemente con base en el mismo. Este es el error que
comete el investigador que ve más lo que hay en los datos; es decir, el investigador
concluye en que existe una relación real o verdadera entre las variables independiente y
dependiente de la investigación, cuando en realidad la relación observada se puede
explicar razonablemente como resultado del azar.
El llamado error tipo I es el error del investigador que se apresura a concluir a favor de
su hipótesis de investigación. Fisher no habló de ningún otro error, pues la prueba de la
hipótesis nula para él no era otra cosa que un freno a la tendencia natural de un
investigador a creer que hipótesis ha sido confirmada por el simple hecho de que los
resultados de la investigación siguen la misma dirección de la hipótesis. En la estrategia
de Fisher, sólo hay un error posible: rechazar una hipótesis nula verdadera.
Una segunda forma de error (se conoce como el error tipo II), introducida por Egon
Pearson y Jerzy Neyman consiste en no rechazar una hipótesis nula falsa, es decir, no
descartar el azar aun cuando éste no constituye una explicación razonable de los datos.
Este es el error que comete el investigador que ve menos que lo que hay en los datos;
por miedo a rechazar incorrectamente el azar, el investigador puede exponerse al riesgo
de pasar por alto una relación real o verdadera entre las variables de su investigación.
Fueron Pearson y Neyman los que, al introducir un segundo tipo de error, bautizaron
como error tipo uno al error de que había hablado Fisher.
Según Fisher, el nivel de significación estadística equivale a la magnitud del riesgo que
está dispuesto a correr el investigador, de cometer el error de rechazar una hipótesis
nula verdadera (el llamado error tipo I). Para la mayoría de los propósitos, el nivel de
significación previamente establecido suele ser de 0.05, aunque en áreas de
investigación más rigurosas se trabaja con un nivel de significación de 0.01. Suponiendo
que se trabaja con un nivel de significación de 0.05, se rechazaría la hipótesis nula
siempre que la probabilidad de explicar los resultados obtenidos en una investigación
como si fueran obra del azar sea igual o menor que 0.05.
En la perspectiva de Pearson y Neyman, para establecer el nivel de significación
estadística habría que atender al impacto de cada tipo de error en el objetivo del
investigador, y a partir de ahí se decidiría cuál de ellos es preferible minimizar. Pearson y
Neyman llamaron alfa al error tipo I y beta al error tipo II; a partir de este último tipo de
error, introdujeron el concepto de "poder de una prueba estadística", el cual se refiere a
su capacidad para evitar el error tipo II, y está definido por 1-beta, y en estrecha
relación con éste se ha desarrollado el concepto de "tamaño del efecto" que algunos han
Pág. 28 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
POBLACIÓN Y MUESTRA
UNIDAD DE ESTUDIO Conocido también como unidad de análisis, unidad de observación, unidad experimental, o unidad de población, son cada uno de los sujetos u objetos de estudio de la población del que hay que obtener la información. POBLACION Conjunto de todos los casos o grupo de unidades (sujetos u objetos de estudio) con alguna característica común. Las poblaciones deben situarse claramente en torno a sus características de contenido, lugar y tiempo. La delimitación de la población que va ser estudiada y sobre la cual se pretende generalizar los resultados, es un paso importante en una investigación. Si se dispone de una lista de unidades o elementos de muestreo se dice que es conocida; sino se dispone de tal listado se dice que es desconocida. La medición completa de todos los elementos que constituyen la población constituye el censo, mientras que cuando no podemos acceder a ella podemos hacer el análisis de una parte de esta. MUESTRA Una muestra representativa debe tener un tamaño mínimo calculado y responder a una selección parametrada (muestreo probabilístico). Así podemos conocer la parte de una población que debe examinarse con la finalidad de hacer inferencias sobre dicha población. El muestreo otorga una probabilidad conocida de integrar la muestra a cada elemento de la población, y dicha probabilidad no es nula para ningún elemento. Unidad de muestreo: Elementos de la población que se van a estudiar. Cada unidad de estudio pertenece sólo una unidad de muestreo. PARAMETRO Es la medida estadística que describe un determinado aspecto de una población. Los parámetros más usuales en una investigaron son: La media poblacional (µ), la varianza poblacional (s). ESTADIGRAFO Es la media estadística que describe un determinado aspecto de una muestra. Así, la media muestral (x), la varianza muestral (σ), etc., son estadígrafos porque se calculan para una muestra. “Un parámetro es una constante, mientras que un estadígrafo es una variable.”
BIOESTADISTICO.COM ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
MUESTREO PROBABILISTICO
1. Muestreo aleatorio simple
Denominado también muestreo equiprobabilístico, porque si se selecciona una
muestra de tamaño n de una población de N unidades, cada elemento tiene una
probabilidad de inclusión igual y conocida de n/N.
Ventaja: Se desarrolla en software porque se basa en la teoría estadística
Desventaja: Precisa un marco muestral o listado de todas las unidades
2. Muestreo sistemático
Para determinar una muestra de tamaño n conseguimos una lista de N elementos,
definimos un intervalo de salto k=N/n y elegimos un número aleatorio entre 1 y k
con el que comenzamos la selección de la muestra.
Ventaja: No es necesario tener un marco muéstralo listado de unidades.
Desventaja: La constante podría asociarse con el fenómeno de interés
3. Muestreo aleatorio estratificado
Como el azar no es una garantía de representatividad, aquí se pretende asegurar la
representación de cada grupo en la muestra. Cuanto más homogéneos sean los
estratos, más precisas resultarán las estimaciones.
Ventaja: La muestra es homogénea en función a la variable involucrada.
Desventaja: Se debe conocer la distribución en la población de la variable utilizada
para la estratificación.
4. Muestreo por conglomerados
Denominado también muestreo por clusters aprovecha se caracterizan porque la
variación en cada grupo es menor que la variación entre grupos lo cual resulta
ventajoso en los estudios comunitarios o poblacionales.
Ventaja: Muy eficiente cuando las unidades están muy dispersas
Desventaja: Requiere un manejo estadístico mas complejo que el resto
Pág. 30 PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
VALIDACIÓN DE TEST PSICOMÉTRICOS
1. Validez de contenido (Juicio de Expertos o validación por jueces) Un instrumento de medición debe contener representados a todos los ítems del dominio de contenido de las variables a medir. Se refiere al grado en que la medición representa al concepto medido. Es decir, que el instrumento debe contener todos los aspectos o ítems del dominio de la variable que se esta midiendo, y se construye de acuerdo con la teoría.
2. Consistencia interna (Alfa de Cronbach) Su valor aumenta cuando las correlaciones ítem – total son altas, por ello, mejores correlaciones, dan mayor fiabilidad al instrumento. Se puede decir también que es un índice de discriminación. El coeficiente de fiabilidad es afectado por la heterogeneidad de los individuos que contestan la prueba; cuanto más heterogéneo es el grupo de encuestados, mayor es el coeficiente de fiabilidad.
3. Validez de constructo (Rotación de Varimax)
El procedimiento consiste en aplicar el instrumento a dos o más grupos y ver si discrimina. Para ello hay que contar con una estructura Factorial del cuestionario. Por ejemplo en los instrumentos para medir variables psicológicas no podemos garantizar la existencia de un constructo psicológico que subyaga y dé sentido y significado a las puntuaciones del test; por lo mismo que no tenemos una prueba patrón.
4. Estabilidad (ANOVA) Se refiere a la confianza que se concede a los datos; requiere de un retest en condiciones similares a la primera evaluación y está relacionada con la estabilidad o constancia test-retest. Se trata de ver hasta que punto un conjunto de medidas son reproducibles en el tiempo, el grado en que las puntuaciones son estables sería el grado de fiabilidad. Por ello es sinónimo de estabilidad.
5. Punto de corte (Curvas ROC). Habitualmente requerimos que el instrumento nos conduzca a una decisión dicotómica (positivo-negativo) para tratar o no a alguien; Se realizan trazando un diagrama en el que la ordenada es la sensibilidad y la abscisa la especificidad. En este sentido la curva ROC nos muestra en un gráfico todos los pares sensibilidad-especificidad resultantes de la variación continua de los puntos de corte en todo el rango de resultados observados. Las Curvas de Roc optimizan el punto de corte.