capitulo 1 bioestadistica

7
1 1 CAPÍTULO 1 Fundamentos de bioestadística 1.1 INTRODUCCIÓN Los investigadores de las disciplinas relacionadas con la salud utilizan una amplia variedad de herramientas para alcanzar el entendimiento de los fenómenos estudiados. Quizás el más importante de dichos estudios es la bioestadística. Ésta desempeña un papel fundamental en la recolección de análisis de datos en el contexto de experimentos clínicos, así como de estudios en otras áreas como epidemiología, política sanitaria, salud comunitaria y familiar, y salud ambiental y ocupacional. Entonces, ¿qué es la bioestadística? Primero debemos decir que la bioestadística es una de las ramas del extenso campo de la estadística. La estadística es la disciplina interesada en (1) la organización y el resumen de datos, y (2) la obtención de conclusiones acerca de las ca- racterísticas de algún conjunto de personas o cosas, cuando sólo una porción de estas caracte- rísticas está disponible para su estudio. Bioestadística, por lo tanto, es una de las áreas de la estadística que trata principalmente con las ciencias biológicas y las disciplinas relacionadas con la medicina y la salud. De tal forma, este libro se interesa por el estudio de la estadística poniendo énfasis en su aplicación a las ciencias de la salud. Cuando nos aproximamos al estudio de cualquier cuerpo de conocimiento organizado, en especial uno tan diverso y complejo como la bioestadística, es importante identicar un marco de referencia a partir del cual sea posible observar el material. Sin tal estructura organizada, los conceptos que serán aprendidos parecerían al estudiante como temas sin relación alguna, cuyos propósitos se perciben sólo vagamente. Esta situación es tolerable hasta cierto grado. Muchos de los elementos importantes de la bioestadística no pueden ser apreciados en su totalidad sino hasta que se yuxtaponen con otros elementos. Por lo tanto, su papel y utilidad en el gran esquema de la disciplina llegan a ser claros únicamente cuando se ven como parte de un todo. Por fortuna, la bioestadística tiene un marco de estudio bastante natural que ayuda a alige- rar este problema de cierta forma. En un curso de introducción a la bioestadística, la mayor parte de este material se puede estructurar alrededor de los conceptos de poblaciones y mues- tras. Estos conceptos constituyen el fundamento sobre el cual está organizado este libro.

Upload: alejandro-arias-alarcon

Post on 25-Dec-2015

11 views

Category:

Documents


0 download

DESCRIPTION

capitulo 1 bioestadistica R. Clifford Blair

TRANSCRIPT

Page 1: capitulo 1 bioestadistica

11C A P Í T U L O

1

Fundamentos

de bioestadística

1.1 INTRODUCCIÓN

Los investigadores de las disciplinas relacionadas con la salud utilizan una amplia variedad de herramientas para alcanzar el entendimiento de los fenómenos estudiados. Quizás el más importante de dichos estudios es la bioestadística. Ésta desempeña un papel fundamental en la recolección de análisis de datos en el contexto de experimentos clínicos, así como de estudios en otras áreas como epidemiología, política sanitaria, salud comunitaria y familiar, y salud ambiental y ocupacional.

Entonces, ¿qué es la bioestadística? Primero debemos decir que la bioestadística es una de las ramas del extenso campo de la estadística. La estadística es la disciplina interesada en (1) la organización y el resumen de datos, y (2) la obtención de conclusiones acerca de las ca-rac te rís ti cas de algún conjunto de personas o cosas, cuando sólo una porción de estas ca rac te-rís ti cas está disponible para su estudio. Bioestadística, por lo tanto, es una de las áreas de la estadística que trata principalmente con las ciencias biológicas y las disciplinas relacionadas con la medicina y la salud. De tal forma, este libro se interesa por el estudio de la estadística poniendo énfasis en su aplicación a las ciencias de la salud.

Cuando nos aproximamos al estudio de cualquier cuerpo de conocimiento organizado, en especial uno tan diverso y complejo como la bioestadística, es importante identiÞ car un marco de referencia a partir del cual sea posible observar el material. Sin tal estructura organizada, los conceptos que serán aprendidos parecerían al estudiante como temas sin relación alguna, cuyos propósitos se perciben sólo vagamente. Esta situación es tolerable hasta cierto grado. Muchos de los elementos importantes de la bioestadística no pueden ser apreciados en su totalidad sino hasta que se yuxtaponen con otros elementos. Por lo tanto, su papel y utilidad en el gran esquema de la disciplina llegan a ser claros únicamente cuando se ven como parte de un todo.

Por fortuna, la bioestadística tiene un marco de estudio bastante natural que ayuda a ali ge-rar este problema de cierta forma. En un curso de introducción a la bioestadística, la ma yor parte de este material se puede estructurar alrededor de los conceptos de poblaciones y mues-tras. Estos conceptos constituyen el fundamento sobre el cual está organizado este libro.

Page 2: capitulo 1 bioestadistica

2 Capítulo 1 Fundamentos de bioestadística

1.2 POBLACIONES Y MUESTRAS

Quizás usted piense que debido al papel fundamental de las poblaciones en la estadística y la bioestadística, es posible que haya consensos en esta deÞ nición. Por desgracia, éste no es el caso. Compare las siguientes aseveraciones respecto de poblaciones tomadas de dos diferentes textos de estadística.

Una población es un conjunto de personas (u objetos) que tienen una característica observable en común [29].

Observe que la palabra población se reÞ ere a datos, no a personas [36].

Estas dos aseveraciones son claramente desiguales y reß ejan la imprecisión con la que el término se utiliza a menudo. Mucha de la confusión respecto de las poblaciones parte del hecho de que los especialistas en estadística utilizan el término en dos sentidos diferentes. El primero se reÞ ere a que se puede hablar de poblaciones populares, y el segundo de poblaciones estadísticas. Las po bla cio-nes populares están formadas por personas o cosas. Así, es habitual referirnos a la población de personas que habitan en Florida cuya prueba de hepatitis C resultó positiva, o a la población de ve-na dos en una provincia en particular en Michigan, que porta la garrapata responsable de la en fer me-dad de Lyme. Estas poblaciones están claramente conformadas por personas o cosas.

En contraste, las poblaciones estadísticas están conformadas por características de personas o cosas. Para comprender la distinción considere lo siguiente. Una población popular podría estar com pues ta de los estudiantes de alguna universidad. Una población estadística, entonces, po-dría con sis tir en las presiones sanguíneas de estos mismos estudiantes. Asimismo, la población estadística posiblemente esté conformada por un indicador para cada estudiante sobre si ha ex pe-ri men ta do alguna forma de abuso sexual en su vida o sobre su opinión respecto de la calidad de la educación que ha recibido.

Parece, entonces, que el primer autor citado arriba estaba intentando deÞ nir una población popular, mientras que la segunda aseveración estaba orientada a una población estadística. Hay otro problema sobre la segunda deÞ nición que debe ser aclarado. Las poblaciones estadísticas consisten en características de personas o cosas, independientemente de si han sido medidas o no. La palabra datos se reÞ ere al registro de mediciones hechas sobre características. De modo que si las presiones sanguíneas de algunos de los estudiantes o de todos ellos se miden y registran de alguna manera, el resultado son datos. La distinción que se hará aquí es que las poblaciones es ta dís ti cas están conformadas por las características mismas y no por el registro de esas ca rac te-rís ticas.

Cuando tales características toman diferentes valores se conocen como variables. Aunque es posible que una población esté formada por una característica que no varía (es decir, una cons-tan te), esto sería de poco interés en un contexto estadístico y, por lo tanto, no será tratado en este libro. Para nuestros propósitos, los términos “característica” y “variable” se utilizarán de forma indistinta.

Obviamente, los tamaños de las poblaciones pueden variar. En la disciplina de la estadística es útil distinguir entre poblaciones Þ nitas e inÞ nitas, puesto que los métodos usados para tratar cada una diÞ eren un poco. Las poblaciones inÞ nitas pueden ser pensadas como poblaciones gran des, mientras que las poblaciones Þ nitas son más pequeñas. Es evidente que la distinción es ar bi tra ria. Los métodos descritos en este libro son generalmente apropiados para utilizarse con po bla cio nes inÞ nitas.

Una muestra es un subconjunto de una población. Por ejemplo, las presiones sanguíneas de los estudiantes de un determinado grupo en la universidad antes mencionada constituirían una muestra (aunque no una escogida al azar).

Page 3: capitulo 1 bioestadistica

Sección 1.3 Parámetros y estadísticos 3

El concepto de población es a menudo mucho más abstracto de lo que implica la discusión anterior. Por ejemplo, en un ensayo clínico la población podría estar constituida por las presiones sanguíneas de todos los varones con más de 65 años de edad, quienes alguna vez tomarán un nuevo medicamento contra la hipertensión. En estas circunstancias sería imposible enumerar la población, debido a que nadie conoce con exactitud quién tomará el nuevo medicamento y quién no. Por el contrario, la muestra casi siempre se deÞ ne mejor. En un estudio sobre la eÞ cacia del fármaco, el medicamento podría administrarse a 50 hombres con más de 65 años, quienes seguirán el protocolo del estudio. En este caso, la muestra se deÞ ne con facilidad, ya que es posible identiÞ car a las personas que están o no en la muestra.

En un entorno típico para este estudio, los investigadores medirían u observarían las características que conforman la muestra y tendrían que registrarlas como datos. Sin embargo, no sucedería lo mismo con la población. En el caso de una universidad grande, sería impráctico medir las presiones sanguíneas del cuerpo estudiantil entero, pero es absolutamente factible tomar medidas de una muestra de 50 presiones sanguíneas.

En esta sección se ha hecho una clara distinción entre la palabra población cuando se usa en un sentido popular y cuando se usa en un sentido estadístico. En los libros de estadística esta distinción comúnmente desaparece. No es raro leer: “Se utilizó una muestra de 50 sujetos en el estudio”. Es obvio que esta muestra fue tomada de una población de personas, lo cual implica que el término se utiliza en sentido popular. Usted también encontrará expresiones como: “La me dia de la muestra es 121”. Aquí, la muestra se reÞ ere a una población estadística. Al igual que en la generalidad de los textos de estadística, en este libro usted encontrará ambos usos de la pala-bra. En la mayoría de los casos, el contexto dejará en claro el signiÞ cado. Una vez comprendida la diferencia entre los signiÞ cados estadístico y popular de la palabra “población” se evita una fuen te potencial de confusión para los estudiantes novatos de estadística.

1.3 PARÁMETROS Y ESTADÍSTICOS

Los conceptos de parámetros y estadísticos están relacionados de manera muy estrecha con los de poblaciones y muestras. Un parámetro se deÞ ne como cualquier resumen de los elemen-tos de una población, mientras que el resumen de los elementos de una muestra se conoce como estadístico. (No hay que confundir la palabra “estadístico” cuando se emplea en este sentido, con “estadística”, que se utiliza para referirse a la disciplina de estudio. De nuevo, el contexto ge ne-ral men te aclarará el signiÞ cado). De acuerdo con estas deÞ niciones, entonces, el promedio de las presiones sanguíneas de todos los estudiantes de la universidad mencionada sería un parámetro, mientras que el promedio de las presiones sanguíneas de los estudiantes de un grupo en particular de esa universidad sería un estadístico. Asimismo, la mediana de las presiones sanguíneas de todos los hombres por arriba de 65 años de edad, que alguna vez tomarán el medicamento contra la hipertensión, sería un parámetro; mientras que la mediana de las presiones sanguíneas de los 50 hombres que participaron en el estudio sería un estadístico. Observe que para obtener el valor de un parámetro o de un estadístico, se deben medir u observar los elementos de la población o muestra correspondiente, registrar estas medidas y observaciones en forma de datos, y después realizar el resumen de tales datos.

Un punto importante que se deduce de lo mencionado arriba es que los valores de los pa-rámetros generalmente no están disponibles para el investigador, mientras que los valores de los estadísticos son fácilmente localizables. Gran parte del material de este libro se relaciona con este hecho.

La distinción entre parámetros y estadísticos es tan fundamental para el pensamiento estadístico, que generalmente se utilizan dos convenciones diferentes para su representación. En

Page 4: capitulo 1 bioestadistica

4 Capítulo 1 Fundamentos de bioestadística

la primera, los parámetros se representan con letras griegas, mientras que los estadísticos se representan con el alfabeto romano o algunos de sus caracteres. Por ejemplo, el promedio (o media) de una población a menudo se designa con la letra griega m (pronunciada “mu”) mientras que el mismo resumen de datos de una muestra se representa mediante x– (“x barra”). Una segunda con ven ción representa los parámetros con letras mayúsculas del alfabeto romano y coloca un carácter, llamado “sombrero”, sobre la(s) misma(s) letra(s) para representar estadísticos. Un ejem-plo de esta convención es el uso de R R para representar el parámetro de la razón de riesgo (la cual se analizará en los capítulos 3, 5 y 6) y —que se lee “RR sombrero”— para representar el estadístico. Algunas veces estas dos convenciones se combinan de manera que el parámetro quede representado por una letra griega y el estadístico por una letra romana con sombrero.

En este libro se combinarán ambas convenciones para adoptar las prácticas comunes. De cual-quier forma, cuando hubiere riesgo de confusión, se indicará cuál convención se está usando.

1.4 ESTADÍSTICA DESCRIPTIVA E INFERENCIAL

Una vez asentados los principios básicos, resulta conceptualmente conveniente describir las disciplinas de la estadística y la bioestadística conformadas por dos componentes. El primer com po nen te se reÞ ere a la estadística descriptiva, mientras que el segundo se llama estadística in fe ren cial. La estadística descriptiva está formada por varias técnicas utilizadas para resumir la in for ma ción contenida en un conjunto de datos. Considere el siguiente problema.

Suponga que se realiza un estudio para determinar los niveles séricos de plomo de 150 niños que viven en las casas más viejas de un vecindario urbano en particular. Si uno investigara los hallazgos de este estudio, obtendría una lista de los resultados de las pruebas individuales. De tal forma, se reportaría que el primer resultado mostró un nivel de 20 mcg/dl (microgramos por decilitro, también designados como g/dl o como ug/dl), mientras que el segundo arrojó un nivel de 25 mcg/dl, y así sucesivamente. Después de incluir en la lista los 150 resultados de la prueba, es probable que el investigador alcanzara a comprender un poco de la información obtenida. Tal in for ma ción no resumida abrumaría la habilidad del oyente para llegar a una conclusión signiÞ cativa. Una respuesta más útil podría ser: “El promedio de los niveles séricos de plomo encontrados en los niños incluidos en el estudio fue de 30 mcg/dl.” Otros resúmenes podrían incluir los valores más altos y los más bajos, así como varias representaciones gráÞ cas de los datos. De esta manera, la estadística descriptiva se ocupa exactamente de lo que implica el término: descripción de datos. Para reiterar, los investigadores podrán obtener fácilmente los resúmenes de los datos relacionados con los elementos de una muestra (estadísticos), a diferencia de lo que sucede con los datos relacionados con la población (parámetros).

En contraste con la estadística descriptiva, la estadística inferencial está conformada por varias técnicas utilizadas para proveer información acerca de los valores de los parámetros basados en observaciones hechas sobre los valores de los estadísticos. Los sondeos de opinión son un ejemplo común de esta forma de inferencia. En un sondeo de opinión, una muestra de opiniones obtenidas de un grupo de personas relativamente pequeño es utilizada para arrojar conclusiones sobre las opiniones de alguna población. Por ejemplo, se podría preguntar a 1,000 personas si favorecen o no un determinado plan de salud que se administra a nivel federal. Si el 65% de los sondeos de opinión fueran favorables, entonces el encuestador intentaría utilizar esta información para obtener conclusiones sobre la proporción de opiniones favorables en todo el país. Note que en este caso el valor de un estadístico (la proporción de opiniones favorables en la muestra) se utiliza para comprender el valor de un parámetro no disponible (la proporción de opiniones favorables en el país). En el ejemplo anterior, los investigadores podrían calcular el promedio de las presiones sanguíneas de los 50 pacientes que recibieron el medicamento contra

Page 5: capitulo 1 bioestadistica

FIGURA 1.1: Esquema que muestra la relación entre poblaciones y muestras, parámetros y estadísticos, y la estadística descriptiva e inferencial.

1Una excepción es la estadística no paramétrica, de la que nos ocuparemos más adelante en este libro.

Estadística descriptiva utilizada para obtener el valor a partir de los datos

(Parámetro)

Población

X 121

Muestra

x

xxx

Estadísticainferencial

(Estadístico)

x

la hipertensión (valor de un estadístico) con el propósito de estimar el promedio de la presión san guí nea de todos los hombres de más de 65 años de edad que alguna vez tomarán el medicamento (un valor de parámetro).

La relación entre poblaciones y muestras, parámetros y estadísticos, y la estadística des crip-ti va e inferencial se presenta en la Þ gura 1.1. Note que la proporción de una población representada por una muestra, por lo común, es muy pequeña y ni siquiera se acerca a la proporción que esta Þgu ra podría implicar. Observe también que los elementos que conforman la muestra (representada por x en la Þ gura) se obtienen aleatoriamente de la población.

1.5 ¿POR QUÉ POBLACIONES Y MUESTRAS?

Con anterioridad se aÞ rmó que la estadística es una importante herramienta que los investigadores utilizan para conocer su materia de estudio. También se dijo que el fundamento de la estadística se basa en los conceptos de poblaciones y muestras.1 Por ahora, quizá usted se pregunte cómo es que este fundamento se utiliza para ayudar a responder varias preguntas planteadas por los in ves-ti ga do res. Ése es el beneÞ cio de los sondeos ya mencionados, pero, con exactitud, ¿cómo es que las inferencias que hacen de una población a partir de una muestra ayudan a determinar si un nue-vo medicamento es efectivo o si la exposición a un factor de riesgo potencial se relaciona con la manifestación de alguna enfermedad?

Por desgracia, este proceso es difícil de percibir hasta que se unen más piezas de un mosaico bastante complejo. Por esta razón, usted necesitará dominar ciertos conceptos básicos, cuya utilidad no será apreciada totalmente sino hasta que pueda formar una imagen más completa. Por

Sección 1.5 ¿Por qué poblaciones y muestras? 5

Page 6: capitulo 1 bioestadistica

6 Capítulo 1 Fundamentos de bioestadística

el momento, sólo tenga presente que los datos recopilados en los estudios de investigación pueden ser muy complejos e incluir numerosos elementos del azar. Se mostrará que los conceptos de poblaciones y muestras resultarán útiles para ayudar a separar tales elementos aleatorios de la realidad fundamental.

1.6 ¿QUÉ OCURRE AHORA?

Con frecuencia se critica que muchos libros de estadística se apresuran en explicar los concep-tos fun da men ta les con el propósito de pasar a “lo interesante”. Como consecuencia, los estudiantes que están tomando el segundo o el tercer curso de estadística, a menudo no conocen bien las ba-ses de los métodos que están estudiando. Por consiguiente, en este libro se hará un intento cui da-do so y metódico por establecer un fundamento adecuado, a partir del cual el contenido restante se desarrollará de manera lógica. Este proceso ya ha comenzado.

En el capítulo 2, después de algunos requisitos, usted podrá ocuparse del estudio de la es ta-dís ti ca descriptiva. En el capítulo 3 se analizarán algunos fundamentos de probabilidad, el me ca-nis mo que sirve de base a la inferencia. El capítulo 4 lo introducirá a la lógica de la inferencia, así como a algunos métodos simples de pruebas de hipótesis y a la construcción de intervalos de conÞ anza. Los siguientes capítulos tratarán a fondo distintos métodos estadísticos comúnmente empleados en la investigación de las ciencias de la salud.

PALABRAS Y FRASES CLAVE

Al terminar de leer este capítulo, usted estará familiarizado con las siguientes palabras y frases:

bioestadística 1característica 2datos 2estadística 1estadística descriptiva 4estadística inferencial 4estadístico 3

muestra 2parámetro 3población estadística 2población Þ nita 2población inÞ nita 2población popular 2variable 2

EJERCICIOS

1.1 ¿En cuáles tareas se enfoca principalmente la es ta dís-tica?

1.2 Diferencie entre los siguientes conceptos:

a) muestras y poblaciones, b) estadísticos y parámetros, c) poblaciones populares y poblaciones estadísticas, d) estadística descriptiva y estadística inferencial, y e) poblaciones inÞ nitas y poblaciones Þ nitas

1.3 ¿Cuál es el signiÞ cado del término “datos”?1.4 Explique por qué las poblaciones no están formadas

por datos, como algunos autores aÞ rman.

A. Las siguientes preguntas se reÞ eren al estudio de caso A (página 469).

1.5 IdentiÞ que la muestra en este estudio. ¿Usted diría que esta muestra se caracteriza como parte de una pobla-ción estadística o de una población popular?

1.6 En este estudio, ¿la población está bien identiÞ cada? Explique su respuesta.

1.7 Describa la población de la mejor forma posible.1.8 ¿Hay algún estadístico reportado en este estudio? De

ser así, dé ejemplos.1.9 ¿Hay algún parámetro reportado en este estudio? De

ser así, dé ejemplos; de no ser así, explique por qué.

Page 7: capitulo 1 bioestadistica

1.10 ¿Se encontrarán datos en este estudio? De ser así, dé ejemplos.

B. Las siguientes preguntas se reÞ eren al estudio de caso B (página 470).

1.11 IdentiÞ que la muestra en este estudio. ¿Usted diría que esta muestra es característica de una población estadística o de una población popular?

1.12 ¿La población en este estudio está bien identiÞ cada? Explique su respuesta.

1.13 Describa la población de la mejor forma que le sea posible.

1.14 ¿Hay algún estadístico reportado en este estudio? De ser así, dé ejemplos.

1.15 ¿Hay algún parámetro reportado en este estudio? De ser así, dé ejemplos; de no ser así, explique por qué.

1.16 ¿Se encontrarán datos en este estudio? De ser así, dé ejemplos.

F. Las siguientes preguntas se reÞ eren al estudio de caso F (página 473).

1.17 ¿Cree usted que los resultados de este estudio son aplicables a los casos de tuberculosis en Estados Uni-dos? Fundamente su respuesta.

Ejercicios 7