la estadistica en la biomédica
Post on 15-Aug-2015
137 Views
Preview:
TRANSCRIPT
2. APLICACIÓN DE LA ESTADISTICA EN LA BIOMEDICINA
2.1GENERALIDADES DE LA ESTADISTICA CON LA BIOMEDICINA
La estadística puede definirse como la disciplina que se ocupa del tratamiento de
los datos numéricos derivados de grupo de casos. A menudo estos casos pueden
ser personas, animales u otros organismos. En ocasiones se dice que la
estadística contribuye poco o nada al progreso de la medicina, porque el medico
se ocupa en cada momento del tratamiento de un solo paciente y este difiere de
los otros en aspectos importantes.Muchas técnicas de la estadística se emplean
con mucha frecuencia en la investigación médica y describirlas en términos que
sean accesibles para quien no domine las matemáticas. La elección de los temas
estadísticos refleja el alcance de su empleo en la investigación médica; muchos de
estos temas se ven más utilizados en la estadística aplicada, pero igual
mostraremos casos puntuales que trabajan en la investigación médica o que están
interesados en la aplicaciones médicas. La estadística biomédica consiste, según
que opiniones, simplemente en formulacionesnuméricas sobre materias médicas:
cuantas personas fallecen por una determinada causa cada año, cuantas camas
hospitalarias se encuentran disponibles en un área concreta o cuánto dinero se
gasta en una determinada prestación médica. Estos hechos tienen una
importancia administrativa clara sobre todo el modo en que la estadística puede
mostrar resultados a personal administrativos que no son necesariamente
estadísticos. Por ejemplo, Para prever el número de camas de un servicio de
obstetricia de una comunidad necesitamos conocer cuántas mujeres dan a luz en
un periodo determinado y cuantas de ellas deben recibir cuidados en hospitales o
maternidades. Los datos numéricos también ofrecen la base de numerosas
investigaciones médicas. El estadístico necesita ir mas allá de esta labor
descriptiva en dos aspectos importantes: el primero, la posibilidad de mejorar la
calidad de información, planeando cuidadosamente la recogida de datos, y el
segundo, saber que los procedimientos de inferencia estadística proporciona una
amplia gama de métodos objetivos para extraer conclusiones de los datos sobre
los temas que se están investigando . En los últimos años se han constatado una
producción abundante de artículos que han desarrollado nuevos métodos
estadísticos específicamente para la investigación médica.
2.2 PRESENTACIÓN DE INFORMACIÓN MEDIANTE LA ESTADISTICA
El material bruto de las investigaciones estadísticas consiste en observaciones
individuales que casi siempre se deben resumir de algún modo para que puedan
ser de utilidad. El objetivo de los métodos estadísticos va más allá de la mera
presentación de datos e incluye la formulación de inferencias a partir de ellos.
Estos dos aspectos –descripción e inferencia- no pueden separarse. No podemos
referiros a las herramientas descriptivas sin considerar el fin para el que son
necesarias. Siempre es útil distinguir, en primer lugar entre dos tipos de variables,
cualitativas (o categóricas) y cuantitativas. Las variables cualitativas pueden
distinguirse en observaciones nominales y ordinales.Uno de los principales
métodos de presentación de la información estadística,sobre todo en la
biomedicina, lo constituyen las gráficas. Las tendencias y los contrastes suelen
percibirse con mayor rapidez y quizá son retenidos durante más tiempo en la
memoria mediante la observación causal de un diagrama bien proporcionado, que
por el escrutinio de los datos numéricos correspondientes, presentados en una
tabla. Sin embargo, las gráficas deben ser sencillas, pues los que contienen
demasiada información entrañan mayor dificultad en la interpretación. Otro método
de resumir y presentar algunas características importantes de un conjunto de
datos en forma de tabla. Existen muchas variantes, pero las características
esenciales son que la estructura y el significado de una se indiquen con
encabezamientos o títulos y que el resumen estadístico se exprese en el cuerpo
de la tabla mediante números.
Es útil clasificar las observaciones cuantitativas en variables discretas y continuas.
Las medidas discretas suelen ser recuentos como el número de veces que un
individuo ha sido ingresado en el hospital en los últimos 5 años. Las variables
continuas pueden adoptar un intervalo de valores continuos o interrumpidos como
la estatura, la edad, el peso y la presión arterial. Un paso práctico para resumir
gran cantidad de datos es la formación de una distribución de frecuencia. TABLA
1.5
2.3 PROBABILIDADES EN LA BIOMEDICA
El principal objetivo de la asignación de probabilidades numéricas es permitir la
realización de cálculos a partir de estos números. Las dos operaciones básicas
que nos ocupan son la suma y la multiplicación. Por ejemplo, si se escoge al azar
el nombre de un médico a partir del British Medical Register, la probabilidad de
que este médico sea varón es de 0,8. La probabilidad de que el médico se haya
graduado en una universidad en Inglaterra es de 0,6. ¿Cuál es la probabilidad de
que el médico sea un varón o se haya graduado en Inglaterra, o ambas
características a la vez? Si se suman ambas probabilidades se obtiene 0,8 + 0,6 =
1,4, lo cual es claramente erróneo, porque las probabilidades no pueden ser
superiores a 1. Para obtener la respuesta correcta se debe restar la probabilidad
del doble suceso. Así llamando A y B a los dos sucesos, obtenemos una expresión
más general de la ley aditiva. P (A o B o ambos) = P (A) + P (B) – P (A y B) y
designando a los sucesos A y B, obtendremos, P (A o B o ambos) = 0,80 + 0,06 –
0,48 = 0,92.
También en el estudio de la biomédica se pueden estudiar las probabilidades con
modelos de distribución binomial y distribución de Poisson. En la distribución
binomial se tiene una secuencia aleatoria en la que los sucesos de cada prueba
individual son de tipo A o B cuyas posibilidades de ocurrir es igual a µ. Para la
distribución binomial se tendrán las siguientes ecuaciones,
E(r) = nπ y Var(r) = nπ(1 – π). La figura 2.7 ilustra la distribución de varias
combinaciones de (π) y n. En la distribución de Poisson el modelo es análogo, en
forma continua, a las secuencias de los ensayos independientes. La probabilidad
de que en la serie completa de n pruebas aparezcan exactamente x sucesos,
según esta aproximación, vendrá dada por la distribución binomial
n (n−1 )…(n−x+1)x !
( µn)x
(1−µn)n− x
, la probabilidad de x se aproxime a:
P x=nx
x !(µn)x
e−µ
La figura 2.9 ilustra la distribución de Poisson para varios valores de µ.Después de
mencionar probabilidad mediante la distribución binomial y la distribución de
Poisson, mostraremos un ejemplo de un problema de probabilidad desarrollado
por distribución binomial.
Regresión múltiple en la Biomédica
En la biomédica es conveniente a menudo expresar el valor medio de una variable
en términos de no otra variable sino de varias. Es posible que se desee conocer a
fondo algunos mecanismos causales descubriendo cuál de las variables de un
conjunto x1, x2, tiene aparentemente más influencia sobre una variable dependiente
y. por ejemplo, la tasa de recién nacidos varía considerablemente en diferentes
ciudades de Gran Bretaña. Relacionando la tasa de recién nacido muertos
simultáneamente con un gran número de variables que describen las ciudades-
por ejemplo, variables económicas, sociales, meteorológicas o demográficas-sería
posible encontrar los factores que ejerce una influencia particular sobre la tasa de
recién nacidos muertos. Otro ejemplo se halla en el estudio de las variaciones del
costo por paciente en los distintos hospitales. Esto presumiblemente depende de
forma acusada de la mezcla de pacientes- las proporciones de los distintos tipos
de pacientes-, así como de otros factores. Un estudio de los efectos simultáneos
de algunas de estas variables puede explicar, en gran parte, la variación de los
costos hospitalarios y, prestar atención a determinados hospitales cuyos costos
altos o bajos están fuera de la línea de predicción, puede sugerir nuevos factores
de suma importancia. La técnica apropiada se denomina regresión múltiple. En
general, el planteamiento consiste en expresar el valor medio de la variable
dependiente en términos de los valores de un conjunto de variables
Ejemplo 1
Los casos de Sida diagnosticados en España en los últimos años vienen recogidos en la tabla, clasificados por grupo de riesgo del paciente.
Desarrolle y presente la distribución de frecuencia (frecuencia absoluta) y el histograma para dicha tabla.
Histograma de casos de Sida en España de 1993 a 1997
Ejemplo 2
El 1% de los niños sufre efectos secundarios tras la administración de un determinado antibiótico. Si éste fue aplicado a seis niños, determinar a) la probabilidad de que ninguno padezca efectos secundarios o b) lo padezca más de un niño. c) Si se suministrase el antibiótico a 1000 niños, ¿cuál sería el número medio de niños con efectos secundarios? Y d) calcular la probabilidad de que, de esos mil niños, padezcan efectos secundarios más de 15.
a) El problema se puede formalizar mediante un modelo binomial en donde cada prueba de Bernoulli sea el administrar el antibiótico en cuestión y el suceso éxito el que el niño padezca efectos secundarios. De esta forma, la variable número de niños, de entre los seis, que padecieron efectos secundarios, se puede modelizar mediante una variable X con distribución binomial B(6, 0.01) al ser 0.01 la probabilidad de que se dé el suceso éxito.
La probabilidad de que ninguno de estos niños padezca efectos secundarios, utilizando la tabla de la distribución binomial, P{X=0}=0.9415.
Conclusión: Existe el 94.15% de probabilidades de que ningún niño padezca efecto secundario.
b) La probabilidad de que más de un niño padezca efectos secundarios será la misma situación de la sección anterior pero de esta manera:
P{X>1} = 1 – P{X=<1} = 1 – [P{X=0} + P{X=1}]
= 1 – [0.9415 – 0.0571]
= 0.0014 , 0.0014 x 100%
= 0.14%
Conclusión: Existe el 0.14% de probabilidades de que más de un niño padezca efectos secundarios.
c) La probabilidad de que se suministrase el antibiótico a 1000 niños sería, ahora lo que ocurre es que se aumenta el número de pruebas B(1000, 0.01), por lo tanto la media de esta distribución es el producto de los parámetros, es decir, E[X] = n . p = 1000 . 0.01 = 10.
Conclusión: El número medio o número de niños esperado de niños con efectos secundarios, de entre los mil, seria 10 niños.
d) El cálculo de probabilidades de distribuciones binomiales para un gran número de ensayos, como ocurre aquí, se realiza aproximando dicha distribución mediante el teorema central de límite. En el caso de una distibución binomial X B(n,p), su aproximación mediante una normal Y N (np, √np (1−p )) es válida, cuando supuesto sea p=< 0.5 entonces sea también np> 5. Pr lo tanto, aproximaremos la X B(1000,0.01), Y (1000 . 0.01, √1000.0,01.0,99= N(10, 3.146) quedando la probabilidad igual a
P{X>15} = P{X−103.146
> 15−103.146
} = P { Z > 1.59} = 0.0559. 0.0559 x 100 % = 5.56%
Conclusión: Existe el 5.56% de probabilidades de que más de 15 niños de esos mil niños padezcan efectos secundarios.
Ejemplo 3
En el análisis de la posible influencia del peso, X1 y del nivel de ácido úrico, X2, sobre el nivel de colesterol, Y, en los individuos de una población, se seleccionó al azar a 10 personas de la población en estudio, anotándose el valor, que en ellos tomaban, las tres variables antes mencionadas. Los resultados obtenidos fueron los siguientes:
Se pide: Determinar la ecuación del sistema de regresión de Y sobre X1, X2.
Para calcular la ecuación del sistema de regresión lineal múltiple de Y sobre X1, X2.
Debemos determinar y resolver, previamente, el sistema de ecuaciones normales
Que para los datos del enunciado queda igual a
Sistema de tres ecuaciones con tres incógnitas, que tiene como solución los valores,
La ecuación del sistema de regresión lineal múltiple será:
top related