02. presentación de datos
DESCRIPTION
BioestadísticaTRANSCRIPT
BIOESADÍSTICAPRESENTACIÓN DE LOS
DATOS
Bio.Est. Wilver Rodríguez López. M.Sc.
UNIVERSIDAD DE SAN MARTIN DE PORRES
ESCUELA DE MEDICINA HUMANA
1. Recolección de datos
• En una investigación, la recolección de datos es un paso crucial e indispensable.
• Los datos se obtienen de una medición o de un conteo de las variables de interés (cuantitativas o cualitativas) .
Fuentes de Datos– Primarias: Aquellos datos que son
generados por el investigador, quien los obtiene directamente de las unidades de observación. – Se registran usando diversas técnicas:
cuestionario , entrevista, observación, experimentación, entre otros.
– Secundarios: Aquellos datos obtenidos anteriormente de las unidades de observación y que se encuentran documentados en: revistas, tesis, censos, registros, publicaciones de organizaciones, publicaciones en Internet, entre otros.
2. Presentación de los datos
Después de recopilar y revisar los datos necesarios para la investigación, se deben clasificar y presentar de forma adecuada para permitir su análisis e interpretación.
La presentación de los datos puede hacerse en:
• Tablas de frecuencia• Gráfica de frecuencias
Tipo de Frecuencias
• Frecuencia absoluta simple (fi) Indica el número de veces que
aparece repetido dicho valor en el conjunto de observaciones estudiadas.
• Frecuencia absoluta acumulada (Fi): indica la suma de las frecuencias absolutas.
• Frecuencia relativa simple porcentual (hi%) Indica el porcentaje del total de observaciones que representa el valor, es el cociente entre la frecuencia absoluta simple y el número total de observaciones, multiplicado por 100.
fi hi% = ______x 100 n• Frecuencia relativa acumulada (Hi%):
Indica la suma de las frecuencias relativas porcentual
Componentes de una tabla de frecuencias:
1.Número de la tabla.
2.Titulo de la tabla: Debe ser claro y preciso. Debe responder a las siguientes preguntas: ¿Qué contiene la tabla?, ¿Cómo se esta presentando la tabla?, ¿ A dónde pertenecen los datos? y ¿A que tiempo pertenecen los datos?.
3. Cuerpo de la tabla: Aquí va la variable de estudio, las frecuencias absolutas y relativas simples y acumuladas.
4. Fuente: Es el lugar de donde se obtuvo los datos.
5. Notas aclaratorias. En el caso en que se quiera hacer alguna aclaración a la información de la tabla. También se le conoce como pie de llamada.
En la práctica cuando se recoge la información de variables cualitativas o categóricas, los datos se presentan en forma desordenada, como por ejemplo:
El registro del servicio de emergencia del Hospital Regional de Trujillo tiene información de la intensidad de dolor del cólico renal de 50 pacientes atendidos en el mes de enero del 2013. La intensidad de dolor se registro como Leve (L), Moderado (M), Severo(S). L, L, M, L, S, S, S, L, M, S,
S, S, S, L, L, M, S, S, S, S,
S, L, M, M, M, S, L, M, S, S,
S, L, M, S, S, S, S, M, M, S,
S, M, M, M, S, S, S, S, S, L
Intensidad de dolor
Nº Pacientes
%
LeveModerado Severo
101327
202654
Total 50 100
Tabla 1: Pacientes según intensidad de dolor,Servicio de emergencia. Hospital Regional de Trujillo.Enero 2013.
Fuente: Archivo del Servicio de emergencia. Hospital Regional de Trujillo.*Pacientes con cólico renal
Tabla de frecuencias para variable cuantitativa discreta El registro del servicio de emergencia del
Hospital Regional de Trujillo tiene información del N° de hijos de 50 pacientes atendidos en el mes de enero del 2013. Los datos son los siguientes: 3,5,1,1,2,2,2,2,4,4,1,0,0,6,6,3,1,2,0,0,0,2,2,4,4,4,4,4,3,1,3,4,5,1,1,0,2,4,4,5,6,5,5,5,5,5,4,1,0,2
Paciente 1 2 3 4 …
# de hijos 3 5 1 1 …
# de hijos fi Fi hi% Hi%0 7 7 14 14
1 8 15 16 30
2 9 24 18 48
3 4 28 8 56
4 11 39 22 78
más de 4 11 50 22 100
TOTAL 50
Tabla 2: Pacientes según número de hijos.Servicio de emergencia. Hospital Regional de Trujillo.
Enero 2013.
# de hijos fi Fi hi% Hi%
0 7 7 14 14
1 8 15 16 30
2 9 24 18 48
3 4 28 8 56
4 11 39 22 78
más de 4 11 50 22 100
TOTAL 50 100
Caso de las variables cuantitativas continuas
En el caso de las variables continuas, hay una cantidad muy grande de posibles valores.
Cuando se manejan más de 30 observaciones es necesario usar intervalos que permitan ordenar de forma práctica los valores.
Sólo cuando se dividen los valores en intervalos encontramos en la tabla de frecuencias: clase, marca de clase y límites reales.
Para crearlos existe un procedimiento e implica la aparición de 3 nuevas columnas:
Clase: indica el número de intervalo del que se trata. Marca de clase (Xi): es un promedio de los límites del
intervalo de clase i. Es el número representativo del intervalo.
Límites reales: cada intervalo tiene números que representan sus límites, pero los límites reales indican los verdaderos valores que toma una medición, ya que los límites nominales son aparentes.
Datos de 30 pacientes con cáncer pulmonar.
Paciente Ciudad Edad Sexo
1 A 30 M2 A 43 M3 B 58 F4 C 61 M5 A 70 M6 D 42 F7 C 58 F8 A 39 M9 B 60 F10 B 55 M11 C 57 M12 A 49 M13 A 61 F14 D 69 M15 D 43 M16 B 46 F17 A 69 M18 A 44 M19 C 59 F20 D 62 M21 D 66 M22 C 71 M23 C 70 F24 C 65 M25 D 37 M26 A 40 F27 A 61 F28 B 65 M29 B 56 M30 C 38 M
PROCEDIMIENTO PARA CONSTRUIR TABLAS DE FRECUENCIAS
1.- Encontrar la amplitud (R) del conjunto de datos, es decir el valormáximo menos el valor mínimo, mas una unidad de medida.
R=(Vmax – Vmin)
Ejemplo.- Considerando los datos de edad dado en el tabla tenemos:
R=(71 – 30)= 41
2-Determinar el número de intervalos (k), utilizando la siguiente fórmula:
k= 1 + 3.322 log n
En relación al ejemplo se tiene que:k=1 + 3.322 log 30 = 5.9
En este caso K puede ser: 4, 5 o 6; se elige el valor de K con menor exceso
3-Determinar la amplitud del intervalo de clase (C), utilizando la siguiente expresión:
C= A / k
Asumiendo K=4 C=41/4=10.25 ˜11 Rt= KxC= 4X11=44 Ex=3Asumiendo K=5 C=41/5=8.2 ˜9 Rt= KxC= 5x9=45 Ex=4Asumiendo K=6 C=41/6=6.8 ˜7 Rt= KxC= 6X7=42 Ex=1
En este caso K=6
5- La clasificación de los datos de una variable continua puede hacerse manualmente o en forma automatizada.
Clase Edad Xi fi Fi hi% Hi% Límites reales
1
2
3
4
5
6
100
R = 41K = 6C = 7
Paciente
Edad
1 302 433 584 615 706 427 588 399 6010 5511 5712 4913 6114 6915 4316 4617 6918 4419 5920 6221 6622 7123 7024 6525 3726 4027 6128 6529 5630 38
29-36 36-43 43-50 50-57 57-64 64-71
Clase Edad Xi fi Fi hi% Hi%
1 29-36 33 1 1 3 3
2 36-43 40 5 6 17 20
3 43-50 47 5 11 17 37
4 50-57 54 2 13 6 43
5 57-64 61 9 22 30 73
6 64-71 68 8 30 27 100
Total 30 100
Tabla 3: Pacientes con cáncer pulmonar, según edad. Hospital Regional de Lambayeque. Año 2013
Propiedades de las frecuencias Las frecuencias absolutas son siempre valores
enteros. La suma de las frecuencias absolutas es igual
n. Las frecuencias relativas son siempre valores
fraccionarios. O < h1 < 1
La suma de las frecuencias relativas es igual 1 El último valor de las frecuencias absolutas
acumuladas es igual a n El último valor correspondiente a las
frecuencias relativas debe ser igual a 1
donde:
fi: Frecuencia absoluta del i-ésimo intervalo, nos indica número de veces que aparece repetido dicho valor en el conjunto de observaciones estudiadas.
Fi: Frecuencia absoluta acumulada de la clase i nos indica la suma de las frecuencias absolutas de los iguales o inferiores a el.
F1=f1F2=f1+f2
hi%: Frecuencia relativa de la clase i es el cociente entre la frecuencia absoluta y el número total de observaciones multiplicando por 100.
hi% = fi/n*100
Hi%: Frecuencia relativa acumulada de la clase i, es la frecuencia absoluta acumulada dividido por el número total de observaciones. Hi% = Fi/n*100
Xi: Es la marca de clase de la clase i se determina mediante el promedio de los límites de dicho intervalo.
Método GráficoEn esencia, un gráfico estadístico es la presentación de la
información por medio de figuras geométricas. El objetivo primordial de un gráfico es dar una impresión
visual de conjunto para una rápida y fácil comprensión. No deben considerarse como sustitutos de un tratamiento
estadístico de los datos, sino más bien como ayuda visual para interpretar problemas estadísticos.
Debe ser sencillo y explicativo; en un buen gráfico se puede:Apreciar tendencias, variaciones, cambios y realizar
visualmente comparaciones.Relacionar 2 o más series de datos superpuestos en un
mismo gráfico.
Histograma
Muestra la distribución de datos cuantitativos
El área es proporcional a la frecuencia respectiva
Representa a la frecuencias absolutas o relativas
Tiene como base los límites reales de los intervalos de clase.
Polígono de frecuencias (simples), Este gráfico se obtiene uniendo los
puntos medios superiores de los rectángulos del histograma, formándose de esta manera un gráfico lineal, el cual debe llevarse hasta el eje x en los extremos del límite inferior del primer intervalo y superior del último intervalo respectivamente.
El área total bajo el polígono equivale al área del histograma.
Polígono de frecuencias (acumuladas) OJIVA
Denominado también ojiva, utiliza las
frecuencias absolutas o relativas acumuladas, y consiste en un gráfico lineal que nos permite observar la cantidad de elementos que quedan por encima o por debajo de determinados valores de los límites de los intervalos de clase.
La ojiva se obtiene uniendo los puntos que le corresponden a las frecuencias acumuladas de los respectivos límites superiores de cada intervalo.