analisis e interpretacion de distribuciones de frecuencia en los estudios descriptivos completo

38
UNIDAD IV: ANALISIS ESTADÍSTICO E INTERPRETACIÓN DE DISTRIBUCIONES DE FRECUENCIAS EN ESTUDIOS DESCRIPTIVOS. 1. Explicar los aspectos que deben tomarse en cuenta durante la etapa de análisis de la información. El análisis de todo estudio, debe comenzar con una evaluación global de la información disponible y de la manera como fue recogida. Conviene examinar si los planes se cumplieron a cabalidad y si los datos se recogieron en la forma prevista y solo una vez que se está seguro de la fidelidad de la información, podrá iniciarse el análisis estadístico propiamente dicho. Las técnicas de análisis estadístico son muy numerosas, y la escogencia depende, entre otros factores de: El propósito del estudio. El tipo de información recogida. La escala de clasificación utilizada. El número de individuos estudiados. Anteriormente ya hemos considerado algunos aspectos referentes al tipo de información escogida (distribuciones de frecuencia, datos de asociación y series cronológicas) y a escala de clasificación utilizada (cualitativa o cuantitativa). Consideraremos ahora, la importancia que para el análisis tiene el propósito del estudio, y el número de observaciones estudiadas (series agrupadas o no agrupadas). 2. Enumerar y seleccionar los diferentes métodos de análisis apropiados para cada modelo de clasificación.

Upload: angel-bello

Post on 11-Jan-2016

220 views

Category:

Documents


0 download

DESCRIPTION

Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

TRANSCRIPT

Page 1: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

UNIDAD IV: ANALISIS ESTADÍSTICO E INTERPRETACIÓN DE DISTRIBUCIONES

DE FRECUENCIAS EN ESTUDIOS DESCRIPTIVOS.

1. Explicar los aspectos que deben tomarse en cuenta durante la etapa de análisis de la

información.

El análisis de todo estudio, debe comenzar con una evaluación global de la información disponible y de la manera como fue recogida. Conviene examinar si los planes se cumplieron a cabalidad y si los datos se recogieron en la forma prevista y solo una vez que se está seguro de la fidelidad de la información, podrá iniciarse el análisis estadístico propiamente dicho.

Las técnicas de análisis estadístico son muy numerosas, y la escogencia depende, entre otros factores de:

El propósito del estudio.

El tipo de información recogida.

La escala de clasificación utilizada.

El número de individuos estudiados.

Anteriormente ya hemos considerado algunos aspectos referentes al tipo de información escogida (distribuciones de frecuencia, datos de asociación y series cronológicas) y a escala de clasificación utilizada (cualitativa o cuantitativa). Consideraremos ahora, la importancia que para el análisis tiene el propósito del estudio, y el número de observaciones estudiadas (series agrupadas o no agrupadas).

2. Enumerar y seleccionar los diferentes métodos de análisis apropiados para cada modelo de

clasificación.

Estudios descriptivos y estudios comparativos.

De acuerdo a su propósito, los estudios se clasifican en:

Descriptivos, y

Comparativos.

En los estudios Descriptivos interesa sobre todo resumir adecuadamente la información y al mismo tiempo destacar las características importantes del grupo que se estudia. En los estudios Comparativos interesa primordialmente averiguar si hay o no diferencias entre los dos o más grupos que se estudian y si dichas diferencias existen, hallar razones valederas que puedan explicarlas.

Page 2: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

Es de advertir que esta tajante diferenciación entre estudios Descriptivos y

Comparativos, es más bien aparente. En primer lugar todo estudio comparativo

debe comenzar con una descripción de los hallazgos encontrados, pues solamente

después que estos han sido resumidos convenientemente, podrá hacerse con

provecho las comparaciones deseadas. En segundo lugar, no debe olvidarse, que en

muchos estudios descriptivos la finalidad última es hacer ciertas generalizaciones a

partir de los resultados observados, pues aunque por razones prácticas el

investigador solo estudia una muestra de la población en la que está interesado, su

deseo es llegar al conocimiento de dicha población a través de los resultados de la

muestra. Tal proceso de inducción exige técnicas distintas a las utilizadas en la

simple descripción de los datos, las cuales tienen mucho en común, con aquellas

que se emplean en los estudios comparativos.

Pero a efectos de conocimiento se estudian separadamente las técnicas que se emplean en los estudios descriptivos y aquellas que se utilizan en las comparaciones de grupos.

Número de individuos estudiados.

Trátese de un estudio descriptivo o comparativo, la escogencia de las técnicas de análisis que se utilizaran, depende del número de individuos en los cuales se basa la investigación.

Cuando el número de individuos observados es poco numeroso, los valores correspondientes se pondrán un lado del otro sin que haya necesidad de agruparlos en diferentes categorías. Se tienen entonces las llamadas series no agrupadas.

Cuando por el contrario, el estudio incluye una cantidad apreciable de individuos, ningún análisis podrá hacerse si no se clasifican previamente en un determinado número de grupos o clases. Tales datos así presentados, reciben el nombre de series agrupadas.

Las técnicas estadísticas de análisis serán distintas según se trate de series agrupadas o no agrupadas, siendo un poco más laboriosas las primeras

Técnicas de análisis de los estudios descriptivos.

Las técnicas utilizadas en resumen de los estudios descriptivos pueden esquematizarse:

DISTRIBUCIONES DE FRECUENCIAS.

Las distribuciones de frecuencias en escala cualitativa se resumen por frecuencias relativas (tasas, porcentajes, etc.). Si la escala es cuantitativa, pueden resumirse en la misma forma, pero

Page 3: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

generalmente se resumen mediante las llamadas tendencias centrales (promedio, mediana, modo) y medidas de dispersión (desviación estándar, percentiles, etc.).

DATOS DE ASOCIACIÓN.

Si las dos escalas son cualitativas, se resumirán en frecuencias relativas. Si una es cualitativa y la otra cuantitativa, podrá escogerse, de acuerdo a la finalidad del estudio, cualquiera de las medidas hasta ahora mencionadas y si ambas son cuantitativas se empleara Coeficiente de correlación y el Coeficiente de regresión.

SERIES CRONOLÓGICAS.

Se resumen por medio de las tendencias calculadas, cambios porcentuales y técnicas de regresión.

3. Enumerar las “estadísticas” utilizadas en análisis de variables cualitativas.

Presentación tabular.

La forma más simple de presentar estos datos, es mediante un cuadro de dos columnas. En la primera se ponen subdivisiones de la escala de clasificación que se utiliza y en la otra el número de individuos observados, generalmente el cuadro se acompaña de una tercera columna, en la cual se ponen porcentajes respectivos

Presentación grafica.

Puede utilizarse el diagrama de barras o el de sectores, pero si la escala tiene muchas subdivisiones, siempre debe preferirse el primero. En ello pueden representarse los números absolutos o los porcentajes respectivos. El grafico quedara igual en ambos casos, variando solamente la numeración de la escala

Page 4: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

Análisis: frecuencias relativas.

El análisis de estos datos se hace mediante frecuencias relativas. Bajo la denominación general de frecuencias relativas se incluye un conjunto de términos (razones, proporciones, índices, porcentajes, tasas, coeficientes. Cuya diferenciación es a veces difícil para el estudiante. Desde el punto de vista práctico la exacta definición para cada uno, tiene mucha menor importancia que comprender su utilización y aplicaciones.

Su importancia radica en que gracias a ellas puede ponerse más fácilmente de presente, las relaciones que existen entre dos o más cifras de los datos que se estudian, facilitando la comparación de diversos resultados. Ejemplo:

Page 5: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

En una ciudad hubo 100 defunciones y 500 en otra, es importante este valor para ciertos propósitos, pero es de poca utilidad para otros. Saber el número de defunciones en cada localidad es esencial para decidir sobre las facilidades medicas y hospitalarias que deben proveerse, pero si aspiramos comparar el riesgo de muerte en las dos poblaciones es necesario relacionar el número de defunciones en cada ciudad con su número de habitantes, pues es obvio que si la segunda tiene 5 veces más habitantes que la primera, en ella debe haber más o menos 5 veces más defunciones.

4. Explicar que expresa una razón. Y,

5. Explicar que expresa una proporción.

RAZONES Y PROPORCIONES.

Si suponemos que un grupo de 369 estudiantes están formados por 279 hombres y 99 mujeres:

Hombres 297

Mujeres 99

Total 396

Aunque es evidente el predominio de los hombres, la intensidad de esa relación se apreciara mejor, al dividir el número de hombres por mujeres, con lo cual que podemos decir que hay 3 hombres por cada mujer en dicho grupo (297/99 = 3).

Puede también dividirse el número de hombres por la totalidad de personas en el grupo (297/ 369 = 3/4= 75%), con lo cual se evidencia fácilmente, que de cada 4 estudiantes, tres son de sexo masculino, es decir, que hay 3 hombres por cada mujer en dicho grupo de estudiantes.

En el primer caso se ha relacionado el número de individuos en una categoría con el número de individuos en la otra. En el segundo caso, se ha relacionado el número de observaciones de una categoría con el total general del grupo. La primera de tales frecuencias se denomina una ´´razón´´: la segunda se llama una ´´proporción´´.

Cuando la serie que se estudia consta solamente de dos categorías (hombres y mujeres o enfermos y sanos) puede usarse según las preferencias una razón o una proporción. Si la serie consta de 3 o más categorías, no hay una manera única de calcular una razón y en tales casos es preferible utilizar las proporciones.

6. Explicar que expresa un porcentaje.

Page 6: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

PORCENTAJES.

Un porcentaje es una proporción multiplicada por 100. Por consiguiente, para calcular porcentajes, basta dividir el número de individuos en cada categoría por el total del grupo y multiplicar el resultado por 100. En nuestro ejemplo, el 75% de los estudiantes son hombres: (297/369) x 100 = 75%) y el 25% mujeres: (99/369) x 100 = 25%).

El uso de los porcentajes tiene varias ventajas. En primer lugar, ellos permiten comparar fácilmente 2 o más series cuyos totales son diferentes, pues estos quedan convenientemente reducidos a 100. Note que si se tienen los 2 siguientes grupos de personas:

Hombres 297

Mujeres 99

Total 396El cálculo de los porcentajes nos permite señalar sin dificultad que la proporción de

hombres en los dos grupos es semejante (276/396 = 75% y 255/340 = 75%), lo cual no era muy aparente antes de su cálculo.

En segundo lugar, a través de los porcentajes se puede resumir la probabilidad de la ocurrencia de un hecho. En la ilustración anterior por ejemplo hay un 75% de probabilidad de que una persona sea de sexo masculino (297/396) y un 25% de que sea femenino (99/396).

7. Explicar que expresan las tasas.

TASAS.

En toda población es importante conocer su composición y los cambios que acontecen en ella. Al estudiar estos cambios, ni las razones, ni los porcentajes, a pesar de su utilidad, permiten analizar completamente la información disponible. Supóngase que en la población de San Pedro los accidentes automovilísticos hubieran sido clasificados como señala el siguiente cuadro:

Hombres 255

Mujeres 85

Total 340

Page 7: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

La información anterior es desde luego útil. Los porcentajes calculados señalan, entre otras cosas, que al ocurrir un accidente hay un 80% de probabilidad de que sea un hombre quien conduce, lo cual facilitara ciertas decisiones administrativas. Así por ejemplo, si se está planeando construir un hospital para atender a los conductores heridos o una cárcel para detenerlos, los porcentajes nos indican que aproximadamente 80% de las camas hospitalarias o de las celdas carcelarias deben ser para hombres.

Sin embargo, sería un absurdo concluir en base a la información anterior que los hombres tienen mayor peligro de verse envueltos en un accidente automovilístico o que las mujeres sean más cuidadosas al manejar.

Con el fin de facilitar comparaciones como la anterior, siempre que se trate de medir el riesgo de que acontezca determinado fenómeno, dicho fenómeno debe relacionarse con la población en la cual puede acontecer. Tales relaciones reciben el nombre general de tasas.

Una tasa es simplemente un quebrado. El numerador, indica el número de veces que ocurrió determinado fenómeno en un área perfectamente limitada y en un periodo de tiempo perfectamente definido. El denominador indica el número de habitantes de la población en la cual puede ocurrir el fenómeno descrito en el numerador:

Como el numerador de la tasa nunca podrá ser mayor que su denominador, el resultado será menor que la unidad y para evitar el uso de decimales, multiplicamos el resultado por 100, 1.000, 10.000, etc. Pues es más fácil recordar por ejemplo, que la tasa de mortalidad en Venezuela en 1975 fue en 6 por 1.000 que recordar que es 0,006.

Teniendo en cuenta el concepto anterior, será muy fácil obtener o calcular cuantas tasas se quiera. Entre ellas, tienen importancia en Medicina:

Page 8: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

Las tasas de mortalidad: las cuales expresan el riesgo de morir. Las tasas de morbilidad: que expresan el riesgo de adquirir determinadas

enfermedades. Las tasas de natalidad: que miden el crecimiento de las poblaciones. Las tasas de letalidad: que indican cuan graves son las enfermedades.

Las tasas anteriores pueden calcularse para toda una población o separadamente para algunos de sus segmentos, como ser para determinado grupo de edad o determinado sexo. Además, unas veces pueden referirse a todas las causas en conjunto o solamente a una causa o grupo de causas en particular.

Tasas que se refieren a toda la población y todas las causas a la vez, se denominan ¨tasas crudas¨ y aquellas se refieren solo a parte de la población o a una determinada causa, se denominan ¨tasas especificas¨. Pueden calcularse tasas especificas por edad, tasas especificas por causa, tasas especificas a la vez por edad y causa, etc. Se puede hacer tan específica como se quiera, desde que se disponga de los datos básicos.

Al calcular estas tasas deberá tenerse en cuenta la población expuesta al riesgo para que el denominador sea correcto. Como las poblaciones cambian continuamente, aumentando a causa de los nacimientos y la inmigración, y disminuyendo a causa de las defunciones y la emigración, la población especificada en el denominador debe ser la de mediados de año (1° de julio), pues ella es intermedia entre la de principios y final de año.

Principales tasas. Calculo de las más comunes. Hay que tener en cuenta que convencionalmente, todas las tasas se expresan por 1.000 habitantes excepto: la tasa de letalidad que se expresa en porcentaje y las tasas especificas por causa que se multiplica por 100.000.

1.- Tasa cruda de mortalidad:

Ejemplo: la población de Venezuela para el 1/7/78 se estimo en 13.121.950 habitantes y en dicho año ocurrieron 72.470 defunciones. La tasa cruda de mortalidad fue por lo tanto:

2.- Tasa cruda de natalidad:

Page 9: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

Ejemplo: en 1987 se registraron en Venezuela 481.782 nacimientos vivos, y la población se estimo en 13.121.950 habitantes. Su tasa cruda de natalidad fue por consiguiente:

3.- Tasa cruda de morbilidad: Habitualmente no se calcula, ya que salvo el caso de encuestas especiales, es imposible conocer la morbilidad total de una región.

4.- Tasa cruda de mortalidad Específica por causa:

Ejemplo: Durante 1978 ocurrieron en Venezuela 838 defunciones por tuberculosis. Como la población del país dicho año se estimo en 13.121.950 habitantes, la tasa de mortalidad especifica por tuberculosis fue

5.- Tasa de mortalidad Específica por edades:

Ejemplos: La población venezolana de menores de 15 años fue estimada para 1978 en 5.574.690 habitantes. Dicho año ocurrieron en el país un total de 22.640 defunciones en personas de 15 años. La tasa de mortalidad en menores de 15 años fue:

6.- Tasa de mortalidad Específica por causa y edades:

Ejemplo: En 1978 ocurrieron en Venezuela 65 defunciones por tuberculosis en el grupo de menores de 15 años. Con la población estimada para esas edades, fue de 5.574.690 habitantes, la tasa de mortalidad específica por tuberculosis para menores de 15 años fue:

Page 10: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

7.- Tasa de Morbilidad Específica por causa:

Ejemplo: En 1978 se conocieron en Venezuela 4.286 casos de tuberculosis. Como la población del país era de 13.121.950 la tasa de morbilidad por tuberculosis fue:

8.- Tasa de Letalidad:

Ejemplo: En 1978 se conocieron en el país 134 casos de Fiebre Tifoidea, de los cuales fallecieron 8. La tasa de letalidad para la Fiebre Tifoidea fue por lo tanto:

Es preciso hacer notar que en ciertas ocasiones la población que sirve de denominador a la tasa no puede conocerse y es necesario recurrir a estimarla por cualquier procedimiento. Como ejemplos concretos se tienen: la tasa de mortalidad infantil y la tasa de mortalidad materna.

a) La tasa de mortalidad infantil se refiere exclusivamente a las defunciones de niños que no han cumplido un año. Por consiguiente, en el denominador de la tasa debiera figurar el número de niños menores a 1 año. Esta cifra sin embargo nunca se conoce con exactitud pues los datos censales son muy deficientes al respecto, y para estimarla se toma el número de nacimientos vivos ocurridos en el año en la región que se estudia. De acuerdo a lo anterior la tasa de mortalidad infantil se calcula mediante la fórmula siguiente:

9.- Tasa de Mortalidad Infantil:

Page 11: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

Ejemplo: En Venezuela durante 1978 ocurrieron 16.325 defunciones de niños menores de un año y dicho año se registraron en todo el país 481.782 nacimientos vivos. La tasa de mortalidad infantil fue:

Es decir, por cada 1.000 nacimientos vivos ocurridos, fallecieron 34 niños menores de un año.

b) La tasa de mortalidad materna mide el riesgo de morir a causa de cualquier trastorno imputable directamente al embarazo, parto o puerperio. Como se desconoce el número de embarazadas, parturientas y puérperas, dicha cifra se estima a través del número de nacimientos vivos ocurridos quedando la tasa:

10.- Tasa de Mortalidad Materna:

Ejemplo: En 1978 ocurrieron en Venezuela 310 defunciones por complicaciones del embarazo, parto y puerperio. Como en tal año se registraron 481.782 nacimientos vivos, la tasa de mortalidad materna fue:

8. Distribuciones de frecuencias en escala cuantitativa

Las distribuciones de frecuencia en escala cuantitativa pueden analizarse mediante porcentajes pero generalmente este análisis es efectuado mediante las llamadas; constantes centrales (medidas de tendencia central) y las medidas de dispersión.

Medidas de tendencia central: Señalan aquellas cifras alrededor de las cuales está la mayoría de las observaciones, estas son: promedio aritmético, mediana y modo.

Medidas de dispersión: Señalan la manera como se distribuyen las observaciones con respecto a los anteriores valores centrales, estas son: desviación estándar, percentiles.

El que se prefiera utilizar una serie mediante porcentajes o mediante medidas de tendencia central y de dispersión depende de la finalidad que se persigue en el estudio. La información dada por unos y otros es diferente y en ocasiones suelen utilizarse al mismo tiempo los dos tipos de medida.

Page 12: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

ANALISIS MEDIANTE FRECUENCIAS RELATIVAS.

Distribuciones de frecuencia en escala cuantitativa, pueden analizarse para ciertos propósitos mediante porcentajes y porcentajes acumulados.

En muchas ocasiones como esta, el promedio puede ocultar diferencias importantes entre los individuos que se estudian, mientras que el simple análisis de los porcentajes puede ser mucho más ilustrativo. Supongamos que el peso promedio normal para niños de la edad estudiada hubiera sido fijado en 35 kilos. El promedio para este grupo de 50 escolares, calculado por el método que luego se estudiara es exactamente 37 kilos, el cual nos lleva erróneamente a formarnos la impresión de que el grupo estudiado, presenta un estado nutritivo normal. Sin embargo el análisis de los porcentajes nos muestra claramente que el 8% de los niños pesa entre 20 y 24 kilos y que el 42% pesa menos de 35 kilos, o sea, que de acuerdo a nuestro patrón de normalidad, casi la mitad de estos escolares estarían desnutridos.

Page 13: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

CONSTANTES CENTRALES TAMBIEN LLAMADAS MEDIDAS DE TENDENCIA CENTRAL.

9. Explicar que expresa el promedio aritmético (series agrupadas y no agrupadas).

PROMEDIO ARITMETICO O MEDIA ARITMETICA Ẋ:

Es la cifra que se obtiene al dividir la suma de todos los valores observados por el número de observaciones.

1.1. CALCULAR EL PROMEDIO ARITMETICO O MEDIA ARITMETICA EN SERIES NO AGRUPADAS:

Si se tienen 5 niños cuyos respectivos pesos son:

7, 4, 9, 6 y 4 Kilos.

El promedio aritmético se obtendrá sumando las cifras anteriores y dividiendo entre 5 que es el número total de niños.

Ẋ= = 6 Kilos.

Es decir, los niños pesan en total 30 Kilos, y si todos ellos pesaran igual, esto es, si no existiera variación, el peso de cada uno seria 6 kilos.

Page 14: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

1.1.1. CALCULAR EL PROMEDIO ARITMETICO PARA SERIES AGRUPADAS:

Para calcular el promedio se asume que cada uno de los individuos en determinada clase tiene un valor igual al punto medio de la clase.

En el ejemplo a continuación se observa que el punto medio de la clase es 22, lo cual significa que cada uno de los 4 individuos de esa clase pesa 22 Kilos y por tanto, los 4 pesaran en conjunto 88 Kilos (22 x 4). Igualmente, el punto medio de la segunda clase es 27, o sea que cada individuo de los 8 que hay pesa 27 Kilos y por lo tanto, los 8 pesaran en total 216 Kilos (27 x 8 = 216). Bastara entonces sumar estos productos para saber cuantos kilos pesa la totalidad de los individuos estudiados y dividir esta suma por el numero de observaciones para encontrar el promedio.

En las 2 primeras columnas del siguiente cuadro aparecen los datos sobre el peso de 50 escolares y en las restantes, los cálculos necesarios para obtener el promedio:

Page 15: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

Los pasos seguidos en el calculo anterior son los siguientes:

Averiguar el punto medio de cada clase (ubicado en la columna 3) Multiplicar el punto medio de cada clase por los individuos en ella (ubicados en la

columna 2) y sumar estos productos. Obtener el promedio dividiendo la suma anterior por el numero de individuos

estudiados.

10. Explicar que expresa la mediana (series no agrupadas y series agrupadas).

MEDIANA (Mɑ):

Es aquella observación que divide la serie en dos partes iguales, en tal forma, que la mitad de las observaciones son iguales o menores que dicho valor, y la otra mitad, iguales o mayores que el.

1.1 CALCULAR LA MEDIANA EN SERIES NO AGRUPADAS.

Para calcular la mediana, es necesario ordenar las observaciones de menor a mayor o viceversa.

Page 16: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

Ejemplo si tenemos: 5 niños cuyos respectivos pesos son:

Ordenamos los datos de menor a mayor obtendríamos:

Aplicando la definición nuestra mediana será: 6, a cada lado de la cual quedan dos observaciones. Si en vez de un numero impar de observaciones tuviéramos las 6 siguientes:

Se ve que no hay ninguna observación que “ocupe la mitad”, pues el limite estaría entre el 7 y el 8. En dichos casos para obtener la mediana, se promediaran los 2 valores centrales, en este caso, los correspondientes a la 3º y 4º observación, es decir:

= 7

1.2. CALCULAR LA MEDIANA EN SERIES AGRUPADAS.

Para calcular la median se considera que los individuos de cada clase se encuentran uniformemente repartidos en ella. Asi por ejemplo, en la clase 35 – 39, cuyos verdaderos limites son 34,5 y 39,5 Kilos y cuya amplitud es 5, hay 10 individuos, o sea, que existe una diferencia de peso entre uno y otro igual a 0,5 kilos (5/10= 0,5 ).

Es como si el intervalo de la clase 34,5 a 39,5 en la cual hay 10 personas, se divide en 10 subintervalos de 0,5 de amplitud, en medio de cada uno de los cuales se encuentra un individuo. Como en la primera clase hay 4 personas, esto quiere decir que allí están los individuos del 1 al 4 y por consiguiente, como en la segunda clase hay 8, allí estarán los

7, 4, 9, 6, 4.

4, 4, 6, 7, 9.

4, 5, 7, 8, 9, 10

Page 17: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

individuos de la clase 34,5- 39,5 (individuos 22-31) se hara como lo muestra el siguiente esquema:

Con estas explicaciones podemos ilustrar el calculo de la mediana tomando el mismo ejemplo utilizado en el calculo del promedio en series agrupadas:

Page 18: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

Los pasos para calcular la mediana son:

Escribir los verdaderos limites de cada clase. Esto no es esencial, pero es conveniente para el principiante.

Obtener la frecuencia acumulada de las observaciones por el procedimiento conocido (ubicado en la columna 4)

Averiguar cual observación es la mediana, para lo cual:

Observación de la mediana= = = 25.

Como la mediana es la observación numero 25 y como hay 21 por debajo de 34,5 Kilos (véase columna 4), se necesitan 4 observaciones mas (25 – 21= 4) de las 10 que hay en la siguiente clase. Puesto que se considera que dichas observaciones están a igual distancia una de otra, se tomara 4/10 de la amplitud de esta clase y se añadirá a 34,5 que es su comienzo, con el fin de obtener la mediana:

MEDIANA (Mɑ) = 34,5 + ( x 5) = 34,5 + 2,0 = 36,5 Kilos.

El lector observara que como se trata de un numero par de observqaciones (50), el valor de la mediana correspondería al promedio de las observaciones 25 y 26 y no a la observación numero 25. Un atento examen del esquema anterior muestra que el individuo 25 tiene un peso de 36,25 y el individuo numero 26 un peso de 36,75. El semi promedio de estos valores que seria la mediana es 36,5 Kilos. Se para facilidades de calculo se asume que el primer individuo de esta clase (el numero 22) esta en el punto 35, en vez de estar en el 34,75 que es su verdadera colocación, lo estamos desplazando

subintervalo a la derecha. Para recompensar este desplazamiento, en vez de tomar

el valor medio entre las observaciones 25 y 26 se tomara el valor de la numero 25,

Page 19: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

como se ha hecho en la formula anterior, con lo cual obtenemos el verdadero valor investigado.

11. Explicar que expresa el Modo (series agrupadas y no agrupadas)

MODO TAMBIEN LLAMADO MODA ( M ):

Es aquel que se observa con mayor frecuencia en los datos.

1. CALCULO DEL MODO EN SERIES NO AGRUPADAS.

Tomemos de nuevo el ejemplo de los 5 niños cuyos pesos son:

El modo en este ejemplo seria 4, pues este es el valor que se observa con mayor frecuencia. Obsérvese que si los valores fueran:

No hay en realidad ningún valor que se observe más frecuentemente que los otros. Lo mismo sucede si los valores fueran:

12. MEDIDAS DE DISPERSION.

Importancia de las medidas de dispersión:

7, 4, 9, 6, 4 Kilos.

7, 4, 8, 3, 5 Kilos.

2, 2, 4, 4, 6 y 6 Kilos.

Page 20: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

Las medidas de tendencia central no son suficientes para describir una distribución o conjunto de datos. Una buena descripción de una distribución requiere, además de un valor ‘promedio’ de las observaciones (es decir, una medida de tendencia central), alguna medida de la dispersión o variabilidad de los valores observados. Esta información es proporcionada por indicadores que se conocen como ‘medidas de dispersión’ (también ‘medidas de variabilidad’). Los más comunes, que constituyen el contenido de esta sección, son la desviación estándar y la varianza.

Supongase que se tienen tres grupos de pacientes de 7 individuos cada uno, y como ejemplo ilustrativo supóngase además que el primer grupo sufre de Gastroenteritis, el segundo de bronquitis y el tercero de amigdalitis

Si la permanencia hospitalaria de cada paciente fuera la que aparece a continuación:

Enfermedades. Días de hospitalización.

Gastroenteritis 1, 3, 5, 7, 9, 11, 13

Bronquitis 1, 2, 3, 7, 11, 12, 13

Amigdalitis 1, 5, 6, 7, 8, 9, 13

Seria fácil constatar los siguientes puntos:

Cada serie tiene el mismo numero de observaciones, es decir 7 pacientes. En los 3 casos la amplitud de la serie es la misma: de 1 a 13 dias. Las 3 series tienen el mismo promedio, o sea 7 dias. Las 3 series tienen la misma mediana, o sea 7 dias. En cada serie el promedio y la mediana coinciden exactamente.

No obstante las similitudes señaladas, las 3 series son muy distintas, pues como puede apreciarse en el grafico siguiente:

a) En el caso de la Gastroenteritis, los 7 pacientes se distribuyen uniformemente en el lapso de 1 a 13 días

b) En el caso de la Bronquitis, los pacientes se agrupan en los extremos de dicho lapso (1-2-3 y 11-12-13)

c) En el caso de la amigdalitis, se agrupan hacia el centro (5-6-7-8-9)

Page 21: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

Lo antes explicado nos señala que cuando se tiene un grupo de observaciones no basta conocer cual es su promedio o su mediana, sino que además, es necesario tener una medida que indique claramente como se distribuyen las observaciones alrededor de ese promedio o esa mediana.

Con tal fin se utilizan la desviación estándar y el intervalo intercuartilar. Debe tenerse en cuenta que cuando se busca el promedio aritmético, se debe calcular la desviación estándar y no el intervalo intercuartilar, pues este ultimo se utiliza solamente para medir la dispersión alrededor de la mediana. Es decir: con el promedio se utiliza la desviación estándar y con la mediana el intervalo intercuartilar, pero estas no son las únicas medidas de dispersión cabria mencionar también la Varianza, que no es más que el cuadrado de la Desviación Estándar y el Coeficiente de variación.

13. Explicar que expresa la Desviación Estándar (series no agrupadas y series agrupadas)

DESVIACION ESTANDAR (D.E O δ):

Consiste en averiguar en cuanto difiere en promedio cada observación, del promedio general del grupo. Se comprende, que si todas las observaciones fueran exactamente iguales, la desviación estándar seria (0), y en cambio, su valor será mucho mayor, mientras más grandes sean las diferencias entre unas observaciones y otras.

Page 22: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

La Desviación estándar suele representarse con la letra griega sigma minúscula (δ) y a veces se coloca su valor después del signo ± que sigue al promedio ( Ẋ = 10 ± 2 indica que la D.E =2).

1. CALCULAR LA DESVIACION ESTANDAR EN SERIES NO AGRUPADAS.

Como ilustración, tomaremos el ejemplo dado anteriormente sobre los días de hospitalización de 7 pacientes con bronquitis.

Días de hospitalización en 7 pacientes con Bronquitis

(Cálculo de la Desviación Estándar)

Promedio (Ẋ) = = 7 días

NUMERO DEL PACIENTE DIAS DE HOSPITALIZACION VALORES X

X₁ AL CUADRADO X²

Primero 1 1

Segundo 2 4

Tercero 3 9

Cuarto 7 49

Quinto 11 121

Sexto 12 144

Séptimo 13 169

Page 23: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

Desviación estándar = 4,7 días

Los pasos a seguir en estos cálculos son los siguientes:

Elevar al cuadrado cada observación y sumar esta columna. Dividir la suma anterior entre el número de observaciones.

Cuando se calcula la desviación estándar de un pequeño grupo de individuos es más exacto dividir por (n-1) que por (n), pero en grupos más o menos grandes, digamos más de 30 individuos, tal refinamiento no es necesario.

Elevar el promedio al cuadrado y restarlo a la cifra anterior. Extraer la raíz cuadrada. El resultado es la D.E que conforme vimos en nuestro

ejemplo, es igual a:

D.E= = 4,7 Días.

1.2 CALCULAR LA DESVIACION ESTANDAR EN SERIES AGRUPADAS.

Los diferentes pasos que deben seguirse para el cálculo de la Desviación Estándar, se encontraran en el siguiente cuadro cuyas primeras cuatro columnas se utilizan para calcular el promedio:

Peso en Número Punto medio Producto fᵢ xᵢ Producto fᵢ x₁²

Kilos personas de clase xᵢ (columna 2x3) (columna 3x4)

fᵢ x₁ x₁

(1) (2) (3) (4) (5)

20-24 4 22 88 1.936

25-29 8 27 216 5.832

30-34 9 32 288 9.216

35-39 10 37 370 13.690

40-44 7 42 294 12.348

45-49 6 47 282 13.254

50-54 6 52 312 16.224

Total 50 1.850 72.500

Page 24: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

Promedio = = 37,0 Kilos.

D.E = = 9 Kilos.

Los pasos a realizar son los siguientes:

Calcular el promedio. Multiplicar cada producto de la columna numero (4) por el respectivo

valor de la columna número (3) y sumar los resultados. Dividir el total anterior entre el número de individuos estudiados (en este

ejemplo n = 50). Elevar el promedio al cuadrado y restarlo a la cantidad anterior. Extraer la raíz cuadrada. Dicho resultado será la D.E.

Utilización de la Desviación Estándar:

Indica en que forma se distribuyen las observaciones alrededor del valor central representado por el promedio. Su utilidad se debe a que ella, junto con el promedio, ayuda a determinar los limites dentro de los cuales se encuentran las observaciones que se estudian, en tal forma, que basta conocer el promedio y la D.E. para reproducir toda la información contenida en los datos originales.

14. Explicar que significan los cuartiles, deciles y percentiles.

Page 25: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

Cuartiles: Son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.

Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada) o también puede definirse el 25º percentil pues por debajo de este valor se encuentra el 25% de las observaciones es decir, la cuarta parte de estas; el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos

Deciles: Son ciertos números que dividen la sucesión de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son también un caso particular de los percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc.

Percentiles: Son, tal vez, las medidas más utilizadas para propósitos de ubicación o clasificación de las personas cuando atienden características tales como peso, estatura. Derivan del “por ciento” y por lo tanto, una serie de observaciones no puede tener mas de 100 percentiles. Cada percentil indica el porcentaje de observaciones que en determinada serie esta por debajo de el.

El 10º percentil por ejemplo, es el valor por debajo del cual esta el 10% de las observaciones y el 25% percentil es el valor por debajo del cual se encuentra el 25% de las observaciones.

Según esto la mediana es simplemente el 50º percentil de las observaciones ya que por debajo de ella, se encuentra el 50% de las observaciones.

15. Dada una serie estadística (serie agrupada y serie no agrupada) calcular e interpretar cualquier cuartil, percentil o decil.

1. CALCULO DEL PRIMER CUARTIL.

Para calcular el primer cuartil (Q se procederá de manera semejante a como se hizo el

calculo de la mediana. Tomando el mismo ejemplo que sirvió para ilustrar el calculo de esta se procederá de la siguiente forma:

Page 26: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

Buscar los limites verdaderos de las clases. Obtener la frecuencia acumulada de las observaciones. Averiguar cual de las observaciones corresponde al primer cuartil, o sea:

= = 12,5.

Como el primer cuartil estará situado en la posición 12,5 y como hay 12

observaciones por debajo de 29,5 Kilos, se necesita observación mas

(12,5 – 12 = 15) de las que hay en la siguiente clase. Como se ha asumido que las observaciones están igualmente espaciadas, se tomara 0,5/9 de la amplitud de la respectiva clase y se añadirá a su punto de comienzo, con el fin de obtener el valor del primer cuartil.

Q₁ = 29,5 +

Page 27: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

2. CALCULO DEL TERCER CUARTIL

La observación correspondiente al tercer cuartil (Qȝ) será:

n = x 50 = 37,5

Por lo tanto como hay 31 observaciones por debajo de 39,5 Kilos, se necesitan 6,5 observaciones mas de las 7 que hay en la próxima clase, o sea, que debemos tomar 6,5/7 de la amplitud de la clase y añadirlo a su comienzo para averiguar el valor del tercer cuartil.

Qȝ = 39,5 +

3. INTERVALO INTERCUARTILAR

Es aquel comprendido entre el primero y el tercer cuartil. Su utilidad consiste en que dentro de los limites determinados por el, se encuentra el 50% de las observaciones “centrales”, generalmente no afectadas por las fluctuaciones extremas de la serie.

El intervalo intercuartilar mide la dispersión de los valores de la serie, pues mientras mas próximos sus limites, mayor concentración de las observaciones alrededor de la mediana.

EJEMPLO: Si los días de hospitalización de 2 grupos de pacientes es respectivamente

Primer grupo Segundo Grupo

Ma = 10 Ma = 10

Page 28: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO

Q₁ = 9 Q₁ = 3

Qȝ = 11 Qȝ = 18

A pesar de que la mediana es 10 para ambos grupos, se observa que en el principio el 50% de los pacientes tienen valores muy próximos a ella y en cambio, en el segundo grupo, la dispersión es muchísimo mayor.

4. CALCULO DE OERCENTILES EN SERIES PEQUEÑAS.

Cuando el numero de observaciones es muy pequeño, solo se pueden calcular ciertos percentiles. Si hay 5 observaciones solo pueden calcularse en realidad 5 percentiles; si hay 7, podrán calcularse solo 7, etc. En tales casos, para calcular determinado percentil se utiliza la formula:

Supongase por ejemplo, que se tienen las 7 siguientes observaciones:

2, 3, 5, 9, 11, 15, 18.

De acuerdo a la formula anterior:

a) El primer cuartil (25º percentil) será:

Es decir, la observación numero 2, cuyo valor es 3.

b) La mediana (50º percentil) será la observación numero 4 cuyo valor es 9.

c) El tercer percentil (75º percentil) será

O sea la observación numero 6 cuyo valor es 15.

Page 29: Analisis e Interpretacion de Distribuciones de Frecuencia en Los Estudios Descriptivos COMPLETO