2.1 medidas descriptivas

35
María del Consuelo Valle Espinosa Medidas descriptivas Instituto Tecnológico Superior de Zacapoaxtla Departamento de Desarrollo Académico

Upload: consuelo-valle

Post on 24-Jul-2015

532 views

Category:

Documents


0 download

TRANSCRIPT

María del Consuelo Valle Espinosa

Medidas descriptivas

Instituto Tecnológico Superior de Zacapoaxtla

Departamento de Desarrollo Académico

M. en C. María del Consuelo Valle Espinosa Media aritmética. Media armónica. Media geométrica. Mediana. Moda.

Medidas de tendencia central

En tiempos pasados, cuando los azares de los viajes marinos eran más

serios que en la actualidad, cuando los barcos golpeados por las

tormentas tiraban por la borda una parte de su carga, se reconoció que

aquellos cuyos bienes se sacrificaban podían reclamar una justa

indemnización a expensas de aquellos cuyos bienes llegaban si

novedad. El valor de los bienes perdidos se pagan mediante un acuerdo

entre todos los que tenían mercancías en el mismo buque. El daño

causado por el mar al cargamento se conocía como HAVARIA. De esta

palabra latina se deriva la moderna palabra inglesa AVERAGE

(promedio)

El propósito de un promedio es representar un grupo de valores individuales de una manera simple y concisa de modo que la mente pueda hacerse con una rápida visión el tamaño general de los individuos en el grupo sin que la distraigan las variaciones fortuitas y sin importancia.

El promedio ha de actuar como REPRESENTANTE y es una cifra con significado que permite hacer deducciones.

Los promedios suelen ser muy desorientadores por eso se han definido diferentes tipos de promedios con la finalidad de escoger el apropiado para el tipo de datos y su propósito.

Los promedios también son conocidos como:

«MEDIADAS DE TENDENCIA CENTRAL»

Calculan el valor alrededor del cual se acumulan los diversos valores diferentes.

!El tipo de medida de tendencia central adecuada

depende siempre de los términos del problema en curso, las fórmulas no se han de aplicar nunca de manera indiscriminada!

Media Aritmética de un conjunto de números:

Se calcula sumando los elementos del conjunto y dividiendo el total por el número de individuos del conjunto (los elementos a promediar han de ser del mismo tipo).

Media Aritmética para un conjunto de números ordenados:

Es la suma de todos sus posibles valores, ponderada por las frecuencias de los mismos.

Para la tabla de valores siguientes:

La media aritmética se calcula como:

La Media Armónica es el reciproco de la media aritmética de los recíprocos de los valores que queremos promediar.

Ejemplo:

Un aeroplano vuela alrededor de un cuadrado cuyo lado tiene 100 km de largo; el primer lado lo recorrer a 100 k/h, el segundo 200 km/h, el tercero a 300 km/h y el cuarto a 400 km/h. ¿Cuál es la velocidad media?

hkm

x

nn

i i

/ 192

1200254

4001

3001

2001

1001

4

1

1

La media armónica es adecuada porque los tiempos eran variables con distancias constantes.

La Media Geométrica:

Es la media que hay que usar cuando se quiere promediar cantidades que siguen un progresión geométrica o exponencial.

Para calcularla se multiplican entre sí todas las cantidades que se quieren promediar y después se obtiene la raíz enésima del producto.

nnxxx 21 geométrica Media

Algunos inconvenientes de los promedios

Uno de ellos es que es que son muy sensible a los valores extremos de la variable: ya que todas las observaciones intervienen en sus cálculos. La aparición de una observación extrema, hará que el promedio se desplace en esa dirección. En consecuencia, no es recomendable usarlos como medida central en las distribuciones muy asimétricas.

Si consideramos una variable discreta, por ejemplo, el número de hijos, el valor de los promedios puede no pertenecer al conjunto de valores de la variable.

Mediana

Consideramos una variable discreta X cuyas observaciones en una tabla estadística han sido ordenadas de menor a mayor. Llamaremos mediana, al primer valor de la variable que deja por debajo de sí al 50% de las observaciones.

En el caso de variables continuas, las clases vienen dadas por intervalos, y aquí la fórmula de la mediana se complica un poco más (pero no demasiado):Sea el intervalo donde hemos encontrado que por debajo están el 50% de las observaciones. Entonces se obtiene la mediana a partir de las frecuencias absolutas acumuladas, mediante interpolación lineal (teorema de Thales)

],( 1 ii ll

Esto equivale a decir que la mediana divide al histograma en dos partes de áreas iguales a 1/2 .

Un ejemplo de cálculo de media y mediana

Obtener la media aritmética y la mediana en la distribución siguiente.

Determinar gráficamente cuál de las dos medidas de tendencia central es más significativa.

Solución:

La media aritmética es:

75.32200

6500

n

nxx ii

La mediada es:

La primera frecuencia absoluta acumulada que supera el valor n/2 = 100 es Ni = 140. Por ello el intervalo mediano es [10; 20). Así:

1510102/

80601001

1 i

i

iied a

n

NnlM

Propiedades de la mediana

Entre las propiedades de la mediana, vamos a destacar las siguientes:

Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones extremas, ya que no depende de los valores que toma la variable, sino del orden de las mismas. Por ello es adecuado su uso en distribuciones asimétricas.

Es de cálculo rápido y de interpretación sencilla.

A diferencia de la media, la mediana de una variable discreta es siempre un valor de la variable que estudiamos.

Llamaremos moda el valor que aparece más comúnmente.

Es muy fácil de calcular.

Puede no ser única.

La moda es una base my pobre para cualquier cálculo posterior de naturaleza aritmética, porque ha excluido deliberadamente precisión aritmética a fin de presentar el resultado más común.

Puede que no sea única.

Moda

Cuartiles

Estadísticos de posición

Para una variable discreta, se define los cuartiles, como aquellas observaciones, Q25, Q50, Q75 que dejan por debajo de si el 25%, 50% y 75% de los datos respectivamente, la Mediana es el cuartil Q50

Ejemplo 1:

Dada la siguiente distribución en el número de hijos de cien familias, calcular sus cuartiles.

Primer Cuartil.

n/4 = 25; Primera Ni > 25 es 39; luego Q1 =2

Segundo Cuartil.

2n/4 = 50; Primera Ni > 50 es 65; luego Q2

=3Tercer Cuartil.

3n/4 = 75; Primera Ni > 75 es 85; luego Q3 =4

Ejemplo2:

Calcular los cuartiles en la siguiente distribución de una variable continua:

Intervalo Intervalo intercuártico Desviación media Varianza Desviación estándar

Dispersión

Los estadísticos de tendencia central o posición nos indican donde se sitúa un grupo de puntuaciones. Los de variabilidad o dispersión nos indican si esas puntuaciones o valores están próximas entre sí o si por el contrario están o muy dispersas.

¿Cómo se puede obtener una medida de la variabilidad alrededor del valor medio?

Intervalo

Diferencia entre el mayor y el menor valor

NOTA:

Esta medida de dispersión está afectada por los valores extremos.

Intervalo intercuártico

Diferencia entre el tercer y primer cuartil, es la longitud del intervalo que la mitad central de los datos.

Desviación media:

El promedio del valor absoluto de la diferencia entre cada uno de los elementos y su media

n

xx

media Desviación

Las medidas; intervalo, intervalo cuártico, desviación media se usan en el trabajo elemental, a causa de su facilidad de cálculo y comprensión pero no se usa en la inferencia estadística. Los grandes teoremas que le dan sustento matemático a la inferencia están fundamentados en la medidas de dispersión llamada desviación estándar.

Varianza:

La varianza, se define como la media de las diferencias cuadráticas de n puntuaciones con respecto a su media aritmética.

Esta medida es siempre una cantidad positiva, con propiedades interesantes para la realización de

inferencia estadística

La varianza no tiene la misma magnitud que las observaciones (ej. si las observaciones se miden en metros, la varianza lo hace en metros cuadrados.

Si queremos que la medida de dispersión sea de la misma dimensionalidad que las observaciones bastaría con tomar su raíz cuadrada. Por ello se define la desviación estándar.

n

xxs

n

Es sensible a la variación de cada una de las puntuaciones, es decir, si una puntuación cambia, cambia con ella la varianza o la desviación estándar.

No es recomendable el uso de ellas, cuando tampoco lo sea el de la media como medida de tendencia central.

Coeficiente de variación

El coeficiente de variación de una variable medida en metros es una cantidad adimensional que no cambia si la medición se realiza en centímetros.

Presenta problemas ya que a diferencia de la desviación estándar este coeficiente es variable ante cambios de origen. Por ello es importante que todos los valores sean positivos y su media dé, por tanto, un valor positivo.

A mayor valor del coeficiente de variación mayor heterogeneidad de los valores de la variable; y a menor Cv, mayor homogeneidad en los valores de la variable.

Para su mejor interpretación se expresa como porcentaje.

100

x

SCv

Depende de la desviación estándar y en mayor medida de la media aritmética, dado que cuando ésta es 0 o muy próxima a este valor Cv pierde significado, ya que puede dar valores muy grandes, que no necesariamente implican dispersión de datos.

El coeficiente de variación es típicamente menor que uno u ocho. Sin embargo, en ciertas distribuciones puede ser 1 o mayor que 1.

x

SCv

Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una mejor interpretación porcentual del grado de variabilidad que la desviación típica o estándar.

Ejemplo:

A continuación se dan los resultados obtenidos con una muestra de 50 universitarios. La característica es el tiempo de reacción ante un estímulo auditivo:

1. calcular: Media Mediana Moda Varianza Desviación estándar Primer cuartil Segundo cuartil Tercer Cuartil2. Encontrar el dato mayor y el dato menor3. Construir : Tabla de frecuencia Histograma Diagrama de caja y bigotes.

Un diagrama de caja y bigotes consiste en una caja rectangular, donde los lados más largos muestran el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero(recordemos que el segundo cuartil coincide con la mediana). 

Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las líneas que sobre salen de la caja se llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente

0.11

0.11 Media 0.113988

0.126 Mediana 0.113 Q1 0.10725

0.112 Moda 0.112 Q2 0.113

0.117 Varianza 9.72807E-05 Q3 0.12

0.113 Desviación estándar 0.009863096 M 0.135

0.135 Coeficiente de variación 0.086527497 m 0.094

0.107 Primer cuartil 0.10725

0.122 Segundo cuartil 0.113

0.113 Tercel cuartil 0.12

0.098 Dato mayor 0.135

0.122 Dato menor 0.094

0.105

0.103

0.119 Clase Frecuencia

0.1 0.094 1

0.117 0.09985714 2

0.113 0.10571429 7

0.124 0.11157143 11

0.118 0.11742857 11

0.132 0.12328571 10

0.108 0.12914286 4

0.115 y mayor... 4

0.12

0.107

0.123

0.109

0.117

0.111

0.112

0.101

0.112

0.111

0.119

0.103

0.1

0.108

0.12

0.099

0.102

0.129

0.115

0.121

0.13

0.134

0.118

0.106

0.128

0.094

0.1114

0.09

4

0.09

98...

0.10

57...

0.11

15...

0.11

74...

0.12

32...

0.12

91...

y m

ayo.

..

1 2

7

11 11 10

4 4

Histograma

Ejercicio:

Tomando como base de datos el largo de la cabeza de los peces de la familia Scorpaniedae de Isla de Guadalupe, Baja California, México, 1. calcular: Media Mediana Moda Varianza Desviación estándar Primer cuartil Segundo cuartil Tercer Cuartil2. Encontrar el dato mayor y el dato menor3. Construir : Tabla de frecuencia Histograma Diagrama de caja y bigotes.

Referencias:

Bioestadística: métodos y aplicaciones

Autores: Francisca Ríus Díaz, Francisco Javier Barón López, Elisa Sánchez Font y Luis Parras Guijosa. Universidad de Málaga .

Sitio en Internet:

http://www.bioestadistica.uma.es/libro/

SIGMA EL MUNDO DE LAS MATEMATICAS VOLUMEN III

NEWMAN JAMES R., GRIJALBOISBN 9788425312922