imforme estadistica

16
ESTADISTICA Y PROBABILIDADES INTRODUCCION Las medidas de dispersión (desviación media, varianza, desviación estándar, rango, amplitud) son todas medidas de variación absolutas. Una medida de dispersión relativa de los datos, que toma en cuenta su magnitud, está dada por el coeficiente de variación. El Coeficiente de variación (CV) es una medida de la dispersión relativa de un conjunto de datos, que se obtiene dividiendo la desviación estándar del conjunto entre su media aritmética y se expresa generalmente en términos porcentuales. ING. CIVIL Página 1 Hernández Machado Yanina

Upload: yaninaa-hernandez-machado

Post on 19-Jan-2016

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: IMFORME ESTADISTICA

INTRODUCCION

Las medidas de dispersión (desviación media, varianza, desviación estándar, rango, amplitud) son todas medidas de variación absolutas. Una medida de dispersión relativa de los datos, que toma en cuenta su magnitud, está dada por el coeficiente de variación.

El Coeficiente de variación (CV) es una medida de la dispersión relativa de un conjunto de datos, que se obtiene dividiendo la desviación estándar del conjunto entre su media aritmética y se expresa generalmente en términos porcentuales.

ING. CIVILPágina 1

Hernández Machado Yanina

Page 2: IMFORME ESTADISTICA

Variación – Dispersión

Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. En cambio las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la mediana media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.

Medidas de dispersión

En secciones anteriores se ha discutido sobre tres medidas descriptivas del centro. Sin embargo, estas medidas no son suficientes para caracterizar la distribución, puesto que otro aspecto que debe ser tomada en cuenta es la variabilidad de las observaciones.

Con el propósito de medir la dispersión o variabilidad, se discutirán en este apartado las medidas de: Amplitud (llamada también rango o recorrido), Desviación media, Varianza, Desviación Estándar (también llamada desviación típica) y Coeficiente de Variación.

Amplitud o recorrido

La medida de dispersión más simple recibe el nombre de Amplitud o recorrido y es muy poco usada puesto que su única ventaja es la sencillez con que se calcula. Es común que se use también el nombre de Rango para esta medida. La amplitud (A) de un conjunto de datos es la diferencia entre las observaciones que tienen el mayor y el menor valor numérico en el mismo.

Por ejemplo: Supóngase que en un hospital el pulso de cada paciente se mide tres veces al día y que cierto día los registros de dos pacientes muestran:

Paciente 1: 73 77 74

Paciente 2: 64 90 73

¿Cuál es la Amplitud en pulsaciones para cada paciente?

ING. CIVILPágina 2

Hernández Machado Yanina

Page 3: IMFORME ESTADISTICA

Para calcular la amplitud de los datos necesario identificar el valor más grande y el valor más pequeño del conjunto de datos de cada uno de los pacientes.

Para el Paciente 1:

A = 77 - 73 = 4

Para el Paciente 2:

A = 90 - 64 = 26

La amplitud es una medida de dispersión cuya ventaja es la facilidad con que se calcula. Tiene en cambio las siguientes desventajas:

En su cálculo sólo intervienen dos elementos del conjunto. Al aumentar el número de observaciones, puede esperarse que aumente la

variabilidad. Puesto que la amplitud no tiene en cuenta el tamaño del conjunto, no es una medida adecuada para comparar la variabilidad de dos grupos de observaciones, a menos que éstos sean del mismo tamaño. []

Varianza

La varianza es una medida estadística que mide la dispersión de los valores respecto a un valor central (media), es decir, es el cuadrado de las desviaciones:

Propiedades

La varianza es siempre positiva o 0: Si a los datos de la distribución les sumamos una cantidad constante la

varianza no se modifica.

[2]

Si a los dato de la distribución los multiplicamos una constante, la varianza queda multiplicada por el cuadrado de esa constante.

ING. CIVILPágina 3

Hernández Machado Yanina

Page 4: IMFORME ESTADISTICA

Propiedad distributiva: con

1. Varianza Poblacional

Cuando se contrasta la hipótesis de igualdad de medias de dos poblaciones o cuando se realiza un análisis de la varianza (ANOVA) es fundamental decidir si puede aceptarse que las muestras independientes provienen de poblaciones con la misma varianza.

Si la altura de las 'cajas' y los 'bigotes' correspondientes a los diagramas de caja de cada una de las muestras son aproximadamente iguales, se tiene un indicio de que posiblemente las muestras provienen de poblaciones con igual varianza.

Como complemento numérico al gráfico se realiza la prueba de Levene que calcula un estadístico que mide la diferencia entre las varianzas y la probabilidad de haberla obtenido al azar bajo el supuesto de que las varianzas poblacionales de los grupos sean iguales. Las hipótesis del contraste son:

La secuencia es:

Analizar Estadísticos Descriptivos Explorar En el cuadro de diálogo se indica la variable de interés 'Dependiente' y la

variable que define los grupos 'Factores'. En Gráficos se debe activar la opción Estimación de potencia.

El contraste de Levene se realiza por defecto cuando se contrasta la diferencia de dos o más medias.

ING. CIVILPágina 4

Hernández Machado Yanina

Page 5: IMFORME ESTADISTICA

Ejemplo:

Para la variable Coste de la encuesta Enctran.sav contrastar si existe diferencia significativa entre las varianzas del coste en transporte de los alumnos que viven en Barcelona y de los que viven fuera.

Los resultados que se obtuvieron fueron los siguientes:

Como puede verse, bajo la hipótesis nula de varianzas iguales el estadístico de Levene (F) toma el valor 37,671.

Este valor es suficientemente grande como para rechazar la hipótesis nula para cualquier nivel de significación. Si se observan los correspondientes diagramas de caja:

Se ve claramente que la variabilidad del coste en el grupo de los residentes en Barcelona es menor que en el de los no residentes.

ING. CIVILPágina 5

Hernández Machado Yanina

Page 6: IMFORME ESTADISTICA

Varianza Muestral

Se puede definir como el "casi promedio" de los cuadrados de las desviaciones de los datos con respecto a la media muestral. Su fórmula matemática para el caso de datos referentes a una muestra es:

Y para el caso de datos de una población es dada por

Propiedades de la varianza

Dos propiedades importantes de la varianza son:

1. La varianza de una constante es cero

2. Otra propiedad importante es que si se tiene la varianza de de un conjunto

de datos y a cada observación se multiplica por una constante , entonces la nueva varianza de los datos se obtiene multiplicando a la varianza de los datos

por .

Ejemplo

La varianza muestral para los datos del ejemplo 1 de la clase 04, se determina de la siguiente manera

Ejemplo propiedades de la varianza

Retomando el ejemplo 4 de la clase 04 y suponiendo que la varianza de los salarios del año 2000 fue 100.000, se tiene que la varianza para los salarios del año 2001 es

ING. CIVILPágina 6

Hernández Machado Yanina

Page 7: IMFORME ESTADISTICA

La desviación estándar y media

Para presentar la desviación estándar, que es por mucho la medida generalmente más útil de la dispersión, obsérvese que la dispersión de un conjunto de datos es pequeña si los valores se agrupan en forma cerrada en torno a su media y es grande si los valores se dispersan ampliamente en torno a su media. Por tanto, parecería razonable medir la dispersión de un conjunto de datos en términos de las cantidades en las cuales difieren los valores individuales de su media. Si se tiene un conjunto de números:

que constituyen una población con una media , las diferencias entre:

se denominan las desviaciones de la media y esto sugiere que se podría usar el promedio de estas desviaciones como medida de dispersión en la población. A menos que las X sean todas iguales, algunas de las desviaciones serán positivas y otras negativas, la suma de todas las desviaciones de la media

y en consecuencia también su promedio es siempre cero.

Como realmente se está interesado en la magnitud de las desviaciones, y no si son positivas o negativas, se pueden ignorar simplemente los signos y definir una medida de variación en términos de los valores absolutos de las desviaciones de la media. En realidad, si se suman las desviaciones de la media como si fueran todas positivas o cero y las dividiéramos entre N, se obtendría la media estadística que se denomina desviación media y se representa por:

Esta medida tiene una apariencia intuitiva, pero debido al valor absoluto, lleva a encontrar dificultades teóricas en problemas de inferencia y rara vez se usa.

ING. CIVILPágina 7

Hernández Machado Yanina

Page 8: IMFORME ESTADISTICA

Un método alternativo consiste en trabajar con los cuadrados de las desviaciones de la media, ya que también esto eliminará el efecto de los signos. Los cuadrados de números reales no pueden ser negativos y pueden tomar el valor de cero.

Por consiguiente, si se promedia las desviaciones cuadradas de la media y se toma la raíz cuadrada del resultado (para compensar el hecho de que las desviaciones fuesen cuadradas), se obtiene la Desviación estándar de la población.

Ésta medida de variación se representa por medio de sigma minúscula ( ) y al expresar literalmente lo que se ha hecho aquí de manera matemática, también se conoce como la raíz de la desviación cuadrada media. A su cuadrado de se le llama Varianza de la población.

Quizá parezca lógico utilizar la misma fórmula con n y sustituidas por N y , para la desviación estándar de una muestra; pero, esto no es realmente lo que se hace. En lugar de dividir la suma de las desviaciones entre n, se divide entre (n-1) y se define como desviación estándar de la muestra, que se denota con s como

Su cuadrado s2, se llama la Varianza de la muestra.

Al dividir entre n-1 en vez de hacerlo entre n, tiene una buena razón. Si se dividiera

entre n y se utilizara s2 como estimación de es decir, se utilizaría la varianza de una muestra para determinar la varianza de la población de la cual provino, el resultado sería demasiado pequeño y esto se corrige al dividir entre n-1 en lugar de hacerlo entre n. Si el valor de n es muy grande no importa hacerlo entre n-1 sino que es práctico para definir s como se hizo.

Ejemplo

La desviación estándar para los datos del ejemplo 1 de la clase 04 es

ING. CIVILPágina 8

Hernández Machado Yanina

Page 9: IMFORME ESTADISTICA

El rango intercuartilico

Es la distancia entre los cuartiles superior e inferior y se define como:

Es una medida de variabilidad que no se deja influenciar por medidas extremas grandes o pequeñas.

Propiedades de la desviación estándar

1. La desviación estándar será siempre un valor posit ivo o cero , en el caso de que las puntuaciones sean iguales.

2. Si a todos los valores de la variable se les suma un número la desviación estándar no varía .

3. Si todos los valores de la variable se mult ipl ican por un número la desviación estándar queda mult ipl icada por dicho número.

4. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones estándar se puede calcular la desviación estándar total .

Si todas las muestras tienen el mismo tamaño:

Si las muestras tienen distinto tamaño:

ING. CIVILPágina 9

Hernández Machado Yanina

Page 10: IMFORME ESTADISTICA

Observaciones sobre desviación la estándar

a) La desviación estándar , al igual que la media y la varianza, es un índice muy sensible a las puntuaciones extremas.

b) En los casos que no se pueda hal lar la media tampoco será posible hallar la desviación estándar .

c) Cuanta más pequeña sea la desviación estándar mayor será la concentración de datos alrededor de la media .

El coeficiente de variación

Las medidas de dispersión anteriores son todas medidas de variación absolutas. Una medida de dispersión relativa de los datos, que toma en cuenta su magnitud, está dada por el coeficiente de variación.

El Coeficiente de variación (CV) es una medida de la dispersión relativa de un conjunto de datos, que se obtiene dividiendo la desviación estándar del conjunto entre su

media aritmética y se expresa como para una muestra y

para la población.

Los coeficientes de variación tienen las siguientes características:

Puesto que tanto la desviación estándar como la media se miden en las unidades originales, el CV es una medida independiente de las unidades de medición.

Debido a la propiedad anterior el CV es la cantidad más adecuada para comparar la variabilidad de dos conjuntos de datos.

En áreas de investigación donde se tienen datos de experimentos previos, el CV es muy usado para evaluar la precisión de un experimento, comparando en CV del experimento en cuestión con los valores del mismo en experiencias anteriores.

Ejemplo:

En seis sábados consecutivos un operador de taxis recibió 9, 7, 11, 10, 13 y 7 llamadas a su sitio para su servicio. Calcule:

ING. CIVILPágina 10

Hernández Machado Yanina

Page 11: IMFORME ESTADISTICA

a. Amplitud. b. Media. c. Desviación media. d. Desviación estándar. e. Varianza. f. Coeficiente de variación.

a) Para calcular la amplitud.

Valor máximo 13

Valor mínimo 7

A = 13 - 7 = 6

b) Para calcular la media.

c) Para calcular la desviación media

d) Para calcular la desviación estándar

Se puede utilizar la siguiente tabla:

ING. CIVILPágina 11

Hernández Machado Yanina

Page 12: IMFORME ESTADISTICA

9 -0.5 0.257 -2.5 6.2511

1.5 2.25

10

0.5 0.25

13

3.5 12.25

7 -2.5 6.250.0 27.50

Al sustituir los valores se obtiene:

e) Para calcular la varianza:

f) Para calcular el coeficiente de variación:

Es una medida que se emplea fundamentalmente para:

1. Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades de medida. Por ejemplo, kilogramos y centímetros.

2. Comparar la variabilidad entre dos grupos de datos obtenidos por dos o más personas distintas.

3. Comparar dos grupos de datos que tienen distinta media. 4. Determinar si cierta media es consistente con cierta varianza.

El Coeficiente de Variación muestral se denota y se define como:

( )

ING. CIVILPágina 12

Hernández Machado Yanina

Page 13: IMFORME ESTADISTICA

Referencias Bibliográficas:

http://mayoleytte.webcindario.com/apuntes/variacion.pdf http://www.monografias.com/trabajos88/dispersion-

relativa/dispersion-relativa.shtml http://colposfesz.galeon.com/est501/distfrec/meddisp/

meddisp.htm

ING. CIVILPágina 13

Hernández Machado Yanina