medidas de descripción y disperción

Upload: reynaldo-jose-alvarado-ramos

Post on 08-Jan-2016

6 views

Category:

Documents


0 download

DESCRIPTION

Descripcion y dispersion

TRANSCRIPT

UNIVERSIDAD NACIONAL DE INGENIERIA

Lic. Manuel Morales Martnez

DEPARTAMENTO DE CIENCIAS BSICAS ESTADSTICAASIGNATURA:ESTADSTICA

Unidad III: Medidas de descripcin estadstica.2012INTRODUCCIN

La palabra Estadstica signific originalmente el conjunto de datos demogrficos, y econmicos de importancia vital para el estado, de ah su nombre.

La importancia de la estadstica radica principalmente en sus aplicaciones, su campo de aplicacin que en un principio se limit al uso estatal, se ha extendido ahora a la agricultura, la biologa, los negocios, la qumica, las comunicaciones, la economa, la contabilidad, la educacin, la electrnica, la medicina, la fsica, la psicologa y otros muchos campos de las ciencias y las ingenieras.

MEDIDAS DE DESCRIPCIN ESTADSTICA.Las medidas descriptivas numricas calculadas a partir del total de observaciones de la poblacin se denominan parmetros, aquellas calculadas de las observaciones de una muestra se denominan estadsticos.

1.- MEDIDAS DE TENDENCIA CENTRALLas medidas de tendencia central sirven para hacerse una imagen mental de la distribucin de un conjunto de datos, es decir, una medida del centro de la distribucin de los datos. Las medidas de tendencia central son la media aritmtica, la media ponderada, la media geomtrica, la mediana y la moda, las cuales se calculan para datos no agrupados y para datos agrupados auxilindonos de la Tabla de Frecuencias (TDF).

1.1.- Media Aritmtica:La media aritmtica representa el valor promedio de los datos, se denota por: para una muestra y por ( para una poblacin.

a) Para datos no agrupados se define como , en donde: xi es cada una de las observaciones y n es el nmero de datos (observaciones) o tamao de la muestra.

b) Para datos agrupados, es decir que se encuentran en una Tabla de Frecuencia se define como , donde: f es la frecuencia absoluta, mi es la marca de clase y n es el nmero de observaciones.

1.2.- Media Ponderada:Es un caso especial de la media aritmtica. Se presenta cuando se tienen varias observaciones con un mismo valor, lo que puede ocurrir si se han agrupado los datos en una distribucin de frecuencia.En general la media ponderada de un conjunto de nmeros designados por xi con sus correspondientes pesos (veces que se repiten), se calcula as:

1.3.- Media Geomtrica:

La media geomtrica de una cantidad finita de nmeros (digamos n nmeros) es la raz n-sima del producto de todos los nmeros (observaciones o datos). Slo es relevante la media geomtrica si todos los nmeros son positivos. Si uno de ellos es 0, entonces el resultado es 0. Si hay un nmero negativo (o una cantidad impar de ellos) entonces la media geomtrica es, o bien negativa o bien inexistente en los nmeros reales. Su frmula es:

2.- La Mediana:Es un valor central que tiene la caracterstica de dividir en dos partes iguales las observaciones. Un 50% de las observaciones son menores o iguales a la mediana y el otro 50% son mayores, se denota por Me.

a) Para datos no agrupados: se ordenan los datos y se escoge el valor central del conjunto de datos, para eso se debe considerar cuando el nmero de datos es par o impar. Si n es impar, entonces . Si n es par, entonces ; o sea: el promedio de los datos centrales.

b) Para datos agrupados se define , donde

Li: Limite inferior del intervalo que contiene a la MeF: Frecuencia acumulada anterior al intervalo que contiene a la Mef : Frecuencia absoluta del intervalo que contiene a la Mew: Amplitud de clase (o longitud del intervalo de clases).

Para obtener la Mediana, identificamos la categora (o el intervalo) que contiene a la Mediana, la cual ser donde la frecuencia acumulada contiene el 50% de los datos.

3.- La Moda:De una serie de datos numricos es el nmero que ocurre con mayor frecuencia (datos no agrupados). Basta observar el nmero que mas se repite.

Para datos agrupados, la moda est en la mayor concentracin de datos (mayor frecuencia), la clase con mayor frecuencia es la clase modal. La moda si existe puede ser no nica y se denota por Mo, se define como:

, donde

Li: Lmite inferior del intervalo Modal.

(1: Mayor frecuencia menos la inmediata anterior

(2: Mayor frecuencia menos la inmediata posterior

w: Amplitud de clases (o longitud del intervalo de clases).2.-MEDIDAS DE POSICIN

Son medidas de posicin ya que por debajo de ellas se ubica un determinado tanto por ciento. a) Si los datos se dividen en cuatro partes iguales se llaman cuartiles y se representan por Qi.

b) Si los datos se dividen en diez partes iguales se llaman Deciles y se representan por Di.

c) Si los datos se dividen en cien partes iguales reciben el nombre de Percentiles y se representan por Pi.

Las formulas para los Cuartiles, Deciles y Percentiles para datos agrupados son:

donde:

Li: Limite inferior del intervalo que contiene a la medida.

F: Frecuencia acumulada anterior al intervalo que contiene a la medida.

f: Frecuencia absoluta del intervalo que contiene a la medida.

w: Amplitud de clase (o longitud del intervalo de clases).

3.- MEDIDAS DE VARIABILIDADSon medidas que expresan variabilidad o dispersin alrededor de un valor promedio. Una vez localizado el centro de distribucin de un conjunto de datos nos vemos en la necesidad de medir el grado en que se dispersan los datos alrededor del valor promedio.

Una caracterstica de casi todos los datos es que los valores no son todos iguales, de ser as el grado de dispersin alrededor del promedio seria cero. Para medir el grado de dispersin lo hacemos a travs de la varianza y la desviacin estndar.

3.1.- VARIANZA:Expresa variabilidad al cuadrado con respecto a la media, se representa por s2 si se calcula para datos de una muestra o (2 si representa la medida de una poblacin y se obtiene:

a) Datos no agrupados

b) Datos Agrupados

xi: datos

mi: marcas de clases

: media aritmtica

f: frecuencia absoluta

n: total de observaciones

n: total de observaciones

3.2.- DESVIACIN ESTANDAR:Expresa variabilidad lineal alrededor del valor promedio, es la raz cuadrada de la varianza y se denota por s y se obtiene tanto para datos agrupados como para no agrupados.

3.3.- COEFICIENTE DE VARIACIN:Se utiliza para comparar la variabilidad de dos o mas distribuciones, ser ms representativa (menos variabilidad) la que tenga el coeficiente de variacin (cv) ms pequeo.

4.- EJERCICIOS PROPUESTOS

1.- Los contenidos de nicotina, en miligramos de 40 cigarrillos de cierta marca son:

1.091.792.031.631.690.851.641.51

1.741.371.862.311.882.171.751.82

1.581.750.721.971.41.682.281.67

2.111.922.461.72.371.851.242.09

1.641.471.931.901.792.082.551.69

a) Construya una Tabla de Distribucin de Frecuencias.

b) Calcule e interprete

2.- Los datos representan las cuotas que 28 clientes tienen que cancelar mensualmente en una casa comercial por un artculo que adquirieron al crdito.562869708775775704809

856655806878909918558

768870918940946661820

898935952957693835905

c) Construya una Tabla de Distribucin de Frecuencias.

d) Calcule e interprete

3.- En un inventario hecho para el cierre de ao fiscal en una cadena de Ferreteras se registraron los dimetros interiores de anillos forjados para pistones que se usan en los motores de automviles, medidos en mm y son los siguientes.

74.030

74.002

73.992

74.024

73.996

74.007

73.995

73.988

74.002

73.992

74.019

74.001

74.021

73.993

74.015

73.992

74.011

74.005

74.015

74.029

74.008

74.004

74.002

74.009

74.014

e) Construya una Tabla de Distribucin de Frecuencias.

f) Calcule e interprete

PAGE 1

_1338102148.unknown

_1338104196.unknown

_1338104399.unknown

_1338104416.unknown

_1338104639.unknown

_1338104385.unknown

_1338103734.unknown

_1338103924.unknown

_1338103658.unknown

_1170778657.unknown

_1170779398.unknown

_1170780098.unknown

_1338102041.unknown

_1170779633.unknown

_1170779122.unknown

_1170774767.unknown

_1170778443.unknown

_1170774476.unknown