medidas de descripción y disperción
Post on 08-Jan-2016
9 Views
Preview:
DESCRIPTION
TRANSCRIPT
UNIVERSIDAD NACIONAL DE INGENIERIA
Lic. Manuel Morales Martnez
DEPARTAMENTO DE CIENCIAS BSICAS ESTADSTICAASIGNATURA:ESTADSTICA
Unidad III: Medidas de descripcin estadstica.2012INTRODUCCIN
La palabra Estadstica signific originalmente el conjunto de datos demogrficos, y econmicos de importancia vital para el estado, de ah su nombre.
La importancia de la estadstica radica principalmente en sus aplicaciones, su campo de aplicacin que en un principio se limit al uso estatal, se ha extendido ahora a la agricultura, la biologa, los negocios, la qumica, las comunicaciones, la economa, la contabilidad, la educacin, la electrnica, la medicina, la fsica, la psicologa y otros muchos campos de las ciencias y las ingenieras.
MEDIDAS DE DESCRIPCIN ESTADSTICA.Las medidas descriptivas numricas calculadas a partir del total de observaciones de la poblacin se denominan parmetros, aquellas calculadas de las observaciones de una muestra se denominan estadsticos.
1.- MEDIDAS DE TENDENCIA CENTRALLas medidas de tendencia central sirven para hacerse una imagen mental de la distribucin de un conjunto de datos, es decir, una medida del centro de la distribucin de los datos. Las medidas de tendencia central son la media aritmtica, la media ponderada, la media geomtrica, la mediana y la moda, las cuales se calculan para datos no agrupados y para datos agrupados auxilindonos de la Tabla de Frecuencias (TDF).
1.1.- Media Aritmtica:La media aritmtica representa el valor promedio de los datos, se denota por: para una muestra y por ( para una poblacin.
a) Para datos no agrupados se define como , en donde: xi es cada una de las observaciones y n es el nmero de datos (observaciones) o tamao de la muestra.
b) Para datos agrupados, es decir que se encuentran en una Tabla de Frecuencia se define como , donde: f es la frecuencia absoluta, mi es la marca de clase y n es el nmero de observaciones.
1.2.- Media Ponderada:Es un caso especial de la media aritmtica. Se presenta cuando se tienen varias observaciones con un mismo valor, lo que puede ocurrir si se han agrupado los datos en una distribucin de frecuencia.En general la media ponderada de un conjunto de nmeros designados por xi con sus correspondientes pesos (veces que se repiten), se calcula as:
1.3.- Media Geomtrica:
La media geomtrica de una cantidad finita de nmeros (digamos n nmeros) es la raz n-sima del producto de todos los nmeros (observaciones o datos). Slo es relevante la media geomtrica si todos los nmeros son positivos. Si uno de ellos es 0, entonces el resultado es 0. Si hay un nmero negativo (o una cantidad impar de ellos) entonces la media geomtrica es, o bien negativa o bien inexistente en los nmeros reales. Su frmula es:
2.- La Mediana:Es un valor central que tiene la caracterstica de dividir en dos partes iguales las observaciones. Un 50% de las observaciones son menores o iguales a la mediana y el otro 50% son mayores, se denota por Me.
a) Para datos no agrupados: se ordenan los datos y se escoge el valor central del conjunto de datos, para eso se debe considerar cuando el nmero de datos es par o impar. Si n es impar, entonces . Si n es par, entonces ; o sea: el promedio de los datos centrales.
b) Para datos agrupados se define , donde
Li: Limite inferior del intervalo que contiene a la MeF: Frecuencia acumulada anterior al intervalo que contiene a la Mef : Frecuencia absoluta del intervalo que contiene a la Mew: Amplitud de clase (o longitud del intervalo de clases).
Para obtener la Mediana, identificamos la categora (o el intervalo) que contiene a la Mediana, la cual ser donde la frecuencia acumulada contiene el 50% de los datos.
3.- La Moda:De una serie de datos numricos es el nmero que ocurre con mayor frecuencia (datos no agrupados). Basta observar el nmero que mas se repite.
Para datos agrupados, la moda est en la mayor concentracin de datos (mayor frecuencia), la clase con mayor frecuencia es la clase modal. La moda si existe puede ser no nica y se denota por Mo, se define como:
, donde
Li: Lmite inferior del intervalo Modal.
(1: Mayor frecuencia menos la inmediata anterior
(2: Mayor frecuencia menos la inmediata posterior
w: Amplitud de clases (o longitud del intervalo de clases).2.-MEDIDAS DE POSICIN
Son medidas de posicin ya que por debajo de ellas se ubica un determinado tanto por ciento. a) Si los datos se dividen en cuatro partes iguales se llaman cuartiles y se representan por Qi.
b) Si los datos se dividen en diez partes iguales se llaman Deciles y se representan por Di.
c) Si los datos se dividen en cien partes iguales reciben el nombre de Percentiles y se representan por Pi.
Las formulas para los Cuartiles, Deciles y Percentiles para datos agrupados son:
donde:
Li: Limite inferior del intervalo que contiene a la medida.
F: Frecuencia acumulada anterior al intervalo que contiene a la medida.
f: Frecuencia absoluta del intervalo que contiene a la medida.
w: Amplitud de clase (o longitud del intervalo de clases).
3.- MEDIDAS DE VARIABILIDADSon medidas que expresan variabilidad o dispersin alrededor de un valor promedio. Una vez localizado el centro de distribucin de un conjunto de datos nos vemos en la necesidad de medir el grado en que se dispersan los datos alrededor del valor promedio.
Una caracterstica de casi todos los datos es que los valores no son todos iguales, de ser as el grado de dispersin alrededor del promedio seria cero. Para medir el grado de dispersin lo hacemos a travs de la varianza y la desviacin estndar.
3.1.- VARIANZA:Expresa variabilidad al cuadrado con respecto a la media, se representa por s2 si se calcula para datos de una muestra o (2 si representa la medida de una poblacin y se obtiene:
a) Datos no agrupados
b) Datos Agrupados
xi: datos
mi: marcas de clases
: media aritmtica
f: frecuencia absoluta
n: total de observaciones
n: total de observaciones
3.2.- DESVIACIN ESTANDAR:Expresa variabilidad lineal alrededor del valor promedio, es la raz cuadrada de la varianza y se denota por s y se obtiene tanto para datos agrupados como para no agrupados.
3.3.- COEFICIENTE DE VARIACIN:Se utiliza para comparar la variabilidad de dos o mas distribuciones, ser ms representativa (menos variabilidad) la que tenga el coeficiente de variacin (cv) ms pequeo.
4.- EJERCICIOS PROPUESTOS
1.- Los contenidos de nicotina, en miligramos de 40 cigarrillos de cierta marca son:
1.091.792.031.631.690.851.641.51
1.741.371.862.311.882.171.751.82
1.581.750.721.971.41.682.281.67
2.111.922.461.72.371.851.242.09
1.641.471.931.901.792.082.551.69
a) Construya una Tabla de Distribucin de Frecuencias.
b) Calcule e interprete
2.- Los datos representan las cuotas que 28 clientes tienen que cancelar mensualmente en una casa comercial por un artculo que adquirieron al crdito.562869708775775704809
856655806878909918558
768870918940946661820
898935952957693835905
c) Construya una Tabla de Distribucin de Frecuencias.
d) Calcule e interprete
3.- En un inventario hecho para el cierre de ao fiscal en una cadena de Ferreteras se registraron los dimetros interiores de anillos forjados para pistones que se usan en los motores de automviles, medidos en mm y son los siguientes.
74.030
74.002
73.992
74.024
73.996
74.007
73.995
73.988
74.002
73.992
74.019
74.001
74.021
73.993
74.015
73.992
74.011
74.005
74.015
74.029
74.008
74.004
74.002
74.009
74.014
e) Construya una Tabla de Distribucin de Frecuencias.
f) Calcule e interprete
PAGE 1
_1338102148.unknown
_1338104196.unknown
_1338104399.unknown
_1338104416.unknown
_1338104639.unknown
_1338104385.unknown
_1338103734.unknown
_1338103924.unknown
_1338103658.unknown
_1170778657.unknown
_1170779398.unknown
_1170780098.unknown
_1338102041.unknown
_1170779633.unknown
_1170779122.unknown
_1170774767.unknown
_1170778443.unknown
_1170774476.unknown
top related