año de la diversificación productiva y del fortalecimiento de la educación estadistica

26
“Año de la Diversificación Productiva y del Fortalecimiento de la Educación” Nombre: Ojeda Antón Rashell Curso: Estadística General Profesor: Hugo Luis (D) Chunga Gutiérrez Tema: Medidas de Resumen para Datos no agrupados

Upload: rashell-jasmin

Post on 05-Nov-2015

12 views

Category:

Documents


0 download

DESCRIPTION

etsadistica

TRANSCRIPT

Ao de la Diversificacin Productiva y del Fortalecimiento de la Educacin

Nombre: Ojeda Antn RashellCurso: Estadstica GeneralProfesor: Hugo Luis (D) Chunga GutirrezTema:Medidas de Resumen para Datos no agrupados

INTRODUCCION

En ocasiones es conveniente resumir la informacin de una muestra (que se representa mediante las distribuciones de frecuencias vistas anteriormente) en un solo valor para obtener indicadores del comportamiento de la variable en diferentes sentidos, como punto alrededor del que toma valores, variabilidad, etc. Resumir la informacin mediante un solo nmero es interesante para comprender mejor cmo se comporta la variable y para poder realizar comparaciones. En este captulo se consideraran las medidas de tendencia central ms habituales. La idea de centro de una distribucin no es nica, aunque en trminos generales se puede decir que se trata de encontrar un punto alrededor del cual tome valores la variable.

Las medidas de dispersin estn encaminadas a cuantificar lo prximos o alejados que estn los datos de la muestra de un punto central. Estas medidas indicaran por un lado el grado de variabilidad que hay en la muestra y, por otro, la representatividad de dicho punto central, ya que si se obtiene un valor pequeo, eso significar a que los valores se concentran en torno a ese centro (por lo que habr poca variabilidad y el centro representar a bien a todos). En cambio, si se obtiene un valor grande, significara que los valores no estn concentrados, sino dispersos (por lo que habr mucha variabilidad y el centro no ser muy representativo).

Las medidas de posicin nos facilitaninformacinsobre la serie dedatosque estamos analizando. Ladescripcinde un conjunto de datos, incluye como un elemento de importancia la ubicacin de stos dentro de un contexto devaloresposible. Una vez definidos los conceptos bsicos en el estudio de unadistribucinde frecuencias de una variable, estudiaremos las distintas formas de resumir dichas distribuciones mediante medidas de posicin (o decentralizacin), teniendo presente el error cometido en el resumen mediante las correspondientes medidas de dispersin.Se trata de encontrar unas medidas que sinteticen las distribuciones de frecuencias. En vez de manejar todos los datos sobre lasvariables, tarea que puede ser pesada, podemos caracterizar su distribucin de frecuencias mediante algunos valores numricos, eligiendo como resumen de los datos unvalorcentral alrededor del cual se encuentran distribuidoslos valoresde la variable Son medidasestadsticascuyo valor representa el valor del dato que se encuentra en el centro de la distribucin de frecuencia, por lo que tambin se les llama "Medidas de Tendencia Central ".

Es la apariencia externa de la distribucin de frecuencias o de una coleccin de datos cuantitativos y viene dada representada por el aspecto grfico. Dentro de la forma se incluye simetra o asimetra de la curva y el grado de apuntamiento o achatamiento de la curva. Son medidas relativas, es decir son cocientes o razones y no vienen expresadas en ninguna unidad de medida

MEDIDASDERESUMEN

Lasmedidasderesumensirvenparadescribirenformaresumidaunconjuntodedatosqueconstituyenunamuestratomadadealgunapoblacin.Podemosdistinguircuatrogruposdemedidasderesumen:lasmedidasdecentro,lasmedidasdeposicin,(lasdecentrosoncasosespecialesdeestasltimas),lasmedidasdedispersinylasmedidasdeforma.Supngasequesedisponedeunamuestradeobservacionesx1,x2,...xn.Conestasobservacionesseefectuarnlosclculosdetodaslasmedidasderesumenquesepresentanacontinuacin.Amododeejemplo,sedisponedetresmuestrasdedatosconlasqueseobtendrnlasmedidasderesumen.Lostresestnordenadosdemenoramayor,porcolumnas.JorgeGalbiatiRiesco

5014017527043050150180280450801501852854608015019029050090150190295510901501953509015025035095150250365130160250370140170250395

Muestra1.Ingresosde45empleadosdeunafirma(milesdepesos).

814172129111214815172249111214915182349111210151823791112121618237912121216192489121213161925891213141719278912131417208912141417208101214

Muestra2.PesosdebultosMuestra3.Escolaridaddeloshabitantestransportadosporuncorreo(kgs).adultosdeuncondominio(aos).

1MedidasdeCentro

Sonmedidasquepretendenindicardndeestloquesepodraconsiderarcomoelcentrodelamasadedatos.Promedioomedia.Eslasumadetodaslasobservaciones,divididaporelnmerodeellas.Lasmsconocidassonlassiguientes:

Media Aritmtica:Es la medida de tendencia central ms utilizada, tambin se le conoce con el nombre de Promedio. Para calcular la media aritmtica, se suman todos los datos de la muestra y el resultado se divide entre el total de datos.

1.-MEDIA ARITMETICA PARA DATOS NO AGRUPADOS

El smbolo que representa a la media aritmtica es una letra X con una barra sobre ella.

La letra x significa uno de los datos de la muestra y la i es el conteo de los datos especficosLa frmula en su esquema de desarrollo se presenta de la siguiente manera:

EJEMPLO:Los sueldos semanales de 5 trabajadores de una obra de construccin civil son los siguientes: 500, 550, 600, 700 y 800 nuevos soles. Por lo tanto el sueldo promedio de los 5 trabajadores es:

DESARROLLO:

DATOS:

500, 550, 600, 700, 800

2.-MEDIANA:Para un conjunto de datos ORDENADOS de mayor a menor, la mitad de los valores sern menores o iguales a la MEDIANA mientras que la mitad restante ser mayor o igual a la MEDIANA.

Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor. La mediana se representa por Me

Datos pares: (X N/2 + X N/2 + 1) / 2 = Me Datos impares: X N+1/2 = Me

Figura IV.7: Los nios han sido ordenados desde el ms pequeo al ms grande.La mediana corresponde a la altura de la nia central.

Mi altura es la mediana de nuestras alturas

Figura: Los nios han sido ordenados desde el ms pequeo al ms grande.La mediana corresponde a la altura de la nia central.

1) PARA DATOS NO AGRUPADOS

EJEMPLOS:

1.1) PARA UN NMERO DE DATOS IMPARLa mediana es el dato que se encuentra a la mitad de la lista. Para calcular su posicin se aplica la siguiente ecuacin:

Ejemplo ilustrativo:Calcular la mediana de las siguientes calificaciones del curso deEstadsticaevaluadas sobre diez: 10, 8, 6, 4, 9, 7, 10, 9 y 6Solucin:1) Se ordena los datos de menor a mayor:

2) Se aplica la ecuacin:

La mediana es el valor de x5 (quinto dato), es decir, Md=8

1.2) PARA UN NMERO DE DATOS PARLa mediana es la media aritmtica de los dos datos que se encuentran a la mitad de la lista. Para calcular su posicin se aplica la siguiente ecuacin:

Ejemplo ilustrativo:Calcular la mediana de las siguientes calificaciones del curso deMatemticaevaluadas sobre diez: 10, 8, 9, 6, 4, 8, 9, 7, 10 y 9Solucin:1) Se ordena los datos de menor a mayor:

2) Se aplica la ecuacin

3.-MODA: Se refiere al valor de la variable que ms se repite en una distribucin de frecuencia, o el valor que est representado por el mayor nmero de observaciones En un grfico de barra o histograma la moda corresponde al valor en que la distribucin alcanza el mximoEJEMPLOS:1.- Determinar la moda del siguiente conjunto de datos:a).- 1, 2, 3, 3, 4, 5, 6, 7, 7, 3, 1, 9, 3La moda de este conjunto de datos es igual a 3 y si considera unimodalb).- 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, -3, 4, 6, 3, 3Las modas de este conjunto de datos son 3 y 4 ya que ambas tienen la ms alta frecuencia, por lo que la muestra es bimodalc).- 1, 2, 3, 4, 5, 6, 7, 8, 9La muestra no contiene ningn dato repetido por lo que se considera que la muestra es amodal.Grficamente eso se puede reflejar mediante el anlisis de un histograma de frecuencias.

MEDIDAS DE POSICION

1.-CUANTILESLos cuantiles son medidas de posicin que se determinan mediante unmtodoque determina la ubicacin delos valoresque dividen un conjunto de observaciones en partes iguales.Los cuantiles son losvaloresde ladistribucinque la dividen en partes iguales, es decir, en intervalos que comprenden el mismo nmero de valores. Cuando la distribucin contiene un nmero alto de intervalos o demarcasy se requiere obtener un promedio de una parte de ella, se puede dividir la distribucin en cuatro, en diez o en cien partes.Los ms usados son los cuartiles, cuando dividen la distribucin en cuatro partes; los deciles, cuando dividen la distribucin en diez partes y los centiles o percentiles, cuando dividen la distribucin en cien partes. Los cuartiles, como los deciles y los percentiles, son en cierta forma una extensin de la mediana.Para algunos valoresu, se dan nombres particulares a los cuantiles, Q (u):

uQ(u)

0.5Mediana

0.25, 0.75Cuartiles

0.1, ... , 0.99Deciles

0.01, ..., 0.99Centiles

2.-CUARTILESLos cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es elvaloren el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesin (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos.

Para Datos No AgrupadosSi se tienen una serie de valores X1, X2, X3... Xn, se localiza mediante las siguientes frmulas:- El primer cuartil:Cuando n es par:

Cuando n es impar:

Para el tercer cuartilCuando n es par:

Cuando n es impar:

3.-DECILESLos deciles son ciertos nmeros que dividen la sucesin de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son tambin un caso particular de los percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc.Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el aprovechamiento acadmico.

Frmulas Datos No AgrupadosSi se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes frmulas:Cuando n es par:Cuando n es impar:Siendo A el nmero del decil.

4.-CENTILES O PERCENTILESLos percentiles son, tal vez, las medidas ms utilizadas para propsitos de ubicacin o clasificacin de las personas cuando atienden caractersticas tales como peso, estatura, etc.Los percentiles son ciertos nmeros que dividen la sucesin de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), ledos primer percentil,..., percentil 99.

Frmulas Datos No AgrupadosSi se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes frmulas:Para los percentiles, cuando n es par:

Cuando n es impar:Siendo A, el nmero del percentil.Es fcil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el percentil 50 y el tercer cuartil con el percentil 75.EJEMPLODeterminacin del primer cuartil, el sptimo decil y el 30 percentil, de la siguiente tabla:SalariosNo. Defa

(I. De Clases)Empleados (f1)

200-2998585

300-29990175

400-499120295

500-59970365

600-69962427

700-80036463

Como son datos agrupados, se utiliza la frmula

Siendo,La posicin del primer cuartil.

La posicin del 7 decil.

La posicin del percentil 30.Entonces,El primer cuartil:115.5 85 = 30.75Li= 300,Ic= 100 ,fi= 90

El 7 decil:

Posicin:324.1 295 = 29.1Li= 500,fi= 70

El percentil 30Posicin:

138.9 85 = 53.9fi= 90

MEDIDAS DE DISPERSIN

DESVIACIN ESTNDAR

Habamos visto que la varianza transforma todas las distancias a valores positivos elevndolas al cuadrado, con el inconveniente de elevar consigo las unidades de los datos originales.La desviacin estndar soluciona el problema obteniendo la raz cuadrada de la varianza, consiguiendo as, un valor similar a la desviacin media.

Desviacin estndar o tpica (S o):Es igual a la raz cuadrada de la varianza.

La S representa la desviacin estndar de una muestra, mientras que la desviacin para todos los datos de una poblacin. Ampliando las frmulas tenemosAplicamos el mismo procedimiento a las frmulas para las tablas de frecuencias tipo A.Y para las tablas de frecuencias tipo B.Ejemplo: Desviacin estndar para datos no agrupados

Varianza:

Varianza (S2 o 2): Es el resultado de la divisin de la sumatoria de las distancias existentes entre cada dato y su media aritmtica elevadas al cuadrado, y el nmero total de datos.

Distinguimos dos smbolos para identificar la varianza: S2 para datos muestrales, =Y 2 para datos poblacionales.=

Ejemplo: Varianza para datos no agrupados

Coeficiente de variacinEnestadstica, cuando se desea hacer referencia a la relacin entre el tamao de la media y la variabilidad de la variable, se utiliza elcoeficiente de variacin.Su frmula expresa la desviacin estndar como porcentaje de la media aritmtica, mostrando una mejor interpretacin porcentual del grado de variabilidad que la desviacin tpica o estndar. Por otro lado presenta problemas ya que a diferencia de ladesviacin tpicaeste coeficiente es variable ante cambios de origen. Por ello es importante que todos los valores sean positivos y su media d, por tanto, un valor positivo. A mayor valor del coeficiente de variacin mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Suele representarse por medio de las siglasC.V.Exigimos que:Se calcula:

Dondees ladesviacin tpica. Se puede dar en tanto por ciento calculando:

Una distribucin tiene x = 140 y = 28.28 y otra x = 150 y = 25. Cul de las dos presenta mayor dispersion?

MEDIDAS DE FORMA1.- ASIMETRA:

Es una medida de forma de unadistribucinque permite identificar y describir la manera como losdatostiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribucin. Permite identificar las caractersticas de la distribucin de datos sin necesidad de generar el grfico.

ASIMETRA POSITIVA O A LA DERECHA.-Se da cuando en una distribucin la minora de los datos est en la parte derecha de la media aritmtica. Este tipo de distribucin presenta un alargamiento o sesgo hacia la derecha, es decir, la distribucin de los datos tiene a la derecha una cola ms larga que a la izquierda.Tambin se dice que una distribucin es simtrica a la derecha o tiene sesgo positivo cuando el valor de la media aritmtica es mayor que la mediana y ste a valor de la mediana a su vez es mayor que la moda, en smbolos

Asimetra o Sesgo

Una distribucin es simtrica si la mitad izquierda de su distribucin es la imagen especular de su mitad derecha. En las distribuciones simtricas media y mediana coinciden. Si slo hay una moda tambin coincide La asimetra es positiva o negativa en funcin de a qu lado se encuentra la cola de la distribucin. La media tiende a desplazarse hacia las valores extremos (colas). Las discrepancias entre las medidas de centralizacin son indicacin de asimetra.

Asimetra: Mide la deformacin horizontal respecto a su promedio o valor central Si el As>o: tiene asimetra positiva. La distribucin extiende la cola hacia los valores grandes de la variable. Si el As 0

Los grficos que veis poseen la misma media y desviacin tpica, pero con diferente grado de apuntamiento.En el curso sern de especial inters las mesocrticas y simtricas (parecidas a la normal).

Kurtosis: mide el grado de elevacin o apuntamiento de una distribucin.

Leptokurtica, Si k>0,263, es decir, es ms apuntada que la normalMesocrtica, Si k= 0,263, es decir es tan apuntada Como la normalPlatikurtica, Si k< 0,263, es decir, es menos apuntada que la normal

CONCLUSION:

.Hemos observado que el estudio de la informacin a travs de los grficos ayuda la comprensin de los datos con respecto a la poblacin.Finalmente hemos omitidos los pasos para el clculo de las medidas de resumen, pues en cualquier parte se pueden encontrar las formulas correspondientes a cada tipo de dato. Es una gran ayuda las medidas de resumen ya que con estas podemos comprender y desarrollar los estudios observados.

FUENTES BLIBLIOGRAFICAS:www.monografias.comwww.youtube.com/watch?v=a9B3wPKjqAUwww.jorgegalbiati.cl/enero_07/MedidasResumen.pdfwww.fca.proed.unc.edu.ar/mod/book/view.php?id=3270&chapterid...www.epiredperu.net/epired/eventos/eve_scsf.../estadistica-scsf-03.pdfes.slideshare.netwww.dm.uba.ar/materias/analisis_de_datos/2008/1/.../Teor4.pdfwww.buenastareas.com www.reeme.arizona.edu/materials/Medidas%20de%20resumen.pdf