medidas de posiciÓn.ppt

Upload: cristinapaez

Post on 06-Oct-2015

12 views

Category:

Documents


0 download

TRANSCRIPT

  • MEDIDAS DE POSICINPROFESORA:MARA DEL S. CAPELLA:

  • MTODOS ESTADSTICOS Y SUS UTILIDADES

    Mtodo o tcnicas estadsticaPara qu se utiliza?

    I DESCRIPTIVA

    1. Tabla de distribucin de frecuenciasPara agrupar datos univariados. Es la base para la gran mayora de los grficos estadsticos

    2. Tablas de contingenciaPara agrupar datos bivariados. Con la distribucin Ji-cuadrada, es muy til para detectar la independencia o dependencia entre dos variables3.Grficos estadsticos: Histogramas, Diagrama de barras, Polgono de frecuencias, Ojiva, Diagramas circulares, pictogramasPara visualizar rpidamente una informacin y su posterior anlisis

  • Medidas: media o promedio aritmtico, mediana, moda, cuartil decil , percentil, rango, varianza, desviacin tpica, coeficiente de asimetra, curtosis, coeficiente de variacin y proporcin o porcentajePara qu se utiliza?Para describir grupos de datos.Estas medidas, con un nico valor, nos permiten conocer la caracterstica general de un grupo de elementos; son base donde se sustenta toda la inferencia cientfica

  • Las medidas de posicin forman parte de las denominadas descriptivas numricas (las otras son de variabilidad, sesgos y curtosis) las cuales se clasifican en parmetro cuando se calculan a partir de la poblacin total y en estadstico cuando se calculan a partir de los datos de una muestra.En estadstica se consideran cuatros tipos de estadgrafos:1. estadgrafo de posicin o medidas de tendencia central. Son aquellas medidas que indican la posicin de un valor respeto a la variable o la posicin de un punto respeto a la abcisa.Estas medidas dan informacin respecto a la puntuacin promedio en una distribucin

  • Las medidas de posicin forman parte de las denominadas descriptivas numricas (las otras son de variabilidad, sesgos y curtosis) las cuales se clasifican en parmetro cuando se calculan a partir de la poblacin total y en estadstico cuando se calculan a partir de los datos de una muestra.En estadstica se consideran cuatros tipos de estadgrafos:1. estadgrafo de posicin o medidas de tendencia central. Son aquellas medidas que indican la posicin de un valor respeto a la variable o la posicin de un punto respeto a la abcisa.Estas medidas dan informacin respecto a la puntuacin promedio en una distribucin

  • Las medidas de tendencia central son aquellas que nos dan informacin sobre que tan centrados estn los datos.Una medida de tendencia central es un valor hacia el cual tiende el resto del conjunto de datos.Como su nombre lo sugiere, las medidas de tendencia central son valores que indican el centro hacia el cual confluyen los datos

  • Clasificacin de las Medidas de tendencia Central

    a)Media oPromedio

    b) Mediana

    c) ModaMedia aritmticaMedia geomtricaMedia ponderadaMedia armnica

  • 2.Estadgrafos de dispersin de desviacin. Las desviaciones son valores que indican la medida en que un valor determinado difieren o se alejan de los valores de la variable. Este valor determinado es el correspondiente a un estadgrafo de centralizacin.3. Estadgrafo de deformacin o asimetra. Son medidas o relaciones entre medidas que determinan la asimetra de una distribucin. Si la distribucin es simtrica,

    En caso contrario, se separan estos promedios

  • 4. Estadgrafos de apuntamiento o curtosis Medida de la altura de la curva representativa de la distribucin, es decir, grado de agudeza en la cima de la curva.

    Una medida de posicin es un nmero que se toma como orientacin para referirnos a un conjunto de datos. Este nmero, para que sea til y nos indique lo que nos interesa sobre la caracterstica estudiada, debe ser escogido de manera tal que se cumpla dicho propsito; por ello se dice que es una medida representativa de un conjunto de datos y as mismo a que existan varias alternativas para una medida de posicin.

  • LA MEDIA ARITMTICA llamada tambin promedio Permite observar la tendencia central de la distribucin. se define como la divisin de la suma de todos los valores entre el nmero de valores. En estadstica es normal representar una medida descriptiva de una poblacin , o parmetro poblacional, mediante letras griegas, en tanto que se utilizan letras romanas para las medidas descriptivas de muestras, o estadsticas muestrales.As, la media aritmtica para una poblacin de valores se presenta mediante el smbolo de ( que se pronuncia mu) en tanto que la media aritmtica de una muestra de valores se representa mediante el smbolo (que se lee X barra)

  • Las frmulas para la media de una poblacin y de una muestra son:

    = X N

    En cuanto a operaciones se refiere, las dos formulas son idnticas, en ambos casos se suman todos los valores (X) y despus se divide este total entre el numero de valores que son. Sin embargo, la diferencia en los denominadores se debe a que en anlisis estadstico, la N normalmente indica el numero de elemento de una poblacin en tanto que la n seala el numero de elemento de una muestra.

    EJERCICIO 1: En determinado mes, 8 vendedores de artculos electrnicos vendieron los siguientes nmeros de aparatos: 8, 11, 5, 14, 8, 11, 16, 11. Considerando a este mes como a la poblacin estadstica que interesa, el numero promedio de unidades vendidas es:

    = X = 84 = 10.5 unidad N 8

    Xn=

  • LA MEDIA PONDERADA

    La media ponderada o promedio ponderado es una media aritmtica, en la cual se considera a cada uno de los valores de acuerdo con su importancia en el grupo. La frmula para la media ponderada muestral y poblacional son idnticas

    En trminos de operaciones, cada uno de los valores del grupo (X) se multiplica por el factor de ponderacin apropiado (p) y despus se suman estos productos y la suma se divide entre los pesos (o ponderaciones)

  • EJERCICIO: En una compaa que maneja 4 productos, los mrgenes de utilidad correspondientes a cada uno de ellos durante el ao fiscal fueron: producto A, 4.2%; producto B,5.5%; Producto C, 7.4%; y producto D, 10.1%. El margen de utilidad promedio no ponderado, es

    Sin embargo, este promedio no ponderado es incorrecto por que se vendieron cantidades distinta de los 4 productos.Suponiendo los totales de ventas que aparecen en la siguiente tabla, se encuentra que el promedio ponderado se describe en forma correcta el promedio global.

    = 27.2= 6.8%. N 4

  • Margen de utilidad y volumen de ventas =$3.033.000 $58.000.000=5.2%

    ProductoMargen de utilidades (X)Ventas (p)PXAB CD 4.2%5.57.410.1$30 000.000 20000.000 5000.000 3000,000 $1260.000 1100.000 370000 303000

  • LA MEDIANA es una medida que divide a una serie de datos ordenados en dos partes iguales, es decir, en un 50% inferior y un 50% superior. Se simboliza: MeMed=X [(n/2) + (1/2)]

    Ejercicio n 3: los 8 vendedores que se describieron en el ejerciccio1 vendieron el sigueiente nmero de aparatos, en orden ascendente:5,8,8,11,11,11,14,16,. El valor de la mediana es:Med= X [(n/2) + (1/2)] = X [(8/2) + (1/2)] = x4.5= 11.0

  • El valor de la mediana se encuentra entre los valores cuarto y quinto de este conjunto ordenado. Como los dos son iguales a11 en este caso,La mediana es 11.0

    LA MODA

    La moda es el valor que se presenta con mayor frecuencia en un conjunto de datos A una distribucin que tiene una sola moda se le denomina unimodal. Para un conjunto de datos poco numerosos, en los que no se repite ningn valor, no existe moda. Cuando dos valores no adyacentes tienen frecuencias mximas similares, se dice que la distribucin es bimodal A las distribuciones de mediciones que tienen varias modas se les denomina multimodales.

    EJERCICIO 4 Los 8 vendedores que se describieron en el ejemplo 1 vendieron el siguiente nmeros de aparatos: 8,11,5,14,8,11,16 y 11. La moda para este grupo de valores es el valor que tiene la mayor frecuencia, o moda =11.

  • RELACIN ENTRE LA MEDIA, LA MEDIANA Y LA MODA.

    La diferencia entre los valores de la media, la mediana y la moda, Permite saber la forma de la curva de frecuencias en trminos de asimetra. Para una distribucin unimodal simtrica, el valor de la media, la mediana y la moda es igual.

  • Para una distribucin asimtrica positiva, la media es el valor mayor de los tres y la mediana es mayor que la moda pero menor que la media. Para una distribucin asimtrica negativa, la media es el menor valor de los tres y la mediana es inferior que la moda pero mayor que la media. El coeficiente de asimetra de Pearson, es una medida conocida asimetra que utiliza la diferencia observada entre la media y la mediana entre un grupo de valores.

  • Ejercicio 5. Para los datos de ventas considerados en los ejercicios 1,3 y 4, puede observarse que la media es 10.5 y la mediana es 11.0 y la moda es de 11.0 unidades, lo cual indica que la distribucin tiene una ligera asimetra negativa (est sesgada hacia la izquierda).

  • ANALISIS DE DATOS AGRUPADOS RELACIN ENTRE LA MEDIA ARITMTICA ,LA MEDIANA Y LA MODA La media es la medida ms conocida, la ms fcil de calcular y la ms familiarizada.A veces, se le denomina simplemente media o promedio VENTAJAS DE PROMEDIAR CON LA MEDIA ARITMTICA:Es la ms conocida, la ms usada comnmente debido a la facilidad para interpretarlaSu clculo es fcil ya que emplea una simple ecuacin matemticaEs altamente sensible a los cambios en los datos aunque muy estable en el muestreoSe utiliza con gran facilidad en clculos posterioresNo es recomendable su uso cuando la variable est dada en forma de tasas o porcentajes o cuando presenta un crecimiento geomtrico

  • CARACTERSTICAS DE LAS MEDIDAS DE TENDENCIA CENTRALEn una distribucin simtrica y adems unimodal la media, la mediana y la moda son iguales. En este caso, se prefiere el uso de la media.Los tres promedios dependen de la forma que tome la distribucin. Si es simtrica, o ligeramente asimtrica, debe utilizarse la media; en cambio cuando esto no ocurre, la mediana es la ms indicada.La media no se puede calcular en distribuciones con intervalos abiertos, por tanto la mediana y la moda son las ms indicadas.Dos medianas y dos modas no se pueden promediar para obtener el valor promedio de dos muestras combinadas, pero si se puede realizar con la media aritmtica.

  • En una distribucin de frecuencias, cuando la amplitud del intervalo no es constante, no es aconsejable la aplicacin de la moda, siendo preferible el uso de la media o de la medianaLa media aritmtica es sensible a cualquier cambio que se haga en los valores que se toma la variable, y en especial cuando uno de ellos es exageradamente grande o pequeo. La mediana y la moda no se afectan mientras el cambio no se realice en su propio valor La media es la ms estable o la ms confiable, ya que presenta menos fluctuacin entre el resultado en una muestra comparada con el de otras obtenidas de la misma poblacin, por tanto proporciona una mejor estimacin de del parmetro

  • Las relaciones entre estas medidas se podrn describir: Cuando es simtrica

    Cuando es asimtrica

    Cuando es asimtrica

  • ANLISIS DE DATOS EN TABLA DE FRECUENCIA AGRUPADAS

    Es posible calcular las medidas de tendencia central y dispersin para datos exhibidos en una tabla de frecuencia agrupada, pero sus valores no son exactos sino nicamente aproximados.Eso se debe al desconocimiento de las medidas en grupo, las cuales se han colocado en intervalos de clase.

  • MEDIA PARA DATOS AGRUPADOS Si debemos encontrar la media para datos proporcionados en tablas de frecuencia agrupadas, usamos marcas de clase para representar las medidas para clase. De esta forma, usamos la frmula conocida de la media aritmtica para determinar la llamada MEDIA MUESTRAL APROXIMADA , puesto que los datos originales se desconocen y cada observacin est representada por su marca de clase.

  • Ejemplo: Los siguientes datos representan el nmero de personas que han entrado a un establecimiento diariamente durante un periodo de 25 das: 60 36 61 56 19 35 51 42 21 28 33 67 30 49 57 54 59 28 63 38 15 24 35 46 53Los datos han sido agrupados en la tabla de frecuencia siguiente usando la frmula de Sturges para el nmero de clase

  • Tabla de frecuencias agrupadas

    Nmero de personas Nmeros de das14.5 25.525.5 36.536.5 47.547.5 58.558.5 69.547365

  • a) Calcula la media del nmero de personas que entra por das.b) Calcula media aproximada del nmero de personas que entran por da.Solucin :Se puede comprobar que la media de los datos es =42.4B) Primero debemos calcular la marca de cada clase. Cada marca de clase se multiplica por su frecuencia correspondiente como se muestra en la siguiente tabla.

  • Solucin :Se puede comprobar que la media de los datos es =42.4Primero debemos calcular la marca de cada clase. Cada marca de clase se multiplica por su frecuencia correspondiente como se muestra en la siguiente tabla.

  • Tabla de frecuencias

    Nmero de personasNmeros de das Marca de clase X X14.5 25.525.5 36.536.5 47.547.5 58.558.5 69.547365203142536480217126318320Sumas251061

  • Por consiguiente, la media aproximada es: = = 1 061 =42.44 25 el cual es slo un valor aproximado para la media de las 25 medidas muestrales originales

  • MEDIANA PARA DATOS AGRUPADOSSi se han registrado datos en una tabla de frecuencias, no pueden colocarse en un arreglo ordenado para calcular la mediana.Ejemplo:

    clasefrecuenciaFrecuencia acumulada49,5-59,559,5-69,569.5-79,579,5-89,589,5-99,599,5-109,5 3 7 18 12 8 231028404850

  • Primero hallamos la clase mediana de la distribucin de frecuencia. La CLASE MEDIANA es la mnima clase cuya frecuencia acumulada es mayor o igual a n/2 siendo n el nmero total de datos.Debido a que n es igual a 50, se necesita localizar la primera clase que tenga una frecuencia acumulada de 25 o ms. En este caso , la tercera clase es la clase mediana porque tiene una frecuencia acumulada de 28. la mediana se determinar entonces comoMediana = Lmed + (n/2-F ) W (med.)

  • En donde Lmed es la frontera inferior de la clase de la mediana (de la tabla , es 69,5)F es la frecuencia acumulada de la clase que antecede a la clase de la mediana (en este caso, es la frecuencia acumulada correspondiente a la segunda clase, o sea F = 10)med es la frecuencia de la clase de la mediana (en este caso, = 18)W es la amplitud del intervalo de clase de la mediana (w = 10)Es decir, Mediana= 69,5 + 25-10 .10 =77,83 18

  • Moda para datos agrupadosUna desventaja de usar la moda con una distribucin de frecuencia agrupada radica en que el valor de la moda a menudo depende del agrupamiento arbitrario de los datos. La clase que contiene al mayor nmero de datos suele denominarse CLASE MODAL o MODA CRUDA.

  • Para estimar la moda en el caso de datos agrupados, se utiliza la siguiente frmula: Moda = Lmod + Da Db +Da * wEn dondeLmod es la frontera inferior de la clase modal(por ejemplo, de la tabla anterior, Lmod =69,5)Da es la diferencia entre la frecuencia de la clase modal y de la clase que la antecede( por ejemplo, de la tabla anterior,Da = 18 por ejemplo,-7 = 11 ) Db es la diferencia entre la frecuencia de la clase modal y de la clase que le sigue ( por ejemplo, de la tabla anterior, Db = 18-12 =6W es el ancho del intervalo de clase de la clase modal ( por ejemplo, de la tabla anterior ,w = 10)Respecto a la tabla anterior ,la moda es :

    Moda = 69.5 + 11 * 10 = 75,97. 6+11

  • PUNTOS DE POSICINPRA DATOS DE UNA TABLA DE FRECUENCIA AGRUPADA Cuando una distribucin contiene un gran nmero de datos o de intervalos de clase (marcas de clase) se utiliza este tipo de medida.supongamos que queremos encontrar el sexagsimo punto percentil de los datos que presentamos en la anterior tabla.Para ello, primero hallamos la clase del sexagsimo punto percentil de la distribucin de frecuencias. En general, la clase Del p- SIMO PUNTO PERCENTIL es la mnima clase cuya frecuencia acumulada es mayor o igual p % n, siendo n el nmero total de datos. Como n =50 y p = 60 , entonces localizamos la primera clase que tenga una frecuencia acumulada de (60%)(50)= 30 o ms. En este caso, la cuarta clase es la clase donde se encuentra el sexagsimo punto percentil de los datos porque tiene una frecuencia acumulada de 40.

  • Entonces, el sexagsimo punto percentil puede determinarse como p- simo punto percentil = Lp + p%n F * w pEn donde Lp es la frontera inferior de la clase del p-simo punto percentil (de la tabla, es 79,5)F es la frecuencia acumulada de la clase que antecede a la clase del p-simo punto percentil ( en este caso, es la frecuencia acumulada a la tercera clase, o sea F = 28)p es la frecuencia de la clase del p-simo punto percentil ( en este caso , =12)W es la amplitud del intervalo de clase de la clase del p- simo punto percentil (w=10).

  • Es decir, Sexagsimo punto percentil = 79,5 + 30 -28 * 10 = 81,16 12

  • CUARTILESLos CUARTILES son las medidas de posicin relativa correspondiente a un conjunto ordenado de datos divididos en cuatro partes (iguales) y se definen as:Q1 = primer cuartil o 25-simo percentilQ2 = segundo cuartil o 50-simo percentil o tambin mediana.Q3 = tercer cuartil o 75-simo percentilCuartiles: Qa = Li + (an/4 F j-1) W fi