variables estadisticas unidimensionales

Download Variables estadisticas unidimensionales

If you can't read please download the document

Upload: inmaculada-leiva-tapia

Post on 26-Jul-2015

299 views

Category:

Education


3 download

TRANSCRIPT

1. VARIABLES ESTADSTICASUNIDIMENSIONALES Inmaculada Leiva Tapia IES Alborn 2. INTRODUCCIN A LA ESTADSTICAEl trmino Estadstica procede del latn "status" debido a que susprimeros pasos tuvieron que ver con la recogida y cuantificacin deinformacin referente al Estado:censos de poblacin, cosechas recogidas, cabezas de ganado,...La Estadstica tiene por objeto el desarrollo de tcnicas para elconocimiento numrico de un conjunto numeroso de elementos:poblacin de una ciudad, alumnos de 2 bachillerato de un centro,precios de un supermercado,... 3. TIPOS DE FENMENOSFenmenosDeterministas(o causales)Aleatorios(de azar oestadsticos)Al repetirlos en idnticas condiciones,se obtiene el mismo resultado y,portanto,son predecibles.Ej.: Tiempo que tarda un mvil,a velocidad constante,en recorreruna distancia dadaAl repetirlos en idnticas condiciones,un gran nmero de veces,se obtienenresultados diferentes y, por tanto, esimposible predecir el resultado de cadaprueba hasta que no se realiza.Ej.: Nmero obtenido en ellanzamiento de un dadoSon los objetos deestudio de laEstadstica 4. MTODO DE TRABAJO DE LAESTADSTICARAMAS DE LA ESTADSTICADescripcin de los datos observados Estadstica DescriptivaModelizacin del comportamiento Clculo de ProbabilidadesEstimacin de lo desconocido ygeneralizacinTeora de Muestras e InferenciaEstadstica 5. ESTADSTICA DESCRIPTIVA Recuento,ordenacin y clasificacin de gran cantidad de datosobtenidos por observacin de todos los individuos de una poblacin. Presentacin de datos en forma resumida y manejable,mediante:tablas,grficas y clculo de parmetros estadsticos (media, mediana,cuartiles,percentiles,desviacin tpica,etc.) que caracterizan ladistribucin de los datos. 6. ESTADSTICA INFERENCIAL Se apoya en el Clculo de Probabilidades. Maneja resultados de la Estadstica Descriptiva. Se utiliza para establecer previsiones y conclusiones generales sobreuna poblacin,a partir nicamente del conocimiento de una muestraextrada de la misma. 7. 7CONCEPTOS BSICOS DE ESTADSTICAPoblacin o universo: conjunto de todos los elementos que poseenuna caracterstica comn y que son objeto de un estudio estadstico.Individuo (o unidad estadstica): cada elemento de la poblacin.Tamao: n de elementos de la poblacin.Puede ser finito o infinito,y se representa por N.Muestra: subconjunto extrado de la poblacin.Utilidad de las muestras:Estudiando muestras finitas representativas,se pueden obtener conclusionesextrapolables a toda la poblacin,(admitiendo un cierto riesgo de error).Se recurre al uso de las muestras cuando:La poblacin es excesivamente numerosa (talla media de los espaoles)La poblacin es difcil o imposible de controlar (visitantes de una ciudad)El proceso de medicin es destructivo (duracin media de bombillas)Se desea conocer rpidamente la poblacin (encuesta sobre alimentacin) 8. La eleccin de la muestra (y las tcnicas utilizadas),se llama muestreo.Las muestras elegidas deben ser representativas de la poblacin, y as evitarque haya errores imprevistos (sesgos).Para ello el muestreo debe ser aleatorio: Todos los individuos de la muestrase eligen al azar, es decir, que cada individuo de la poblacin tiene la mismaprobabilidad de ser elegido.8Ejemplos: En un sondeo de opinin para conocer la intencin de voto de una ciudad:la poblacin son todos los individuos con derecho a voto ,yla muestra el conjunto de personas a las que se encuesta. En el estudio de la proporcin de tornillos defectuosos producidos por unafbrica en un mes:la poblacin son todos los tornillos que produce la fbrica en el mes,yla muestra los tornillos que se seleccionan para comprobar si son o nodefectuosos. 9. Un carcter estadstico es cualquier propiedad que permite clasificar losindividuos de una poblacin,y que puede tomar distintos valores o estados,llamados modalidades ,de manera que cada individuo pertenece a una yslo una de dichas modalidades.horas de estudio diarias9CARACTERES ESTADSTICOSCaracteresestadsticosCuantitativos(o var. estadsticas)Cualitativos(o atributos)Toman valores numricosEj.: Peso,talla,n hijos,No toman valores numricosEj.: color de ojos,color de pelo,partido al que se vota,profesin 10. Una variable estadstica es un carcter cuantitativo,es decir,un aspectomedible de una poblacin.Segn los valores numricos que puede tomar,se clasifican en:10TIPOS DE VARIABLES ESTADSTICASVariablesestadsticasDiscretasContinuasToman valores aisladosEj.: n hijos de las familias,n asignaturas en 2 BtoPueden tomar todos los valoresde un intervalo de la recta realEj.: estatura, peso,temperaturas diarias 11. 11EJEMPLOCARACTERESTADSTICOMODALIDADES TIPOSexo {Hombre,Mujer} CualitativoEdad {12,13,14,15,16,17,18,19} Cuantitativo(discreto)Curso {1,2,3,4,1Bto,2Bto} CualitativoTalla { [140,150],]150,160],]160,170],]170,180],]180,190],]190,200] }Cuantitativo(continuo)Poblacin: Todos los alumnos de un Instituto 12. 12FRECUENCIASSea una poblacin de N individuos,en la que se estudia un carcterestadstico con modalidades x1,x2,....,xk.frecuencia absoluta de la modalidad xi, es el n de individuos de lapoblacin que presentan dicha modalidad; o sea, el n de veces que serepite xi en la poblacin. Se representa fi.Como las modalidades son incompatibles y exhaustivas,se tiene que:kf iN = f 1+ f 2+ f 3+ ...+ f k = i=1frecuencia relativa de la modalidad xi , es la proporcin de individuos dela poblacin que presentan dicha modalidad; o sea,es el cociente entrela frecuencia absoluta y el nmero total de individuos. Se representa hi.hi =f iN (0 hi 1 ) 13. Una propiedad obvia de las frecuencias relativas, es que su suma es 1:13k f ikhi = i=1i=1N =kf iN = NNi=1= 1Frecuencia absoluta acumulada de la modalidad xi ,es la suma de lasfrecuencias absolutas desde la 1 hasta la i-sima; se representa por Fi .iFi = f 1+ f 2+ f 3+ ....+ f i = j=1f j 14. 14Frecuencia relativa acumulada de la modalidad xi , es la suma de lasfrecuencias relativas desde la 1 hasta la i-sima; se representa Hi .Tambin es el cociente entre la frecuencia absoluta acumulada Fi y elnmero total de individuos N de la poblacin.iHi = j=1i f jh j = j=1N =iif jN =j=1FiNHi = h1+ h2+ h3+ ....+ hi = j=1h j 15. DISTRIBUCIN DE FRECUENCIAS Y TABLASSe llama distribucin de frecuencias al conjunto de pares ordenadosde las modalidades o valores de una variable estadstica y sus frecuencias.Colocando los valores con sus correspondientes frecuencias en una tablaformamos una tabla estadstica.15MODAL.xiFR.ABSfi{ (x1,f1) , (x2,f2) , ...... , (xk,fk) }FR.ABSACUM FiFR.RELhiFR.RELACUM HiPORC.100hi%GRADOS360hix1 f1 F1 h1 H1 100h1 % 360h1 x2 f2 F2 h2 H2 100h2 % 360h2 ....... ....... ....... ....... ....... ....... .......xk fk Fk = N hk Hk = 1 100hk % 360hk TOTAL N 1 100 % 360 16. Un profesor tiene anotadas las calificaciones de los 30 alumnos de un grupo:165 3 4 1 2 8 9 8 7 66 7 9 8 7 7 1 0 1 59 9 8 0 8 8 8 9 5 7Construye la tabla de frecuencias absolutas,absolutas acumuladas,relativas,relativas acumuladas,porcentajes y n de grados.xi recuento fi Fi hi Hi % grados0 | | 2 2 0,067 0,067 6,7 24,121 | | | 3 5 0,1 0,167 10 362 | 1 6 0,033 0,2 3,3 11,883 | 1 7 0,033 0,233 3,3 11,884 | 1 8 0,033 0,266 3,3 11,885 | | | 3 11 0,1 0,366 10 366 | | 2 13 0,067 0,433 6,7 24,127 | | | | | 5 18 0,167 0,6 16,7 60,128 | | | | | | | 7 25 0,233 0,833 23,3 83,889 | | | | | | 5 30 0,167 1 16,7 60,1210 0 30 0 1 0 0TOTALES 30 1 100 360Abrir documento Variable estadstica discreta 17. En el caso de variables continuas o discretas con un gran n de datos,stos se agrupan en intervalos o clases.Entonces,la distribucin defrecuencias es de la forma { (I1,f1) , (I2,f2) , ...... , (Ik,fk) }donde Ii = ] ei , ei+1] es el intervalo i-simoextremos de clase son los dos extremos ei (extremo inferior) yei+1 (extremo superior) de cada intervalo.amplitud de clase es la diferencia entre el extremo superior y el extremoinferior del intervalo: ai = ei+1 - eimarcas de clase son los puntos medios de los intervalos:17xi = (ei + ei+1) / 2OBSERVACIONES: Los intervalos no tienen por qu ser de igual amplitud.Si ocurre esto,hayque tenerlo muy en cuenta en la representacin grfica, para recalcularla altura de los rectngulos en los histogramas( altura = frecuencia/base). Por lo anterior,si se puede elegir,es ms cmodo tomar los intervalos conigual amplitud, para facilitar los clculos. Las clases primera y ltima pueden ser intervalos no acotados, deamplitud infinita (semirrectas). Con eso se pretende recoger los casosmuy extremos o raros que se pudieran dar. 18. 18CONSTRUCCIN DE LOS INTERVALOS Si tenemos una variable discreta con numerosos datos, se aconsejaconvertirla en continua, agrupando los datos en intervalos. El nmero de intervalos aconsejable es igual a la raz cuadrada delnmero total de datos. Si no es exacta, decidiremos el n de intervalosredondeando. Hallamos el rango o recorrido ( R = valor mximo valor mnimo )de los datos. Repartimos ese rango entre el nmero total de intervalos y tendremosla amplitud que hay que dar a cada intervalo. 19. Las edades de los pacientes que han visitado a un mdico en un mes son:3 2 11 13 4 3 2 4 5 67 3 4 5 3 2 5 6 27 154 21 14 4 3 6 29 13 6 176 13 6 5 12 26Construye la tabla de frecuencias agrupando los datos en clases de amplitud 5Intervalos Marcas xi recuento fi Fi hi Hi %]0,5] 2,5 ||||| ||||| ||||| || 17 17 0,4722 0,4722 47,22]5,10] 7,5 ||||| || 7 24 0,1944 0,6666 19,44]10,15] 12,5 ||||| || 7 31 0,1944 0,861 19,44]15,20] 17,5 | 1 32 0,0278 0,8888 2,78]20,25] 22,5 | 1 33 0,0278 0,9166 2,78]25,30] 27,5 ||| 3 36 0,0833 0,9999 8,33TOTALES 36 0,9999 99,9919Abrir documento Variable estadstica (tratada como) continua 20. 20REPRESENTACIONES GRFICASCARACTER CUALITATIVO(ATRIBUTO)CARACTER CUANTITATIVO(VARIABLE ESTADSTICA)Diagrama rectangularVARIABLEDISCRETAVARIABLECONTINUADiagrama de sectoresPictogramaDiagrama debarras HistogramaCartogramaPirmides de poblacin Polgono defrecuenciasPolgono defrecuencias 21. DIAGRAMA RECTANGULARSe representan rectngulos de base constante,uno por cada modalidady de altura la frecuencia absoluta correspondiente.21 22. DIAGRAMA DE SECTORESConsiste en repartir el rea del crculo en sectores de tamao proporcionala la frecuencia de cada modalidad.22360N =ni f i ni = 360 f iN ni = 360 hi 23. PICTOGRAMASConsiste en la representacin de figuras alusivas al carcter estudiado,de forma que el tamao o el n de ellas sea proporcional a la frecuenciade cada modalidad.23 24. PIRMIDES DE POBLACINSe utilizan para estudiar conjuntamente el carcter cuantitativo (variableestadstica) edad y el carcter cualitativo (atributo) sexo. Se representaen la abscisa el sexo y en la ordenada el grupo de edad.24Poblacin joven Poblacin adulta 25. DIAGRAMA DE BARRAS Y POLGONO DE FRECUENCIASLos diagramas de barras se utilizan para representar una var. estadsticadiscreta, colocando en el eje de abscisas los valores xi , y levantando barrascuya altura sea la de la frecuencia correspondiente.25Si se unen los extremos de las barras mediante una lnea poligonal, seobtiene otro tipo de grfico llamado polgono de frecuencias . 26. Tambin se pueden representar diagramas de barras acumulativos ,utilizando como altura de las barras las frecuencias absolutas acumuladas.Y, anlogamente, el polgono de frecuencias acumulativo .26 27. Si se quieren comparar varias poblaciones de distinto tamao,se usan lasfrecuencias relativas o los porcentajes en los diagramas.27 28. HISTOGRAMA Y POLGONO DE FRECUENCIASLos histogramas se utilizan para representar una var. estadstica continua,(con datos agrupados por intervalos), colocando en el eje de abscisas losextremos de los intervalos ] ei , ei+1 ] y levantando rectngulos de base losintervalos y cuya altura sea la de la frecuencia correspondiente.(Esto sloen el caso de que todos tengan la misma amplitud; en otro caso, la alturaser igual a la frecuencia absoluta fi dividida por la amplitud ai del intervalo).Si se unen los puntos medios de las bases superiores de los rectngulos,mediante una lnea poligonal, se obtiene otro tipo de grfico llamadopolgono de frecuencias (el rea que encierra coincide con el rea de los28rectngulos del histograma). 29. PARMETROS ESTADSTICOSResumiremos los datos de una tabla estadstica en unos pocos valoresque nos informen de las caractersticas ms relevantes de la poblacin.Estos valores representativos son los parmetros estadsticos29ParmetrosestadsticosDe centralizacinDe posicinDe dispersinMediaMedianaModaOtras mediasCuantiles:CuartilesDecilesPercentilesRecorridoRangosDesviacin mediaVarianzaDesviacin tpicaCoeficiente de variacin 30. 301.MEDIDAS DE CENTRALIZACINLas medidas o estadsticos de centralizacin nos indican los valores entorno a los cuales se distribuyen los datos de la variable estadstica.Las ms usadas son las medias (aritmtica, geomtrica, armnica,...),la moda y la mediana.MEDIA ARITMTICALa media aritmtica de una variable estadstica X se representa por x ,y se define como la suma de todos los valores xi de la variable dividida porel nmero total de valores existentes (teniendo en cuenta el n de veces fique se repite cada valor):x=f 1 x1+ f 2 x2+ ...+ f k xkN =ki=1f i xiN =ki=1f i xiki=1f i 31. OBSERVACIONES: Si los datos de la variable se agrupan en intervalos (variable continua),se toma como xi la marca de clase( para convertirla en discreta ). Es la medida de centralizacin ms utilizada. Tiene en cuenta todos los valores en su clculo. Si hay valores extremos poco significativos, stos producen una distorsinen la media.31MEDIANATeniendo ordenados,de menor a mayor, los N valores xi de la variableestadstica, la mediana es el valor Me que tiene tantos valores por debajocomo por encima, dividiendo as a la poblacin en dos partes de igualtamao, N/2.La mediana Me, es el valor que ocupa la posicin central si el nmero dedatos N es impar; o bien, la semisuma de los datos centrales si el nmerode datos N es par. 32. La mediana Me, se puede calcular directamente sobre los datos ordenados:32Ejemplo1: N = 9 (impar) N/2 = 9/2 = 4,53 4 4 5 6 7 7 7 10Me = 6Ejemplo2: N = 10 (par) N/2 = 10/2 = 56,53 4 4 5 6 7 7 7 10 12Me = (6+7)/2 = 6,5 33. 33Cuando N es relativamente grande la mediana Me, tambin se puedecalcular utilizando la tabla de frecuencias absolutas acumuladas Fi .Se busca el primer valor Fi N/2 , y se localiza el valor xi que lecorresponde; dicho valor es Me.xi recuento fi Fi hi Hi % grados0 | | 2 2 0,067 0,067 6,7 24,121 | | | 3 5 0,1 0,167 10 362 | 1 6 0,033 0,2 3,3 11,883 | 1 7 0,033 0,233 3,3 11,884 | 1 8 0,033 0,266 3,3 11,885 | | | 3 11 0,1 0,366 10 366 | | 2 13 0,067 0,433 6,7 24,127 | | | | | 5 18 0,167 0,6 16,7 60,128 | | | | | | | 7 25 0,233 0,833 23,3 83,889 | | | | | | 5 30 0,167 1 16,7 60,1210 0 30 0 1 0 0TOTALES 30 1 100 360Me = 7Abrir documentoN/2 = 15 18 = Fi 34. 34Si la variable es continua, se halla el intervalo que contiene a lamediana como el primer intervalo donde Fi N/2 ( en el histogramaacumulativo ); despus se halla la mediana por interpolacin:ei-1 eiFiN/2Fi-1MeFi Fi1ei ei1=N2 Fi1Meei1Me = ei1 +N2 Fi1f iai 35. 35Fi Fi1ei ei1=N2 Fi1Meei1Me = ei1 +N2 Fi1f iaiEn las dos frmulas anteriores, tenemos:Fi frecuencia absoluta acumulada de la clase medianaFi-1 frecuencia absoluta acumulada de la clase precedente a la clasemedianaei lmite superior de la clase medianaei-1 lmite inferior de la clase medianaai amplitud de la clase mediana (ei ei-1)fi frecuencia absoluta, (Fi Fi-1)N/2 mitad del nmero total de datos 36. 3635 167565 = 25 16Me 65 25 16Me65 = + 3516(7565) = 69.737 37. 37MODALa moda es el valor Mo de la variable que ms se repite; o sea, el de mayorfrecuencia absoluta. Puede haber varias modas y, segn esto, la distribucinde la variable se llama unimodal, bimodal, etc.Mo = 8Distribucin unimodalMo = 3 y 4Distribucin bimodal 38. Si la variable es continua, se halla la clase modal o intervalo de mayorfrecuencia (el de mayor altura del histograma); despus se halla la modainterpolando con la frmula siguiente (tringulos ACF y BCE semejantes):38F B1 = fi - fi-1 CAEei-1 Mo ei2 = fi - fi+1fifi-1fi+1Mo ei11=ei Mo 2Mo = ei1 +11 + 2 ai 39. 39Mo ei11=ei Mo 2Mo = ei1 +11 + 2 aiEn las dos frmulas anteriores, tenemos:ei-1 lmite inferior de la clase modalei lmite superior de la clase modalai amplitud de la clase modal (ei ei-1)1 diferencia entre la frecuencia absoluta modal fi y la premodal fi-12 diferencia entre la frecuencia absoluta modal fi y la postmodal fi+1 40. 40F B1 = fi - fi-1 CAEei-1 Mo ei2 = fi - fi+1fifi-1fi+1Mo 153825 =20 Mo3816Mo = 15 + 1313 + 22 5 = 16,86 41. 2.MEDIDAS DE POSICINSon una generalizacin de la mediana. Los cuantiles sirven para determinaren qu posicin de la distribucin se encuentra un individuo,supuestos stosordenados en orden creciente.Los cuantiles son aquellos valores que dividen a la muestra en intervaloscon igual nmero de observaciones.Los ms importantes son los siguientes:cuartiles, deciles y percentiles, segn el nmero de partes en que dividena la poblacin.41CUARTILESDividen a la poblacin en cuatro partes,cada una de las cuales contiene al25 % de la poblacin, es decir, N/4 valores. Hay tres cuartiles:Primer cuartil: Q1 = C1/4Segundo cuartil: Q2 = C1/2 = MeTercer cuartil: Q3 = C3/4En general,un cuartil Qi deja a su izquierda iN/4 valores menores que l( i = 1, 2, 3).La forma de calcularlos es similar a la de la mediana. 42. 42DECILESDividen a la poblacin en diez partes, cada una de las cuales contiene al10 % de la poblacin, es decir, N/10 valores. Hay nueve deciles:Primer decil: D1 = C1/10Noveno decil: D9 = C9/10En general,un decil Di deja a su izquierda iN/10 valores menores que l( i = 1, 2, 3 , . , 9 ).CENTILES O PERCENTILESDividen a la poblacin en cien partes, cada una de las cuales contiene al1 % de la poblacin,o sea,N/100 valores. Hay noventa y nueve percentiles:Primer percentil: P1 = C1/100ltimo percentil: P99 = C99/100En general,un centil o percentil Pi deja a su izquierda iN/100 valoresmenores que l ( i = 1, 2, 3 , . , 99 ). 43. Ejemplo1: N = 9 (impar) N/4 = 9/4 = 2,25 Q1 = C1/4(posicin 3)2 N/4 = 22,25 = 4,5 Q2 = C1/2 = Me (posicin 5)3 N/4 = 32,25 = 6,75 Q3 = C3/4 (posicin 7)3 4 4 5 6 7 7 7 10Q1 Q2 = Me Q3Ejemplo2: N = 10 (par) N/4 = 10/4 = 2,5 Q1 = C1/4(posicin 3)2 N/4 = 22,5 = 5 Q2 = C1/2 = Me (posicin 5 y 6)3 N/4 = 32,5 = 7,5 Q3 = C3/4 (posicin 8)436,53 4 4 5 6 7 7 7 10 12Q1 Q2 = Me Q3 44. 44Obviamente se cumplen las relaciones siguientes:P25 = Q1 = C1/4P50 = D5 = Q2 = C1/2 = MeP75 = Q3 = C3/4CLCULO DE CUANTILESCuando N es relativamente grande, los cuartiles se calculan utilizandola tabla de frecuencias absolutas acumuladas del total N de datos,de forma similar a como se calculaba la mediana( calculando losvalores que corresponden a N/4, N/2 , 3N/4, etc).En general, para hallar el percentil Pk, se utiliza la tabla de lasfrecuencias absolutas acumuladas expresadas en % , y se tomala primera de ellas que supera el k %. El valor xi que le correspondeser el percentil Pk.Si alguna de esas frecuencias en porcentaje coincide con el k% ,entonces se toma como Pk la media entre ese xi y el siguiente xi+1. 45. 45EJEMPLO 1: Las calificaciones de 30 alumnos de un colegio vienendadas por la siguiente tabla. Halla los tres cuartiles y el percentil P20.xi fi Fi hi Hi % grados % acumulado0 2 2 0,067 0,067 6,7 24,12 6,71 3 5 0,1 0,167 10 36 16,72 1 6 0,033 0,2 3,3 11,88 203 1 7 0,033 0,233 3,3 11,88 23,34 1 8 0,033 0,266 3,3 11,88 26,65 3 11 0,1 0,366 10 36 36,66 2 13 0,067 0,433 6,7 24,12 43,37 5 18 0,167 0,6 16,7 60,12 608 7 25 0,233 0,833 23,3 83,88 83,39 5 30 0,167 1 16,7 60,12 10010 0 30 0 1 0 0 100TOTALES 30 1 100 360para hallar cuartiles (con Fi) para hallar percentiles (con % acumulado)N/2 = 15 15 y 16 pos. Q2 = P50 = C50/100 = Me = 7(60>50)N/4 = 7,5 8 posicin Q1 = P25 = C25/100 =4 (26,6>25)3N/4 = 22,5 23 posicin Q3 = P75 = C75/100 =8 (83,3>75)(2+3)/2 = 2,5 (20 = 20)P20 = C20/100 =Variable estadstica discreta 46. EJERCICIO: Los pesos de 100 alumnos de un colegio vienen dadospor la siguiente tabla. Calcula media, moda, mediana, los tres cuartilesy el percentil P30.EJEMPLO 2: Los pesos de 100 alumnos de un colegio vienen dados46Comprueba grficamente estos resultados en los histogramas quecorrespondan en cada caso.Intervalos Marcas xi fi]40,48] 44 10]48,56] 52 20]56,64] 60 30]64,72] 68 20]72,80] 76 20TOTALES 100 47. 47Intervalos Marcas xi fi Fi fi*xi % acumulado]40,48] 44 10 10 440 10]48,56] 52 20 30 1040 30]56,64] 60 30 60 1800 60]64,72] 68 20 80 1360 80]72,80] 76 20 100 1520 100TOTALES 100 6160Media 61,6 Clasemediana:x =Mediana 50 60 ]56,64] Me:Cl.modal:Moda ]56,64] (max Fi = 30)Q1 = C25/100 =Cuartil 1 54Q3 = C75/100 =Cuartil 3 70P30 = C30/100 =Percentil 30 56Mo563020 =64Mo3020 Mo =56+ 642 = 6060306456 =5030Me56Me= 56 +50306030 (6456)= 61,333 0 1 05 6 4 8 =2 5 1 0Q 1 4 8 Q 1 = 4 8 +2 5 1 03 0 1 0 ( 5 6 4 8 ) = 5 48 0 6 07 2 6 4 =7 5 6 0Q 3 6 4 Q 3 = 6 4 +7 5 6 08 0 6 0 ( 7 2 6 4 ) = 7 06 0 3 06 4 5 6 =3 0 3 0P 3 0 5 6 P30 = 56SOLUCIN:Variable estadstica continua 48. 48Mo 563020 =64 Mo3020Mo = 56 + 642 = 60 49. 4960 3064 56 = 50 30Me 56 50 30Me56 = + 6030(64 56)= 61,33 50. DIAGRAMA BOX-WHISKER ( CAJA CON BIGOTES )La caja abarca el intervalo Q1, Q3 y en ella se seala la mediana Me.Los bigotes se trazan hasta abarcar todos los datos, sin sobrepasar lalongitud de una vez y media la longitud de la caja, o sea, 1,5(Q3 Q1).Si as fuera, se traza la longitud mxima permitida, y los individuos quecaigan fuera se sealan mediante puntos o asteriscos ( casos raros ).El 50 % de los datos centrales estn dentro de la caja,entre el primery el tercer cuartil, mientras que el resto estn representados sobre lossegmentos o bigotes.50 51. X min X max51CONSTRUCCIN DEL DIAGRAMA BOX-WHISKERPara construir el diagrama Box-Whisker se determinan: Rango intercuartlico RIQ = Q3 - Q1 Factor de escala FE = 1,5 RIQ Frontera interior inferior f1 = Q1 FE Frontera interior superior f2 = Q3 + FE Valor adyacente inferior VAI = menor dato f1 Valor adyacente superior VAS = mayor dato f2 Valores anmalos los datos que estn fuera del intervalo] f1 , f2 [f1 f2 VAI Q1 Q2 = ME Q3 VAS 52. Las medidas de dispersin miden la mayor o menor separacin que hayentre los datos de la distribucin; es decir, si estn concentrados o, por elcontrario, se encuentran dispersos.confrontan la dispersin absolutacon el valor de algn promedio.A menor dispersin relativa,menorvariabilidad de los datos y mayorrepresentatividad del promedioconsiderado.523.MEDIDAS DE DISPERSINParmetrosde dispersinDispersinabsolutaDispersinrelativapermiten comparar la mayor omenor heterogeneidad de dosdistribucionesRecorrido y otros rangos,desviacin media, varianza ydesviacin tpicaCoeficiente de variacin 53. 53RECORRIDOEl recorrido o rango es la diferencia entre el valor mximo y el valormnimo de los datos.R = X mx X mnOTROS RANGOSExisten otros rangos interesantes como, por ejemplo:el rango intercuartlico es la diferencia entre el tercer y el primercuartil, y abarca el 50 % de la poblacin.RIQ = Q3 Q1DESVIACIN MEDIALa desviacin media es la media de los valores absolutos de lasdesviaciones respecto a la media. 54. 54D.media X =ki=1f i xi xN =ki=1f i xi xki=1f iVARIANZA Y DESVIACIN TPICALa varianza es la media de los cuadrados de las desviaciones respectoa la media. Por tanto, la varianza se mide en unidades cuadradas de lavariable y, por ello, se usa la desviacin tpica que es la raz cuadradade la varianza, y que se mide en la misma unidad que la variable.Var X = 2 =ki=1f i ( xi x)2N =ki=1f i ( xi x)2ki=1f i 55. 55Otra expresin (ms cmoda) de la varianza: es la media de loscuadrados menos el cuadrado de la media.Var X = 2 =ki=12f i xiN x 2 =ki=12f i xiki=1f i x 2Y la desviacin tpica es la raz cuadrada de cualquiera de las dosexpresiones anteriores k = i=1xkf ( xi )2i = N i=12f i xiN x 2 56. En distribuciones normales,el intervalo ( x - , x + ) contiene el 68,27 % de los datos de la poblacin,el intervalo ( x - 2, x + 2) contiene el 95,45% , yel intervalo ( x - 3, x + 3 ) contiene el 99,73%.El coeficiente de variacin es el cociente entre la desviacin tpica y lamedia aritmtica. Se suele expresar en %. Cuanto menor es el CV, msconcentrada est la distribucin alrededor de su media y, por tanto, staes ms representativa.Y, al contrario, a medida que se aleja de 0, el parmetro media es menosrepresentativo de la poblacin.56COEFICIENTE DE VARIACINdispersin relativa= medida de dispersinpromedio utilizadoenel numeradorCV = x100 CV ( / )=100 x ( / ) 57. 57FIN Inmaculada Leiva Tapia IES Alborn