ui estadistica descriptiva

82
 UNIDAD I: ES T ADÍSTI CA DESCRIPTIVA Asignatura: Estadística Grupo: 206 A

Upload: raul-alejandro-limon

Post on 07-Oct-2015

16 views

Category:

Documents


0 download

DESCRIPTION

guia de estadistica descriptiva con ejemplos

TRANSCRIPT

Elementos de Estadstica descriptiva

UNIDAD I: ESTADSTICA DESCRIPTIVA

Asignatura: Estadstica

Grupo: 206 A

Ral Alejandro Limn Hernndez

TEMA I: Introduccin a la estadsticaLa Estadstica es una ciencia que facilita la solucin de problemas en los cuales necesitamos conocer caractersticas sobre el comportamiento de algn suceso o evento.

Nos permite inferir el comportamiento de sucesos iguales o similares sin necesidad de que estos ocurran.

Esto nos da la posibilidad de tomar decisiones acertadas y a tiempo, as como realizar proyecciones del comportamiento del suceso.

Slo se realizan los clculos y el anlisis con los datos obtenidos de una muestra de la poblacin y no con toda la poblacin.

Conceptos bsicosEstadstica:Es la ciencia que se encarga de recolectar, organizar, resumir y analizar datos para despus obtener conclusiones. Se divide en Estadstica Descriptiva y Estadstica Inferencial.

Estadstica descriptiva:Se encarga de la recoleccin, organizacin, presentacin y anlisis de los datos de una poblacin.

Estadstica inferencial:Se encarga de analizar la informacin presentada por la estadstica descriptiva mediante tcnicas que nos ayuden a conocer, con determinado grado de confianza, a la poblacin. Lo que nos permite tomar decisiones.

Poblacin:Conjunto definido de TODOS los INDIVIDUOS, de donde se observa cierta caracterstica.

Al nmero de integrantes de la poblacin se llama tamao de la poblacin y se representa con la letra N.

Las poblaciones pueden ser finitas o infinitas.

Poblacin Estadstica:Conjunto de TODOS los DATOS que se obtienen al realizar la medicin de una variable en los elementos de una poblacin.

Muestra:Subconjunto de una poblacin, que intenta reflejar las caractersticas de la poblacin lo mejor posible.

El nmero de individuos que integran la muestra, llamado tamao de la muestra se representa con la letra n.

Individuo:Es el elemento de la poblacin o de la muestra que aporta informacin sobre lo que se estudia.

Variable:Caracterstica o propiedad de los individuos que se desea estudiar y se puede medir o calificar; cambia o vara con el tiempo en un individuo dado, o cambia o vara de elemento a elemento. Ej. Edad, peso, sexo, estado civil, nmero de hijos, etc.

Dato:Valor que se obtiene al realizar la medicin de la caracterstica de la variable en estudio.

La naturaleza de los datos pueden ser datos cuantitativos o datos cualitativos.

Datos Cuantitativos (nmeros):Valores obtenidos al medir peso, estatura, temperatura, nmero de hijos.

Datos Cualitativos (categoras):Se obtienen al calificar la caracterstica en cuestin como el sexo, estado civil, grado mximo de estudios.

V. CUANTITATIVA:Variable Continua:Si la variable puede tomar cualquier nmero real entre dos valores dados (decimal o entero). Ej. El peso de un individuo.

Variable Discreta:Si la variable slo puede tomar nmeros enteros.Ej. El nmero de hijos de un individuo.

Fuentes de informacinEncuesta:Recopilar los datos mediante el uso de cuestionarios o entrevistas.Experimento:Procedimiento utilizado en la investigacin cientfica para obtener informacin que permita conocer el comportamiento de algn proceso.

Fuentes de InformacinInvestigacin Documental:Procedimiento para obtener datos mediante la consulta de informacin ya escrita y concentrada en documentos que se localicen en libros o revistas en bibliotecas, hemerotecas, o en centros virtuales. ACTIVIDAD 1. CUESTIONARIO 1Cul es la importancia de la estadstica en la contabilidad?Cul es la diferencia entre la estadstica descriptiva e inferencial? Define los conceptos de poblacin, muestra e individuo.Qu es una variable y como se clasifican? Menciona 3 ejemplos de cada tipoCules son las principales formas de obtener datos (informacin)?ACTIVIDAD II. CUESTIONARIO 2Retroalimentacin del cuestionario con respuestas

ESTADISTICA UNIDAD I.docxTEMA II: Organizacin de la informacinLa ordenacin es el proceso mediante el cual los datos estn acomodados de tal manera que se establece un orden (ascendente o descendente) entre ellos.

Hay dos mtodos comunes para variables cuantitativas:Listado en orden ascendenteMtodo de tallo y hojasEjemploConsidera que la variable de estudio es el peso de 25 estudiantes. Los pesos se encuentran en la siguiente tabla:Peso de 25 estudiantes (en kg)40434851495644425552526244505963505655455766635158

Listado en orden ascendenteEl proceso consiste en ordenarlos de menor a mayorPeso de 25 estudiantes (en kg)42404851495644435552526244505963505655455766635158Peso de 25 estudiantes (en kg)40424344444548495050515152525555565657585962636366

Mtodo de tallo y hojasSi los nmeros de los datos estn formados por dos dgitos, se hace una columna con el primer dgito (decenas) y a la derecha de cada uno de ellos se escribe, en fila, slo el segundo dgito (unidades) de cada uno de los datos que tengan el mismo primer dgito.Datos sin ordenar:

Datos ordenados:4564560,2,3,4,4,5,8,90,0,1,1,2,2,5,5,6,6,7,8,92,3,3,6Peso de 25 estudiantes (en kg)424048514956444355525262445059635056554557666351582,0,8,9,4,3,4,51,6,5,2,2,0,9,0,6,5,7,1,82,3,6,3Doble talloUna variante de este mtodo es en lugar de dividir en un grupo las decenas, se divide en dos grupos. El primero abarcando los dgitos del 0 al 4 y el segundo del 5 al 9.

El ejemplo anterior queda:40,2,3,4,445,8,950,0,1,1,2,2,55,5,6,6,7,8,962,3,366Caso de variables cualitatitivasEl procedimiento es:

Se identifican todos los valores diferentes y se acomodan en columna.

Se agrega una segunda columna en donde se van registrando, mediante una lnea vertical, la veces que aparece el valor dado.EjemploConsidera que la variable de estudio es el color de playera de 25 estudiantes. Los colores se encuentran en la siguiente tabla:rosaazulblancoazulrosagrisblancocafnegroblancorosa azulcafblancoblancogrisazulblancorosagrisgrisblancocafnegroverderosaazulblancoazulrosagrisblancocafnegroblancorosa azulcafblancoblancogrisazulblancorosagrisgrisblancocafnegroverdeColorFrecuenciaAzulBlancoCafGrisNegroRosaVerdeI I I II I I I I II I II I I II II I I IITabla de Frecuencia de DatosUna vez que se tenga ordenados los datos, se acomodan en la Tabla de distribucin de frecuencias o tabla de frecuencias.

La tabla es bsicamente una tabla de valores x-y, dnde x representa el dato y y representa la frecuencia.La frecuencia es el nmero de veces que aparece cada dato.

Hay dos clases de tablas de frecuencias:Para datos NO agrupados.Para datos agrupados.Tabla de frecuencias para datos NO agrupadosEst formada por dos columnas: una para la variable xi y la otra para su frecuencia f, a esta frecuencia se le llama frecuencia absoluta o frecuencia observada.EjemploTabla de frecuencias de los pesos en kg de 25 alumnos.Peso de 25 estudiantes (en kg)40424344444548495050515152525555565657585962636366xif404243444548495051xif525556575859626366Total11121112222211112125Frecuencia relativa y acumuladaPor lo regular, se agregan dos columnas: la de la frecuencia relativa fr y la de la frecuencia acumulada fa.La frecuencia relativa se obtiene mediante el cociente de la frecuencia y el nmero total de datos, esto es fr = f/n.La frecuencia acumulada se obtiene sumando las frecuencias anteriores a las frecuencias de un dato dado.Ejemploxiffrfa401421431442451481491502512xiffrfa522552562571581591621632661Total250.040.040.040.040.040.040.040.040.040.040.040.080.080.080.080.080.080.081/252/25123567810121416181920212224251Siempre es el nmero totalSiempre es 1Intervalo de claseEn ocasiones es conveniente acomodar los datos en pequeos grupos de igual tamao, llamados intervalos de clase.El punto medio o marca de clase xi, se obtiene con:

El tamao del intervalo se obtiene mediante la diferencia de los lmites superior e inferior.Marca de clase = Lmite inferior + lmite superior2EjemploIntervalo de clasePunto medio xi38 424043 474548 525053 575558 626063 6765Lmite inferiorLmite superiorLm inf + Lim sup

2+5+5+5Lmite verdadero del intervaloFrontera de clase o lmite verdadero del intervalo:Intervalo de clasePunto medio xi37.5 42.54042.5 47.54547.5 52.55052.5 57.55557.5 62.56062.5 67.5655/2 = 2.540 2.540 + 2.5+5+5Tabla de intervalos con lmites verdaderosUsando smbolos de desigualdad

Usando parntesis y corchetes

Intervalo de clasePunto medio xi37.5 x < 42.54042.5 x < 47.54547.5 x < 52.55052.5 x < 57.55557.5 x < 62.56062.5 x < 67.565Intervalo de clasePunto medio xi[37.5 , 42.5)40[42.5 , 47.5)45[47.5 , 52.5)50[52.5 , 57.5)55[57.5 , 62.5)60[62.5 , 67.5)65Est incluidoNo est incluidoEst incluidoNo est incluidoEl tamao del intervalo es de 5Cmo elegir el intervalo? Si por alguna razn no es fcil decidir el ancho del intervalo y el nmero de ellos, se pueden utilizar las siguientes frmulas:K = 1 + 3.3 log (n)Donde K = nmero aproximado de clasesn = nmero de datos.Amplitud de los intervalos = Rango / KDonde Rango = diferencia entre el dato mayor y el dato menor.EjemploPara el ejemplo de los datos de los pesos de 25 alumnos, el valor de K:

Y la amplitud de los intervalos sera:K = 1 + 3.3 log (n) = 1 + 3.3 log (25) = 5.6.Por lo tanto se requieren aproximadamente 6 intervalos.Amplitud = Rango / K = (66 40) / 5.6 = 4.64.Aproximadamente 5 unidades es la amplitud de los intervalos.Tabla de distribucin de frecuencias para datos agrupadosSe elabora con los intervalos de clase, sus puntos medios y las frecuencias correspondientes para cada uno de los intervalos.xif401421431442451481491502512522552562571581591621632661Total25Datos sin agruparIntervalo de clasePunto medio xif38 424043 474548 525053 575558 6260- 6765TotalDatos agrupados24853325

Se agregan las columnas de frecuencia relativa fr y frecuencia acumulada fa:Intervalo de clasePunto medio xiffrFa38 4240243 4745448 5250853 5755558 62603- 68653Total250.080.160.320.200.120.12126141922252/254/258/25

Por ltimo se agregan las columnas:Frecuencia porcentual, f% %f, se obtiene multiplicando la frecuencia relativa fr x 100.Frecuencia relativa acumulada fra, se obtiene sumando las frecuencias relativas anteriores a un dato dado.Frecuencia porcentual acumulada, f%a, se obtiene sumando las frecuencias porcentuales acumuladas a un dato dado.Tablas de frecuencias absoluta, relativa y acumuladaIntervalo de clasePunto medio xiffrf%fafraf%a38 424020.08243 474540.16648 525080.321453 575550.201958 626030.1222- 686530.1225Total251816322012121000.080.240.560.760.8818245676881000.08 x 1002/250.08 x 100TEMA III. Representacin grfica de DatosExisten dos tipos de grficas mas usuales:Polgono de FrecuenciasHistograma

Otros grficos:Grfica de barrasPictogramaGrfico Circular o de pastel.Polgono de FrecuenciasEs la representacin mediante un grfico de lnea. En l se muestra la distribucin de frecuencias y est formado por segmentos de lnea que unen los puntos correspondientes a la frecuencia de cada una de las clases.

El eje x representa el dato xi y el eje y las frecuencias.

EjemploIntervalo de clasePunto medio xif38 4240243 4745448 5250853 5755558 62603- 68653Total25

El eje y puede ser sustituido por las frecuencias relativas o porcentuales.frxiPolgono de Frecuencia Relativa

% fxiPolgono de Frecuencia PorcentualHistogramaEs la representacin grfica de los datos mediante una sucesin de rectngulos.Est formado por rectngulos cuya anchura representa a cada uno de los intervalos y la altura corresponde a la frecuencia.En el eje x estarn los lmites verdaderos, los puntos medios y en el eje y las frecuencias.

Intervalo de clasePunto medio xif38 4240243 4745448 5250853 5755558 62603- 68653Total25Ejemplo

Tambin podemos usar la frecuencia relativa y la frecuencia porcentual.frxi

% fxi

Pirmide PoblacionalUna variante en el histograma es colocar en el eje x de tal manera que las columnas quedarn en forma horizontal, es muy comn en datos poblacionales.OjivaEs la representacin grfica de las frecuencias acumuladas mediante un grfico de lnea. Se muestra la distribucin de frecuencias acumuladas de los datos.

En el eje x estarn los puntos medios y en el eje y las frecuencias acumuladas.EjemploIntervalo de clasePunto medio xiffrfa38 424020.08243 474540.16648 525080.321453 575550.201958 626030.1222- 686530.1225Total251

Usando la frecuencia acumulada y la frecuencia porcentual. Intervalo de clasePunto medio xiffrf%fafraf%a38 424020.08820.08843 474540.161660.242448 525080.3232140.565653 575550.2020190.767658 626030.1212220.8888- 686530.1212251100Total251100

Grfico CircularTambin es llamado grfico de pastel.

Slo se representan datos de frecuencias relativas o frecuencias porcentuales.

Se debe dividir el rea del crculo de manera proporcional a las frecuencias.

Agregaremos una columna a nuestra tabla de frecuencias Frecuencia relativa al crculo, multiplicando (fr)(360), para mostrar la parte proporcional de crculo medida en grados que corresponde a cada intervalo.Ejemplo 1Intervalo de clasePunto medio xiffr(fr ) (360)38 424020.0843 474540.1648 525080.3253 575550.2058 626030.12- 686530.12Total25128.80.08 x 3600.16 x 36057.6115.27243.243.2360

Ejemplo 2ColorFrecuenciaConteoAzul4Blanco7Caf3Gris4Negro2Rosa4Verde1I I I II I I I I II I II I I II II I I IIOtros GrficosLa grfica de barras se traza similar al Histograma, slo que las barras se dibujan separadas unas de otras.La escala en el eje x es para mostrar categoras o intervalos de nmeros NO consecutivos.

CarreraAlumnosMedicina8Mecnica11Civil8Agronoma3Fsico - Matemticas3Leyes6Contadura11PictogramaSimilar al de barras, slo que se sustituyen por figuras, generalmente relacionadas con la variable estudiada.

TEMA IV. Medidas de Tendencia CentralTEMA V. Medidas de dispersin La dispersin o variacin es una caracterstica importante de un conjunto de datos porque intenta dar una idea de cun esparcidos se encuentran stos.

Existen diversas medidas de dispersin, algunas de ellas son:

Rango Desviacin media Desviacin estndar Varianza

RangoVarianza (datos no agrupados)Mide la distancia entre los valores de la serie y la media. Se calcula como la sumatoria de las difeencias al cuadrado entre cada valor y la media, multiplicadas por le nmero de veces que se ha repetido cada valor.

Ejemplo: Calcula la varianza para los siguientes datos: 2 1 2 4 1 3 2 3 2 0 5 1Aplicando la frmula:

Desviacin Estndar (Datos no agrupados)Llamada desviacin tpica, es una medida de dispersin usada en estadstica cuyo valor seala cuanto tiende a alejarse los valores puntuales del promedio en una distribucin

La desviacin estndar es la raz cuadrada de la varianza

Ejemplo: Tomando los datos del ejemplo de varianza, calcular la desviacin estndar: 2 1 2 4 1 3 2 3 2 0 5 1

72Coeficiente de variacinEs una medida de dispersin que se utiliza para poder comparar las desviaciones de poblaciones con diferentes medias y se calcula como cociente entre la desviacin tpica y la media.

Ejemplo: En dos cursos los promedios que sacaron los alumnos fueron 6.1 y 4.3 respectivamente y las desviaciones estndar respectivas fueron 0.6 y 0.45 respectivamente. En qu curso hay mayor dispersin?

El curso B muestra mayor dispersin de sus datos

Ejercicio:En la siguiente tabla se muestran lo salarios de 10 trabajadores en distintos puestos. Realiza el anlisis de varianza, desviacin estndar y coeficiente de variacin:

A8129310121112147B767151211991311Salario (miles de pesos)PuestoVarianza y desviacin estndar (Datos agrupados)Cuando los datos se encuentren agrupados en tablas de frecuencias, el significado es el mismo, sin embargo la manera de calcularla la varianza es distinta, aunque la desviacin estndar sigue siendo la raz cuadrada de la varianza:

80

Fin de la unidad I