resumen 2 de estadistica

6
 Resumen#2 d e los de Estadística y probabilidades. Nombre: Ilka Meneses C Profesor: Jaime González Cedula 2-716-2417 1. Medidas de tendenc ia central. Moda, media y media na. n es!e "ideo se e#$li%an las $rin%i$ales medidas de !enden%ia %en!ral& 'ue son una (erramien!a indis$ ens abl e $ar a el es!udio del %om$or!amien!o de una mues!ra )& $or e#!ensi*n& de una $obla%i*n de in!er+s, Primero& se re"isa el %on%e$!o de !enden%ia& el %ual se refiere a un %om$or!amien!o %omn& es de%ir& el %om$or!amien!o 'ue "iene in"olu%rado a un .ru$o de $ersonas& a la ma)or/a de la mues!ra 'ue se es!á analizando, 0os as$e%!os $ara (ablar de una !enden%ia son la moda& $romedio ) "alor medio, l "alor de ma)or re$e!i% i*n se %ono%e en es!ad/ s!i%a %on el nombre de moda, l se .undo %ri!erio es el %om$or!amien !o $romedio de di%(a $obla%i* n analizada o en el %aso del es!udio& de la mues!ra sele%%ionada& en es!e %aso& (ablamos de una media, Por l!imo& o!ro %ri!erio de sele%%i*n $ara el %ál%ulo de las medidas de !enden%ia %en!ral %orres$onde al "alor medio& es de%ir& el $un!o %en!ral de la serie ordenada de da!os o indi"iduos analizados, n el "ideo se $rofundiza en %ada una de las medidas de !enden%ia %en!ral men%ionadas ) se (a%e un re$aso de %ada uno de los dis!in!os !i$os de series de da!os,0as medidas de !e nden%i a %en!ral so n "alores 'ue se ubi%an al %en!ro de un %onun!o de da!os ordenados se.n su ma.ni!ud, Generalmen!e se u!ilizan 4 de es!o s "a lo re s !amb i+ n %ono%idos %omo es!a d/ .rafos& la media ar i! m+ !i% a& la mediana& la moda ) al ran.o medio, La media ari! m+ !i%a es la medida de $osi%i*n u!ilizada %on más fre%uen%ia, i se !ienen n "alores de obser"a%iones& la media ari!m+!i%a es la suma de !odos ) %ada uno de los "alores di"idida en!re el !o!al de "alore s: 0o 'ue indi%a 'ue $uede ser afe%!ada $or los "alores e#!remos& $or lo 'ue $uede dar una ima.en dis!orsionada de la informa%i*n de los da!os,

Upload: ilkaitzelmeneses

Post on 01-Nov-2015

215 views

Category:

Documents


0 download

DESCRIPTION

estadistica

TRANSCRIPT

Resumen#2 de los de Estadstica y probabilidades.Nombre: Ilka Meneses C Profesor: Jaime GonzlezCedula 2-716-2417 1. Medidas de tendencia central. Moda, media y mediana.En este video se explican las principales medidas de tendencia central, que son una herramienta indispensable para el estudio del comportamiento de una muestra y, por extensin, de una poblacin de inters. Primero, se revisa el concepto de tendencia, el cual se refiere a un comportamiento comn, es decir, el comportamiento que viene involucrado a un grupo de personas, a la mayora de la muestra que se est analizando. Los aspectos para hablar de una tendencia son la moda, promedio y valor medio. El valor de mayor repeticin se conoce en estadstica con el nombre de moda. El segundo criterio es el comportamiento promedio de dicha poblacin analizada o en el caso del estudio, de la muestra seleccionada, en este caso, hablamos de una media. Por ltimo, otro criterio de seleccin para el clculo de las medidas de tendencia central corresponde al valor medio, es decir, el punto central de la serie ordenada de datos o individuos analizados. En el video se profundiza en cada una de las medidas de tendencia central mencionadas y se hace un repaso de cada uno de los distintos tipos de series de datos.Las medidas de tendencia central son valores que se ubican al centro de un conjunto de datos ordenados segn su magnitud. Generalmente se utilizan 4 de estos valores tambin conocidos como estadgrafos, la media aritmtica, la mediana, la moda y al rango medio. La media aritmtica es la medida de posicin utilizada con ms frecuencia. Si se tienen n valores de observaciones, la media aritmtica es la suma de todos y cada uno de los valores dividida entre el total de valores: Lo que indica que puede ser afectada por los valores extremos, por lo que puede dar una imagen distorsionada de la informacin de los datos. La Mediana, es el valor que ocupa la posicin central en un conjunto de datos, que deben estar ordenados, de esta manera la mitad de las observaciones es menor que la mediana y la otra mitad es mayor que la mediana, resulta muy apropiada cuando se poseen observaciones extremas.

La Moda es el valor de un conjunto de datos que aparece con mayor frecuencia. No depende de valores extremos, pero es ms variables que la media y la mediana. Rango Medio es la media de las observaciones menor y mayor. Como intervienen solamente estas observaciones, si hay valores extremos, se distorsiona como medida de posicin, pero ofrece un valor adecuado, rpido y sencillo para resumir al conjunto de datos.2. Medidas de posicin no centrales cuartiles, deciles y porcentiles.Las medidas de posicin no centrales permiten conocer otros puntos caractersticos de la distribucin que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales:Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados.Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados.Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.3. Medidas de dispersin. Rango desviacin media, varianza desviacin estndar.Las medidas de dispersin nos informan sobre cunto se alejan del centro los valores de la distribucin. Rango o recorrido: El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica.Desviacin media: La desviacin respecto a la media es la diferencia entre cada valor de la variable estadstica y la media aritmtica.

La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media.La desviacin media se representa por signo, Desviacin media para datos agrupados Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la desviacin media es:Varianza: La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica.La desviacin estndar o desviacin tpica es la raz cuadrada de la varianza. Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin.

4. Coeficiente de variacin de Pearson. Indica la relacin existente entre la desviacin tpica de una muestra y su media.Al dividir la desviacin tpica por la media se convierte en un valor exento de unidad de medida. Si comparamos la dispersin en varios conjuntos de observaciones tendr menor dispersin aquella que tenga menor coeficiente de variacin.El principal inconveniente, es que al ser un coeficiente inversamente proporcional a la media aritmtica, cuando est tome valores cercanos a cero, el coeficiente tender a infinito.5. Datos agrupados: intervalos limites superior e inferior.En este video se estudia el tema de la agrupacin de datos, el cual es de uso bastante frecuente en series de datos cuantitativos continuos. Disponiendo de una serie de datos determinada es posible encontrar mltiples repeticiones para valores o categoras de datos muy cercanas entre s, lo que hace muy complicado el conteo de datos y la subsecuente construccin de la tabla de frecuencias. Por tal motivo se establece un sistema de agrupacin de datos mediante la definicin de intervalos de clase, tambin conocidos simplemente como clases. La funcin de las clases es contener los datos que se encuentran al interior de sus lmites, es decir, sus valores mnimo y mximo.

. Las distintas clases que hacen parte de una tabla de frecuencia para datos agrupados pueden representarse grficamente mediante un histograma, que es en esencia un diagrama de barras unidas, cuya base es proporcional a la longitud del intervalo, y la altura es proporcional a su frecuencia absoluta. No obstante tambin puede definirse un polgono de frecuencias para estos datos agrupados, a partir de la unin de los segmentos que se obtienen a partir de los puntos medios ubicados en las bases superiores de cada barra del histograma. Los puntos medios, que se encuentran en la parte superior de las barras se conocen como marcas de clase, que corresponde a la definicin de mediana.6. Asimetra en distribucin de datos.Se establece el concepto de asimetra en datos, as como las formas para su estimacin. En este video se estudia la asimetra en distribuciones de datos, tema muy importante para poder predecir o estimar el comportamiento de una serie. Suponiendo que tenemos una serie de datos organizada en una tabla de frecuencias, representada grficamente mediante un diagrama de barras o histograma, si nos encargamos de unir los puntos medios de cada barra, nos encontraremos con que los puntos estn creando una forma regular en la que los valores extremos se encargan de conformar unos puntos extremos mnimos, y la mayor parte de los datos est concentrada en el centro de la curva. En dicha figura se observa que la categora que est en el centro corresponde, a su vez, a la moda de la misma, y si nos encargamos de analizar los datos con un poco ms de detalle, encontramos que tambin ah se localiza la media del sistema. Entonces en el punto sugerido nos encontramos que la moda, la media y la mediana son iguales, y tambin encontramos que el comportamiento de los extremos es prcticamente el mismo, estamos hablando entonces de una distribucin simtrica. Otros histogramas difieren considerablemente del tratado. En el segundo caso en el que la media es menor que la moda, y la mediana es menor que la media, estamos hablando de una distribucin asimtrica negativa. Para determinar el nivel o calidad de la asimetra se puede hacer mediante relaciones o coeficientes que utilizan diferentes parmetros. Se tienen tres coeficientes principales: coeficiente de asimetra de Fisher, coeficiente de asimetra de Pearson y coeficiente de asimetra de Bowley. En el primero se emplean herramientas probabilsticas. En el segundo se emplean las medidas de tendencia central al igual que las medidas de dispersin. En el ltimo se emplean las medidas de posicin no centrales, particularmente los cuartiles.

7. Asimetra coeficiente de Pearson Coeficiente de asimetra de Pearson CAP mide la diferencia entre la media y la moda respecto a la dispersin del conjunto X=(x1, x2,, xN).Este procedimiento, menos usado, lo emplearemos solamente en distribuciones unimodales y poco asimtricas.