formula de estadistica

Upload: dawill-ocana-carballido

Post on 01-Mar-2016

5 views

Category:

Documents


0 download

DESCRIPTION

Formula de Estadistica

TRANSCRIPT

ModaLamoda, Mo,es elvalorque tienemayor frecuencia absoluta.1 Todos los intervalos tienen la misma amplitud.

Li-1es el lmite inferior de la clase modal.fies la frecuencia absoluta de la clase modal.fi--1es la frecuencia absoluta inmediatamente inferior a la en clase modal.fi-+1es la frecuencia absoluta inmediatamente posterior a la clase modal.aies la amplitud de la clase.Tambin se utiliza otrafrmulade lamodaque da unvalor aproximadode sta:

2 Los intervalos tienen amplitudes distintas.En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor altura.

Lafrmulade lamoda aproximadacuando existen distintas amplitudes es:

MedianaEs elvalorque ocupa ellugar centralde todos losdatoscuando stos estnordenados de menor a mayor.1Si la serie tiene unnmero impar de medidaslamedianaes lapuntuacin centralde la misma.2Si la serie tiene unnmero parde puntuaciones lamedianaes lamediaentre las dospuntuaciones centrales.Mediana para datos agrupados

es la semisuma de las frecuencias absolutas.Li-1es el lmite inferior de la clase donde se encuentra.Fi-1es lafrecuencia acumuladaanterior a la clase mediana.aies la amplitud de la clase.Media aritmticaLamedia aritmticaes elvalorobtenido alsumartodos losdatosydividirel resultado entre elnmerototal dedatos.

CuartilesLoscuartilesson lostres valoresde la variabledividena unconjuntodedatos ordenadosencuatro partes iguales.Clculo de los cuartiles1Ordenamoslosdatosdemenor a mayor.2Buscamos el lugar que ocupa cada cuartil mediante la expresin.Clculo de los cuartiles para datos agrupadosEn primer lugar buscamos laclasedonde se encuentra, en latabla de las frecuencias acumuladas.

DecilesLosdecilesson losnueve valoresquedividenla serie dedatosendiez partes iguales.Clculo de decilesOrdenamoslosdatosdemenor a mayor.Buscamos la puntuacin, en la serie, o la clase, en la tabla de las frecuencias acumuladas, donde se encuentra, .

PercentilesLospercentilesson los99 valoresquedividenla serie dedatosen100 partes iguales.Clculo de percentilesOrdenamoslosdatosdemenor a mayor.Buscamos la puntuacin, en la serie, o la clase, en la tabla de las frecuencias acumuladas, donde se encuentra,.

Desviacin mediaLadesviacin mediaes lamedia aritmticade losvalores absolutos de las desviaciones respecto a la media.

Desviacin media para datos agrupados

VarianzaLavarianzaes lamedia aritmtica del cuadrado de las desviaciones respecto a la mediade una distribucin estadstica.

Varianza para datos agrupados

Para simplificar elclculo de la varianzavamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Varianza para datos agrupados

Desviacin tpicaLadesviacin tpicaes laraz cuadrada de la varianza.

Desviacin tpica para datos agrupados

Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Desviacin tpica para datos agrupados

Coeficiente de variacinElcoeficiente de variacines la relacin entre ladesviacin tpicade una muestra y sumedia.

Coeficiente de variacin en tanto por ciento

Puntuaciones diferencialesLaspuntuaciones diferencialesresultan derestarlesa laspuntuaciones directas la media aritmtica.xi= XiXPuntuaciones tpicasLaspuntuaciones tpicasson el resultado dedividirlaspuntuaciones diferencialesentre ladesviacin tpica. Este proceso se llamatipificacin.

Distribuciones bidimensionalesCovarianza

Coeficiente de correlacin lineal

Recta de regresin de Y sobre X

Recta de regresin de X sobre Y

a.Medidas de tendencia centralLas medidas de centralizacin vienen a responder a la primera pregunta. La medida ms evidente que podemos calcular para describir un conjunto de observaciones numricas es su valor medio. Lamediano es ms que la suma de todos los valores de una variable dividida entre el nmero total de datos de los que se dispone.Como ejemplo, consideremos 10 pacientes de edades 21 aos, 32, 15, 59, 60, 61, 64, 60, 71, y 80. La media de edad de estos sujetos ser de:

Ms formalmente, si denotamos por (X1, X2,...,Xn) los n datos que tenemos recogidos de la variable en cuestin, el valor medio vendr dado por:

Otra medida de tendencia central que se utiliza habitualmente es lamediana. Es la observacin equidistante de los extremos.La mediana del ejemplo anterior sera el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:15, 21, 32, 59, 60, 60,61, 64, 71, 80.Como quiera que en este ejemplo el nmero de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el clculo de la media de estos dos valores nos dar a su vez 60, que es el valor de la mediana.Si la media y la mediana son iguales, la distribucin de la variable es simtrica. La media es muy sensible a la variacin de las puntuaciones. Sin embargo, la mediana es menos sensible a dichos cambios.Por ltimo, otra medida de tendencia central, no tan usual como las anteriores, es la moda, siendo ste el valor de la variable que presenta una mayor frecuencia.En el ejemplo anterior el valor que ms se repite es 60, que es lamodab.Medidas de dispersinTal y como se adelantaba antes, otro aspecto a tener en cuenta al describir datos continuos es la dispersin de los mismos. Existen distintas formas de cuantificar esa variabilidad. De todas ellas, lavarianza(S2) de los datos es la ms utilizada. Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmtica de la distribucin.

Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada.En el ejemplo anterior la varianza sera:Sx2=

Ladesviacin tpica(S) es la raz cuadrada de la varianza. Expresa la dispersin de la distribucin y se expresa en las mismas unidades de medida de la variable. La desviacin tpica es la medida de dispersin ms utilizada en estadstica.

Aunque esta frmula de la desviacin tpica muestral es correcta, en la prctica, la estadstica nos interesa para realizar inferencias poblacionales, por lo que en el denominador se utiliza, en lugar de n, el valor n-1.Por tanto, la medida que se utiliza es la cuasidesviacin tpica, dada por:

Aunque en muchos contextos se utiliza el trmino de desviacin tpica para referirse a ambas expresiones.En los clculos del ejercicio previo, la desviacin tpica muestral, que tiene como denominador n, el valor sera 20.678. A efectos de clculo lo haremos como n-1 y el resultado seria 21,79.El haber cambiado el denominador de n por n-1 est en relacin al hecho de que esta segunda frmula es una estimacin ms precisa de ladesviacin estndarverdadera de la poblacin y posee las propiedades que necesitamos para realizar inferencias a la poblacin.Cuando se quieren sealar valores extremos en una distribucin de datos, se suele utilizar la amplitud como medida de dispersin. La amplitud es la diferencia entre el valor mayor y el menor de la distribucin.Por ejemplo, utilizando los datos del ejemplo previo tendremos 80-15 =65.Como medidas de variabilidad ms importantes, conviene destacar algunas caractersticas de la varianza y desviacin tpica: Son ndices que describen la variabilidad o dispersin y por tanto cuando los datos estn muy alejados de la media, el numerador de sus frmulas ser grande y la varianza y la desviacin tpica lo sern. Al aumentar el tamao de la muestra, disminuye la varianza y la desviacin tpica. Para reducir a la mitad la desviacin tpica, la muestra se tiene que multiplicar por 4. Cuando todos los datos de la distribucin son iguales, la varianza y la desviacin tpica son iguales a 0. Para su clculo se utilizan todos los datos de la distribucin; por tanto, cualquier cambio de valor ser detectado.Otra medida que se suele utilizar es elcoeficiente de variacin(CV). Es una medida de dispersin relativa de los datos y se calcula dividiendo la desviacin tpica muestral por la media y multiplicando el cociente por 100. Su utilidad estriba en que nos permite comparar la dispersin o variabilidad de dos o ms grupos. As, por ejemplo, si tenemos el peso de 5 pacientes (70, 60, 56, 83 y 79 Kg) cuya media es de 69,6 kg. y su desviacin tpica (s) = 10,44 y la TAS de los mismos (150, 170, 135, 180 y 195 mmHg) cuya media es de 166 mmHg y su desviacin tpica de 21,3. La pregunta sera: qu distribucin es ms dispersa, el peso o la tensin arterial? Si comparamos las desviaciones tpicas observamos que la desviacin tpica de la tensin arterial es mucho mayor; sin embargo, no podemos comparar dos variables que tienen escalas de medidas diferentes, por lo que calculamos los coeficientes de variacin:CV de la variable peso =

CV de la variable TAS =

A la vista de los resultados, observamos que la variable peso tiene mayor dispersin.Cuando los datos se distribuyen de forma simtrica (y ya hemos dicho que esto ocurre cuando los valores de su media y mediana estn prximos), se usan para describir esa variable su media y desviacin tpica. En el caso de distribuciones asimtricas, la mediana y la amplitud son medidas ms adecuadas. En este caso, se suelen utilizar adems loscuartiles y percentiles.Los cuartiles y percentiles no son medidas de tendencia central sinomedidas de posicin. El percentil es el valor de la variable que indica el porcentaje de una distribucin que es igual o menor a esa cifra.As, por ejemplo, el percentil 80 es el valor de la variable que es igual o deja por debajo de s al 80% del total de las puntuaciones. Los cuartiles son los valores de la variable que dejan por debajo de s el 25%, 50% y el 75% del total de las puntuaciones y as tenemos por tanto el primer cuartil (Q1), el segundo (Q2) y el tercer cuartil (Q3).