estadistica formulario

28

Upload: gustavo-tzub

Post on 30-Nov-2015

62 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estadistica formulario
Page 2: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

Distribución de frecuencias

Agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría. Esto proporciona un valor añadido a la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase.

Estas agrupaciones de datos suelen estar agrupadas en forma de tablas.

Es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

Si se reúnen grandes cantidades de datos sueltos es útil distribuirlos en clases o categorías y determinar el número de individuos que pertenecen a cada categoría, a lo que se le llama frecuencia de clase. A una disposición tabular de los datos por clases, con sus correspondientes frecuencias de clase, se le conoce como distribución de frecuencia o tabla de frecuencias.

Cuando se dispone de gran número de datos, es útil el distribuirlos en clases o categorías y determinar el número de individuos pertenecientes a cada clase, que es la frecuencia de clase. Una ordenación tabular de los datos en clases, reunidas las clases y con las frecuencias correspondientes a cada una, se conoce como una distribución de frecuencias o tabla de frecuencias. La Tabla 1 es una distribución de frecuencias de alturas (registradas con aproximación de pulgada) de 100 estudiantes de la Universidad XYZ.

La primera clase o categoría, por ejemplo, comprende las alturas de 60 a 62 pulgadas y viene indicada por el símbolo 60 - 62. Puesto que 5 estudiantes tienen una altura perteneciente a esta clase, la correspondiente frecuencia de clase es 5.

Frecuencias

Se llama frecuencia a la cantidad de veces que se repite un determinado valor de la variable.

Se suelen representar con histogramas y con diagramas de Pareto.

2

Page 3: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

Frecuencia es una magnitud que mide el número de repeticiones por unidad de tiempo de cualquier fenómeno o suceso periódico.

Para calcular la frecuencia de un suceso, se contabilizan un número de ocurrencias de este teniendo en cuenta un intervalo temporal, luego estas repeticiones se dividen por el tiempo transcurrido. Según el SI (Sistema Internacional), la frecuencia se mide en hercios (Hz), en honor a Heinrich Rudolf Hertz. Un hercio es aquel suceso o fenómeno repetido una vez por segundo. Así, dos hercios son dos sucesos (períodos) por segundo, etc. Esta unidad se llamó originariamente «ciclo por segundo» (cps) y aún se sigue utilizando. Otras unidades para indicar la frecuencia son revoluciones por minuto (rpm). Las pulsaciones del corazón y el tempo musical se miden en «pulsos por minuto» (bpm, del inglés beats per minute).

Un método alternativo para calcular la frecuencia es medir el tiempo entre dos repeticiones (periodo) y luego calcular la frecuencia (f) recíproca de esta manera:

Donde T es el periodo de la señal.

Frecuencia absoluta

Frecuencia absoluta (ni) de una variable estadística Xi, es el número de veces que aparece en el estudio este valor. A mayor tamaño de la muestra, aumentará el tamaño de la frecuencia absoluta; es decir, la suma total de todas las frecuencias absolutas debe dar el total de la muestra estudiada (N).

La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.

Se representa por fi.

La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.

3

Page 4: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

Ejemplo:

Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

En la primera columna de la tabla colocamos la variable ordenada de menor a mayor y en la segunda anotamos la frecuencia absoluta.

xi fi

27 1

28 2

29 6

30 7

31 8

32 3

33 3

34 1

31

Frecuencia relativa

Frecuencia relativa (fi), es el cociente entre la frecuencia absoluta y el tamaño de la muestra (N). Es decir,

Siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una distribución de frecuencias (ver fig.1 y (fig.2).

4

Page 5: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento (pi) que presentan esta característica respecto al total de N, es decir el 100% del conjunto.

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.

La frecuencia relativa se puede expresar en tantos por ciento y se representa por ni.

La suma de las frecuencias relativas es igual a 1.

Ejemplo

Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

xi fi ni

27 1 0.032

28 2 0.065

29 6 0.194

30 7 0.226

31 8 0.258

32 3 0.097

33 3 0.097

34 1 0.032

31 1

Frecuencia porcentual

5

Page 6: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

Es el porcentaje que representa una determinada variable en la serie de datos que estas analizando....por ejemplo si de una muestra de 10 observaciones y un resultado total de 100, un dato acapare 20 puntos de ese resultado, en consecuencia su frecuencia porcentual será 20 que surge de (20/100)*100.

La frecuencia porcentual es la frecuencia relativa ( hi ) expresada en forma porcentual. En otras palabras, es la frecuencia relativa ( hi ) multiplicada por 100.

Es el Producto de la Frecuencia Absoluta “fi” por 100% entre el total de datos “n”: así;

Es la frecuencia relativa expresada en porcentajes (%)

Pi = f i ● 100NEn nuestro ejemplo: Tabla:

x i f i F i h i H i f i %0 4 4 0,08 0,08 8 %1 9 13 0,18 0,26 18 %2 12 25 0,24 0,50 24 %3 10 35 0,20 0,70 20 %4 8 43 0,16 0,86 16 %5 4 47 0,08 0,94 8 %6 2 49 0,04 0,98 4 %7 1 50 0,02 1,00 2 %

Frecuencia absoluta acumulada

Es la suma de los distintos valores de la frecuencia absoluta tomando como referencia un individuo dado. La última frecuencia absoluta acumulada es igual al nº de casos:

N1 = n1

N2 = n1+ n2

Nn = n1 + n2 + . . . . . . + nn-1 + nn=n

Frecuencia relativa acumulada

6

Page 7: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

Es el resultado de dividir cada frecuencia absoluta acumulada por el número total de datos, se la suele

representar con la notación: Fi

De igual forma, también se puede definir a partir de la frecuencia relativa, como suma de los distintos valores de la frecuencia relativa, tomando como referencia un individuo dado. La última frecuencia relativa acumulada es igual a la unidad.

La Frecuencia relativa acumulada (Fi), es el cociente entre la frecuencia absoluta acumulada y el número total de datos, N. Es decir,

Con la frecuencia relativa acumulada por 100 se obtiene el porcentaje acumulado (Pi)), que al igual que Fi deberá de resultar al final el 100% de N.

La representación gráfica de la distribución de frecuencias acumuladas se denomina ojiva. En ella el eje de las abscisas corresponde a los límites de clase y el de las ordenadas a los porcentajes acumulados.

Media

Una media o promedio es una medida de tendencia central que según la Real Academia Española, resulta al efectuar una serie determinada de operaciones con un conjunto de números y que, en determinadas condiciones, puede representar por sí solo a todo el conjunto». Existen distintos tipos de medias, tales como la media geométrica, la media ponderada y la media armónica aunque en el lenguaje común, el término se refiere generalmente a la media aritmética.

Media aritmética

La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.

Es el símbolo de la media aritmética .

7

Page 8: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

Ejemplo:

x i f i x i · f i

[10, 20) 15 1 15

[20, 30) 25 8 200

[30,40) 35 10 350

[40, 50) 45 9 405

[50, 60 55 8 440

[60,70) 65 4 260

[70, 80) 75 2 150

42 1 820

Mediana

Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor .

La mediana se representa por Me .

La mediana se puede hallar sólo para variables cuantitativas .

8

Page 9: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

Cálculo de la mediana

1 Ordenamos los datos de menor a mayor.

2 Si la serie t iene un número impar de medidas la mediana es la puntuación central de la misma.

2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5

3 Si la serie t iene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.

7, 8, 9, 10, 11, 12Me= 9.5

Cálculo de la mediana para datos agrupados

La mediana se encuentra en el intervalo donde la frecuencia acumulada l lega hasta la mitad de la suma de las frecuencias absolutas .

Es decir tenemos que buscar el intervalo en el que se encuentre .

L i es el l ímite inferior de la clase donde se encuentra la mediana.

es la semisuma de las frecuencias absolutas.

F i - 1 es la frecuencia acumulada anterior a la clase mediana.

a i es la amplitud de la clase.

La mediana es independiente de las amplitudes de los intervalos.

Ejemplo

Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:

9

Page 10: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

f i F i

[60, 63) 5 5

[63, 66) 18 23

[66, 69) 42 65

[69, 72) 27 92

[72, 75) 8 100

100

100/2 = 50

Clase de la mediana: [66, 69)

Moda

Es una medida de tendencia central es el valor de la variable que tiene mayor frecuencia absoluta, la que más se repite es la única medida de centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de ningún cálculo. Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia siendo esta máxima. Entonces tendremos una distribución bimodal o polimodal según el caso.

Considerando distribuciones unimodales, el cálculo de la moda (M o ) para datos agrupados en intervalos se obtiene mediante la fórmula:

n j - n j-1

Mo = LI + ------------------------ * c i

(n j - n j-1 ) + (n j - n j+1 )

10

Page 11: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

Donde:

LI Es el límite inferior de la clase modal.

n j - n j-1 Es la diferencia de la frecuencia absoluta de la clase modal menos la frecuencia del intervalo anterior.

n j - n j+1 Es la diferencia de la frecuencia absoluta de la clase modal menos la frecuencia del intervalo posterior

c i Es la amplitud del intervalo.

Clase modal es el intervalo que tiene mayor frecuencia o frecuencia relativa.

Media Geométrica

Es una medida de tendencia central. Dado dos números y 1 e y 2 , llamaremos media geométrica (G) de estos números a la raíz cuadrada del producto de los mismos. Cuando se tiene N observaciones (más de dos datos): x 1 , x 2 ....x p y cada uno de ellos se repite

n 1 , n 2 ......n p veces entonces, generalizando la primera expresión se tiene:

Solo se puede calcular si no hay observaciones negativas o valores cero.

Es menos sensible que la media aritmética a los valores extremos. Su valor es siempre menor o igual que la media aritmética. Su uso más frecuente es el de promediar porcentajes, tasas, números índices, entre otros, es decir en los casos que se supone que la variable presenta variaciones acumulativas.

Media Armónica

Es un valor que se obtiene como la inversa de la media de las inversas de las observaciones. Se le denota por H.

11

Page 12: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

Donde:

i representa el valor de la variable o en su caso la marca de clase.

n i representa la frecuencia absoluta.

Media cuadráticaLa media cuadrática es igual a la raíz cuadrada de la suma de los cuadrados de los valores dividida entre el número de datos:

Esta media como medida de asociación tiene aplicaciones tanto en ciencias biológicas como en medicina.

A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en los errores de medida.

En tal caso se puede estar interesado en obtener un promedio que no recoja los efectos del signo.

Este problema se resuelve, mediante la denominada media cuadrática.

Consiste en elevar al cuadrado todas las observaciones (así los signos negativos desaparecen), en obtener después su media aritmética y en extraer, finalmente, la raíz cuadrada de dicha media para volver a la unidad de medida original.

Fractil o Cuantil

Es el valor que se obtiene al fraccionar el conjunto de datos en partes o fracciones iguales. Los más conocidos son: mediana, cuartiles, deciles y percentiles.

Rango Intercuartil

El rango intercuartílico es la diferencia entre el tercer y el primer cuartil. Nos da una franja en la que se encuentra el 50% de la población.

Mide qué tan lejos de la mediana debemos ir en cualquiera de las dos direcciones (izquierda o derecha) antes de recorrer la mitad de los valores del conjunto de datos.

12

Page 13: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

Al estudiar el rango, vimos que era muy influenciable por los valores extremos; para eliminar la influencia de los extremos en estadística se suele analizar la situación del intermedio de la distribución y a esto se refiere el rengo intercuartílico que es la diferencia entre el tercer cuartil Q3 y el primero Q1.  

Desviación Cuartílica

Mide el intervalo promedio de un cuarto de los datos [Q3-Q1)/2]

Si la distribución es perfectamente simétrica, los dos cuartiles Q1 y Q3 equidistan de la mediana y la mitad de la distancia entre los cuartiles representa la distancia promedio entre ellos y la mediana.

Si en una distribución simétrica se mide una distancia igual a la desviación cuartílica a ambos lados de un punto ubicado en el centro de los cuartiles, el 50% de los valores estarán incluidos dentro de esos límites y el valor del punto medio coincide con la mediana.

La ventaja de la desviación cuartílica es que evita los valores extremos utilizando únicamente la mitad intermedia de los datos. Ejemplo:Si el tercer cuartil = 24 y el primer cuartil = 10, ¿cuál es la desviación cuartílica? La amplitud intercuartílica es 24 - 10 = 14; por lo tanto, la desviación cuartílica es 14/2 = 7. Es la mitad del recorrido intercuartílico Desviación cuartílica.

Rango Interpercentil

Mide la dispersión del 80% de los datos centrales y se obtiene de la diferencia entre el decil 9 y el decil 1, evitando así los puntos extremos.

13

Rango intercuartil = Q = Q3– Q1

RSQ= Q3-Q1 2

Page 14: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

Para poder hallar el RIP (rango interpercentilico), primero se deben hallar los percentiles 1 y 99.

i= posición percentil Pn= tamaño de la muestra

Si i es no entero: Redondearlo al entero mayorSi i es entero: Promedio de las posiciones i e (i +1)

Demostración: Wall-Mart realizó una investigación acerca de un nuevo producto que se desea comercializar en sus almacenes de Estados Unidos. Se hizo el mismo estudio en Canadá y se obtuvo un rango interpercentil de 45. El departamento de mercadotecnia espera encontrar un rango interpercentil más bajo en Estados Unidos.¿La esperanza del departamento se hizo realidad?

Datos: Solución:

34 46 6235 49 6338 56 6542 58 7042 60 7345 62 75

Desviación PercentílicaDesviación percentílica 10-90.Se llama desviación percentílica 10-90 o recorrido semipercentílico 10-90 de una distribución y se designa por DP10-90, como la mitad de la diferencia entre los percentiles noventa y diez, a saber:DP10-90 =P90 - P10

14

Rta: El RIP en Estados Unidos fue de 41.

RSP = P 90 - P 10 2

Page 15: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

Desviación Estándar

Mide el nivel de dispersión de los resultados. Refleja qué tan homogéneos (si la mayoría de los estudiantes respondió de manera similar) o heterogéneos (si hay estudiantes que respondieron muy bien, otros mal y otros regular) son los datos. Se espera que la desviación estándar sea baja (cercana a 0).Es la raíz cuadrada de la variancia (es decir de la media del cuadrado de las desviaciones) y representa lo que podríamos denominar un promedio de las distancias que separan a todos los valores en la distribución, respecto a su media. Esta medida permite identificar cuántas veces el promedio de la distancia se ubica cada valor respecto a su media.

La Desviación de la Media

La desviación de una puntuación es su distancia desde la media de la distribución y se representa con una x minúscula. De manera que para calcular la desviación de una puntuación respecto a la media de la distribución, se resta el valor de la media del valor observado. x = (X – X).Las puntuaciones que se encuentran sobre la media en una ordenación poseen un valor positivo, mientras que aquellas bajo la media lo tienen negativo. Para determinar la desviación desde la media (DM) se suman los valores absolutos de las x’s correspondientes a cada caso y se divide entre el total de casos.GRUPO A x GRUPO B x75 75 – 25 = 50 35 35 – 25 = 1050 50 – 25 = 25 30 30 – 25 = 535 35 – 25 = 10 28 28 – 25 = 324 24 – 25 = 1 26 26 – 25 = 116 16 – 25 = -9 25 25 – 25 = 012 12 – 25 = -13 24 24 – 25 = -111 11 – 25 = -14 22 22 – 25 = -310 10 – 25 = -15 20 20 – 25 = -510 10 – 25 = -15 15 15 – 25 = -107 7 – 25 = -18 Total = 225Total = 250Para el grupo A la desviación de la media resulta de sumar los valores absolutos de x = 175 y dividirlo entre 10 que son los casos (N) dando como resultado DM = 17.5. La misma medida para el grupo B los valores absolutos de x suman 28 y los casos (N) son 9 dando como resultado DM = 3.11.

15

Page 16: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

Varianza

Se trata de la suma de las desviaciones al cuadrado, consideradas desde la media, de las puntuaciones individuales, dividida por N – 1. La varianza se representa por una letra s al cuadrado. Las desviaciones son sometidas al cuadrado para eliminar los signos, lo cual se justifica dado que lo importante es la cantidad de la desviación y no la dirección de la misma.

GRUPO A (X – X) = x x x GRUPO B (X – X ) = x 75 75 – 25 = 50 2 500 35 35 – 25 = 10 10050 50 – 25 = 25 625 30 30 – 25 = 5 2535 35 – 25 = 10 100 28 28 – 25 = 3 924 24 – 25 = 1 1 26 26 – 25 = 1 116 16 – 25 = -9 81 25 25 – 25 = 0 012 12 – 25 = -13 169 24 24 – 25 = -1 111 11 – 25 = -14 196 22 22 – 25 = -3 910 10 – 25 = -15 225 20 20 – 25 = -5 2510 10 – 25 = -15 225 15 15 – 25 = -10 1007 7 – 25 = -18 324 Total = 225 Σ x =270Total = 250 Σ x = 4 446La varianza para el grupo A resulta de dividir la suma de los cuadrados de x (S x) entre (N – 1), es decir entre (10 – 1) lo cual es 9 y da como resultado 494. La misma operación, con el grupo B, conduce a dividir 270 entre 8 lo cual da como resultado 33.75. Cuando se trabaja con datos agrupados en intervalos de clase se identifica el punto medio de cada intervalo (Xi) según aparece en la columna 3 del ejemplo y se multiplica por la frecuencia en cada intervalo (fi) que son los valores de la columna 2 dando como resultado la columna 4 (Xi fi). Además se eleva al cuadrado el valor de los puntos medios de cada intervalo (Xi) y se multiplica por la frecuencia en cada intervalo (fi) lo cual resulta en nuestro ejemplo en la columna 5. Para calcular la varianza de la distribución se procede de la siguiente manera: se eleva al cuadrado la suma de la columna 4 (Xi fi) y se divide entre el total de casos (total de la columna 2). Una vez hecha esta operación su resultado se resta de total que resulta en la columna 5 (Suma de Xi al cuadrado por fi) y la diferencia se divide entre el número de casos menos uno. Dando como resultado la varianza.

16

Page 17: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

Coeficiente de Variación

Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variación de Pearson que se define como el cociente entre la desviación típica y el valor absoluto de la media aritmética. El coeficiente de variación representa el número de veces que la desviación típica contiene a la media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media.

Medidas de Asimetría

Definición

Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmética). La asimetría presenta tres estados diferentes, cada uno de los cuales define de forma concisa como están distribuidos los datos respecto al eje de asimetría. Se dice que la asimetría es positiva cuando la mayoría de los datos se encuentran por encima del valor de la media aritmética, la curva es Simétrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetría negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media. 

 

El Coeficiente de asimetría, se representa mediante la ecuación matemática 

Coeficiente de asimetría de Fisher

En teoría de la probabilidad y estadística, la medida de asimetría más utilizada parte del uso del tercer momento estándar. La razón de esto es que nos interesa mantener el signo de las desviaciones con respecto a la media, para obtener si son mayores las que ocurren a la derecha de la media que las de la izquierda. Sin embargo, no es buena idea tomar el momento estándar con respecto a la media de orden 1 (¡Ya que una

17

Page 18: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

simple suma de todas las desviaciones siempre es cero!). Por ello, lo más sencillo es tomar las desviaciones al cubo.

El coeficiente de asimetría de Fisher, representado por γ1, se define como:

Donde μ3 es el tercer momento en torno a la media y σ es la desviación estándar.

Si γ1 = 0, la distribución es simétrica.

Si γ1 > 0, la distribución es asimétrica positiva o a la derecha.

Si γ1 < 0, la distribución es asimétrica negativa o a la izquierda.

Utilidad

La asimetría resulta útil en muchos campos. Muchos modelos simplistas asumen una distribución normal, esto es, simétrico en torno a la media. La distribución normal tiene una asimetría cero. Pero en realidad, los valores no son nunca perfectamente simétricos y la asimetría de la distribución proporciona una idea sobre si las desviaciones de la media son positivas o negativas. Una asimetría positiva implica que hay más valores distintos a la derecha de la media.

Las medidas de asimetría, sobre todo el coeficiente de asimetría de Fisher, junto con las medidas de apuntamiento o curtosis se utilizan para contrastar si se puede aceptar que una distribución estadística sigue la distribución normal. Esto es necesario para realizar numerosos contrastes estadísticos en la teoría de inferencia estadística.

Coeficiente de Sesgo

El coeficiente de SESGO determina el grado de asimetría (alargamiento de la distribución hacia la izquierda o

hacia la derecha). Para determinar el sesgo de una distribución de frecuencias se utiliza el:

o Si el coeficiente de sesgo tiene un valor positivo se dice que la distribución es SESGADA a

DERECHA o que tiene SESGO POSITIVO. o Si el coeficiente de sesgo tiene un valor negativo se dice que la distribución es SESGADA a

IZQUIERDA o que tiene SESGO NEGATIVO.o Si el coeficiente de sesgo tiene un valor 0 se dice que la distribución es INSESGADA o que tiene

SESGO 0.

18

Page 19: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

El Coeficiente de Curtosis

El coeficiente de CURTOSIS determina el grado de alargamiento de la distribución hacia arriba o hacia abajo.

Para determinar la curtosis de una distribución de frecuencias se utiliza el:

Si el coeficiente de curtosis es mayor que 3 se dice que la distribución es LEPTOCÚRTICA. Si el coeficiente de curtosis es menor a 3 se dice que la distribución es PLATICÚRTICA Si el coeficiente de curtosis es igual a 3 se dice que la distribución es MESOCÚRTICA.

Medida de Apuntamiento

19

Page 20: Estadistica formulario

ESTADISTICA FORMULARIO: Conceptos Básicos

2013

Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de distribuciones según su grado de curtosis:

Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).

Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable.

Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.

Regresión y Correlación

La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muéstrales para saber qué es y cómo se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos.Los datos necesarios para análisis de regresión y correlación provienen de observaciones de variables relacionadas.

20