estadística objetivo: recordar elementos presentes en el estudio de la estadística

Post on 25-Jan-2016

215 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Estadística

Objetivo: Recordar elementos presentes en el estudio de la estadística

Cantidad de palabras leídas por estudiantes de 1° medio

Cantidad de palabras

[201,300]

[301,400]

[401,500]

[501,600]

[601,700]

Tabla de frecuencias: tipo de representación que permite agrupar datos

Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras

[201,300]

[301,400]

[401,500]

[501,600]

[601,700]

Rango: Es la diferencia entre el dato máximo y el dato mínimo.

La amplitud de un intervalo es la diferencia entre el límite superior y el inferior. La amplitud (A) de intervalos puede calcularse de la siguiente manera:

Cantidad de palabras leídas por estudiantes de 1° medio Cantidad de palabras

[201,300]

[301,400]

[401,500]

[501,600]

[601,700]

Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras

Marca de clase

[201,300]

[301,400]

[401,500]

[501,600]

[601,700]

La Marca de clase de un intervalo corresponde al promedio entre el límite superior (LS) y el inferior (LI).

Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras

Marca de clase

f. Absoluta( f )

[201,300] 250,5 12

[301,400] 350,5 15

[401,500] 450,5 20

[501,600] 550,5 14

[601,700] 650,5 2

Frecuencia absoluta (f) : es el numero de veces que se repite un dato o el numero de datos incluidos en un determinado intervalo

Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras

Marca de clase

f. Absoluta

( f ) F

[201,300] 250,5 12

[301,400] 350,5 15

[401,500] 450,5 20

[501,600] 550,5 14

[601,700] 650,5 2

Frecuencia absoluta acumulada(F) : corresponde a la suma de las frecuencias absolutas menores o iguales al valor de la variable en cuestión. El ultimo valor debe ser igual al total de datos.

Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras

Marca de clase

f. Absoluta ( f ) F fr

[201,300] 250,5 12 12

[301,400] 350,5 15 27

[401,500] 450,5 20 47

[501,600] 550,5 14 61

[601,700] 650,5 2 63

Frecuencia relativa (fr): corresponde a la división entre la frecuencia absoluta de un dato o intervalo y la cantidad total de datos.

Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras

Marca de clase

f. Absoluta ( f ) F fr Fr

[201,300] 250,5 12 12 0,19

[301,400] 350,5 15 27 0,24

[401,500] 450,5 20 47 0,32

[501,600] 550,5 14 61 0,22

[601,700] 650,5 2 63 0,03

Frecuencia relativa acumulada (Fr): corresponde a la suma de las frecuencias relativas menores o iguales al valor de la variable en cuestión. El ultimo valor debe ser igual 1.

Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras

Marca de clase

f. Absoluta ( f ) F fr Fr fp

[201,300] 250,5 12 12 0,19 0,19

[301,400] 350,5 15 27 0,24 0,43

[401,500] 450,5 20 47 0,32 0,75

[501,600] 550,5 14 61 0,22 0,97

[601,700] 650,5 2 63 0,03 1

Frecuencia relativa porcentual (fp): corresponde a la frecuencia relativa multiplicada por 100 y expresada como porcentaje.

Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras

Marca de clase

f. Absoluta ( f ) F fr Fr fp Fp

[201,300] 250,5 12 12 0,19 0,19 19%

[301,400] 350,5 15 27 0,24 0,43 24%

[401,500] 450,5 20 47 0,32 0,75 32%

[501,600] 550,5 14 61 0,22 0,97 22%

[601,700] 650,5 2 63 0,03 1 3%

Frecuencia relativa porcentual acumulada (Fp): corresponde a la suma de las frecuencias relativas porcentuales menores o iguales al valor de la variable en cuestión. El ultimo valor debe ser igual a 100%.

Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras

Marca de clase

f. Absoluta ( f ) F fr Fr fp Fp

[201,300] 250,5 12 12 0,19 0,19 19% 19%

[301,400] 350,5 15 27 0,24 0,43 24% 43%

[401,500] 450,5 20 47 0,32 0,75 32% 75%

[501,600] 550,5 14 61 0,22 0,97 22% 97%

[601,700] 650,5 2 63 0,03 1 3% 100%

Frecuencia relativa porcentual acumulada (Fp): corresponde a la suma de las frecuencias relativas porcentuales menores o iguales al valor de la variable en cuestión. El ultimo valor debe ser igual a 100%.

Medidas de tendencia central para datos agrupados

• Una manera de representar características de un conjunto de datos en estadística es a través de tres medidas numéricas: media aritmética, mediana y moda. Cada una de ellas representa un tipo de promedio, el cual indica la tendencia central del conjunto de datos. En esta parte del curso veremos como calcularlos y que información nos brindan.

Media aritmetica

• La media aritmética es el promedio aritmético de los valores de la variable. Obviamente, al ser promedio, tiene sentido en variables de tipo cuantitativo. Se puede representar como o como .

• Para calcular la media de un conjunto de datos agrupados en intervalos se utiliza la siguiente formula:

X

1 1 2 2 ...

donde:

Mc marca de clase del intervalo i

frecuencia absoluta del intervalo i

N= Cantidad total de datos

i i n n

i

i

Mc f Mc f Mc f Mc fX

N N

f

Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras

Marca de clase

f. Absoluta ( f ) F fr Fr fp Fp

[201,300] 250,5 12 12 0,19 0,19 19% 19%

[301,400] 350,5 15 27 0,24 0,43 24% 43%

[401,500] 450,5 20 47 0,32 0,75 32% 75%

[501,600] 550,5 14 61 0,22 0,97 22% 97%

[601,700] 650,5 2 63 0,03 1 3% 100%

i iMc fX

N

Mediana• La mediana de un conjunto de observaciones se define

como el valor que queda en la parte central de un grupo de observaciones arreglados en orden de magnitud.

• La definición de geométrica se refiere al punto que divide en dos partes a un segmento. Por ejemplo, la mediana del segmento AB es el punto C.

• Existen entonces dos segmentos iguales:• AC = CB• Se calcula de la siguiente forma:

1) Calculo de posición: se identifica en que intervalo se encuentra la mediana:

Cantidad de palabras

Marca de clase

f. Absoluta ( f ) F fr Fr fp Fp

[201,300] 250,5 12 12 0,19 0,19 19% 19%

[301,400] 350,5 15 27 0,24 0,43 24% 43%

[401,500] 450,5 20 47 0,32 0,75 32% 75%

[501,600] 550,5 14 61 0,22 0,97 22% 97%

[601,700] 650,5 2 63 0,03 1 3% 100%

63( ) 31.5 32 3 intervalo

2 2

NPos Md

2) Se calcula la mediana:

inf

inf

2

:

Limite inferior del intervalo

N= cantidad de datos

F frecuencia acumulada anterior al intervalo

A= amplitud del intervalo

ant

i

ant

NF

Md L Af

donde

L

Cantidad de palabras

Marca de clase

f. Absoluta ( f )

F fr Fr fp Fp

[201,300] 250,5 12 12 0,19 0,19 19% 19%

[301,400] 350,5 15 27 0,24 0,43 24% 43%

[401,500] 450,5 20 47 0,32 0,75 32% 75%

[501,600] 550,5 14 61 0,22 0,97 22% 97%

[601,700] 650,5 2 63 0,03 1 3% 100%

inf2 ant

i

NF

Md L Af

Moda

• Indica el valor que más se repite, o la clase que posee mayor frecuencia.

• En el caso de que dos valores presenten la misma frecuencia, decimos que existe un conjunto de datos bimodal. Para más de dos modas hablaremos de un conjunto de datos multimodal.

• Se calcula de la siguiente manera

1) Posición de la moda: se identifica en que intervalo se encuentra la mayor frecuencia absoluta y trabajamos en base a eso.

2) Calculamos:

1inf

1 2

inf

1 1

2 1

:

Limite inferior del intervalo modal

(frecuencia modal-frecuencia del intervalo anterior)

(frecuencia modal-frecuencia del intervalo siguiente)

A= a

i i

i i

dMo L A

d d

donde

L

d f f

d f f

mplitud del intervalo modal

Cantidad de palabras

Marca de clase

f. Absoluta ( f )

F fr Fr fp Fp

[201,300] 250,5 12 12 0,19 0,19 19% 19%

[301,400] 350,5 15 27 0,24 0,43 24% 43%

[401,500] 450,5 20 47 0,32 0,75 32% 75%

[501,600] 550,5 14 61 0,22 0,97 22% 97%

[601,700] 650,5 2 63 0,03 1 3% 100%

1inf

1 2

dMo L A

d d

• Los percentiles, entregan la idea de "posición" de los datos, es decir avisan a partir de que observación o intervalo de clase se ha acumulado un determinado porcentaje de observaciones

• Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales, o sea, dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.

• Ejemplo: el percentil 50 coincide con la mediana.

inf

inf

100

limite inferior del intervalo

k=orden del percentil k=0,1,2,...,99

cantidad total de datos

frecuencia acumulada del intervalo anterior

amplitud del intervalo

ant

ki

ant

k NF

P L Af

L

N

F

A

Cantidad de palabras

Marca de clase

f. Absoluta ( f )

F fr Fr fp Fp

[201,300] 250,5 12 12 0,19 0,19 19% 19%

[301,400] 350,5 15 27 0,24 0,43 24% 43%

[401,500] 450,5 20 47 0,32 0,75 32% 75%

[501,600] 550,5 14 61 0,22 0,97 22% 97%

[601,700] 650,5 2 63 0,03 1 3% 100%

100k

k NPOS P

50

50 63 315031,5 32 3 intervalo

100 100POS P

1°. Calculamos la posición del percentil

Cantidad de palabras

Marca de clase

f. Absoluta ( f )

F fr Fr fp Fp

[201,300] 250,5 12 12 0,19 0,19 19% 19%

[301,400] 350,5 15 27 0,24 0,43 24% 43%

[401,500] 450,5 20 47 0,32 0,75 32% 75%

[501,600] 550,5 14 61 0,22 0,97 22% 97%

[601,700] 650,5 2 63 0,03 1 3% 100%

50 inf100 ant

i

k NF

P L Af

• 2°. Calculamos el percentil

• 1.- Calcule el percentil 10:

Cantidad de palabras

Marca de clase

f. Absoluta ( f )

F fr Fr fp Fp

[201,300] 250,5 12 12 0,19 0,19 19% 19%

[301,400] 350,5 15 27 0,24 0,43 24% 43%

[401,500] 450,5 20 47 0,32 0,75 32% 75%

[501,600] 550,5 14 61 0,22 0,97 22% 97%

[601,700] 650,5 2 63 0,03 1 3% 100%

• 2.- Calcule el percentil 75:

Cantidad de palabras

Marca de clase

f. Absoluta ( f )

F fr Fr fp Fp

[201,300] 250,5 12 12 0,19 0,19 19% 19%

[301,400] 350,5 15 27 0,24 0,43 24% 43%

[401,500] 450,5 20 47 0,32 0,75 32% 75%

[501,600] 550,5 14 61 0,22 0,97 22% 97%

[601,700] 650,5 2 63 0,03 1 3% 100%

Otras medidas de posición:

• Cuartiles: son los 3 valores que dividen a la muestra de datos en 4 intervalos iguales.

1 25C P 2 50C P 3 75C P

Otras medidas de posición:

• Quintiles: son los 4 valores que dividen a la muestra de datos en 5 intervalos iguales.

1 20Q P 2 40Q P 4 80Q P3 60Q P

Otras medidas de posición:

• Deciles: son los 9 valores que dividen a la muestra de datos en 10 intervalos iguales.

1 10D P 2 20D P 4 40D P

6 60D P 7 70D P 8 80D P 9 90D P

3 30D P

5 50D P

1. Construya la tabla de frecuencias:

2.Construya la tabla de frecuencias

top related