estadística 1

Post on 10-Jul-2015

997 Views

Category:

Education

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

LA ESTADÍSTICA ES LA CIENCIA QUE PROVEE DE MÉTODOS QUE PERMITEN RECOGER, ORGANIZAR ,RESUMIR, PRESENTAR Y ANALIZAR DATOS RELATIVOS A UN CONJUNTO DE INDIVIDUOS U OBSERVACIONES , PARA ASÍ , EXTRAER CONCLUSIONES VÁLIDAS Y TOMAR DECISIONES LÓGICAS BASADAS EN DICHOS ANÁLISIS.

LA ESTADÍSTICA SE DIVIDE EN DOS TIPOS:

A) ESTADÍSTICA DESCRIPTIVA

B) ESTADÍSTICA INFERENCIAL O DEDUCTIVA

LA ESTADÍSTICA DESCRIPTIVA :

SE REFIERE A LA DESCRIPCIÓN NUMÉRICA DE UN GRUPO PARTICULAR.NINGUNA CONCLUSIÓN PUEDE IR MÁS

ALLÁ DEL GRUPO DESCRITO.

LOS DATOS ANALIZADOS , DESCRIBENESTE GRUPO Y SÓLO ÉSTE .

ESTADÍSTICA INFERENCIAL

ES EL EMPLEO DE LA TÉCNICA DE MUESTREO PARA LLEGAR ADETERMINADAS CONCLUSIONES ACERCA DE LA POBLACIÓN DE LA CUAL SE HAN OBTENIDO LAS MUESTRAS

POBLACIÓN

SE LLAMA POBLACIÓN AL CONJUNTO FORMADO POR TODOS LOS

ELEMENTOS CUYO CONOCIMIENTO NOS INTERESA . CADA UNODE ESTOS ELEMENTOS LO

DENOMINAREMOS INDIVIDUO .

MUESTRA

SE LLAMA MUESTRA A UN SUBCONJUNTO FINITO DE LA

POBLACIÓN EN ESTUDIO . SE USA UNA MUESTRA

CUANDO ES IMPOSIBLE ( O POCO PRÁCTICO) ESTUDIAR A TODOS LOS INDIVIDUOS DE UNA

POBLACIÓN .

Población y MuestraPoblación

Muestra

Concepto de Variable

Una variable en estadística corresponde a la o las características que se miden en la muestra. Las variables pueden ser:

a) CUANTITATIVAS (Se pueden medir numéricamente)

b) CUALITATIVAS (No se pueden medir numéricamente)

VARIABLES CUALITATIVAS

Nominales Ordinales

No existe orden Existe orden intuitivo Estado Civil Nivel Educacional

VARIABLES CUANTITATIVAS

Variables discretas Variables continuas

Sólo números naturales Números reales

BUEN MÉTODO ESTADÍSTICO

a) SELECCIÓN Y RECOPILACIÓN DE LOS DATOS A ESTUDIAR EN UNA MUESTRA O POBLACIÓN .

b) CLASIFICACIÓN Y ORDENACIÓN DE LOS DATOS .

c) TABULACIÓN DE LOS DATOS

d) CÁLCULO DE ALGUNOS PARÁMETROS ESTADÍSTICOS QUE

COMPLETEN LA INFORMACIÓN .e) ENTREGA O PUBLICACIÓN DE LA INFOMACIÓN . PARA ELLO ES USUAL UTILIZAR LOS DISTINTOS GRÁFICOS ESTADÍSTICOS .

CONSTRUCCIÓN DE UNA TABLA DEDISTRIBUCIÓN DE FRECUENCIA

REGLAS GENERALES

1 ) LOS DATOS SE ORDENAN DE MENOR A MAYOR

2 ) SE DETERMINA EL CAMPO DE VARIACIÓN (RECORRIDO DE LAVARIABLE) . C.v. = X(max.) - X(min.) SE SELECCIONA LA AMPLITUD DE LOS INTERVALOS

EJEMPLO

EN UN GRUPO DE 50 ALUMNOS EN UNA PRUEBA SE REGISTRARON LOS SIGUIENTES PUNTAJES .

61 70 77 82 63 75 83 62 67 8367 80 77 85 83 76 83 67 78 7672 80 83 72 84 71 77 82 79 8366 88 68 74 84 75 73 75 83 8487 64 83 72 87 77 63 72 84 78

EN PRIMER LUGAR SE ORDENAN LOS DATOS DE MENOR A MAYOR

2 ) CALCULAMOS EL CAMPO DE VARIACIÓN O RANGO

C.V = 88 - 61 C.V = 27

61 62 63 63 64 66 67 67 67 6870 71 72 72 72 72 73 74 75 7575 76 76 77 77 77 77 78 78 7980 80 82 82 83 83 83 83 83 8383 83 84 84 84 84 85 87 87 88

3 ) SE SELECCIONA LA AMPLITUD DE LOS INTERVALOS.

a ) CUANDO SE TIENE UN CONJUNTO DE DATOS Y SE ESPECIFICA EL NÚMERO DE INTERVALOS PARA LA TABLA, LA AMPLITUD “a”, SE TIENE :

intervalosdeNvariacióndeCampo

=

EN CASO DE OBTENER UN NÚMERO DECIMAL PARA “a” , SE APROXIMA AL ENTERO MAS CERCANO.

4 ) SE DETERMINAN LOS INTERVALOS

I ) EL NÚMERO DE INTERVALO RECIBE EL NOMBRE DE CLASE .

II ) LOS INTERVALOS QUEDAN CARACTERIZADOS POR LAS MARCAS DE CLASES QUE SON LOS PUNTOS MEDIOS O SEMISUMA DE LOS LÍMITES SUPERIORES E INFERIORES, ÉSTE NORMALMENTE ES POSITIVA .

CALCULAMOS LA AMPLITUD “a”

TENIENDO EN CUENTA QUE LA CANTIDAD DE DATOS ES PEQUEÑA , LOS AGRUPAREMOS EN SOLO 6 CLASES LUEGO TENEMOS :

SIEMPRE SE APROXIMA LA AMPLITUD AL ENTEROMAS CERCANO

LUEGO :

27a =

6Cv

a =6

a = 4,5

a =5

60 64

65 69

70 7475 7980 8485 89

626772778287

5 ) SE REALIZA LA TABULACIÓN

FRECUENCIA o FRECUENCIA ABSOLUTA:

ES EL NÚMERO DE VECES QUE SE REPITE EL VALOR DE UN DATO , O EL NÚMERO DE INDIVIDUOS QUE PERTENECEN A LA MISMA CLASE. SE SIMBOLIZA POR

if

60 6465 6970 7475 7980 8485 89

626772778287

5 5 81216 4

50

FRECUENCIA ACUMULADA

PARA CADA VALOR ES LA SUMA DE SU FRECUENCIA MAS LAS ANTERIORES,

SE SIMBOLIZA POR acf

60 64

65 69

70 74

75 79

80 84

85 89

62

67

7277

8287

558

1216

4

510

18

30

46

50

50

5

812164

FRECUENCIA RELATIVA

ES EL NÚMERO DE VECES QUE SE REPITE UN DATO O CLASE, REFERIDO AL TOTAL DE INDIVIDUOS. ESTA FRECUENCIA RELATIVA SE SIMBOLIZA POR , Y SECALCULA :

rif

elementosdetotalnúmeroeles,n;nf

f iri =

60 6465 6970 7475 7980 8485 89

626772778287

5 5 81216 4

0,10,10,160,240,320,08

51018304650

1,050

FRECUENCIA PORCENTUAL

ES EXPRESAR LA FRECUENCIA EN FORMA DE PORCENTAJE , PARA TAL EFECTO SE TOMA LA FRECUENCIA RELATIVA Y SE CORRE LA COMA DOS ESPACIOS O SE MULTIPLICA POR 100

SE SIMBOLIZA POR : f%

60 6465 6970 7475 7980 8485 89

626772778287

5 5 81216 4

51018304650

0,10,10,160,240,320,08

1010162432 8

50 1,0 100

FRECUENCIA PORCENTUAL ACUMULADA

ES EXPRESAR EN FORMA ACUMULADA LA FRECUENCIA PORCENTUAL

60 6465 6970 7475 7980 8485 89

59,5- 64,5

64,5-69,5

69,5-74,5,74,5-79,5

79,5-84,5

84,5-89,5

626772778287

5 5 81216 4

51018304650

0,10,10,160,240,320,08

1010162432 8

10 20 36 60 92100

50 1,0 100

59,5- 64,5

64,5-69,5

69,5-74,5,74,5-79,5

79,5-84,5

84,5-89,5

626772778287

0,10,10,160,240,320,08

¿ Cuánto alumnos obtuvieron 69 o menos punto ?¿ Qué % obtuvo 75 o más puntos ? ¿ Cuántos alumnos obtuvieron entre 80 y 84 puntos ?¿ En cuales clases se concentraron la mayoría de los puntajes , entre puntos estuvieron y a que % corresponde ?

64%

10 20 36 60 92100

60 6465 6970 7475 7980 8485 89

30%³ 51018304650

5 5 81216 4

75 y 84 puntos

1010162432 8

56 %

GRÁFICOS

Los gráficos nos permiten obtener información de forma ordenada y resumida sobre las variables en estudio. Los gráficos más utilizados son:

a) Gráfico de barra: Es un diagrama de barras rectangulares, cuya altura de cada barra indica la frecuencia absoluta de cada valor de la variable.

Las barras pueden estar orientadas en forma horizontal o vertical. Estos gráficos se usan para comparar dos o más valores. Este gráfico sirve para representar variables cualitativas y cuantitativas.

Ejemplo 1:

Ejemplo 2:

cantidad de personas arriba de un avión

0

10

20

30

40

50

60

HOMBRES MUJERES

Género

Can

tid

ad

Serie1

b) Gráfico Circular: Es un gráfico formado por un círculo dividido en sectores. Se utiliza para representar cualquier tipo de frecuencias aunque, generalmente, se utiliza para frecuencias relativas porcentuales. Este gráfico sirve para representar variables cualitativas y cuantitativas.

Ejemplo 1:

Deportes Preferidos

41%

12%24%

21%

Bicicleta

Nadar

Trotar

Fútbol

Histograma: Es un gráfico cuya altura es proporcional a la frecuencia absoluta, frecuencia relativa o frecuencia porcentual, y la base está formada por segmentos cuyos extremos representan los extremos de cada intervalo. Este gráfico sirve para representar variables cuantitativas.

5 - 89 - 12

13 - 1617 - 20

05

1015202530354045

1

5 - 8

9 - 12

13 - 16

17 - 20

Polígono de Frecuencias: Se obtiene al unir los puntos medios de los intervalos representados por cada barra de un histograma, es decir, al unir la marca de clase de cada intervalo mediante una línea poligonal.

Edad de los estudiantes

0

5

10

15

20

25

30

35

40

45

5 - 8 9 - 12 13 - 16 17 - 20

Años

de

estu

dia

nte

s

Serie2

Medidas de tendencia central

Las medidas de tendencia central, denominados también PROMEDIOS, ubican el centro de los datos, como la media aritmética, la media geométrica, la media armónica y la mediana.

Las cuales serán calculadas para datos NO agrupados y agrupados (tabla de frecuencia)

MEDIA ARITMÉTICA OPROMEDIO ARITMÉTICO

SE SIMBOLIZA POR X

n321, x,......x,xxSE CALCULA SUMANDO LASOBSERVACIONES

Y SE DIVIDE POR POR EL NÚMERO TOTAL DE ELLAS , O SEA :

nx....xxx

X n321 +++=

MEDIANA

ES EL VALOR CENTRAL DE UNA DISTRIBUCIÓN ORDENADA DE MENOR A MAYOR O VICEVERSA , QUE DEJA SOBRE Y BAJO SI , EL 50 % DE LOS VALORES DE LA DISTRIBUCIÓN, SE SIMBOLIZA POR :

Me

EJEMPLO :

2 4 6 7 9 12 16MENORES MAYORES

ME

DIA

NA

Me = 7

SI EL NÚMERO DE DATOS ES PAR

5 8 10 13 15 18

LA MEDIANA ES IGUAL A LA MEDIA ARITMÉTICA DE LOS DOS VALORES CENTRALES

EJEMPLO :

11,52

1310x =+=ˆ

MODA

EN LENGUAJE COTIDIANO LO QUE ESTÁ DE MODA ES LO QUE MAS SE LLEVA, LOQUE MAS SE USA .

MODA : ES EL VALOR CON MAYOR FRECUENCIA , SE DESIGNA POR : Mo

PUEDE HABER MAS DE UNA MODA ONO HABER MODA

EJEMPLO

1 1 2 2 2 3 3 4 4 4 4 5 5 5 6 6 6 6 7 7 8 8 9

HAY DOS MODAS 4 Y 6

3 3 5 5 6 6 7 7 8 8 9 9EN ESTE CASO NO HAY MODA

EJEMPLO

EN EL CONJUNTO DE LOS DATOS :

5 2 2 2 4 5 6 6 6 6 7 7 8 9

LA MODA ES : Mo = 6

La moda es el promedio menos importante por su ambigüedad

Medidas de tendencia central para datos agrupados.

Media o Media aritmética: Si valores de alguna variable están tabulados en una distribución de frecuencias de intervalos, donde:

nX

son las marcas de clases, luego kyyyy ,...,,, 321

kffff ,...,,, 321 son las frecuencias absolutas respectivas,

Entonces su media aritmética está dada por:

n

mfx

k

iii∑

=

⋅= 1

Mediana para Datos Agrupados

Está dada por la fórmula:

Af

Fn

LMei

i

i ⋅−

+=−12

Dónde

:iLLímite inferior de la frecuencia acumulada, inmediatamente posterior al 50%

:n Cantidad total de datos

:1−iF Frecuencia acumulada anterior a la mediana

:if Frecuencia absoluta del intervalo de la Mediana

Ejemplo

Ingreso de personas a U.C.I coronaria de un determinado Hospital

45182 - 89

44374 – 81

41866 – 73

331658 – 65

171050 – 57

7442 – 49

3234 – 41

1126 – 33

Frecuencia Acumulada

Número de Personas

Edades

Af

Fn

LMei

i

i ⋅−

+=−12

Moda para datos agrupados

Para calcular la moda tabulados por intervalos, primero se determina el intervalo que contiene la moda, esto es, el intervalo que tiene la mayor frecuencia (intervalo modal). Luego se utiliza la fórmula

Add

dLMo i ⋅

+

+=21

1

Donde:

esto es igual a la frecuencia del intervalo modal menos la frecuencia del intervalo inmediatamente anterior

=iL Límite inferior del intervalo modal

11 −−= ii ffd

12 +−= ii ffd Esto es igual a la frecuencia del intervalo modal menos la frecuencia del intervalo inmediatamente posterior

A = Amplitud

Del ejemplo anterior

45182 - 89

44374 – 81

41866 – 73

331658 – 65

171050 – 57

7442 – 49

3234 – 41

1126 – 33

Frecuencia Acumulada

Número de PersonasEdades

61996,60

7429,058

786

658

≈=⋅+

=⋅

++=Mo

Cuartiles, Deciles y Percentiles

Si un conjunto de datos se ordena de acuerdo con su magnitud, el valor central que divide al conjunto en dos partes iguales es la MEDIANA. Extendiendo esta idea, es posible considerar los valores que dividen al conjunto en cuatro, diez o cien partes iguales

Fórmula general

)(% 1

isi

i LLf

NnLi −⋅−⋅+ −

Donde:

: Límite inferior de la clase utilizada

: Porcentaje a utilizar, expresado cómo número racional (Dividir en 100)

: Número total de datos de la muestra

Li

%

n

: Frecuencia acumulada anterior

: Frecuencia absoluta de la clase utilizada

: Límite Superior de la clase utilizada

1−iN

if

sL

Ejemplo 1

583105100 – 109

58

55395 90 - 99

52585 80 - 89

471175 70 - 79

362165 60 – 69

151055 50 – 59

5545 40 – 49

Fr. ac.Fr.M. ClasePeso

13,76)7079(11

365,4370)(

5875,0 175 =−−+=−−⋅+= −

isi

ii LL

f

NLP

Ejemplo 2:

La siguiente tabla muestra una distribución de frecuencia de salarios semanales de 65 empleados de una determinada empresa.

2310.000 – 319.999

5300.000 – 309.999

10290.000 – 299.999

14280.000 – 289.999

16270.000 – 279.999

10260.000 – 269.999

8250.000 – 259.999

N° EmpleadosSalarios

Calcule: el cuartil 3, los deciles 2, 4,7 y 9 y los percentiles 7, 19, 48, 67, 79

Medidas de dispersión

Son números que miden el grado de separación de los datos con respecto a un valor central. (Generalmente la media)

Estudiaremos las dos más importante:

c) Varianza

d) Desviación Estándar

Varianza

Es la media aritmética de los cuadrados de las diferencia de los datos con respecto a su media aritmética. Está dada por la fórmula:

n

xxs

n

ii∑

=

−= 1

2

2

)(

Ejemplo 1: (Datos no agrupados)

Obtener la varianza de los siguientes valores:

1,3,3,5,7,18,10

Varianza para datos AGRUPADOS

n

xxfs

n

iii∑

=

−= 1

2

2

)(

top related