ornadas de introducción a la investigación estadística

Post on 26-Mar-2016

218 Views

Category:

Documents

2 Downloads

Preview:

Click to see full reader

DESCRIPTION

ornadas de introducción a la investigación estadística para los profesores del liceo. nº2

TRANSCRIPT

ESTADÍSTICA

COORDINACIÓN 2012

LICEO N° 2 HÉCTOR MIRANDA

PROF. TERESITA FUSTER BARDIER

BREVE INTRODUCCIÓN PARA DOCENTES

OBJETIVOS

El objetivo principal del curso es mostrar a

los colegas docentes una breve

introducción a la Estadística, algunas de sus

aplicaciones relacionadas con el trabajo

diario del docente, formas de presentar los

datos ya procesados y la lectura de los

mismos.

2

CONTENIDO DEL CURSO

Estadística: qué es, para qué sirve, cómo

pueden usarla los docentes.

Investigación estadística

Datos estadísticos: formas de recolección.

Variables estadísticas

Variables de resumen

Gráficos y tablas: construcción y lectura

3

DEFINICIÓN

Es la ciencia que tiene por objeto la

recolección, la organización, el

análisis y la presentación de datos,

con el fin de brindar información

que facilite la toma de decisiones.

4

APLICACIONES (ejemplos)

Recopilación de datos de los alumnos, análisis de los mismos y toma de decisiones a nivel grupal e individual.

Prueba diagnóstica

Análisis comparativo de escritos o pruebas, ya sea dentro del grupo o entre diferentes grupos.

Análisis de los datos de promoción, relacionarlos (si es posible) con otros datos de los alumnos y análisis comparativos.

Recordar que todos estos ejemplos deben utilizarse como base para otros análisis y tomas de decisiones y no como un fin en sí mismos.

5

INVESTIGACION ESTADÍSTICA

Objetivos de la investigación.

Pregunta problema.

Hipótesis (si la hubiera).

¿Investigación cualitativa o cuantitativa?

Determinación de la forma de recoger los

datos.

Determinación del tipo de formulario a

emplear.

6

INVESTIGACIÓN CUANTITATIVA

Plan de tabulados (de acuerdo al objetivo

planteado).

Determinación de las preguntas a incluir

(para cumplir con el plan de tabulados).

Recogida de datos (trabajo de campo).

Introducción, depuración y análisis de los

datos.

Publicación de resultados.

7

CONCEPTOS BÁSICOS Población: Una población finita (o simplemente

población) es un conjunto finito de elementos. O sea, puede determinarse sin ambigüedad si un elemento pertenece o no al conjunto. Denominaremos población objetivo, a la población finita sobre la cual deseamos obtener alguna información estadística.

Muestra: Es un subconjunto de la población: no tenemos los datos totales de la población, sino solamente de una parte de ella. En estos casos, las conclusiones extraídas de estos datos pueden extenderse o no a la población dependiendo de cómo se haya extraído la muestra.

8

RECOLECCIÓN DE DATOS

Registros administrativos

Censos

Encuestas por muestreo

9

RECOLECCIÓN DE DATOS

REGISTROS ADMINISTRATIVOS: son datos que

fueron recolectados con fines no estadísticos,

pero que pueden ser una base para el análisis

estadístico.

CENSOS: los datos se recogen directamente con

finalidad estadística. Se aplica el cuestionario a

toda la población objetivo.

10

RECOLECCIÓN DE DATOS ENCUESTAS: las encuestas también se aplican

con fines estadísticos. La diferencia con el censo es que se recolectan datos de una porción de la población.

ENCUESTAS POR MUESTREO ALEATORIO: tienen detrás un diseño de muestreo que permite expandir eficazmente sus resultados al total de la población.

ENCUESTAS POR MUESTREO NO ALEATORIO: no tienen un diseño muestral detrás. Sus resultados no pueden generalizarse al total poblacional.

11

VARIABLES ALEATORIAS Una variable es cualquier dato sujeto a medida o cuenta. Es aleatoria si no se puede predecir su valor. Ejemplos:

La hora de salida del sol cada día no es una variable aleatoria, ya que los astrónomos saben de antemano la hora exacta de la misma para cada día del año.

La cantidad de lluvia caída durante un período específico sí es una variable aleatoria, ya que no puede predecirse.

También son variables aleatorias:

La cantidad de alumnos inscriptos en cada liceo determinado año.

El número de alumnos que promueven el curso.

12

VARIABLES ALEATORIAS Cualitativas: También se llaman categóricas. Los

datos están divididos en clases o categorías. Por ejemplo: sexo del alumno, orientación, etc.

Pueden clasificarse en:

Nominales: las categorías no siguen ningún ordenamiento. Ejemplo: sexo, barrio en el que vive el alumno.

Ordinales: las categorías presentan cierto orden lógico. Ejemplo, preguntas de opinión cuya valoración es Bueno, Regular, Malo.

13

VARIABLES ALEATORIAS Cuantitativas: Son datos numéricos. Se clasifican

en:

Discretas: son aquellos datos que se pueden contar o numerar. Ejemplos: edad del alumno, cantidad de alumnos matriculados en cada clase; cantidad de profesores de Matemática; cantidad de horas libres que tiene el Liceo por día.

Continuas: datos numéricos que pueden tomar cualquier valor (en general, entre ciertos límites). Por ejemplo: salario por hora docente en el tiempo o en diferentes grados; altura y peso de una persona.

14

ESTADÍSTICA DESCRIPTIVA DISTRIBUCIONES UNIVARIADAS

Distribución de frecuencia y frecuencia acumulada

La frecuencia de una variable (ya sea discreta o

cualitativa) es la cantidad de veces que el dato se

repite. Normalmente los datos se presentan

agrupados según una tabla de frecuencias, que

puede contener frecuencias absolutas (número de

casos) o frecuencias relativas (porcentajes).

Si la variable es ordinal o cuantitativa puede

presentarse una distribución de frecuencia que

acumula cantidades desde la menor a la mayor.

15

ESTADÍSTICA DESCRIPTIVA El siguiente ejemplo corresponde a respuestas a la

pregunta sobre la opinión del estudiante sobre

Matemática, recogida en la prueba diagnóstica 2011

de 3 grupos de 5° año.

Opinión sobre Matemática

Frecuencia

absoluta Frecuencia

relativa Frecuencia

acumulada

No me gusta 2 3,17 3,17

Me disgusta algo 2 3,17 6,35

Ni me gusta ni me

disgusta 12 19,05 25,40

Me gusta algo 29 46,03 71,43

Me gusta mucho 18 28,57 100,00

Total 63 100

16

GRAFICAS UNIVARIADAS

El tipo de gráfica depende de la variable con la cual se está trabajando: Variables cualitativas: gráficas de

barras, gráficas de torta o circulares.

Variables cuantitativas discretas: histogramas, gráficas de puntos.

Variables cuantitativas continuas: gráficas de puntos.

17

Gráficas de barras

18

0

5

10

15

20

25

30

35

No me gusta Me disgusta

algo

Ni me gusta ni

me disgusta

Me gusta algo Me gusta

mucho

Número de alumnos

Siguiendo el ejemplo anterior: número de alumnos

por opinión sobre Matemática

Gráficas circulares

19

Total de alumnos

Femenino

Masculino

Para los alumnos que realizaron la misma prueba

diagnóstica. La variable utilizada es el sexo de los

alumnos.

Histogramas

20

0

5

10

15

20

25

30

35

40

45

15 16 17 18 19

Numero de alumnos

Siguiendo el ejemplo visto anteriormente, la variable

es la edad de los alumnos en años cumplidos al

momento de la prueba.

Gráficas de puntos

21

0

5

10

15

20

25

30

35

40

45

14 15 16 17 18 19 20

N° de alumnos

En el mismo ejemplo anterior, la gráfica

representa el número de alumnos según la edad.

MEDIDAS DE RESUMEN

22

Se tratan de medidas que ofrecen un resumen

de la distribución de los datos, con la menor

pérdida de información posible.

Se utilizan también para comparar distribuciones

distintas de la misma variable (diferencia

temporal o geográfica, por ejemplo)

Se consideran dos tipos de variables de

resumen: las medidas de tendencia central (o

de posición y las medidas de dispersión.

Variables cualitativas

El único resumen que puede darse es la

variable de tendencia central llamada

MODO (o Moda)

Representa el o los valores de la variable

con mayor frecuencia.

Por ejemplo, en los casos vistos anteriormente :

Opinión sobre Matemática: el modo es “Me

gusta algo”

Sexo de los alumnos: el modo es: “Femenino”

23

Variables cualitativas

Medidas de tendencia central:

Modo

Media

Medidas de posición:

Percentiles o cuantiles

Cuartiles, quintiles, deciles

Medidas de dispersión:

Rango

Varianza (o variancia)

Desvío (o desviación) estándar (o típica)

24

Variables cuantitativas Tendencia central: modo

Modo: valor o valores de la variable que tiene la

mayor frecuencia.

En el ejemplo de las edades de los alumnos, el modo es

16.

25

Variables cuantitativas Tendencia central: media

26

Variables cuantitativas Tendencia central: media

Variable agrupada por frecuencia

27

Edad N° de alumnos

Edad*N° alumnos

15 5 75

16 40 640

17 12 204

18 4 72

19 2 38

Total 63 1029

Variables cuantitativas Medidas de posición

Indican el valor de la distribución de la variable

ordenada que ocupa el lugar indicado. Por ejemplo:

Cuartiles: el primer cuartil es el valor de la variable que

deja al 25% de la distribución con valores menores. El

segundo cuartil (o mediana) es el valor de la variable que

ocupa el medio de la distribución ordenada. El tercer

cuartil deja el 75% de la distribución de la variable con

valores menores.

Quintiles: la distribución de la variable ordenada se separa

en 5 grupos de igual tamaño.

Deciles: idem con 10 grupos de igual tamaño.

Cuantiles o percentiles: lo mismo, con 100 grupos de igual

tamaño.

28

Variables cuantitativas Medidas de posición

Ejemplo: se tienen las edades de 13

alumnos. Se ordenan de menor a mayor.

14, 14, 15, 15, 15, 15, 16, 16, 16, 16, 17, 17, 18

29

En este caso la mediana es 16 ya que hay 6

alumnos con edades menores y 6 alumnos

con edades mayores

Variables cuantitativas Medidas de dispersión

El siguiente ejemplo muestra las notas obtenidas

por 10 alumnos de 3 grupos distintos en un escrito:

30

Grupo 1 Grupo 2 Grupo 3

6 5 1

6 5 2

6 5 3

6 6 4

6 6 5

6 6 7

6 6 8

6 7 9

6 7 10

6 7 11

En los tres

casos, la

media es 6

Variables cuantitativas Medidas de dispersión

Las gráficas correspondientes son:

31

0

2

4

6

8

1 2 3 4 5 6 7 8 9 10

Grupo 1

0

2

4

6

8

1 2 3 4 5 6 7 8 9 10

Grupo 2

0

2

4

6

8

10

12

1 2 3 4 5 6 7 8 9 10

Grupo 3

Variables cuantitativas Medidas de dispersión: Rango

Se define el rango como la diferencia entre el mayor valor que toma la variable en esa distribución y el menor valor de esa variable.

En los ejemplos de escritos vistos:

En el primer caso el rango es: 6 – 6 = 0

En el segundo grupo es: 7 – 5 = 2

En el grupo 3, el rango es: 11 – 1 = 10

Puede observarse que el tercer grupo es el “más desparejo” de los tres (los valores de la variable tienen mayor dispersión)

32

Variables cuantitativas Medidas de dispersión: varianza

La varianza puede definirse como un

promedio de la diferencia al cuadrado

entre los valores que toma la variable y

la media de la distribución. Esta

diferencia debe considerarse al

cuadrado porque, por la propia

definición de la media, sería siempre 0.

33

Variables cuantitativas Medidas de dispersión: varianza

34

Nota Nota - media (Nota - media)^2

1 -5 25

2 -4 16

3 -3 9

4 -2 4

5 -1 1

7 1 1

8 2 4

9 3 9

10 4 16

11 5 25

Suma 0 110

Variables cuantitativas Medidas de dispersión: desvío estándar

Para el cálculo de la varianza, se eleva la diferencia con la media al cuadrado, por lo que la unidad de medida que se está usando también queda elevada al cuadrado.

Si se quiere considerar la unidad de medida original, se calcula la raíz cuadrada de la varianza. A este valor se le llama desvío estándar, desviación estándar o desvío típico.

En el caso visto anteriormente, el desvío estándar es 3,49.

Esto significa que, en promedio, las notas obtenidas en los escritos de desvían 3,49 unidades de la media.

35

Diagrama de caja y bigotes

36

• El cuerpo de la caja muestra el recorrido

intercuartílico (RIC) (entre el primer y el tercer

cuartil)

• La línea en la caja muestra la mediana.

• Los “bigotes” se encuentran a 1,5 RIC de los

bordes de la caja.

• Los valores que quedan fuera de este rango se

denominan atípicos (outliers)

• Es un diagrama muy útil para comparar

distribuciones, ya que muestra también la

dispersión de las mismas.

Diagrama de caja

37

Diagrama de caja

que representa la

nota obtenida por

los alumnos de 5°B1

y 5°B2 (2012) en la

Prueba Diagnóstica

de puntaje máximo

30.

El número 18

corresponde al orden

del alumno que tuvo

el máximo puntaje (la

nota se observa en los

valores del eje)

Otras medidas de resumen: tasas

Las tasas o ratios son cocientes entre

cantidades específicas de una variable o de

dos variables. Se calcula en general como el

total de veces que se presenta el fenómeno

estudiado sobre el total poblacional.

Como ejemplo se verán las tasas de

escolarización bruta y la tasa de

escolarización neta.

Las definiciones y cuadros siguientes fueron extraídos del

Observatorio de la Educación de ANEP.

38

Tasas de escolarización. La tasa bruta de escolarización (TBE) se calcula como el

número total de alumnos de cualquier edad matriculados

en un determinado nivel de enseñanza, expresado en

porcentaje de la población del grupo en edad oficial de

cursar ese nivel (3 a 5 o 4 a 5 años para educación inicial,

6 a 11 años para educación primaria, 12 a 17 años para

educación media general, 12 a 14 años para ciclo básico

de educación media, 15 a 17 años para segundo ciclo de

educación media y 18 a 24 años para educación

terciaria).

Los alumnos matriculados surgen de los registros

estadísticos de cada uno de los subsistemas. La población

en edad oficial (o teórica) surge de las proyecciones al 30

de junio de cada año realizadas por el Instituto Nacional de Estadística.

39

Tasa bruta de escolarización

AÑO

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

TOTAL EDUCACIÓN

MEDIA 94,5 97,8 103,2 107,0 105,7 102,6 102,4 100,1 101,7 103,4 102,4

Pública 83,4 86,7 92,2 96,3 94,7 91,3 91,0 88,6 89,3 90,6 89,6

Secundaria 64,9 68,4 73,2 76,0 74,3 71,9 70,6 68,1 69,1 70,1 70,0

CETP 18,4 18,3 19,0 20,3 20,4 19,4 20,5 20,5 20,2 20,5 19,6

Privada 11,1 11,0 11,0 10,7 11,0 11,3 11,4 11,5 12,4 12,8 12,8

Total ciclo básico 93,9 97,0 100,5 101,8 100,4 98,0 98,7 98,3 104,4 107,4 108,0

Pública 80,3 83,5 87,4 89,4 87,7 85,5 85,7 85,1 89,7 92,0 92,5

Secundaria 71,3 74,7 78,4 79,9 78,1 75,8 75,9 75,2 79,0 80,1 80,2

CETP 9,0 8,8 9,0 9,5 9,6 9,7 9,8 9,9 10,8 11,9 12,3

Privada 13,6 13,5 13,1 12,4 12,7 12,6 13,1 13,2 14,7 15,4 15,4

Total segundo ciclo 82,3 86,0 93,3 98,7 98,0 95,9 94,1 90,5 88,6 90,8 90,7

Pública 73,6 77,4 84,5 89,7 88,8 85,8 84,4 80,6 78,6 80,6 80,6

Secundaria 58,5 62,0 68,0 72,0 70,5 67,9 65,1 60,8 59,0 59,8 59,7

CETP 15,2 15,4 16,5 17,7 18,3 17,9 19,3 19,8 19,6 20,8 20,9

Privada 8,6 8,5 8,8 8,9 9,2 10,1 9,7 9,9 10,0 10,1 10,1

40

Fuente: Observatorio de la Educación - ANEP

Tasa neta de escolarización

41

La tasa neta de escolarización (TNE) se calcula

como el número total de alumnos de edad

oficial para el nivel, matriculados en un

determinado nivel de enseñanza, expresado en

porcentaje de la población del grupo en edad

oficial de cursar ese nivel (3 a 5 o 4 a 5 años para

educación inicial, 6 a 11 años para educación

primaria, 12 a 17 años para educación media

general, 12 a 14 años para ciclo básico de

educación media, 15 a 17 años para segundo

ciclo de educación media y 18 a 24 años para educación terciaria).

DISTRIBUCIONES MULTIVARIADAS

En la mayoría de los estudios estadísticos no alcanza con estudiar la distribución de una variables, sino que es necesario su vinculación con otras, por ejemplo, involucrando variables demográficas (edad y sexo principalmente), variables económicas o variables temporales.

Estas vinculaciones dan mayor riqueza al análisis y a la comprensión del fenómeno que se está estudiando.

Como ejemplo, se verán cuadros y gráficas que involucren más de una variable.

No es conveniente usar más de tres variables en un cuadro y siempre que, al menos una de ellas, tenga pocas categorías. De lo contrario, se tendrán cuadros inmanejables por su tamaño.

42

Cuadros con dos variables:

valores absolutos

Distribución de alumnos de 1° Bachillerato por

sexo según grupo (año 2011 Liceo Miranda)

43

Grupo Sexo

Total Femenino Masculino

Total 312 180 132

1 32 20 12

2 35 20 15

3 35 23 12

4 36 17 19

5 34 19 15

6 35 23 12

7 35 19 16

8 36 19 17

9 34 20 14

Cuadros con dos variables:

valores relativos

En estos casos se pueden presentar tres tipos de tablas, dependiendo de cuál es la referencia considerada: Porcentajes de columnas (en el caso anterior, el total es

la cantidad de casos femeninos y se consideran porcentajes de cada grupo, lo mismo para el total masculino y el general).

Porcentajes de filas (el total es el número de alumnos de cada grupo y se calculan los porcentajes de casos femeninos y masculinos)

Porcentajes de tabla (el total es el número total de alumnos y se calculan los porcentajes de cada una de las casillas, o sea, qué porcentaje del total de alumnos son chicas de 4°1, etc.)

44

Cuadro con tres variables:

valores absolutos

45

Total Aprobado Por examen Pendiente Repite o recursa

Total 54 37 7 7 3

Femenino 37 26 5 4 2

Masculino 17 11 2 3 1

Total 6 6 0 0 0

Femenino 6 6 0 0 0

Masculino 0 0 0 0 0

Total 37 27 7 3 0

Femenino 22 16 5 1 0

Masculino 15 11 2 2 0

Total 6 2 0 2 2

Femenino 5 2 0 2 1

Masculino 1 0 0 0 1

Total 5 2 0 2 1

Femenino 4 2 0 1 1

Masculino 1 0 0 1 0

Total

15

16

17

18 y más

Resultado de Matemática (2011)Edad Sexo

Gráficas con dos variables

46

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

Total 1 2 3 4 5 6 7 8 9

Sexo Femenino Sexo Masculino

Distribución de alumnos por sexo según grupo (Primer año

bachillerato, Liceo Miranda, año 2011)

Gráficas con dos variables

47

0

20

40

60

80

100

120

140

160

180

200

Total Promovido Fallo en suspenso Repite

Fallo reunión final de profesores

Femenino

Masculino

Distribución de alumnos por sexo, según fallo reunión final

de profesores (Primer año bachillerato, Liceo Miranda, año

2011)

Gráficas con dos variables:

usos de escala En el siguiente ejemplo se observará como el

cambio de escala en los ejes de la gráfica

influye en la interpretación de la observación.

Valor nominal mensual de la hora docente (efectivos e interinos

titulados, tiempo extendido, segundo ciclo) según grado.

48

Grado Salario Nominal

Diferencia porcentual

1 704 -

2 739 4,97

3 773 4,60

4 815 5,43

5 868 6,50

6 925 6,57

7 987 6,70

Gráficas con dos variables:

usos de escala

49

0

100

200

300

400

500

600

700

800

900

1000

1 2 3 4 5 6 7

Salario nominal por hora, según grado

Gráficas con dos variables:

usos de escala

50

650

700

750

800

850

900

950

1000

1 2 3 4 5 6 7

Salario nominal por hora, según grado

Propuestas finales

Se propone que el conjunto de los

docentes decidan un tema a investigar

durante el año lectivo, de manera que sus

conclusiones sean de utilidad a la

comunidad educativa.

Este tema puede involucrar solo uno de los

niveles, ser general para el liceo o incluso,

involucrar los liceos de donde provienen la

mayoría de nuestros alumnos.

51

52

MUCHAS GRACIAS POR SU

ATENCIÓN.

ESPERO QUE ESTAS JORNADAS

HAYAS SIDO DE INTERÉS PARA

TODOS Y PUEDAN SER DE

UTILIDAD PARA MEJORAR LOS

PROCESOS EDUCATIVOS.

top related