introduccion a la estadistica descriptiva
DESCRIPTION
introduciion estadistica descrptivaTRANSCRIPT
Prof. Ximena N. Villarreal
UNIDAD N°1: ESTADISTICA
UNIDAD N°2: PRESENTACIÓN DE DATOS
ESTADÍSTICOS
UNIDAD N°3: MEDIDAS DE RESUMEN
UNIDAD N° 4: NOCIONES ELEMENTALES DE
PROBABILIDAD
UNIDAD N° 5: TABLAS DE CONTINGENCIA
UNIDAD N° 6: INFERENCIA ESTADÍSTICA
CONCEPTOS IMPORTANTES.
ESTADÍSTICA: Proviene del latín status (estado). Es considerada como una disciplina perteneciente a la Matemática Aplicada que se dedica al estudio cuantitativo de fenómenos colectivos. Proporciona métodos para:
- La recolección de datos
- Su ordenamiento, resumen y presentación
- Su análisis e interpretación y
- Posterior enunciado de conclusiones
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
Si las conclusiones se refieren
exclusivamente a los datos de
los que se dispone
Estadística
Descriptiva
Si las se conclusiones van más
allá de los datos que se
dispone y se refieren a un
conjunto mayor, del cual se
extrajeron
Estadística
Inferencial
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
CONCEPTOS IMPORTANTES.
POBLACIÓN: Es el conjunto de individuos u objetos
que comparten una característica común, en la
que el investigador está interesado.
Puede ser finita o infinita
MUESTRA: Es un subconjunto de la población.
Debe ser representativa, es decir se deben
mantener las mismas características de la
población de estudio.
EJEMPLO: una población puede ser definida como los alumnos de la escuela San Francisco.
Los alumnos pueden ser listados e individualizados a través de los registros áulicos –
POBLACIÓN FINITA.
Personas portadoras de una enfermedad determinada en Santiago del Estero – POBLACIÓN
INFINITA
UNIDAD DE OBSERVACIÓN: es aquella sobre la cual se
efectúan las mediciones u observaciones.
DATO: es el valor que se obtiene de la medición, observación
o conteo efectuada en la unidad de observación o unidad de
muestreo.
Por ejemplo: si el objetivo de una investigación es el rendimiento
de los alumnos:
Unidad de observación
Dato
Alumno
Número de
materias rendidas
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
CONCEPTOS IMPORTANTES.
VARIABLE: Cualquier característica que varía
de una unidad de muestreo a otra en la
población o en la muestra.
Ejemplos: estado de salud de un alumno,
número de hermanos de cada alumno, medir
la altura de cada alumno, etc.
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
POBLACION
MUESTRA
INDIVIDUO
Posee características que toman
diferentes valores (VARIABLES)
VARIABLES
CUANTITTIVA
CUALITATIVA
Los valores que asumen
pueden expresarse
mediante números
Los valores que puede
asumir son cualidades
DISCRETA
Toma sólo valores en el
intervalo que va de cero a n-
CONTINUA
Toma infinitos valores dentro
del intervalo
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
Las variables pueden clasificarse de la siguiente manera:
Otra forma de clasificación de las variables CUALITATIVAS es mediante el empleo de
cuatro niveles de medición:
NOMINAL: Los valores de las variables son nombres, etiquetas o categorías, y no se
puede establecer un orden entre ellos.
Ejemplos: lugar de nacimiento, colores de ojos, estado de salud, etc.
ORDINAL: Se puede establecer un orden entre las categorías de la variable.
Ejemplos: nivel de instrucción de un alumno, posición de corredores en una carrera, etc.
INTERVALO: En este nivel, la diferencia entre dos valores de datos tiene un
significado. En este nivel no hay un cero natural donde nada de la cantidad está
presente, sino que es convencional.
Ejemplos: escalas de medición de la temperatura
RAZÓN O COCIENTE: Es parecido al nivel de intervalo, pero este tiene un punto de
partida (cero inherente) , donde el cero indica que nada de la cantidad está presente.
Para los valores de este nivel, tanto las diferencias como los cocientes tienen significado.
Ejemplo: los precios de libros de texto ($0 representa ningún costo y un precio $60 es
dos veces más costoso que uno de $30
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
A TRABAJAR!! Hacemos la Actividad 1, pág. 35
Clasifique en base al siguiente listado las variables socieducativas, en cualitativas
nominales u ordinales y cuantitat. Discretas o continuas.
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
RELIGIÓN
N° DE ALUMNOS PROMOCIONADOS POR
SECCIÓN.
BARRIOS
NIVEL DE EDUCACIÓN ALCANZADO POR EL
TUTOR
EDAD DE LOS ALUMNOS
SEXO
N° DE INASISTENCIAS MENSUALES
ALTURA DE LOS ALUMNOS
LUGAR DE NACIMIENTO
PESO DE LOS ALUMNOS
HORAS DE JUEGO
N° DE MATERIAS QUE CURSAN
N° DE HERMANOS QUE TIENE CADA
ALUNMO
GRADO DE SATISFACCIÓN POR LA
ASIGNATURA
SUPERFICIE CONSTRUIDA POR ESCUELA
N° DE ESCUELAS POR DEPARTAMENTO
CATEGORÍAS DE ESCUELA
SERIE DE DATOS
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
El conjunto de valores de una variableconstituye una serie de datos.Ejemplo: En el año 2004, se examinaron 30 niños de un Jardín de Infantes de Córdoba
y se denota su estado de salud (S = sano, E= enfermo)
Generalmente las variables se designan con las ultimas letras del abecedario en
mayúscula, por ej. X, y los valores que toma la variable con x minúscula; incluso se
coloca xi donde el índice i indica el número de individuo observado; de este modo las 30
observaciones son:
Xi= S, S, E, E, E, S, S, E, S, S, S, S, S, E, S, S, S, S, E, S, S, S, S, S, S, S, S, S, S, S.
El sub índice “i” varía de 1 a 30. Así, x1= S; x7=S; x14= E; …., x30=S.
Los datos en bruto, tal cual fueron obtenidos, sin agrupar constituye una serie simple de datos.
Se deja para el alumno, el análisis de los ejemplos 2 y 3 de la pág. 10
ORGANIZACIÓN DE DATOS CATEGÓRICOS O CUALITATIVOS.
Cuando la masa de datos obtenidos es muy grande y estos están desordenados, no dan
información alguna; conviene por lo tanto ordenarlos y tabularlos, haciendo uso de tablas
estadísticas, que deben confeccionarse de tal modo que los datos resulten fáciles de ser leídos e
interpretados. Con los datos del ejemplo anterior, se puede construir una tabla de frecuencias.
TABLA DE FRECUENCIAS PARA UNA VARIABLE CUALITATIVA.
Es una tabla que asocia cada categoría de la variable con el número de veces que se repite la
categoría.
Siguiendo el ejemplo, sería la siguiente:
i Categorías: xi
(Estado de salud)
Frecuencias: fi
(n° de alumnos)
1 Sano 24
2 Enfermo 6
Total 30
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
Frecuencia Absoluta: Es el número de veces que se repite cada categoría de la variable. Se
la simboliza con fi.
La suma de las frecuencias absolutas es igual al número de observaciones, en este caso 30 :
Nótese que “i” ahora se refiere a las categorías x1= Sano, f1=24; x2= Enfermo, f2= 6.
Los datos organizados en tabla de simple entrada para variable cualitativa, pueden
presentarse mediante gráficos, que tiene la finalidad de que la información entre por los ojos.
El gráfico que puede usarse en éste caso es el gráfico de barras.
Con respecto al ejemplo:
2
1
30
i
fi
0
5
10
15
20
25
30
sano enfermo
Alumnos de un Jardín de Infantes de Córdoba
sano
enfermo
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
Para su construcción se utiliza el sistema de coordenadas ortogonales. Sobre el eje
horizontal se colocan las distintas categorías de la variable en estudio (estado de salud) y
sobre el vertical con una escala adecuada, se representan las frecuencia. Se dibujan barras
de ancho constante, una para cada valor de la variable, con una altura que representa el
valor de la frecuencia que corresponde a cada categoría. Es conveniente que la separación
entre las barras sea menor que le ancho de las mismas. Las barras pueden ser horizontales
o verticales.
0 5 10 15 20 25 30
sano
enfermo
Alumnos de un curso de EGB1, de la escuela San FRancisco
sano
enfermo
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
También es posible, y en algunos casos necesario, calcular frecuencias relativas.
FRECUENCIA RELATIVA: Es la proporción de veces que ocurre una categoría. Se la obtiene
dividiendo la frecuencia absoluta de cada categoría entre la suma de las frecuencias de todas las
categorías.
La suma, en el caso del ejemplo, es f1 + f2= 24+ 6= 30, y se expresa literalmente mediante el signo Sque se denomina sumatoria:
Así, a la frecuencia relativa de la clase i – ésima se la simboliza con fri y se la calcula de la siguiente
manera:
La suma de las frecuencias relativas es siempre igual a 1.
2
1
21 30624i
i fff
i
iri
f
ff
n
i
rif1
1
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
Si se multiplica las frecuencias relativas por 100, se obtienen los porcentajes, o también
conocida como la frecuencia relativa porcentual.
En este ejemplo, sería.:
i xi
(ESTADO DE
SALUD)
fi fri %
1 Sano 24 24/30=
0,80
80
2 Enfermo 6 6/30= 0,20 20
Total 30 1 100
Se pueden representar estos datos mediante un gráfico de barras, sólo que en el eje vertical van
los porcentajes.
Otro gráfico adecuado para representar series de frecuencias de variable cualitativa es el gráfico
de sectores circulares, llamado gráfico de tortas o pie charts.
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
Para su construcción, se elige un radio de por ejemplo 3cm (el valor del radio se elige según el
espacio que se disponga) y se grafica un círculo. La superficie de dicho círculo representa el total
de alumnos (30), que le corresponde un ángulo de 360°. Se puede discriminar mediante sectores
circulares la porción correspondiente a los alumnos sanos y a los enfermos. Los grados
correspondientes a los sectores se obtienen multiplicando la frecuencia relativa por 360°.
Siguiendo el ejemplo de estudio:
xi
(ESTADO DE SALUD)
fi fri 360°. fri
Sano 24 24/30= 0,80 360x0,80= 288°
Enfermo 6 6/30= 0,20 360x0,20= 72°
30 1 360°
80%
20%
sano
enfermo
Se deja como tarea
analizar el ejemplo
propuesto en el
apunte
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
TABLA DE FRECUENCIAS PARA UNA VARIABLE CUANTITATIVA DISCRETA
Si consideramos el ejemplo en el que tiene en cuenta el número de hermanos de los alumnos de
Preescolar de la escuela San Martín, los datos fueron los siguientes:
Xi= 4, 1, 6, 0, 0, 1, 2, 3, 1 0, 2, 5, 6, 4, 2, 0, 1, 2, 4, 3, 5, 6, 1, 3, 2, 4, 5, 2, 6, 0.
Esta es un caso de variable cuantitativa discreta, y la tabla de frecuencias se construye de la
siguiente manera: se ubica el valor mayor y el menor valor de la variable (0 y 6), se colocan todos los
valores correspondientes en la primera columna de la tabla, y luego se cuentan las veces que se
presentan dichos valores. Además de las frecuencias relativas, aquí se puede calcular también las
frecuencias acumuladas Fi. La Fi de una clase se obtiene sumándole a la frecuencia de la clase, la
frecuencia de las clases anteriores. La tabla resultante es:
xi fi fr Fi %
0 5 5/30=0,17 5 17
1 5 0,17 10 17
2 6 0,20 16 20
3 3 0,10 19 10
4 4 0,13 23 13
5 3 0,10 26 10
6 4 0,13 30 13
Total 30 1,0 100
La tabla de frecuencias para variables discretas se representan mediante un gráfico de bastones.
En la abscisa se colocan los valores de la variable y se levanta para cada uno de ellos una línea de
altura igual a su frecuencia
1
2
3
4
5
6
1 2 3 4 5 6
Número de hermanos
Fre
cu
en
cia
INTERPRETACIÓN.
- El número 6 en la columna de fi significa que 6
alumnos tienen 2 hermanos.
- El número 19 en la columna de Fi significa que
19 alumnos tienen 3 hermanos o menos.
- El número 20 en la columna de porcentajes
significa que el 20% de los alumnos tienen 2
hermanos.
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
ACTIVIDAD 3 – PAG. 36A los padres de 50 alumnos de sección de 5 años de jardín de infantes
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
MC:muy conformeC: conformeI: indiferente
D: disconformeMD : muy disconforme
a. Indicar el tamaño de la
muestra
b. Presentar los datos en una
tabla de frecuencias:
absoluta, relativa y relativa
porcentual.
c. Presentar los datos en un
gráfico de barras
d. Realizar la conclusión
correspondiente.
TABLA DE FRECUENCIAS PARA UNA VARIABLE CUANTITATIVA CONTINUA
Para el caso de este tipo de variables, como los datos del ejemplo 3 (altura en cm de 25 alumnos
de una sección maternal de la Esc. San Francisco) que fueron obtenidos por medición, se
recomienda construir intervalos de clase, cuya amplitud depende de la cantidad de intervalos que
se deseen construir y la cantidad de datos que posee la serie simple. Es recomendable que los
intervalos de clase sean iguales, es decir, que la amplitud de los mismos sea constante. La técnica
a emplear para el agrupamiento de una serie simple de variable continua es sencilla.
Ejemplo: xi(cm) = 70, 75, 74, 87, 88, 89, 72, 83, 84, 79, 98, 99, 95, 87, 84, 85, 79, 78, 95, 99, 97,
84, 86, 78, 74.
Pasos a seguir:
1) Se ubica el valor mayor (99cm) y el menor (70cm) que toma la variable.
2) Se obtiene la diferencia, la que se denomina Rango o amplitud de variación y se designa con la
letra R.
R = xmax – xmin = 99cm – 70cm = 29 cm
3) El número de intervalos aproximado se puede calcular con la siguiente fórmula:
)2log(
)1log( nn° de intervalos =
Donde
n:n° de valores de la serie o tamaño
de la muestra.
log: logaritmo decimal.
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
Siguiendo con el ejemplo y aplicando la fórmula:
)2log(
)1log(n
a =
57004,4)2log(
)125log(
intervalos
4) El rango se divide entre el n° de clases o intervalos de clases, 5 para este caso (se recomienda
que el número de intervalos no sea menor que 5 ni mayor que 15, pues en el primer caso se
reduce demasiado la información y el el segundo no se cumple con el objetivo del agrupamiento)
obteniéndose una idea aproximada de la longitud o amplitud del intervalo de clase.
68,55
29
int
ervalosden
Rango
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
5) Se delimitan las clases buscando preferentemente valores enteros para sus límites. Se debe
elegir el límite inferior del 1er intervalo de tal manera que contenga el menor valor de la serie
(70cm). La elección recae en el 70. El límite superior del 1er intervalo, se obtiene sumando al Li la
amplitud.
Li del 1er intervalo= 70
Ls del 1er intervalo= Li+a = 70+5 = 75
El límite inferior del 2do intervalo debe coincidir con el límite superior del primer intervalo.
Li del 2do intervalo =75
Ls del 2do intervalo= Li + a= 75 +5=80
Así sucesivamente, hasta que el último intervalo contenga el valor observado más alto de la
variable.
6) Una vez formadas las clases se procede al conteo, que consiste en determinar el número de
observaciones (frecuencias) de cada clase. Una manera sencilla de hacerlo es leyendo la serie
simple y ubicando mediante marcas cada valor de la variable en su clase correspondiente. De esta
manera cuando se termine de pasar lista a la serie simple, el agrupamiento ha sido efectuado.
70 - 75
75 - 80
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
Serie simple del Ejemplo:
xi(cm) = 70, 75, 74, 87, 88, 89, 72, 83, 84, 79, 98, 99, 95, 87, 84, 85, 79, 78, 95, 99, 97, 84, 86, 78, 74.
Intervalo de
clase
(altura en cm)
Xi
(marca de
clase)
fi fri
70 a 75 72,5 4 4/25= 0,16
75 a 80 77,5 5 0,20
80 a 85 82,5 4 0,16
85 a 90 87,5 5 0,20
90 a 95 92,5 1 0,04
95 a 100 97,5 6 0,24
Total 25 1,00
Pregunta… si uno de los alumnos mide exactamente 95cm, ¿dónde lo
ubicamos, en el quinto o en el sexto intervalo?
[75 ; 80)Cerrado, tomamos el Li Abierto, no tomamos el Ls
Los valores del intervalo van de 75 a 79, 99999…
7) Se agrega una tercera columna, titulada marca de clase o punto medio de clase que se
designa con xi que contiene los valores correspondientes a los puntos medios de cada uno de los
intervalos y se calcula así:
5,772
8075
2
5,722
7570
2
222
111
LsLix
LsLix
Un gráfico adecuado para representar una serie de frecuencias de v.c.continua es el histograma. Su
construcción es sencilla: se utiliza el sistema de coordenadas cartesianas ortogonales, en el eje de las
ordenadas (vertical) se marcan las frecuencias fi y en el de las abscisas (horizontal) la variable según la
cual se efectuó la clasificación (altura). Consiste en rectángulos adyacentes (uno por cada clase) con
bases materializadas por la amplitud de clases. La altura está dada por la frecuencia correspondiente a
cada clase. Cuando las clases son iguales, el área del histograma es proporcional a la frecuencia total.
1
2
3
4
5
6
70 9085 Altura (cm)
N°
alu
mn
os
75 80 95 100
72,5
77,5
82,5
87,5
92,5
97,5
POLÍGONO
DE
FRECUENCIA
1
2
3
4
5
6
70 948876 82 100
7
8
106
HISTOGRAMA
El Histograma y el Polígono de frecuencia son dos gráficos que brindan la misma información. Si se
escogió la cantidad adecuada de intervalos, NO se produce lo que se denomina serrucho. En este
caso, como hay serrucho, debería reelegirse la cantidad de intervalos para obtener un histograma
adecuado
HISTOGRAMA
sin serrucho
1
2
3
4
5
6
70 9488 Altura (cm)
N°
alu
mn
os
76 82 100
73
79
85
96
91
POLÍGONO
DE
FRECUENCIA
7
8
106
POLIGONO DE FRECUENCIA
El polígono de frecuencia comienza un intervalo antes del primero de la tabla y finaliza uno
después.
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
a. Agrupar los datos en una tabla de frecuencias calculando la amplitud y la cantidad de intervalos con las fórmulas correspondientes.b. Calcular marca de clase, frecuencia absoluta, relativa, relativa porcentual y acumulada.c. Presentar los datos en el gráfico correspondiente.
Lic. en EGB 1 y 2 - E.I.E - UNSE - UNIDAD 3
Se conocen varias formas de determinar el centro de un
conjunto de datos. A continuación, se indicarán tres que
son las mas comúnmente utilizadas:
MEDIA, MEDIANA Y MODA
Existen medidas de dispersión, como el Desvío medio y
la Varianza que nos permiten calcular que tan dispersos
están los datos del promedio de la muestra.
Lic. En Educac. Inicial - UNSE – UNIDAD 3
La media es la medida de posición y tendencia central más empleada para describir los datos;
constituye lo que la mayoría de la gente denomina promedio.
A la media aritmética se la representa con: x
a) Cálculo de la media aritmética en una serie simple de datos.
Se la obtiene al dividir la suma de todos los valores de la variable entre la cantidad de valores sumados.
n
x
n
xxxx
n
i
i
n
121 ....
“n”: tamaño de la muestra
Ejemplo: Se registró los días de inasistencias en un año, de una muestra de cinco alumnos de la
sección maternal del jardín y se desea averiguar cual es el promedio de inasistencias de esa
muestra. La variable de estudio es:
X= n° de inasistencias de los alumnos
Los valores de la variable son: xi= 0, 16, 12, 5, 7.
85
40
5
7512160
x
Interpretación: Los alumnos tienen en promedio 8 inasistencias por año.
Lic. En Educac. Inicial - UNSE – UNIDAD 3
Algunas propiedades de la media aritmética
La media aritmética es reproductora del total.
La media aritmética se puede calcular cuando los valores de las variables son cuantitativos tanto
continuos como discretos.
Si llamamos desvío a la diferencia entre un valor y la media aritmética
0xxd iixi
0 0 – 8= -8
5 5 – 8 = -3
7 7 – 8 = -1
12 12 – 8= 4
16 16 – 8 = 8
total 0
xxd ii
Una desventaja de la media es su sensibilidad a valores extremos, de modo que un valor excepcional puede
afectarla de una manera drástica, en este caso no representa en forma adecuada al centro de dicho conjunto y
tiende a dirigirse a ese valor extremo.
Si por equivocación, en lugar de colocar 16 ponemos 66 veamos que ocurre:
Lic. En Educac. Inicial - UNSE – UNIDAD 3
X= inasistencias de alumnos
xi= 0, 66, 12, 5, 7.
185
90
5
7512660
x
La inasistencia promedio toma el valor 18, alejándose el promedio hacia
el valor extremo 66.
La media aritmética no representa el centro del conjunto de datos. Este
problema o desventaja se resuelve utilizando otra medida de resumen de
datos denominada MEDIANA.
Lic. En Educac. Inicial - UNSE – UNIDAD 3
La mediana de un conjunto de datos es una la medida de tendencia central que divide a la serie
ordenada de datos en dos partes iguales, de tal forma que el 50% de los datos so menores o iguales
a la mediana y el otro 50% mayores o iguales a ella. La mediana se designa con Me.
b) Cálculo de la mediana en una serie simple de datos.
Se consideran dos casos, cuando el tamaño de la muestra (n) es par o es impar.
Considerando el ejemplo anterior, se desea determinar el valor mediano de las inasistencias de los
alumnos:
El tamaño de la muestra “n” es impar
X= inasistencias de alumnos
xi= 0, 66, 12, 5, 7.
Para su cálculo, debemos ordenar primero los datos en forma ascendente o descendente.
0,5,7,12,66
Si el número de observaciones es impar, la mediana es el valor de la variable que se localiza
exactamente en la mitad de la lista.
0, 5, 7, 12, 66
Me= 7 inasistencias
Interpretación: el 50% de los alumnos tiene inasistencias menores o iguales a 7.
Lic. En Educac. Inicial - UNSE – UNIDAD 3
En caso de que el número de observaciones fuera par, el valor de la mediana se obtiene
promediando los dos valores centrales. Esos valores centrales se posicionan en el lugar:
2
1n
Considerando otro ejemplo, en el caso de que n sea par, supongamos que contamos las
inasistencias de 6 alumnos.
X= Inasistencias de los alumnos
Xi= 0, 66, 12, 5, 7, 10.
Primero ordenamos los datos: 0, 5, 7, 10, 12, 66.
La muestra posee tamaño n=6, o sea que la posición de los valores centrales es:
Los valores centrales ocupan el tercer y cuarto lugar, la mediana se obtiene como el promedio
de los dos valores centrales.
0, 5, 7, 10, 12, 66.
5,32
7
2
16
82
5,8
2
107
Interpretación: el 50% de los alumnos
tienen inasistencias menores o iguales a
8
Lic. En Educac. Inicial - UNSE – UNIDAD 3
Algunas propiedades de la mediana
La mediana no se ve influenciada por los valores extremos, ya que en su cálculo interviene el
orden y no la magnitud de los valores.
No es sensible a valores extremos.
Se puede determinar para variables cuantitativas continuas discretas y para variables cualitativas
que se miden en escala ordinal.
EL Modo es el valor de la variable que ocurre con mayor frecuencia. Se designa frecuentemente
como Mo.
Se debe hacer notar aquí que el Mo es un valor de variable y la frecuencia de este valor sugiere su
importancia estadística.
Cuando dos valores ocurren con la misma frecuencia y ésta es la más alta, ambos valores son
modas, por lo que el conjunto es BIMODAL. Cuando más de dos valores ocurren con la misma
frecuencia y ésta es la mas alta, todos los valores son modas, por lo que el conjunto es
MULTIMODAL.
Cuando ningún valor se repite, se dice que no hay moda.
Lic. En Educac. Inicial - UNSE – UNIDAD 3
EJEMPLO:
Calcular la/s moda/s para el siguiente conjunto de datos:
SERIE A:6, 7, 1, 0, 0, 0, 7, 4, 3, 2, 8, 0
¿Cuál es el número que más se repite (mayor frecuencia)? El 0
En realidad, la moda no se utiliza mucho con datos numéricos. Sin
embargo, entre las distintas medidas de tendencia central que
consideramos, la moda es la única que puede usarse cuando se trata
de variables cualitativas nominales.
Como tarea domiciliaria, leer el ejemplo que propone el apunte (Ejemplo 6)
Lic. En Educac. Inicial - UNSE – UNIDAD 3
CALCULO DE LAS MEDIDAS DE POSICIÓN EN SERIES DE FRECUENCIAS
MEDIA ARITMETICA PARA VARIABLES AGRUPADAS EN SERIE DE FRECUENCIAS SIMPLEComo en una serie de frecuencias, fi nos indica las veces que se repite el valor de la variable,
debemos considerarlas en el cálculo de la media aritmética.
Tomamos el siguiente ejemplo: Alumnos de la primera sección del Jardín Municipal N°1,
clasificados según el número de hermanos.
N° de hermanos
(xi)
N° de alumnos(fi)
0 1
1 9
2 7
3 5
4 3
Total 25
Si aplicamos la fórmula de promedio para series
simples, deberíamos sumar 1 vez cero, nueve veces
1 y así sucesivamente hasta sumar 3 veces; luego
dividir esa suma entre 25 que es el tamaño de la
muestra.
xi= n° de hermanos
fi= número de alumnos que poseen xi hermanos
225
50
25
4...44...33....22...110
25
25
1
i
ix
x
9 veces 7 veces 5 veces 3 veces
Lic. En Educac. Inicial - UNSE – UNIDAD 3
Pero, la fórmula de manera más sencilla es:
n
i
ii fxnfff
fxfxfxx
1521
552211 1
...
.... MEDIA
PONDERADA
Volviendo al ejemplo, y aplicando la fórmula recién vista, tenemos que:
N° de hermanos
(xi)
N° de alumnos
(fi)
xi*fi
0 1 0*1=0
1 9 1*9=9
2 7 2*7=14
3 5 3*5=15
4 3 4*3=12
Total 25 50
250.25
11
1
n
i
ii fxn
x
Podemos concluir diciendo que los alumnos en promedio
poseen 2 hermanos.
Lic. En Educac. Inicial - UNSE – UNIDAD 3
MEDIANA PARA VARIABLES AGRUPADAS EN SERIE DE FRECUENCIAS SIMPLEComo en la tabla de frecuencia los datos ya se encuentran ordenados, debemos seguir las
siguientes instrucciones:
1) Calcular la frecuencia a cumulada correspondientes a cada valor de la variable.
2) Calcular el orden de localización de la mediana efectuando el cociente:
3) Luego de ubicar la posición de la mediana, se busca en la columna de frecuencias
acumuladas el menor valor que contiene al resultado obtenido con la fórmula anterior. La
mediana será el valor de la variable q corresponde a la frecuencia acumulada elegida.
Veamos un ejemplo:
Alumnos de la primera sección del Jardín de una escuela rural, clasificados según el número de
hermanos..
2
1n “n” tamaño de la muestra
N° de hermanos
(xi)
N° de alumnos (fi)
Frecuenciasacumuladas
(Fi)
2 5 5
3 5 10
4 30 40
5 4 44
total 44
5,222
45
2
144
2
1
nPOSICIÓN
Ubicamos en la tabla el menor valor
que contiene a 22,5
Interpretación: el 50% de los alumnos de escuelas rurales tienen 4 hermanos
o menos.Lic. En Educac. Inicial - UNSE – UNIDAD 3
Me = 4
MODA PARA VARIABLES AGRUPADAS EN SERIE DE FRECUENCIAS SIMPLE
Como en el caso de las series simples sin agrupar, la moda es el valor que más se repite, es
decir, con mayor frecuencia.
Por ejemplo, si tomamos nuevamente la tabla anterior:
N° de hermanos
(xi)
N° de alumnos (fi)
2 5
3 5
4 30
5 4
Total 44
El valor que más se repite es x=4 (fi=30), por lo que
la moda Mo=4
INTERPRETACIÓN: La mayoría de los alumnos
poseen 4 hermanos.
Lic. En Educac. Inicial - UNSE – UNIDAD 3
VARIABLE AGRUPADA EN SERIES DE FRECUENCIAS CON INTERVALOS DE CLASEPara el cálculo de las tres medidas de posición debemos trabajar con las marcas de clase, ya que
al organizar los datos en intervalos se pierde información al indicar que un valor se encuentra
entre los límites de dicho intervalo, pero no se conoce exactamente el valor del dato. Por ejemplo,
se indica que en una escuela hay 12 alumnos que pesan entre 30 y 40 kg, pero no se conoce el
peso exacto de cada uno de ellos.
Así, debemos encontrar un único valor que represente o resuma a todos los valores del intervalo:
ese valor es el promedio de los límites del intervalo y se denomina punto medio o marca de
clase.
Ejemplo: si el intervalo es [30; 40), la marca de clase es: 5,302
70
2
4030
La fórmula para encontrar la media aritmética es la siguiente:
n
i
ii fxn
x1
1 Donde en este casi, xi representa la marca de clase
“n” tamaño de la muestra
Lic. En Educac. Inicial - UNSE – UNIDAD 3
EJEMPLO: Consideremos el peso de los alumnos de un Jardín de una escuela rural.
Intervalo (kg)
N° alumnos fi
Marca de clase
xi
Xi*fi
[10;12) 12 11 132
[12;14) 19 13 247
[14;16) 7 15 105
[16;18) 6 17 102
[18;20) 6 19 114
Total 50 700
kgfxn
xn
i
ii 14700*1
501
1
INTERPRETACIÓN: Los alumnos pesan en promedio 14kg.
Lic. En Educac. Inicial - UNSE – UNIDAD 3
Para calcular esta medida de posición, utilizamos la siguiente fórmula:
af
Ff
LMMe
anteriorMe
i
e *2inf
Linf : límite inferior de la clase mediana
: Suma de la frecuencia entre dos
Fanterior Me : frecuencia acumulada anterior a la clase mediana
fMe : frecuencia absoluta de la clase mediana
a : Amplitud del intervalo a = Lsup - Linf
2
if
Lic. En Educac. Inicial - UNSE – UNIDAD 3
El procedimiento a realizar es:
1) En la tabla se agrega una columna para valores de frecuencia acumuladas.
2) Se calcula . El tamaño de la muestra se divide en 2 porque la mediana
divide a la serie ordenada de datos en dos partes iguales.
3) Se busca en la columna Fi el menor valor que contiene a al resultado obtenido en el ítem
anterior. Luego, con estos valores se aplica la fórmula para calcular la Me.
Continuando con el ejemplo anterior:
2
if
Intervalo (kg)
N°alumnos
fi
Fi
[10;12) 12 12
[12;14) 19 31
[14;16) 7 38
[16;18) 6 44
[18;20) 6 50
Total 50
252
50
2
if
kg
M
af
Ff
LM
e
Me
anteriorMe
i
e
37,1337,112
2*19
13122*
19
1225122*
19
122
50
12
*2inf
INTERPRETACIÓN: El 50% de los alumnos
pesan 13,37 kg
La siguiente fórmula, nos permite calcular la Moda en una serie de datos:
Continuando con el ejemplo anterior:
aDD
DLMo Mo *
21
1inf
D1 = fMo – fanterior a la clase Modal
D2 = fMo – fposterior a la clase modal
a = amplitud del intervalo.
Intervalo (kg)
N°alumnos
fi
[10;12) 12
[12;14) 19
[14;16) 7
[16;18) 6
[18;20) 6
Total 50
La clase modal corresponde al intervalo [40;42), ya que su
frecuencia es la mayor. Luego, aplicamos la fórmula.
D1= 19 - 12=7
D2= 19 - 7=12
a = 14 – 12= 2
kgMo
aDD
DLMo Mo
74,1274,0122*19
7122*
712
712
*21
1inf
INTERPRETACIÓN: el peso más frecuente del grupo de alumnos es de 12,74kg
MEDIAARITMETICA
MEDIANA MODO
V. CUALITATIVA ORDINAL
NO SI (en algunos
casos)
SI
V. CUALITATIVANOMINAL
NO NO SI
V. CUANTITATIVA
DISCRETA
SI SI SI
V. CUANTITATIVA
CONTINUA
SI SI SI
Teniendo en cuenta la Actividad 2 y la Actividad 5 de la unidad anterior, calcular
para cada una de ellas las medidas de tendencia central con la conclusión
correspondiente.
Lic. En Educac. Inicial - UNSE – UNIDAD 3
Lic. En Educac. Inicial - UNSE – UNIDAD 4
Lic. En Educac. Inicial - UNSE – UNIDAD 4
INTRODUCCIÓN
La teoría de probabilidad tiene sus orígenes en la teoría de la
casualidad. Históricamente, la teoría de la Probabilidad comenzó
con el estudio de los juegos de azar, tales como la ruleta y las
cartas.
Por ejemplo, para tomar decisiones en cualquiera de nuestros
ámbitos cotidianos, analizamos todos los factores que puedan
incidir en dicha decisión, que certeza hay de que ocurran ciertos
eventos y cuales de que no ocurran. Sin darnos cuenta, aplicamos
conceptos “intuitivos de la probabilidad”.
Antes de estudiar la teoría de probabilidad, es importante conocer
el concepto de azar.
Lic. En Educac. Inicial - UNSE – UNIDAD 4
Cuando se selecciona una determinada muestra de la
población, para obtener valores significativos para el estudio
estadístico es necesario que dicha muestra sea
seleccionada al AZAR, es decir, que cada una de las
observaciones tiene la misma probabilidad de ser
seleccionada.
Cuando un suceso no puede predecirse, como por ejemplo
el número que va a salir en una ruleta o una determinada
carta de una baraja, se dice que es independiente. Si la
independencia existe, se puede hablar de sucesos
realmente al azar.
Lic. En Educac. Inicial - UNSE – UNIDAD 4
La Probabilidad es la teoría que tiene que
ver con los posibles resultados de los
experimentos. Estos deben ser repetitivos,
es decir, debemos ser capaces de
reproducirlos bajo condiciones similares.
Lic. En Educac. Inicial - UNSE – UNIDAD 4
EXPERIMENTOS ALEATORIOS. ESPACIO MUESTRAL. EVENTOS.
Los experimentos aleatorios son aquellos cuyos resultadosdependen del azar. Por ejemplo: el tiempo de espera en laparada del colectivo, el lanzamiento de un dado, etc.
EXPERIMENTOS ALEATORIOS: Son aquellos que , repetidos bajo idénticas condiciones, no arrojan un único resultado sino un conjunto de ellos.
ESPACIO MUESTRAL: Es el conjunto de los resultados posibles de un experimento aleatorio y se denota con M.
Ejemplos.
Arrojar un dado. Espacio muestral M= {1, 2, 3, 4,5, 6}Arrojar una moneda. Espacio muestral M={C, S}Arrojar una moneda y un dado simultáneamente, el espacio muestral resultante es:M={ (cara,1) , (cara, 2), …., (seca, 1), (seca, 2), … , (seca, 6)}
SUCESO SEGURO: Es el conjunto total M (espacio muestral)
SUCESO IMPOSIBLE : Es el conjunto vacío.
Lic. En Educac. Inicial - UNSE – UNIDAD 4
Lic. En Educac. Inicial - UNSE – UNIDAD 4
Consideremos un espacio muestral M, dos eventos cualesquiera A y B en el experimento. Definimos:
UNION DE EVENTOS A U B : Representa el evento que ocurre si o
sólo si ocurre A u ocurre B o ambos.
INTERSECCION DE VENTOS A ∩B : Representa el evento que ocurre
si y sólo si, ocurren A y B simultáneamente, esto es, si ocurren en la
misma ejecución del experimento en consideración.
EVENTOS MUTUAMENTE EXCLUYENTES: Son los eventos que no
ocurren simultáneamente. Este caso se representa solamente cuando
A∩B = ,el evento vacío, de tal manera que A y B no tienen puntos en
común.
Lic. En Educac. Inicial - UNSE – UNIDAD 4
Un experimento consiste en tirar un dado y observar el número de puntos que aparece en la cara superior. El espacio muestral se puede describir f{acilmente, ya que es finito. Las posibilidades para el dado son seis: 1, 2, 3, 4, 5, 6. por lo tanto:
M= {1, 2, 3, 4, 5, 6}ESPACIO
MUESTRAL
• Describir los siguientes eventos.
A = Sale un número par.B= Sale un número impar.C= Sale un número menor que 4.D = Sale un número mayor que 3.E= Sale un número impar o mayor que 3. F = Sale un número par y menor que 4.G = sale un número par y un impar.
Lic. En Educac. Inicial - UNSE – UNIDAD 4
La Probabilidad de un evento A en un experimento aleatorio estádado por el cociente entre el número de casos favorables y elnúmero de casos igualmente posibles.
posibles igualmente casos de totalN
A a favorables casos )(
deNAP
Si los eventos son Mutuamente excluyentes, esto es si dos eventos no pueden ocurrir simultáneamente:
A∩B = , entonces la P() = 0
Lic. En Educac. Inicial - UNSE – UNIDAD 4
Ejemplos:La probabilidad de extraer un as de espada de
una baraja de 52 naipes, es iguala a 1/52.
La probabilidad de sacar un as de espadas rojoes cero, puesto que no hay figuras de espadasrojas en la baraja.
La probabilidad de extraer 6 manzanas de uncajón que trae 20 manzanas es 6 / 20
Lic. En Educac. Inicial - UNSE – UNIDAD 4
1. SI ES EL CONJUNTO VACÍO, ENTONCES P() = 0. IMPOSIBILIDAD
2. SI E ES EL COMPLEMENTO DE UN EVENTO E, ENTONCES:P(E) = 1 – P(E)
3. SI A B, ENTONCES P(A) P(B)4. EL RESULTADO DE LA PROBABILIDAD DE UN EVENTO ES: 0≤ P(E) ≤ 1
EJEMPLO:La probabilidad de que ocurra el evento A, es decir que al lanzar un dado salga un número par, se calcula como: P(A) = 3/6 = ½
Donde:-El número de resultados favorables es 3, ya que A= { 2, 4, 6}, tiene tres elementos.-El número total de resultados es 6, ya que M= { 1, 2, 3, 4, 5, 6} tiene 6 elementos.
Lic. En Educac. Inicial - UNSE – UNIDAD 4
Muchas veces necesitamos encontrar la probabilidadde un evento B si se sabe que ha ocurrido un evento A.esta probabilidad se llama probabilidad condicional deB dado A y se representa como P(B/A) . Se define comosigue:
)(
)()/(
AP
BAPABP
)(
)()/(
BP
BAPBAP
Lic. En Educac. Inicial - UNSE – UNIDAD 4
Considerar el experimento aleatorio de arrojar un
dado.
a. Halle la probabilidad de que aparezca un número
menor que 4 dado que apareció un número mayor que
3.
b. Halle la probabilidad de que aparezca un número
impar dado que apareció un número mayor que 3.
Lic. En Educac. Inicial - UNSE – UNIDAD 4
Sean A y B dos eventos del espacio muestral M generado por un experimento aleatorio. El teorema se enuncia de la siguiente manera:
P(A∪B) = P(A) + P(B) – P( A ∩B)
Si los eventos son mutuamente excluyentes, el último término es igual a cero, por lo que se anula ya que A∩B = , entonces la P() = 0. entonces:
P(A∪B) = P(A) + P(B)
Ejemplo: Si consideramos el experimento de lanzar simultáneamente un dado y una moneda, calcular la probabilidad del evento “ sale cara o sale un número
par”
Lic. En Educac. Inicial - UNSE – UNIDAD 4
Sean A y B dos eventos del espacio muestral M, y P(A)> 0 y P(B)>0, entonces se cumple que:
P(A∩B) = P(A) * P(B/A) = P(B) * P(A/B)
Cuando los eventos son independientes, se representa simbólicamente como:
P(B/A) = P(B) y P(A/B) = P(A)
Cuando los eventos son independientes, la regla de multiplicación se simplifica a:
P(A∩B) = P(A) * P(B)
Lic. En Educac. Inicial - UNSE – UNIDAD 4
A= salga un número parB = salga un número impar.
Para que sean independientes, debe ocurrir que P(A/B) = P(A) o bien que P(B/A) = P(B).En caso de NO ser independientes, se dice que son dependientes.
Lic. En Educac. Inicial - UNSE – UNIDAD 4
Consideremos el siguiente ejemplo: Para un estudio , se obtiene una muestra de
padres de alumnos de un jardín de infantes y se los clasifica según ocupación y
grado de compromiso con el mismo, obteniéndose los siguientes resultados:
Ocupación Grado de compromiso con el establecimiento
No comprometido
Poco comprometido
Comprometido Total
Desocupado 20 10 5 35
Trabajo permanente
10 15 10 35
Trabajo temporario
15 10 5 30
Total 45 35 20 100
Lic. En Educac. Inicial - UNSE – UNIDAD 4
Suponga que se selecciona un padre al azar de este grupo.
Obtenga las probabilidades siguientes:
Que el padre no se comprometa con la institución.
Que el padre no se comprometa o se comprometa con la
institución.
Que el padre se comprometa poco con la institución .
Que el padre sea desocupado y no se comprometa.
Probabilidad que el padre sea poco comprometido dado
que tiene trabajo permanente.
Probabilidad que el padre tenga trabajo temporario o sea
poco comprometido