tema 1 - crodzmate3026.files.wordpress.com · esto pocas veces es posible en una población grande....
TRANSCRIPT
Estadística descriptiva
• La estadística descriptiva estudia datos con el único
fin de describir el grupo observado, sin inferir los
hallazgos a elementos que no fueron observados.
• Se utilizan tablas, gráficas y medidas como: media
aritmética, mediana, moda, desviación estándar,
varianza y otras medidas para describir el grupo
observado.
1-2
La Estadística
• Rama de las matemáticas que trata con la
recolección, análisis, presentación e
interpretación de datos para la explicación de
un fenómeno.
– En otras palabras, es la ciencia observa nuestro
mundo através de los datos para luego llegar a
conclusiones.
1-3
1-4
El proceso de la estadística
Los métodos de la estadística siguen un proceso:
1. Identificar el objetivo de la investigación.
Un investigador debe determinar la(s) pregunta (s)
que se quieren contestar. La pregunta debe ser específica
para que identifique la población que se va a estudiar .
2. Recopilar los datos necesarios para responder a la pregunta
planteada en (1).
La etapa de recoger datos es vital para el proceso
estadístico, ya que si los datos no se recogen
correctamente, las conclusiones extraídas no tienen
sentido.
1-5
El proceso de la estadística (cont)
Los métodos de la estadística siguen un proceso:
3. Describir los datos.
Se obtiene un resumen de los datos que permitirá
elegir el tipo de método estadístico que se debe
usar para generalizar los resultados.
4. Realizar inferencia.
Aplicar las técnicas adecuadas para extender los
resultados obtenidos en la muestra a la población y
reportar un nivel de confianza en los resultados .
Data
• Hechos usados para llegar a una conclusión o
tomar una decisión.
• Describe las características de un individuo.
• Varía…Uno de los objetivos de la estadística
es el de describir y entender las fuentes de
variabilidad en los datos.
1-6
El grupo completo de
individuos que se estudiarán
se llama la población.
Una muestra es un
subconjunto de la población
bajo estudio.
Un individuo es una persona
u objeto que es miembro de
la población bajo estudio.
1-7
Población, muestra o individuo
1-8
Indique si en las situaciones presentadas a continuación se usó una muestra
o la población para hallar los resultados indicados:
a. Basado en una encuesta realizada a 1,000 electores en Puerto Rico se estimó
que el candidato ganador obtendrá un 4.5% de ventaja sobre su más cercano
rival.
b. El promedio en el examen de destrezas básicas de álgebra de los estudiantes
de nuevo ingreso fue 58%.
c. Un estudio estadístico realizado con 150 estudiantes femeninas de la
Universidad de Puerto Rico en Arecibo estimó en 135 libras el peso promedio
de las alumnas del recinto.
d. La desviación estándar en la puntuación del el primer examen de los 30
alumnos del curso MATE 3026 fue 6 puntos.
Población versus muestra
Estadística descriptiva
• La estadística descriptiva estudia datos con el único
fin de describir el grupo observado, sin inferir los
hallazgos a elementos que no fueron observados.
• Se utilizan tablas, gráficas y medidas como: media
aritmética, mediana, moda, desviación estándar,
varianza y otras medidas para describir el grupo
observado.
1-9
Estadística inferencial
• La estadística inferencial utiliza métodos que toman
los resultados de una muestra, los extiende a la
población. Mide la fiabilidad de los resultados.
• Las características observadas en la muestra se
infieren o generalizan para incluir elementos no
observados.
• Las generalizaciones no son completamente válidas
por tal razón se debe incluir la “probabilidad” de su
validez.
1-10
1-11
• Un parámetro es un resumen numérico de la
población
• Una estadística es un resumen numérico basado en
una muestra.
Parámetro versus Estadística
• Supongamos que el porcentaje de todos los estudiantes en su
recinto que tienen un empleo es del 84.9%. Este valor
representa un parámetro, ya que es un resumen numérico de
una población.
• Supongamos que se obtiene una muestra de 250 estudiantes de
este recinto, y de esta muestra encontramos que el 86.3% tiene
un empleo. Este valor representa una estadística, ya que es un
resumen numérico basado en una muestra.
EJEMPLO Un parámetro versus una estadística
Práctica Indique a qué área de la estadística pertenece cada
una de las situaciones siguientes:
1. Calcular el promedio en el primer examen de los
estudiantes del curso MATE 3035.
2. Calcular cuán cercanos entre sí están las puntuaciones
obtenidas en el examen de ubicación de los estudiantes
de nuevo ingreso.
3. Estimar la dosis óptima de un medicamento a base de
pruebas realizadas a pacientes voluntarios.
4. Estimar el por ciento de triunfo del candidato victorioso
en la próximas elecciones en Puerto Rico.
5. Construir una gráfica circular de la preferencia política en
Arecibo.
6. Estimar el peso promedio de un estudiante de nuevo
ingreso a la universidad en Puerto Rico para el año 2020.
1-12
Variables y experimentos
• Experimento – Es una actividad planificada para
obtener un conjunto de datos.
• Variable – Es una característica de interés para
cada individuo de una población o muestra.
– Algunos ejemplos de variables son: la edad de los estudiantes de nuevo ingreso, el color del cabello y el peso.
1-13
Son atributos.
Ej. religión, color de ojos, pueblo de
residencia, etc.
Los valores de la variable son
numéricos; se refieren a tamaño o
cantidad de algo
1-14
La investigadora, Elisabeth Kvaavik, y otros estudiaron los factores que
afectan a los hábitos alimenticios de los adultos entre treinta y treinta
y cinco años. (Fuente: Kvaavik E, et. al. Psychological explanatorys of
eating habits among adults in their mid-30’s (2005) International Journal
of Behavioral Nutrition and Physical Activity (2)9.)
Clasifique cada variable en el estudio como cuantitativa o
cualitativa.
a. Nacionalidad
b. Número de hijos
c. Ingreso del hogar en el año previo
d. Nivel de educación
e. Consumo diario de granos enteros (medido en gramos por día)
EJEMPLO Distinguir entre variables cualitativas y
variables cuantitativas
Clasifique cada variable cuantitativa en el estudio como discreta
o contínua.
a) Número de hijos
b) Ingreso del hogar en el año previo
c) Consumo diario de granos enteros (medido en gramos por
día)
EJEMPLO Distinguir entre variables discretas y
variables contínuas
La investigadora, Elisabeth Kvaavik, y otros estudiaron los factores que afectan a
los hábitos alimenticios de los adultos entre treinta y treinta y cinco años. (Fuente:
Kvaavik E, et. al. Psychological explanatorys of eating habits among adults in their
mid-30’s (2005) International Journal of Behavioral Nutrition and Physical Activity
(2)9.)
1-17
Muestra Es un subconjunto de la población.
Objetivo del muestreo:
El objetivo del muestreo es obtener la mayor cantidad de
información posible sobre la población al menor costo posible.
El costo incluye los gastos monetarios, tiempo y otros recursos.
Muestreo
1-18
Muestreo aleatorio
La muestra es seleccionada de modo que todos los
elementos de la población tengan la misma probabilidad de
ser seleccionados.
Pasos para obtener una muestra aleatoria simple:
1. Crear una lista con todos los individuos de la población
2. Enumerar los individuos desde 1 a N
3. Usar una calculadora gráfica o un programa de
estadística para generar números (del 1 a N)
aleatoriamente.
Tipos de muestras
1-19
EJEMPLO Obtener una muestra aleatoria simple
El centésimo décimo Congreso de los Estados Unidos
tenía 435 miembros en la Cámara de Representantes.
Explicar cómo llevar a cabo una muestra aleatoria
simple de 5 miembros para asistir a un almuerzo
presidencial.
Solución:
1-20
EJEMPLO: Usar la TI-84 para generar del 1 a 435
aleatoriamente.
Elegir un valor aleatorio
entre 1 y 435.
Elegir 5 valores
aleatorios entre 1 y 435.
1-21
EJEMPLO: Usar la TI-89 para generar del 1 a 435
aleatoriamente.
Elegir un valor aleatorio
entre 1 y 435.
Para generar un entero aleatorio entre 1 y un límite superior,
• En la Pantalla de inicio (HOME), pulse 2nd MATH.
• Pulse 7: “Probability”
• Pulse 4: rand (límite superior) y pulse ENTER
• Para más números, mantenga presionado “ENTER
1-22
Limitaciones: • Como debemos enumerar los individuos de la
población, debemos tener una lista de todos
los individuos dentro de la población (llamado
un marco). Esto pocas veces es posible en
una población grande.
• A menudo, el tamaño de la población es tan
grande que generar una muestra aleatoria
simple de esta manera no es práctico.
Muestra aleatoria simple
1-23
• En una muestra estratificada simple se separa la
población en grupos que son similares de alguna manera
y que no tienen miembros comunes (llamados estratos).
• Luego, se obtiene una muestra aleatoria simple de cada
estrato.
• El número de elementos seleccionados al azar en cada
estrato corresponde a la proporción del estrato en la
población general.
Tipos de muestras (cont.)
1-24
Ejemplo: El presidente de una universidad quiere realizar
una encuesta para determinar la opinión de la comunidad
con respecto a la seguridad del campus . El presidente
divide la comunidad universitaria en tres grupos: los
estudiantes que se hospedan, los que no se hospedan y el
personal (incluyendo profesores ). Quiere obtener una
muestra estratificada de 100 individuos .
Supongamos que hay 6,204 estudiantes que se hospedan ,
13,304 estudiantes no se hospedan y 2,401 empleados,
para un total de 21,909 individuos en la población
Solución:
Queremos
1. Obtener una muestra aleatoria simple de cada estrato
2. Que la participación de cada estrato sea proporcional
a su tamaño
EJEMPLO Obtener una muestra estratificada simple
1-25
Tenemos:
• 6,204 estudiantes que se hospedan
• 13,304 estudiantes no se hospedan
• 2,401 empleados
• Total: 21,909 individuos en la población
Los participantes de cada estrato se determinan : 𝟔𝟐𝟎𝟒
𝟐𝟏𝟗𝟎𝟗= 𝟎. 𝟐𝟖 = 28% de la muestra es 28
𝟏𝟑,𝟑𝟎𝟒
𝟐𝟏𝟗𝟎𝟗= 𝟎. 𝟔𝟏 = 61% de la muestra es 61
𝟐𝟒𝟎𝟏
𝟐𝟏𝟗𝟎𝟗= 𝟎. 𝟏𝟏 = 11% de la muestra es 1
Se debe obtener una muestra aleatoria simple de 28 estudiantes
que se hospedan, una muestra aleatoria simple de 61 estudiantes
que no se hospedan, y una muestra aleatoria simple de 11
empleados.
EJEMPLO cont.
1-26
Crear una muestra en este caso, se usaría algun otro
programa de computadora.
En Excel:
1. Inserte una columna en blanco al lado de sus datos.
2. Resalte todas las celdas de la columna a los que desea
asignar números aleatorios.
3. Escriba "= RAND ()" sin las comillas en la barra de
fórmulas y, a continuación, presione la tecla "Ctrl-Enter“
4. Seleccione la columna de números aleatorios y la
columna con los datos y haga clic en la ficha "Datos" y
"Ordenar" de menor a mayor.
5. Tienes un ordenamiento aleatorio de sus individuos,
ahora si eliges los primeros 10, será una muestra
aleatoria.
EJEMPLO cont.
1-27
Una ventaja del muestreo estratificado sobre el
muestreo aleatorio simple es que el investigador
puede determinar las características dentro de
cada estrato.
Esto permite analizar cada subgrupo para ver si
las diferencias significativas entre
los grupos existe.
Por ejemplo, podríamos analizar los datos
obtenidos en el ejemplo anterior
para ver si hay una diferencia en las opiniones
de los estudiantes en comparación con la de los
empleados.
Algunas ventajas
1-28
Una muestra sistemática se obtiene mediante la
selección de cada individuo k-ésimo de la población.
Por ejemplo, si se selecciona cada tercer miembro, k =
3.
El primer individuo seleccionado es un número
aleatorio entre 1 y k.
Debido a que el muestreo sistemático no requiere un
marco, que es una técnica útil cuando no se puede
obtener una lista de los individuos en la población que
se desea estudio.
Tipos de muestras (cont.)
1-29
PASOS PARA SELECCIONAR UNA MUESTRA
SISTEMÁTICA SI EL TAMAÑO DE LA
POBLACIÓN ES CONOCIDA
Paso 1: Determinar el tamaño de la población, N.
Paso 2: Determine el tamaño deseado de la muestra, n.
Paso 3: Calcular 𝑁
𝑛 y redondear al entero más cercano.
Este valor es k.
Paso 4: Seleccionar al azar un número entre 1 y k.
Llame a este número p.
Paso 5: La muestra estará compuesta por los siguientes
individuos:
p, p + k, p + 2k,…, p + (n – 1)k
1-30
SELECCIONAR UNA MUESTRA SISTEMÁTICA
SI EL TAMAÑO DE LA POBLACIÓN NO ES
CONOCIDA
• Si el tamaño de la población es
desconocido, no hay forma matemática
para determinar k.
• Se elige determinando un valor de k que no
es tan grande que no podemos alcanzar
nuestro tamaño deseado de la muestra,
pero no tan pequeña que no se obtiene un
tamaño de muestra que sea representativa
de la población.
1-31
EJEMPLO Obtener una muestra sistemática
Un ingeniero de control de calidad quiere obtener
una muestra sistemática de 25 botellas que
vienen de una máquina de llenar botellas, para
verificar que la máquina funciona correctamente.
Diseñe una técnica de muestreo que se puede
utilizar para obtener una muestra de 25 botellas.
1-32
Una muestra por conglomerados se obtiene
seleccionando todos los individuos dentro de una
colección o grupo de individuos donde los grupos
se han seleccionado aleatoriamente.
Tipos de muestras (cont.)
1-33
EJEMPLO Obtainer una muestra por conglomerados
Un administrador escolar quiere obtener una
muestra de estudiantes con el fin de realizar una
encuesta. Ella selecciona aleatoriamente 10
clases y administra la encuesta a todos los
estudiantes de la clase.
1-34
Muestras estratificada y muestras por conglomerados
son diferentes.
En una muestra estratificada, se divide la población en dos
o más grupos homogéneos. Luego, se obtiene una
muestra aleatoria simple de cada grupo.
En una muestra por conglomerados, se divide la población
en grupos. Luego se obtiene una muestra aleatoria simple
de algunos de los grupos y, finalmente, participan todos los
individuos de los grupos seleccionados.
Estratos vs conglomerados