josé gonzalo lugo pérez estadística básica curso de estadística básica m. en c. josé gonzalo...
TRANSCRIPT
José Gonzalo Lugo PérezEstadística Básica
Curso de Estadística Básica
M. en C. José Gonzalo Lugo Pérez
SESION 1INTRODUCCIÓN A LA ESTADÍSTICA
José Gonzalo Lugo PérezEstadística Básica
Objetivo
Crear una imagen inicial del campo de la estadística así como introducir y comprender los términos básicos aplicados en su estudio.
José Gonzalo Lugo PérezEstadística Básica
Agenda Sesión 1
• Introducción a la Estadística– Términos básicos
– Recolección de datos
– Comparación entre la probabilidad y la estadística
– Proceso estadístico
José Gonzalo Lugo PérezEstadística Básica
¿Qué es la estadística?
Diccionario de la Real Academia Española:
1. Estudio de los datos cuantitativos de la población, de los recursos naturales e industriales, del tráfico o de cualquier otra manifestación de las sociedades humanas.
2. Conjunto de estos datos.
3. Rama de la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades.
José Gonzalo Lugo PérezEstadística Básica
¿Qué es la estadística?
“Medio para recolectar y representar grandes cantidades de información”
“Medio para tomar decisiones de frente a la incertidumbre”
José Gonzalo Lugo PérezEstadística Básica
¿Qué es la estadística?
Estadística
Descriptiva
Inferencial
Recolección, presentación y descripción de los datos muestrales
Técnica de interpretación de los valores resultantes de las técnicas descriptivas y a la toma de decisiones y obtención de conclusiones sobre la población muestreada
José Gonzalo Lugo PérezEstadística Básica
¿Qué es la estadística?
• Ciencia de recolectar, describir e interpretar datos
José Gonzalo Lugo PérezEstadística Básica
Caso
• Ocupar un asiento incómodo durante largos periodos no es gracioso. Ocupar su sitio en el asiento de un avión cuando se es más grande que el promedio de la gente, puede ser verdaderamente penoso.
José Gonzalo Lugo PérezEstadística Básica
Asientos estrechos en aviones
Alquiler de automóviles económicos y el gasto para obtener un automóvil más grande
Camas de hotel demasiado pequeñas, estrechas o suaves
Sillas y mesas de restoranes sujetas al piso
Regaderas demasiado bajas en hoteles y moteles
Nota: Se permitió más de una respuesta. Fuente: Encuesta aplicada a 10 000 clientes de King-Size Co.
Lo que menos agrada a los viajeros robustos y altos cuando viajan:
99%
87%
83%
80%
77%
Viajar es un problema
José Gonzalo Lugo PérezEstadística Básica
Ejercicio
• ¿Quién fue encuestado?
• ¿Cuántos fueron encuestados?
• Explique el significado de “Asientos estrechos en aviones: 99%”
• ¿Porqué se han reportado porcentajes tan elevados?
José Gonzalo Lugo PérezEstadística Básica
Ejercicio
• Determine cuál de las siguientes proposiciones es de naturaleza descriptiva y cuál es inferencial.
a) Lo que menos agrada al 99% de todos los viajeros robustos y altos son los asientos estrechos de los aviones.
b) Lo que menos agrada al 99% de los 10 000 clientes de la King-Size Co. Son los asientos estrechos de los aviones.
José Gonzalo Lugo PérezEstadística Básica
Términos Básicos
• Población
• Muestra
• Variable
• Dato
• Datos
• Experimento
• Parámetros
• Estadística
José Gonzalo Lugo PérezEstadística Básica
Población
• Es la colección o conjunto de individuos, objetos o eventos cuyas propiedades serán analizadas.
Ejemplo de población bien definida
• “Todos los estudiantes que han asistido alguna vez a una universidad mexicana”
• “El conjunto de trabajadores de la industria entre 20 y 40 años en el Estado de Querétaro”
José Gonzalo Lugo PérezEstadística Básica
Muestra
• Es un subconjunto de la población
Una muestra consta de los individuos, objetos o medidas seleccionados de la población por el recolector de la muestra
José Gonzalo Lugo PérezEstadística Básica
Variable
• Característica de interés sobre cada elemento individual de una población o muestra
• Ejemplo: La edad de un estudiante que ingresa a la universidad, el color de su cabello, su estatura y su peso
José Gonzalo Lugo PérezEstadística Básica
Dato
• Valor de la variable asociada a un elemento de una población o muestra. Este valor puede ser un número, una palabra o un símbolo
• Ejemplo: José Hernández ingresó a la universidad a la edad de “23” años, su cabello es “café”, mide “1.80m” y pesa “83 kg”. Estas cuatro piezas de datos son los valores de las cuatro variables aplicadas a José Hernández.
José Gonzalo Lugo PérezEstadística Básica
Datos
• Conjunto de valores recolectados para la variable de cada uno de los elementos que pertenecen a la muestra
• Ejemplo: El conjunto de 25 estaturas recolectadas de 25 estudiantes.
José Gonzalo Lugo PérezEstadística Básica
Experimento
• Actividad planeada cuyos resultados producen un conjunto de datos
• El experimento incluye las actividades para seleccionar los elementos y obtener los valores de los datos
José Gonzalo Lugo PérezEstadística Básica
Parámetro
• Valor numérico que resume todos los datos de una población completa. Es un valor que describe a toda la población.
• Ejemplo: La edad “promedio” en el momento de admisión de todos los estudiantes que han asistido alguna vez a una universidad o la “proporción” de estudiantes que tenían más de 21 años de edad cuando ingresaron a la universidad.
José Gonzalo Lugo PérezEstadística Básica
Estadística
• Valor numérico que resume los datos de la muestra. Es un valor que describe una muestra. Casi todas las estadísticas muestrales se determinan con ayuda de fórmulas y suele asignárseles denominaciones simbólicas.
• Ejemplo: La estatura “promedio” encontrada al utilizar el conjunto de 25 estaturas es un ejemplo de una estadística muestral.
José Gonzalo Lugo PérezEstadística Básica
Determinar los términos básicos...
• Una estudiante de estadística está interesada en determinar algo sobre el promedio del valor en pesos de los automóviles que pertenecen al cuerpo docente de nuestra universidad.
• Cada uno de los ocho términos descritos pueden identificarse en esta situación
José Gonzalo Lugo PérezEstadística Básica
Determinar los términos básicos...
• La población es la colección de todos los automóviles que pertenecen a todos los miembros del cuerpo docente de la universidad.
• Una muestra es cualquier subconjunto de esa población. Por ejemplo, una muestra serían los automóviles que pertenecen a los profesores del departamento de matemáticas.
• La variable es el “valor en pesos” de cada automóvil individual.
• Un dato podría ser el valor en pesos de un automóvil en particular. El automóvil del profesor Juan Pérez está valuado en $100,000 pesos
• Los datos serían el conjunto de valores que corresponden a la muestra obtenida ($100,000; $148,000; $30,000; $23,000...)
• El experimento serían los métodos aplicados para seleccionar los automóviles que integren la muestra y determinar el valor de cada automóvil de la muestra. Podría efectuarse preguntando a cada miembro del departamento de matemáticas o de otras maneras.
• El parámetro sobre el que se está buscando información es el valor “promedio” de todos los automóviles de la población.
• La estadística que se encuentre es el valor “promedio” de todos los automóviles de la muestra.
José Gonzalo Lugo PérezEstadística Básica
Variable
Cualitativa Cuantitativa
Variable que clasifica o describe un elemento de una población. Las operaciones aritméticas como sumar y obtener promedios no son significativas para datos que resultan de una variable cualitativa
Variable que cuantifica un elemento de una población. Las operaciones aritméticas como sumar y obtener promedios sí son significativas para datos que resultan de una variable cuantitativa
José Gonzalo Lugo PérezEstadística Básica
Ejercicio 1
• Un fabricante de medicamentos está interesado en la proporción de personas que padecen hipertensión (presión arterial elevada) cuya condición pueda ser controlada por un nuevo producto desarrollado por la empresa. Se condujo un estudio en el que participaron 5000 personas que padecen de hipertensión, y se encontró que 80% de las personas pueden controlar su hipertensión con el medicamento. Suponiendo que las cinco mil personas son representativas del grupo con hipertensión, conteste las siguientes preguntas:
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) Identifique el parámetro de interés
d) Identifique la estadística y proporcione su valor
e) ¿Se conoce el valor del parámetro?
José Gonzalo Lugo PérezEstadística Básica
Ejercicio 2
• Un técnico de control de calidad selecciona piezas ensambladas de una línea de montaje y registra la siguiente información sobre cada pieza:
– A: defectuosa o no defectuosa
– B: el número de identificación del trabajador que ensambló la pieza.
– C: el peso de la pieza.
a) ¿cuál es la población?
b) La población ¿es finita o infinita?
c) ¿cuál es la muestra?
d) Clasifique las respuestas para cada una de las tres variables como datos de atributo o cuantitativos.
José Gonzalo Lugo PérezEstadística Básica
Ejercicio 3
• Identifique las siguientes expresiones como ejemplos de variables de atributos (cualitativas) o variables numéricas (cuantitativas)
a) La resistencia a la rotura de un tipo de cuerda dado
b) El color de cabello de los niños que se presentan a una audición para la revista musical Annie
c) El número de señales de alto que hay en poblaciones con menos de quinientos habitantes
d) Si un grifo es o no defectuoso
e) El número de reactivos contestados correctamente en una prueba estandarizada
f) El tiempo necesario para contestar una llamada telefónica en cierta oficina de bienes raíces.
José Gonzalo Lugo PérezEstadística Básica
Recolección de Datos
• Definir los objetivos de la investigación o del experimento.
– Ejemplos: comparar la eficacia de un nuevo medicamento con la eficacia del medicamento normal; estimar el ingreso familiar medio en algún municipio.
• Definir la variable y la población de interés.
– Ejemplos: duración del tiempo de recuperación de los pacientes que sufren alguna enfermedad particular; ingreso total de los hogares en algún municipio.
• Definir los esquemas para recolectar y medir los datos.
– Esto incluye los procedimientos de muestreo, el tamaño de la muestra y el instrumento de medición (cuestionario, por teléfono, etc.) de los datos.
• Determinar las técnicas idóneas para realizar el análisis de datos: descriptivas o inferenciales.
José Gonzalo Lugo PérezEstadística Básica
Nota:
• A menudo ocurre que un analista se encuentra con datos ya recolectados, tal vez, incluso, recolectados para otros fines, lo cual imposibilita determinar si los datos son “buenos” o no. Es mucho mejor recolectar los datos propios.
• A continuación se describe la población y la variable de interés para una investigación específica:
– La oficina de inscripciones de nuestra universidad desea estimar el costo “promedio” actual de los libros de texto por semestre, por estudiante. La población de interés es la “matrícula estudiantil actual”, y la variable es la “cantidad total gastada en libros de texto” por cada estudiante en este semestre.
José Gonzalo Lugo PérezEstadística Básica
Métodos para recolectar datos
Experimento
Encuesta
Se controla o modifica el entorno y se observa el efecto sobre la variable bajo estudio.
Los datos se obtienen al muestrear alguna parte de la población de interés.No se modifica el entorno
José Gonzalo Lugo PérezEstadística Básica
Marco Muestral
• Es una lista de los elementos que pertenecen a la población de la cual se obtendrá la muestra.
José Gonzalo Lugo PérezEstadística Básica
Diseño de la Muestra
• Es importante que el marco muestral sea representativo de la población. Una vez establecido, se procede a la selección de los elementos de la muestra. Este proceso de selección se denomina Diseño de la Muestra. Este se clasifica en dos categorías:
– Muestreo de Juicio (o de Selección intencional)
– Muestreo probabilístico
José Gonzalo Lugo PérezEstadística Básica
Muestreo de Juicio (o de Selección intencional)
• Las muestras son elegidas con base en el hecho de que son “típicas”
José Gonzalo Lugo PérezEstadística Básica
Muestreo Probabilístico
• Son muestras en que los elementos a seleccionar se obtienen con base en la probabilidad. Cada elemento de una población tiene cierta probabilidad de ser elegido como parte de la muestra. Uno de los métodos más comúnmente utilizado para recolectar datos es el muestreo aleatorio.
José Gonzalo Lugo PérezEstadística Básica
Muestreo Aleatorio
• Una muestra es seleccionada de modo que todos los elementos de la población tienen la misma probabilidad de ser elegidos. De igual manera, todas las muestras de tamaño n tienen la misma probabilidad de ser elegidas. Las muestras aleatorias se obtienen por muestreo con reemplazamiento en una población finita o por muestreo sin reemplazamiento en una población infinita.
José Gonzalo Lugo PérezEstadística Básica
Ejemplo
• El señor Hernández quien trabaja en la oficina de inscripciones, ha obtenido un listado por computadora de la matrícula de tiempo completo para este semestre. Hay 4265 nombres de estudiantes en la lista. El señor Hernández numeró los nombres de los estudiantes como 0001, 0002, 0003, etc., hasta 4265; luego, usando números aleatorios de cuatro cifras, identificó una muestra: 1288, 2177, 1952, 2463, 1644, 1004, etc.
José Gonzalo Lugo PérezEstadística Básica
Ejercicio 4
• Considere una población simple que consta sólo de los números 1, 2 y 3 (una cantidad ilimitada de cada uno). Hay nueve muestras distintas de tamaño dos que pueden obtenerse de esta población: (1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1), (3,2), (3,3).
a) Explique porqué la lista anterior de muestras representa todas las posibles muestras aleatorias de tamaño dos que pueden extraerse aleatoriamente de la población {1, 2, 3}.
b) Si la población consta de los números 1, 2, 3 y 4, enumere todas las muestras de tamaño dos que pueden elegirse.
c) Si la población consta de los números 1, 2 y 3, enumere todas las muestras de tamaño tres que pueden elegirse
d) Si la población consta de los números 1, 2, 3 y 4, enumere todas las muestras de tamaño tres que pueden elegirse
José Gonzalo Lugo PérezEstadística Básica
Probabilidad vs Estadística
La probabilidad es el vehículo de la estadística
José Gonzalo Lugo PérezEstadística Básica
Ejercicio 5
• Clasifique cada una de las siguientes afirmaciones como problema de probabilidad o de estadística.
– Determinar si un nuevo medicamento reduce el tiempo de recuperación de cierta enfermedad.
– Determinar la posibilidad de obtener “cara” cuando se lanza una moneda
– Determinar el tiempo de espera necesario para pagar y salir de una tienda
– Determinar la posibilidad de obtener una mano de “veintiuno”
– Determinar cuánto tiempo es necesario para manejar un sondeo telefónico típico en una oficina de bienes raíces
– Determinar la duración de la vida de los focos de 100 watts producidos por una empresa
– Determinar la posibilidad de extraer una bola azul de un tazón que contiene 15 bolas, de las cuales 5 son azules.
– Determinar la resistencia al corte de los remaches recientemente adquiridos por una compañía para construir aviones.
José Gonzalo Lugo PérezEstadística Básica
El proceso estadísticoPoblación estadística
Recolección de datos sobre los cuales se desea
reunir informaciónConclusiones
Objetivo del análisis¿Qué es necesario
conocer?¿Qué espera encontrarse?
¿Cómo se obtendrán los datos de la muestra?
MuestraDatos
recolectados de la población
Estadísticas de la muestra
Gráfica numérica
x
y
Determinar lo que se quiere saber
Recolectar datos
Análisis de datos
Analizar las estadísticas. Determinar lo que indican sobre la población