estadistica descriptiva
TRANSCRIPT
LOGO
UNIVERSIDAD BOLIVIANA DE INFORMÁTICA
CARRERA: INGENIERÍA COMERCIAL ASIGNATURA: ESTADÍSTICA DESCRIPTIVA DOCENTE: LIC. FRANKLIN BLANCO
LA PAZ - BOLIVIA
U.B.I.
Lic. Franklin Blanco
Contenido de la asignatura de Estadistica
Distribuciones Bidimencionales
Metodo para el analisis descriptivo de datos cualitativos
Organización y Clasificación de datos
Introducción a la estadística
Series Cronologicas
Metodo para el analisis descriptivo de datos cuantitativos
Números Indices
Tema 1
U.B.I.
Lic. Franklin Blanco
1.El 63% de las ventas de automóviles
producidos por Toyota son fuera de Japón.
2.La tasa de desempleo bajo 8,2% la mínima en
25 años en el país.
3.La inflación en este año alcanzara un máximo
de 6.2%.
4.El 70% de los vuelos comerciales a nivel
nacional están liderados por BOA y por TAM.
Tema 1
¿Qué es la Estadistica?
Es una ciencia que proporciona un conjunto de métodos que se utilizan para recolectar, resumir, clasificar, analizar e interpretar el comportamiento de los datos con respecto a una característica materia de estudio o investigación.
Se encarga de obtener información, describirla y luego se usa esta información a fin de predecir “algo” respecto a la fuente de información.
U.B.I.
Lic. Franklin Blanco
Tema 1
U.B.I.
Lic. Franklin Blanco
La palabra "estadística" procede del latín
statisticum collegium ("consejo de Estado")y
de su derivado italiano statista ("hombre de
Estado" o "político"). El término alemán
Statistik, introducido por Gottfried Achenwall
(1749), designaba originalmente el análisis de
datos del Estado, es decir, "la ciencia del
Estado". No fue hasta el siglo XIX cuando el
término estadística vino a designar la
colección y clasificación de datos.
División de la estadística
1. Estadistica Descriptiva. Es el conjunto de métodos que implican
la recolección, presentación y caracterización de un conjunto de datos a fin de describir en forma apropiada las diversas características de estas.
Es decir, un estudio estadístico se considera “DESCRIPTIVO” cuando solo se analiza y describe los datos.
U.B.I.
Lic. Franklin Blanco
Ejemplo 1
Un gerente de personal desea conocer las aptitudes de cinco secretarias de una compañía.
Se aplica la prueba y se obtiene las siguientes calificaciones 85, 90, 93, 82 y 95 puntos.
Utilizamos una medida estadística que es la MEDIA ARITMÉTICA, la cual es la suma de los valores observados dividida entre el numero de observaciones.
¿Cuál es la calificación promedio?
U.B.I.
Lic. Franklin Blanco
El resultados se limita a los datos obtenidos en ese caso particular y no implica ninguna generalización acerca de las aptitudes de las secretarias de las otras oficinas de la compañía.
U.B.I.
Lic. Franklin Blanco
85 + 90 + 93 + 82 + 95 = 445 = 89 puntos
5 5
Ejemplo 1
División de la estadística
1. Estadistica Inferencial.
Es el conjunto de métodos o técnicas que posibilitan la generalización o toma de decisiones en base a una información parcial obtenida mediante técnicas descriptivas.
Es decir, un estudio estadístico, se considera inferencial cuando se pretende inferir o predecir conclusiones que atañen a toda la fuente de información de donde proviene los datos (probabilidad).
U.B.I.
Lic. Franklin Blanco
Ejemplo 2
Supongamos que el gerente de personal desea conocer la aptitud promedio de todas secretarias de la compañía, pero carece de tiempo o de los recursos para aplicar una prueba de aptitudes a todas ellas.
Entonces decide usar la aptitud promedio de
la cinco secretarias para estimar la aptitud promedio de todas las secretarias de la compañía.
El proceso de estimar esta aptitud promedio
global será un problema de la INFERENCIA ESTADISTICA.
U.B.I.
Lic. Franklin Blanco
Ejemplo 3
U.B.I.
Lic. Franklin Blanco
Ejemplo 4
U.B.I.
Lic. Franklin Blanco
U.B.I.
Lic. Franklin Blanco
POBLACIÓN Y MUESTRA
U.B.I.
Lic. Franklin Blanco
Es la colección de todos los individuos, objetos u observaciones
que poseen al menos una característica común
Población personas
Región
Localidad
País
Universo =
Ejemplo 5
U.B.I.
Lic. Franklin Blanco
Es importante definir la población de acuerdo a la
naturaleza y extensión del problema de estudio
•Las edades de los estudiantes de Bolivia.
•Las edades de los alumnos del sistema universitario
Boliviano.
•Los diámetros de la producción diaria de tuercas.
•Las placas de los automóviles que circulan en un país.
•Los pacientes con poliomielitis sometidos a una determinada
terapéutica de rehabilitación.
•Los enfermos de SIDA, tratado con uno de tres tratamientos
diferentes.
U.B.I.
Lic. Franklin Blanco
Al referimos a la naturaleza del problema,
optamos también por distinguir entre lo que
podemos llamar población "objeto" y población
"objetivo"
Población objeto es el conjunto de
elementos de la materia de estudio
Población objetivo las diferentes medidas de la característica que nos
interesa de la población objeto.
POBLACIÓN FINITA es aquella que tiene un
número limitado de elementos. Por ejemplo, las
estaturas de todos los estudiante que actualmente
estudian en las universidades del Bolivia.
POBLACIÓN INFINITA es aquella que no tiene
limite, es decir, tiene un número infinito de
elementos. Por ejemplo, la calidad de todas las
unidades producidas mediante un proceso
manufacturero
U.B.I.
Lic. Franklin Blanco
Parámetro es una medida resumen que describe una característica de toda la población.
Los parámetros son características medibles de
una población y naturalmente para determinar su
valor es necesario utilizar la información de toda
la población.
Por ejemplo, la edad promedio de los escolares del
primer año de secundaria de los colegios de Bolivia,
es una característica medible (por tanto un
parámetro) de la población formada por las edades
de todos los escolares del primer año de secundaria
del país; es pues la media de la población. Lic. Franklin Blanco
Los parámetros más usados son:
- La media poblacional = µ (que se lee mu)
- Proporción poblacional = p (que se lee pe)
- Desviación típica poblacional = σ (que se lee sigma)
U.B.I.
Lic. Franklin Blanco
Muestra es una parte o un subconjunto
representativo de la población. y al proceso de
obtener la muestra se llama muestreo.
Notación: El número de observaciones (o
tamaño) de la muestra se denota por "n",
El número de observaciones en una muestra es
menor que el número de observaciones posibles
en la población, de otra forma, la muestra sería la
población misma.
Para determinar la proporción de partes
defectuosas producidas en cierto proceso de
fabricación, los técnicos de control de calidad
examinan un lote de unidades producidas para
determinar el número de defectuosas contenida
en él. La proporción de la población, la cual es
un parámetro que se desconoce, es la
proporción de todas las unidades defectuosas
producidas en el proceso; se estima mediante
la proporción de la muestra, la cual es la
proporción de las unidades defectuosas
contenida en la muestra.
En un lote de 300 unidades producidas en el
proceso de fabricación, el ingeniero de control de
calidad encuentra 45 defectuosas, entonces la
proporción de defectuosas en la muestra será
45/300 = 0.15 (15%).
El promedio de la muestra, como la proporción de la muestra en los ejemplos considerados en el párrafo anterior son características medibles de las muestras.
U.B.I.
Lic. Franklin Blanco
Estadístico o Estadígrafo es una medida resumen que describe una característica de la muestra.
Se realiza una votación preliminar para determinar las preferencias de los electores en una elección presidencial. Con este fin se entrevistan 1500 electores registrados y entre ellos 860 están a favor del candidato A.
U.B.I.
Lic. Franklin Blanco
a) ¿Qué constituye la muestra?
b) ¿Qué constituye la población?
c) ¿La población es finita o infinita?
d) ¿Cuál es el parámetro de la
población?
e) ¿Cuál es el estadístico de la muestra?
RESPONDA LO SIGUIENTE:
U.B.I.
Lic. Franklin Blanco
a) La muestra está constituida por las respuestas de
1500 electores registrados.
b) La población está constituida por las respuestas
de todos los electores registrados.
c) La población es finita.
d) El parámetro de la población será la proporción
de todos los electores registrados que están a
favor del candidato A.
e) El estadístico de la muestra es la proporción de
los 1 500 electores registrados que están a favor
del candidato A. Es decir 860/1 500 "" 0.57 (57%).
SOLUCIÓN:
U.B.I.
Lic. Franklin Blanco
•Supóngase que el 60% de todos los
electores registrados en un país son
integrantes de un partido A y el 40% no.
A partir de una muestra de 500 electores,
se encuentra que 250 pertenecen al
partido A. Responda lo siguiente:
Problema 1.
U.B.I.
Lic. Franklin Blanco
a) ¿Cuál es la proporción de electores en la muestra
que pertenecen al partido A?
b) ¿Cuál es la proporción de electores en la población
que pertenecen al partido A?
c) ¿La población es finita o infinita'?
d) ¿Cuál es el parámetro de la población?
e) ¿Cuál es el estadístico de la muestra?
Determine lo siguiente:
U.B.I.
Lic. Franklin Blanco
a) La proporción de los electores en la muestra que
pertenecen al partido A es de 250.
b) La proporción de electores en la población que
pertenecen al partido A es 60%
c) La población es finita.
d) El parámetro de la población será la proporción
de todos los electores registrados que están a
favor del candidato A.
e) El estadístico de la muestra es la proporción de
los 500 electores registrados que están a favor
del candidato A. Es decir 250/500 "" 0.5 (50%).
SOLUCIÓN:
U.B.I.
Lic. Franklin Blanco
Se realiza un muestreo de opinión para
determinar si las amas de casa de la
ciudad de el alto prefieren un
detergente de marca OMO con
respecto a ACE. Con este fin se
entrevistan 2000 amas de casa y entre
ellas 1500 prefieren OMO.
Problema 2.
U.B.I.
Lic. Franklin Blanco
a) ¿Qué constituye a la muestra?
b) ¿Qué constituye a la población?
c) ¿ La población es finita o infinita?
d) ¿Cuál es el parámetro de la
población?
e) ¿Cuál es el estadístico de la muestra?
Determinar lo siguiente:
U.B.I.
Lic. Franklin Blanco
SOLUCIÓN:
a) La muestra está constituida por las respuestas de
las 2000 amas de casa entrevistadas.
b) La población está constituida por las respuestas
de todas las amas de casa entrevistadas.
c) La población es finita.
d) El parámetro de la población será la proporción
de todas las amas de casa que se inclinaron por
la preferencia hacia OMO.
e) El estadístico de la muestra es la proporción de
los 2000 amas de casa que se inclinaron por la
preferencia hacia OMO.. Es decir 1500/2000 0.75
(75%).
U.B.I.
Lic. Franklin Blanco
USOS DE LA ESTADÍSTICA
U.B.I.
Lic. Franklin Blanco
La Estadística proporciona un conjunto de
métodos aplicables en todas las áreas
científicas donde se acumulan, se analizan y se
interpretan datos. Resulta, pues muy difícil
nombrar áreas donde no se aplica. Citaremos
aquí brevemente algunos campos en los cuales
los métodos estadísticos juegan un papel
principal, como: Salud y Medicina. Biología,
Economía, Administración, Contabilidad,
Ingeniería, etc. y en la Investigación Científica.
U.B.I.
Lic. Franklin Blanco
EN SALUD Y MEDICINA: Las estadísticas de salud
incluyen toda información numérica relacionada de
modo directo con los problemas de salud, concebidos
en una escala social. Podemos citar muchos ejemplos
que muestran lo necesario que son las estadísticas de
salud, lado a lado con los métodos para su análisis e
interpretación para fomentar y desarrollar una política
sanitaria adecuada. Las siguientes interrogantes y
muchas más que encuentran respuesta en las
estadísticas de salud, son una muestra de
ellos:
Interrogantes
U.B.I.
Lic. Franklin Blanco
¿Cuál es la causa más importante de muerte en ésta
región: el cáncer?, la tuberculosis? , los accidentes de
tránsito?
¿A qué edad resulta más alta la mortalidad y por cuál
enfermedad?
¿En qué zona, determinado tipo de enfermedad presenta
una incidencia mucho más elevada que la incidencia
promedio?
¿Qué condiciones prevalecen en esas zonas?
¿Existen algunas áreas específicas o algunas épocas en
que se registran preferentemente brotes de alguna
enfermedad?
U.B.I.
Lic. Franklin Blanco
Algunos usos principales de las estadísticas de
salud son las siguientes:
- Describir el nivel de salud de una comunidad
- Diagnosticar las enfermedades de una comunidad.
- Encontrar soluciones a los problemas de salud.
- Determinar prioridad para los programas de salud.
U.B.I.
Lic. Franklin Blanco
EN ECONOMÍA:
La estadística constituye uno de los pilares de
la aplicación de la teoría. económica. Se
utiliza en la descripción de fenómenos
económicos, en la estimación de las
relaciones económicas, en la verificación de
las teorías económicas y en la predicción y
previsión de las variables económicas
U.B.I.
Lic. Franklin Blanco
EN BIOLOGÍA: La estadística se puede utilizar
para estimar el tamaño real de la población de una
especie animal particular, la propagación de
bacterias, en mejorar la raza de los animales.
U.B.I.
Lic. Franklin Blanco
LA ESTADÍSTICA EN EL DESARROLLO DE LA
INVESTIGACIÓN
El desarrollo del conocimiento en la
ciencia, se caracteriza porque su
ejecución se lleva a cabo según un
método: "El método científico". La
aplicación de este método es lo que
diferencia al conocimiento científico del
conocimiento ordinario.
U.B.I.
Lic. Franklin Blanco
Las etapas del método científico, según el
matemático filosofo Bertrand Russel son
tres:
1. La Observación del fenómeno que se
estudia.
2. La formulación de una (o de varias)
hipótesis mediante la cual puedan
explicarse los hechos observados.
3. La Verificación de las hipótesis
mediante observaciones.
U.B.I.
Lic. Franklin Blanco
EL METODO ESTADISTICO
El método científico de investigación se
basa en dos tipos de razonamiento: el
DEDUCTIVO y el INDUCTIVO.
De lo general
particular
De lo particular
a lo general
U.B.I.
Lic. Franklin Blanco
Utiliza el razonamiento matemático: se establecen Hipótesis
generales que caracterizan un problema y se deducen ciertas
propiedades particulares por razonamientos lógicos
DEDUCTIVO
Realiza un proceso inverso a partir de observaciones
particulares de ciertos fenómenos se intenta deducir unas
reglas generales aplicables a todos ellos
INDUCTIVO
U.B.I.
Lic. Franklin Blanco
La investigación estadística se desarrolla
utilizando el ciclo DEDUCTIVO-
INDUCTIVO en las siguientes 4 etapas:
a) Planteamiento del problema.
b) Recolección de la información.
c) Organización y clasificación de los
datos recogidos.
d) Análisis e interpretación de los
resultados.
U.B.I.
Lic. Franklin Blanco
Planteamiento del problema
El primer paso de la investigación es definir
claramente los objetivos del estudio y
relacionar este objetivo con los valores
numéricos de las variables observables.
La investigación científica es una actividad
con propósito (finalidad, meta) y como tal
debe dar respuesta a las siguientes
interrogantes:
U.B.I.
Lic. Franklin Blanco
1. ¿En que consiste el problema objeto de
investigación? ¿Qué se quiere conocer?
2. ¿Por qué o para que se plantea su
investigación?
3. ¿Sobre quien recae la investigación?
4. ¿Como se va investigar?
5. ¿Quién va realizar la investigación?
6. ¿Donde se va realizar?
7. ¿Cuándo se va realizar?
U.B.I.
Lic. Franklin Blanco
Solo cuando se esta en condiciones de dar
respuesta a todas estas interrogantes se puede
redactar el protocolo de un trabajo de
investigación (Documento Básico).
Los objetivos surgen al contestar la pregunta
acerca de para que se va realizar la
investigación.
U.B.I.
Lic. Franklin Blanco
LA HIPOTESIS
Es una conjetura, un supuesto o
proposición acerca de determinados
hechos que va mas allá (trasciende) de
los datos (evidencia empírica) que
intenta explicar.
Es una herramienta en la tarea científica, que pretende explicar o interpretar ciertos hechos, pero que va mas allá de los mismos,
U.B.I.
Lic. Franklin Blanco
Cuando se ha considerado un problema
científico y se ha logrado formular una
hipótesis en relación al mismo, la labor
investigativa posee un grado de lucidez y de
claridad considerablemente mayor. Es
precisamente esta claridad la que permite
definir los objetivos con mucha mayor
precisión y orientar la realización de los
experimentos o la práctica de las
observaciones con un alto grado de
especificidad.
U.B.I.
Lic. Franklin Blanco
RECOLECCIÓN DE LA INFORMACIÓN
La recolección correcta de los datos es de extrema importancia para el investigador ,que tiene que ser realizada o vigilada por éste.
Esta etapa consiste en: determinar los métodos
de recolección adecuado, preparar los
instrumentos de recolección, prueba del método
y de los instrumentos de recolección
seleccionados, y realizar la recolección de los
datos.
U.B.I.
Lic. Franklin Blanco
ORGANIZACIÓN Y CLASIFICACIÓN DE LOS DATOS
Aquí se debe hacer un análisis de
consistencia y ajuste de los datos. Se
trata de asegurar la validez y
confiabilidad de los datos recopilados.
Luego se debe clasificar y tabular los
datos y finalmente presentarlos en
cuadros estadísticos y gráficas.
U.B.I.
Lic. Franklin Blanco
ANÁLISIS E INTERPRETACIÓN DE LOS RESULTADOS
En esta etapa se calculan
indicadores y medidas resumen que
describen al conjunto de datos.
También se establece relaciones
entre variables de modelos
estadísticos que nos permitirán
aceptar o rechazar los modelos.
U.B.I.
Lic. Franklin Blanco
RECOLECCIÓN DE LOS DATOS
Desarrollaremos aquí, la segunda etapa
del método de investigación estadística,
que comprende la recolección de la
información, y fundamentalmente los
principales procedimientos y métodos que
son utilizados para recolectar la
información necesaria para un estudio
determinado.
U.B.I.
Lic. Franklin Blanco
ALGUNOS PROCEDIMIENTOS Y MÉTODOS PARA
RECOLECTAR DATOS
Existen tres métodos básicos con los
cuales el investigador puede obtener los
datos deseados: en primer lugar, el
investigador puede recurrir a datos ya
publicados por fuentes gubernamentales,
industriales o individuales; en segundo
lugar, puede diseñar un experimento para
obtener los datos necesarios, y en tercer
lugar, puede efectuar una encuesta.
U.B.I.
Lic. Franklin Blanco
1. FUENTES DE INFORMACIÓN
FUENTE DE
DA TOS
INTERNOS
Información recopilada por la empresa de los
resultados de su propia gestión
a) Reportes financieros.
b) Reportes de operaciones,
que están dadas por la
información de la producción,
ventas, compras, estados de
pérdidas y ganancias.
c) Reportes especiales, es
información adicional para
análisis específico.
U.B.I.
Lic. Franklin Blanco
FUENTES DE
DATOS
EXTERNOS
FUENTES
PRIMARIAS
FUENTES
SECUNDARIAS
Son informaciones estadísticas
elaboradas por instituciones
especializadas en investigación
La información estadística es
obtenida directamente de la
unidad de observación; los
resultados de los censos de
población y vivienda, índices de
precios al consumidor.
Se obtiene información
estadística elaborada a base de
los datos de fuentes primarias
U.B.I.
Lic. Franklin Blanco
DISEÑO DE EXPERIMENTO
Un segundo método de recolección de la información
es con un diseño de experimentos. Los diseños
experimentales deben utilizarse siempre que sea
posible cuando se desee construir modelos
explicativos, y sus estudios suelen ser materia de
textos más avanzados, ya que implican
procedimientos estadísticos complejos.
Es el proceso de recopilar información a través de una
muestra, se efectúa con propósito especifico (tiene
alcance restringido) en un sector de la población.
U.B.I.
Lic. Franklin Blanco
Con objeto de brindarle un mejor servicio,
le pedimos conteste por favor estas breves
preguntas.
1. ¿Qué le pareció la comida?
excelente buena regular mala
2. El servicio fue...
excelente bueno regular malo
3. El lugar le parece...
Agradable Bonito Sin
trascendencia Feo
4. Los baños (si los visitó) le parecieron:
Limpios Sucios Muy sucios
5. El servicio de valet parking fue:
Rápido lento regular
6. Le gusto el restaurante
sí no
7. Los precios se le hicieron:
muy caros Normales baratos
8. Regresaría a comer aquí:
sí no
9. Recomendaría el lugar:
sí no
10. Algún comentario adicional que guste
dejarnos
…………………………………………………
…………………………………………………
Agradecemos su tiempo, fue un placer
servirle.
¡Vuelva pronto!
EJEMPLO DE ENCUESTA SEMI CERRADA
U.B.I.
Lic. Franklin Blanco
TIPOS DE DATOS
Sea cual fuere la fuente de la que obtenemos la
información, esta puede estar referida a características
CUALITATIVAS o CUANTITATIVAS.
a) Las primeras se refieren a cualidades tales como,
color: blanco, azul, etc.; estado civil: casado,
soltero, etc.; profesión: economista, ingeniero, etc.;
calidad de un producto: bueno, regular, etc.
b) Los segundos se refieren a cantidades tales como:
estatura en cm., salario en Bs., numero de hijos de
una familia, número de dormitorios por vivienda,
etc.
U.B.I.
Lic. Franklin Blanco
CUALITATIVA : Se dirige a la interpretación de
los significados de las acciones de los sujetos se basa en métodos de recolección de datos sin medición numérica como descripciones y las observaciones
CUANTITATIVA: Se centra en procesos y observaciones cuantificables y el análisis de datos para contestar preguntas de investigación y probar hipótesis, confía en la medición numérica el conteo y la estadística.
U.B.I.
Lic. Franklin Blanco
Con cada característica materia de investigación, asociamos
una variable; así, podemos dar la definición siguiente:
VARIABLE Es una característica de la población que se va
investigar y que puede tomar diferentes valores.
Así, por ejemplo una variable sería, las horas extras
trabajadas por los trabajadores de una empresa y los valores
de esta variable vendrían dadas por las diferentes horas
trabajados por cada trabajador fuera de la jornada normal:
ninguna, una, dos, tres, ....
Notación: Las variables se denotarán por X, Y, etc.
Las variables se clasifican en: cualitativas y cuantitativas.
U.B.I.
Lic. Franklin Blanco
Por su parte, las variables cuantitativas se pueden
clasificar en discretas y continuas:
Discretas: sólo pueden tomar valores enteros (1, 2,
8, -4, etc.). Por ejemplo: número de hermanos (puede
ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser
3,45).
Continuas: pueden tomar cualquier valor real dentro
de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.
U.B.I.
Lic. Franklin Blanco
DATOS Son los valores recopilados como
resultado de las observaciones de una
característica o variable. Llamados también series
estadísticas.
Como hay dos tipos de variables: cualitativas y
cuantitativas, diremos también que hay dos tipos
de datos: datos cualitativos y cuantitativos. Los
datos cuantitativos, se pueden considerar
también como datos discretos y datos continuos.
U.B.I.
Lic. Franklin Blanco
En toda actividad de carácter científico, lo que se hace en última
instancia, es dar respuesta a ciertas preguntas.
DISEÑO O ELABORACIÓN DE FORMULARIOS
Los formularios recogen dos clases de datos:
1. Administrativos o de identificación
2. Sobre el problema que se estudia.
Los primeros ayudan a identificar las unidades estadísticas de
observación o incluyen el nombre de la persona, su edad, sexo,
residencia o ubicación, fecha de realización del estudio, etc.
RAZÓN SOCIAL
NOMBRE DEL PUESTO ANTIGUEDAD
RELACION FAMILIAR CON LA EMPRESA SI NO
PUESTO INMEDIATO SUPERIOR
PUESTO INMEDIATO INFERIOR
U.B.I.
Lic. Franklin Blanco
Los segundos se refieren específicamente al problema que
se investiga.
Antes de elaborar el formulario debe considerarse:
l. El propósito para el cual será utilizado.
2. Circunstancias bajo las cuales se recogerán la
información.
Lo primero tiene importancia para decidir sobre los datos
que se recogerán y lo segundo para la determinación del
tamaño y del material más conveniente
U.B.I.
Lic. Franklin Blanco
CONDICIONES DE UNA BUENA MUESTRA
Aunque cualquier parte de o subconjunto de
una población constituye una muestra, no
cualquier muestra resulta útil para hacer
inferencia. Las muestras deben cumplir
determinadas condiciones, podríamos decir
que estas son dos:
1. La relativa al tamaño muestral, y
2. La calidad Muestral.
U.B.I.
Lic. Franklin Blanco
TIPOS DE MUESTRAS
Existen básicamente dos clases de muestras: muestra no
probabilística y muestra probabilística.
MUESTRA NO PROBALÍSTICA Llamada también
muestras de conveniencia o de juicio, se basan en
el conocimiento y la opinión personal para
identificar los elementos de la población que van a
incluirse en la muestra. Una muestra seleccionada
a juicio se basa en el conocimiento de la población
por parte de una persona que generalmente es un
experto en la materia.
U.B.I.
Lic. Franklin Blanco
TIPOS DE MUESTRAS
MUESTRAS PROBABILÍSTICAS Son
aquellas en que todos los elementos de
la población tienen una posibilidad (una
posibilidad conocida) de ser incluida en
la muestra. Naturalmente no es
necesario que todos tengan la misma
posibilidad, basta que tengan alguna
posibilidad.
U.B.I.
Lic. Franklin Blanco
REDACCIÓN DE OBJETIVOS
a) Verbo en infinitivo Incrementar
b) Atributo del Objetivo (cualitativo)
Auditorias especiales
c) Escala o Medida (cuantitativo)
Nº de informes
d) Línea de base (punto de partida)
150 Informes de auditoria 50 – 25%
e) Meta (punto de llegada)
200 Informes de auditoria
f) Temporalidad 2013
Verbo de función NO (realizar)
Verbo de logro SI (Incrementar)
U.B.I.
Lic. Franklin Blanco
REDACCIÓN DE OBJETIVOS
a) Verbo en infinitivo Incrementar
b) Atributo del Objetivo (cualitativo)
Alcance de la señal / Cobertura nacional
c) Escala o Medida (cuantitativo)
Nº de Fibra Optica
d) Línea de base (punto de partida)
60 40 – 40%
e) Meta (punto de llegada)
100
f) Temporalidad 2013
El objetivo debe apuntar a la finalidad de la Oº y/o el
tema de investigación.
U.B.I.
Lic. Franklin Blanco
REDACCIÓN DE OBJETIVOS
a) Verbo en infinitivo Disminuir
b) Atributo del Objetivo (cualitativo)
Campañas de vacunación
c) Escala o Medida (cuantitativo)
Nº de casos de rabia canina
d) Línea de base (punto de partida)
1.500 casos de rabia 1350 – 90 %
e) Meta (punto de llegada)
150 casos de rabia
f) Temporalidad 2013
Verbo de función NO (realizar)
Verbo de logro SI (Disminuir)
U.B.I.
Lic. Franklin Blanco
Tema 2
Distribución de frecuencia
La distribución de frecuencia es la
representación estructurada, en forma
de tabla, de toda la información que se
ha recogido sobre la variable que se
estudia.
U.B.I.
Lic. Franklin Blanco
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
x x x x x
X1 n1 n1 f1 = n1 / n f1
X2 n2 n1 + n2 f2 = n2 / n f1 + f2
... ... ... ... ...
Xn-1 nn-1 n1 + n2 +..+ nn-1 fn-1 = nn-1 / n f1 + f2 +..+fn-1
Xn nn S n fn = nn / n S f
Siendo X los distintos valores que puede tomar la variable.
Siendo n el número de veces que se repite cada valor.
Siendo f el porcentaje que la repetición de cada valor supone sobre el total
U.B.I.
Lic. Franklin Blanco
Veamos un ejemplo: Medimos la altura de los niños de una clase y obtenemos los
siguientes resultados (cm):
Alumno Estatura Alumno Estatura Alumno Estatura
Alumno 1 1,25 Alumno 11 1,23 Alumno 21 1,21
Alumno 2 1,28 Alumno 12 1,26 Alumno 22 1,29
Alumno 3 1,27 Alumno 13 1,30 Alumno 23 1,26
Alumno 4 1,21 Alumno 14 1,21 Alumno 24 1,22
Alumno 5 1,22 Alumno 15 1,28 Alumno 25 1,28
Alumno 6 1,29 Alumno 16 1,30 Alumno 26 1,27
Alumno 7 1,30 Alumno 17 1,22 Alumno 27 1,26
Alumno 8 1,24 Alumno 18 1,25 Alumno 28 1,23
Alumno 9 1,27 Alumno 19 1,20 Alumno 29 1,22
Alumno 10 1,29 Alumno 20 1,28 Alumno 30 1,21
U.B.I.
Lic. Franklin Blanco
Si presentamos esta información estructurada
obtendríamos la siguiente tabla de frecuencia:
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
1,2 1 1 3,30% 3,30%
1,21 4 5 13,30% 16,60%
1,22 4 9 13,30% 30,00%
1,23 2 11 6,60% 36,60%
1,24 1 12 3,30% 40,00%
1,25 2 14 6,60% 46,60%
1,26 3 17 10,00% 56,60%
1,27 3 20 10,00% 66,60%
1,28 4 24 13,30% 80,00%
1,29 3 27 10,00% 90,00%
1,3 3 30 10,00% 100,00%
30 100,00%
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
1,2 1 1 3,30% 3,30%
1,21 4 5 13,30% 16,60%
1,22 4 9 13,30% 30,00%
1,23 2 11 6,60% 36,60%
1,24 1 12 3,30% 40,00%
1,25 2 14 6,60% 46,60%
1,26 3 17 10,00% 56,60%
1,27 3 20 10,00% 66,60%
1,28 4 24 13,30% 80,00%
1,29 3 27 10,00% 90,00%
1,3 3 30 10,00% 100,00%
30 100,00%
U.B.I.
Lic. Franklin Blanco
Si los valores que toma la variable son
muy diversos y cada uno de ellos se
repite muy pocas veces, entonces
conviene agruparlos por intervalos, ya que de otra manera obtendríamos una
tabla de frecuencia muy extensa que aportaría muy poco valor a efectos de
síntesis.
U.B.I.
Lic. Franklin Blanco
Distribuciones de frecuencia agrupada
Supongamos que medimos la estatura de los habitantes de
una vivienda y obtenemos los siguientes resultados (cm):
Habitante Estatura Habitante Estatura Habitante Estatura
Habitante 1 1,15 Habitante 11 1,53 Habitante 21 1,21
Habitante 2 1,48 Habitante 12 1,16 Habitante 22 1,59
Habitante 3 1,57 Habitante 13 1,60 Habitante 23 1,86
Habitante 4 1,71 Habitante 14 1,81 Habitante 24 1,52
Habitante 5 1,92 Habitante 15 1,98 Habitante 25 1,48
Habitante 6 1,39 Habitante 16 1,20 Habitante 26 1,37
Habitante 7 1,40 Habitante 17 1,42 Habitante 27 1,16
Habitante 8 1,64 Habitante 18 1,45 Habitante 28 1,73
Habitante 9 1,77 Habitante 19 1,20 Habitante 29 1,62
Habitante 10 1,49 Habitante 20 1,98 Habitante 30 1,01
U.B.I.
Lic. Franklin Blanco
Si presentáramos esta información en una tabla de
frecuencia obtendríamos una tabla de 30 líneas (una
para cada valor), cada uno de ellos con una
frecuencia absoluta de 1 y con una frecuencia
relativa del 3,3%. Esta tabla nos aportaría escasa
información
En lugar de ello, preferimos agrupar los datos por intervalos, con lo que la información queda más
resumida (se pierde, por tanto, algo de información), pero es más manejable e informativa:
U.B.I.
Lic. Franklin Blanco
Estatura Frecuencias absolutas Frecuencias relativas
Cm Simple Acumulada Simple Acumulada
1,01 - 1,10 1 1 3,30% 3,30%
1,11 - 1,20 3 4 10,00% 13,30%
1,21 - 1,30 3 7 10,00% 23,30%
1,31 - 1,40 2 9 6,60% 30,00%
1,41 - 1,50 6 15 20,00% 50,00%
1,51 - 1,60 4 19 13,30% 63,30%
1,61 - 1,70 3 22 10,00% 73,30%
1,71 - 1,80 3 25 10,00% 83,30%
1,81 - 1,90 2 27 6,60% 90,00%
1,91 - 2,00 3 30 10,00% 100,00%
30 100%
U.B.I.
Lic. Franklin Blanco
El número de tramos en los que se agrupa
la información es una decisión que debe
tomar el analista: la regla es que mientras más tramos se utilicen menos información
se pierde, pero puede que menos
representativa e informativa sea la tabla.
U.B.I.
Lic. Franklin Blanco
REPRESENTACIÓN TABULAR Y GRAFICA
Una ves que se ha ejecutado la investigación
y se ha recolectado y clasificado la
información o serie estadística, resulta
imprescindible representarlo de manera
adecuada, de tal forma que nos permita
hacer un análisis útil. Existen dos tipos de
representación: mediante los cuadros
estadísticos y gráficos.
CUADROS ESTADÍSTICOS
En un cuadro estadístico pueden representarse
características cualitativas, cuantitativas o una
combinación de ambas
La finalidad es ofrecer información resumida de
fácil lectura, comparación e interpretación.
La tabla de distribución de frecuencias es un caso
especial de un cuadro estadístico
PARTES DE UN CUADRO ESTADÍSTICO
Las partes esenciales de un cuadro estadístico son :
1. Número; 2 Título; 3. Cuadro propiamente
dicho; 4. Las notas explicativas o calce
1. NUMERO: Es el código de identificación del
cuadro. Este numero se escribe a continuación de
la palabra “CUADRO”. Por ejemplo cuadro Nº
2.5, indica el quinto cuadro del capitulo dos.
1. TÏTULO: este debe ser completo y ser conciso
a) SER COMPLETO: este debe indicar claramente cual
es el contenido del cuadro estadístico. Debe
responder a las preguntas: Que, Cómo, Dónde y
Cuándo.
QUE: a que se refiere la tabla que se estudia. Cual
es el universo que se investiga.
COMO: las variables ubicadas en las filas se
identifican con la proposición “POR” y las de
las columnas con la proposición “SEGÚN”
CUANDO: Momento o periodo de tiempo a que se
refiere el estudio.
DONDE: Lugar que se refiere la investigación
b) SER CONCISO: debe ser breve, lomas conciso
posible, pero no sacrificar la claridad de la
concisión
QUE: Distribución de mujeres de 15 a 49 años
COMO: Por area urbana, rural, y región natural, Según estado conyugal.
CUANDO: En 1986
DONDE: En el Perú
www.themegallery.com
Company Logo
Medidas de posición central
Las medidas de posición nos facilitan información
sobre la serie de datos que estamos analizando. Estas medidas permiten conocer diversas características de
esta serie de datos.
son de dos tipos
Medidas de
posición central:
informan sobre
los valores
medios de la
serie de datos.
Medidas de posición
no centrales:
informan de como se
distribuye el resto de
los valores de la serie.
U.B.I.
Lic. Franklin Blanco
Medidas de posición central
Las principales medidas de posición central son las siguientes:
1.- Media: es el valor medio ponderado de la serie de datos.
Se pueden calcular diversos tipos de media, siendo las más
utilizadas:
a) Media aritmética: se calcula multiplicando cada valor por
el número de veces que se repite. La suma de todos estos
productos se divide por el total de datos de la muestra:
U.B.I.
Lic. Franklin Blanco
b) Media geométrica: se eleva cada valor al número
de veces que se ha repetido. Se multiplican todo
estos resultados y al producto final se le calcula la raíz "n" (siendo "n" el total de datos de la muestra).
Según el tipo de datos que se analice será más
apropiado utilizar la media aritmética o la media
geométrica.
U.B.I.
Lic. Franklin Blanco
La media geométrica se suele utilizar en series de datos
como tipos de interés anuales, inflación, etc., donde el
valor de cada año tiene un efecto multiplicativo sobre el
de los años anteriores. En todo caso, la media
aritmética es la medida de posición central más
utilizada.
Lo más positivo de la media es que en su cálculo se
utilizan todos los valores de la serie, por lo que no se
pierde ninguna información.
U.B.I.
Lic. Franklin Blanco
2.- Mediana: es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un
50% de valores son inferiores y otro 50% son
superiores).
No presentan el problema de estar influido por los
valores extremos, pero en cambio no utiliza en su cálculo toda la información de la serie de datos (no
pondera cada valor por el número de veces que se
ha repetido).
U.B.I.
Lic. Franklin Blanco
3.- Moda: es el valor que más se repite en la muestra.
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
U.B.I.
Lic. Franklin Blanco
Vamos a calcular los valores de las distintas posiciones
centrales:
Luego:
Por lo tanto, la estatura media de este grupo
de alumnos es de 1,253 cm.
1.- Media aritmética:
U.B.I.
Lic. Franklin Blanco
2.- Media geométrica:
Luego:
En este ejemplo la media aritmética y la media
geométrica coinciden, pero no tiene siempre por qué
ser así.
U.B.I.
Lic. Franklin Blanco
La mediana de esta muestra es 1,26 cm, ya que por debajo está el 50% de los valores y por arriba el otro
50%. Esto se puede ver al analizar la columna de
frecuencias relativas acumuladas.
3.- Mediana:
En este ejemplo, como el valor 1,26 se repite en 3 ocasiones, la media se situaría exactamente entre
el primer y el segundo valor de este grupo, ya que entre estos dos valores se encuentra la división
entre el 50% inferior y el 50% superior.
U.B.I.
Lic. Franklin Blanco
4.- Moda:
Hay 3 valores que se repiten en 4 ocasiones: el
1,21, el 1,22 y el 1,28, por lo tanto esta serie cuenta
con 3 modas.
U.B.I.
Lic. Franklin Blanco
Medidas de posición no central
Permiten conocer otros puntos característicos de la
distribución que no son los valores centrales. Entre
otros indicadores, se suelen utilizar una serie de
valores que dividen la muestra en tramos iguales:
Cuartiles: son 3 valores que distribuyen la serie de
datos, ordenada de forma creciente o decreciente, en
cuatro tramos iguales, en los que cada uno de ellos
concentra el 25% de los resultados.
U.B.I.
Lic. Franklin Blanco
Percentiles: son 99 valores que distribuyen la serie
de datos, ordenada de forma creciente o decreciente,
en cien tramos iguales, en los que cada uno de ellos
concentra el 1% de los resultados.
Deciles: son 9 valores que distribuyen la serie de
datos, ordenada de forma creciente o decreciente, en
diez tramos iguales, en los que cada uno de ellos
concentra el 10% de los resultados.
U.B.I.
Lic. Franklin Blanco
Ejemplo: Vamos a calcular los cuartiles de la serie de datos
referidos a la estatura de un grupo de alumnos. Los deciles y centiles se calculan de igual manera, aunque haría falta
distribuciones con mayor número de datos.
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
U.B.I.
Lic. Franklin Blanco
1º cuartil: es el valor 1,22 cm, ya que por debajo suya se situa el
25% de la frecuencia (tal como se puede ver en la columna de la
frecuencia relativa acumulada).
2º cuartil: es el valor 1,26 cm, ya que entre este valor y el 1º cuartil se situa otro 25% de la frecuencia.
3º cuartil: es el valor 1,28 cm, ya que entre este valor y el 2º
cuartil se sitúa otro 25% de la frecuencia. Además, por encima
suya queda el restante 25% de la frecuencia.
Atención: cuando un cuartil recae en un valor que se ha repetido
más de una vez (como ocurre en el ejemplo en los tres cuartiles)
la medida de posición no central sería realmente una de las
repeticiones.
U.B.I.
Lic. Franklin Blanco
MEDIDAS DE DISPERSIÓN
Estudia la distribución de los valores de la serie,
analizando si estos se encuentran más o menos
concentrados, o más o menos dispersos.
Existen diversas medidas de dispersión, entre las más
utilizadas podemos destacar las siguientes:
1. Rango: mide la amplitud de los valores de la
muestra y se calcula por diferencia entre el valor más
elevado y el valor más bajo.
U.B.I.
Lic. Franklin Blanco
2. Varianza: Mide la distancia existente entre los
valores de la serie y la media. Se calcula como
sumatorio de las diferencias al cuadrado entre cada
valor y la media, multiplicadas por el número de
veces que se ha repetido cada valor. El sumatorio
obtenido se divide por el tamaño de la muestra.
La varianza siempre será mayor que cero. Mientras más
se aproxima a cero, más concentrados están los valores
de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.
U.B.I.
Lic. Franklin Blanco
3. Desviación típica: Se calcula como raíz cuadrada
de la varianza.
4. Coeficiente de varización de Pearson: se
calcula como cociente entre la desviación típica y
la media.
U.B.I.
Lic. Franklin Blanco
Ejemplo: vamos a utilizar la serie de datos de la estatura de los alumnos de una clase y vamos a calcular sus medidas de dispersión.
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
30 100,0
U.B.I.
Lic. Franklin Blanco
1. Rango: Diferencia entre el mayor valor de la muestra (1,30) y el menor valor (1,20). Luego el rango de esta muestra es 10 cm.
2.Varianza: recordemos que la media de esta muestra es 1,253. Luego, aplicamos la fórmula:
Por lo tanto, la varianza es 0,0010
3.Desviación típica: es la raíz cuadrada de la varianza.
Luego:
U.B.I.
Lic. Franklin Blanco
4.Coeficiente de variación de Pearson: se calcula como cociente entre la desviación típica y la media de la muestra.
Cv = 0,0320 / 1,253 Luego, Cv = 0,0255
El interés del coeficiente de variación es que al ser un
porcentaje permite comparar el nivel de dispersión de
dos muestras. Esto no ocurre con la desviación típica,
ya que viene expresada en las mismas unidas que los
datos de la serie.
LOGO