julio ramos ramírez - wordpress.com · 2010. 9. 11. · a objetivos del curso precio internacional...
TRANSCRIPT
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
CURSO:
ESTADISTICA I
Profesor Julio Ramos Ramírez
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
ESTADISTICA I
IMPORTANCIA, OBJETIVOS Y
CONTENIDO DEL CURSO
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
IMPORTANCIA DEL CURSO
¿Por qué es necesario estudiar Estadística?.
¿El curso Estadística I es importante en mi
formación profesional?
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
OBJETIVOS DEL CURSO
• 32 42 36 34 40
• 42 40 36 34 36
• 40 50 24 76 32
• 34 36 38 30 26
• 24 22 24 30 36
• 40 32 40 38 36
• 38 40 36 50 36
• 40 34 42 30 36
• 26 30 28 24 22
• 18 20
Costo del SOAT ($ por año) pagado
por 47 clientes asegurados
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
OBJETIVOS DEL CURSO
Precio Internacional del Petróleo crudo ($ por barril)
El costo del SOAT osciló entre 18 y 76 dólares por
año
Los costos del SOAT están en promedio en 34.42
dólares por año.
Los costos del SOAT oscilaron, en promedio, en
cerca de 10 dólares por asegurado por encima y
por debajo del costo promedio.
Los costos del SOAT tuvieron una dispersión del
29% con respecto al costo promedio y por tanto,
afirmamos que la dispersión es moderada.
Por cada punto porcentual de incremento en la
siniestralidad de accidentes se espera un
incremento de $1.5 del SOAT
Rango
Media aritmética
Desviación
estándar
Coeficiente de
variación
Regresión
lineal
El índice de precios del SOAT nos índica una
variación del 12% con respecto al año anterior
Números
Índice
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
OBJETIVOS DEL CURSO
3630241812
95% Confidence Interval for Mu
19181716
95% Confidence Interval for Median
Variable: Precio
16,0000
3,9522
15,9440
Maximum3rd QuartileMedian1st QuartileMinimum
NKurtosisSkewnessVariance
StDevMean
P-Value:A-Squared:
18,0000
5,9736
18,7369
38,000020,000018,000015,0000 9,0000
476,725131,6160422,6207
4,756117,3404
0,0031,212
95% Confidence Interval for Median
95% Confidence Interval for Sigma
95% Confidence Interval for Mu
Anderson-Darling Normality Test
Descriptive Statistics
Uso de Excel o Minitab
Resultados
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
Nociones Generales
Tabulación de datos
Presentación gráfica de datos
Medidas de resumen de tendencia central, posición, dispersión, asimetría y apuntamiento.
Introducción al análisis exploratorio de datos
Análisis de regresión lineal y no lineal simple
Análisis de correlación lineal
Números Índice
CONTENIDO DEL CURSO
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
El desarrollo del curso se realizará con la:
Exposición de los temas por parte del profesor de teoría
Resolución de problemas en clase de práctica
Presentación de aplicaciones desarrollado con uso de software
(Excel o Minitab)
Durante el desarrollo del curso se propiciará la participación
activa de los alumnos de modo que empleen los conocimientos
adquiridos en la solución de problemas y casos.
METODOLOGÍA DEL CURSO
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
Sobre las Evaluaciones:
2 Prácticas calificadas que conducen al promedio de práctica: PP
Práctica:
Teoría:
Trabajo de aplicación grupal con informe escrito y exposición que
conducen a la nota de trabajo práctico: TP
Nota final de curso:
10
*3*6 TPPPPENF
2 exámenes parciales
Un sustitutorio
Promedio simple de exámenes: PE
Trabajo práctico:
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
Cronograma de evaluaciones
ESTADÍSTICA I
Semana Fecha Evaluación
6 26/05/10 Práctica calificada 1
9 14/06/10 Examen Parcial
12 07/07/10 Práctica calificada 2
15 26/07/10 Exposición y entrega de trabajo grupal
16 02/08/10 Examen Final
17 09/08/10 Examen sustitutorio
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
Algunas definiciones Previas
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
¿Qué es la Estadística?
Conjunto de métodos y técnicas que nos permite
recolectar, organizar y analizar datos numéricos relativos a
un conjunto de personas u objetos y tomar decisiones
lógicas basados en dichos análisis.
Objetivos de la Estadística
Describir las características más importantes de un
fenómeno haciendo uso de técnicas adecuadas.
Inferir resultados válidos para una población con base al
análisis de la muestra.
Predecir valores futuros de una variable mediante la
formulación de un modelo estadístico - matemático.
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
ESTADISTICA
Clasificación
Estadística
Descriptiva
Estadística
Inferencial
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
• Estadística Descriptiva – Describe y analiza las características de un conjunto de datos,
obteniéndose conclusiones sobre las características de dicho
conjunto y sobre las relaciones existentes entre ellas.
– Puede no solo referirse a la observación de todos los elementos de
una población, sino también a la descripción de los elementos de
una muestra.
• Estadística Inferencial – Fundamentada en los resultados obtenidos del análisis de una
muestra de población, con el fin de inducir o inferir el
comportamiento o característica de la población, de donde procede,
por lo que recibe también el nombre de Inferencia estadística
Clasificación de la Estadística
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
Estadística descriptiva
0
10000
20000
30000
40000
50000
60000
70000
80000
1985
1987
1989
1991
1993
1995
1997
1999
2001
2003
2005
2007
1/
Mil
es d
e b
arr
iles
-40.0
-30.0
-20.0
-10.0
0.0
10.0
20.0
30.0
40.0
Var
%
Miles de Barriles Var% Anual
Total
Promedio
por agente Total
Promedio
por agente Total
Promedio
por agente Total
Promedio
por agente
2007
E nero 379 190 3,090 26 151 12 4,185 26 F ebrero 304 152 2,878 24 138 13 3,802 22
Marzo 270 135 3,263 26 181 13 4,182 25 Abril 220 110 3,232 25 181 14 3,946 23
Mayo 273 137 3,236 27 207 16 4,527 25 J unio 261 131 3,567 29 187 14 4,395 24 J ulio 306 153 3,626 27 219 17 4,820 22
Agosto 288 144 4,060 31 238 16 4,977 24 S eptiembre 286 143 3,724 32 231 11 4,788 22
F uente: Datos del S C OP - OS INE R G MIN
11.2- P E R U: F R E C UE NC IA DE P E DIDOS DE S P AC HADOS DE G L P S E G ÚN T IP O DE AG E NTE C OMP R ADOR
(NÚME R O)Ordenes despachadas
AÑO / ME SImportador Pta. Envasadora
Distribuidor
granel
EE.SS y/o
Gasocentro
AÑO / ME SKerosene Diesel 2
Gasolina
de 84
Gasolina
de 90
Gasolina
de 95
Gasolina
de 97
Gasolina
de 98
NAC IONAL
Mínimo 7.54 7.25 6.92 8.36 11.90 12.55 13.75Máximo 16.49 13.69 14.00 16.50 19.00 20.40 17.98
P romedio 11.45 10.52 10.99 12.81 14.84 15.58 15.98C uartil inferior 11.10 10.15 10.39 12.06 13.89 14.69 14.89
Mediana 11.50 10.55 11.10 12.93 14.89 15.59 15.59C uartil superior 11.96 10.95 11.69 13.50 15.79 16.30 17.49
Desviación estándar 0.84 0.73 1.04 1.02 1.21 1.19 1.24C oeficiente de variación (% ) 7.38% 6.92% 9.42% 7.94% 8.19% 7.61% 7.78%
L IMA ME TR OP OL ITANA
Mínimo 9.80 9.25 9.39 10.39 11.90 12.55 13.75Máximo 16.49 13.69 13.80 15.38 18.69 17.95 17.98
P romedio 11.42 10.28 10.82 12.46 14.66 15.44 15.96C uartil inferior 11.06 9.95 10.26 11.85 13.79 14.62 14.88
Mediana 11.30 10.29 10.69 12.35 14.40 15.40 15.59C uartil superior 11.80 10.59 11.49 13.15 15.74 16.00 17.44
Desviación estándar 0.51 0.39 0.69 0.75 1.24 1.10 1.24C oeficiente de variación (% ) 4.48% 3.77% 6.41% 6.01% 8.45% 7.10% 7.79%
C OS TA
Mínimo 9.90 9.42 9.18 10.96 12.20 12.69 15.39Máximo 13.50 11.80 13.04 15.51 19.00 20.40 17.96
P romedio 11.53 10.55 11.11 13.15 14.86 16.33 16.46C uartil inferior 11.10 10.30 10.49 12.59 14.00 15.45 15.40
Mediana 11.46 10.58 11.29 13.19 14.99 16.20 16.40C uartil superior 11.92 10.84 11.66 13.70 15.70 17.30 17.96
Desviación estándar 0.55 0.39 0.69 0.76 1.16 1.53 1.09C oeficiente de variación (% ) 4.79% 3.73% 6.21% 5.81% 7.78% 9.38% 6.63%
S IE R R A
Mínimo 8.59 8.25 9.38 10.23 12.75 13.85Máximo 14.20 13.50 14.00 16.40 17.60 18.99
P romedio 11.68 10.90 11.38 13.24 15.55 16.34C uartil inferior 11.30 10.50 10.70 12.69 14.95 15.53
Mediana 11.60 10.95 11.45 13.28 15.60 16.20C uartil superior 12.00 11.30 11.99 13.79 16.50 17.00
Desviación estándar 0.60 0.57 0.80 0.79 1.13 1.06C oeficiente de variación (% ) 5.15% 5.19% 7.05% 6.00% 7.24% 6.47%
S E L VA
Mínimo 7.54 7.25 6.92 8.36 13.39 14.50Máximo 15.00 13.00 13.90 16.50 16.50 17.19
P romedio 10.69 10.11 10.17 12.39 14.88 15.62C uartil inferior 8.80 8.58 8.35 10.39 13.99 14.75
Mediana 11.20 10.59 10.54 13.00 14.50 15.33C uartil superior 12.25 11.30 11.90 14.00 15.50 17.04
Desviación estándar 1.87 1.45 1.90 1.99 1.11 1.03C oeficiente de variación (% ) 17.51% 14.37% 18.69% 16.03% 7.44% 6.63%
F uente: Datos del P R IC E - OS INE R G MIN
2.1- P E R U: P AR Á ME TR OS E S TADÍS T IC OS DE S C R IP TIVOS DE L P R E C IO DE C OMB US TIB L E S E N E S TAB L E C IMIE NTOS DE VE NTA AL P UB L IC O, E NE -07 a AG O-07
(NUE VOS S OL E S )
• Cuadros, gráficos y medidas estadísticas de resumen
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
Estadística Inferencial
Población
Todos los agentes
comercializadores de
hidrocarburos líquidos
del Perú, en 2007.
Muestra
600 agentes
seleccionados en
todo el país
¿Tipo ?
Probabilística
Procedimientos
-Estimaciones
-Márgenes de error
-Intervalos de confianza
-Pruebas de hipótesis
-Modelos de predicción
Se extrae
INFIERE
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
Población Objetivo
de Estudio
¿Por qué?
muestra
- Recursos limitados
- Datos disponibles limitados
- Prueba destructiva
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
Población.- Es un conjunto de personas, objetos o medidas que
poseen al menos una característica en común que las une o
identifica de la cual o cuales se desea estudiar algo
Muestra.- Subconjunto de la población seleccionada de acuerdo
con una estrategia o plan establecido llamado Muestreo. Se
espera que una muestra sea representativa y adecuada de
su respectiva población.
Unidad elemental (análisis).- Es el “ente” o elemento de la
muestra o población que está sujeto a medición u
observación. Ejemplo: un operador de la BVL, una familia,
un artículo producido, una unidad de transporte, etc
Definiciones
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
Tipos de Variables
Cuantitativa Cualitativa
Variables Características o fenómenos que interesan estudiar
en una población
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
Variable Cuantitativa Contínua Genera valores reales en base a un
instrumento de medición (balanza,
Cuestionario, etc.)
Variable Cuantitativa Discreta Genera valores enteros obtenidos por conteo.
Cuando genera valores numéricos. Ejemplo: edad, peso, longitud,
precio, unidades vendidas, etc.
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
Variable Cualitativa ordinal Al establecer un rango o jerarquía entre
los diferentes atributos, por ejemplo:
rendimiento académico, grado de
instrucción, escala de pensiones.
Variable Cualitativa nominal Al identificar los atributos de la variable
sin establecer el rango o jerarquía entre
cada uno de ellos, por ejemplo: idiomas,
color de preferencia, etc Favorable Desfavorable No sabe
Cuando genera valores no numéricos que expresan cualidades o
Atributos de las personas u objetos. Ejemplo: Estado civil, calidad
de un producto, profesión, etc.
Primaria
Secundaria
Superior
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
• Escala Nominal
– Cuando se utilizan nombres para establecer
categorías o grupos de elementos. Para
distinguir los grupos se utilizan letras, símbolos
y números (códigos numéricos)
Marca Genero
Escalas de medición
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
• Escala Ordinal – En este nivel también se definen varias categorías, pero
además de mostrar un ordenamiento existe una relación
de “mayor o menor que” entre ellas. Las etiquetas,
símbolos o números asignados si indican jerarquía.
Cargo funcional
Escalas de medición
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
• Escala de Intervalo – Mide las variables en forma numérica. Los números de
esta escala permiten establecer “distancias” entre dos
elementos, y las operaciones de suma y resta son
perfectamente realizables, no así la multiplicación y
división.
– En esta escala el cero es un valor que no indica ausencia
absoluta del fenómeno o variable medida, y es colocado
arbitrariamente en algún lugar de la escala.
Temperatura
Escalas de medición
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
• Escala de Razón o Proporción – Escala mas fuerte, dado que usa un sistema numérico en
el que el cero es un valor que indica ausencia absoluta de
la característica o variable que se está midiendo.
– Las operaciones de multiplicación y división tienen
validez.
Estatura Peso
Escalas de medición
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
• La complejidad del análisis aumenta con cada una
de las escalas de medición. Desde la simpleza de
la escala nominal hasta el refinamiento de la
escala de razón.
Análisis de datos y Escala
Análisis
paramétrico
Análisis no
paramétrico
UN
MS
M. F
acu
ltad
de
Ing
en
ierí
a d
e S
iste
mas e
In
form
áti
ca
1. PLANIFICACIÓN DEL PROBLEMA. DETERMINACIÓN DE LO QUE SE PRETENDE INVESTIGAR Y SU FINALIDAD; DELIMITACION DEL CAMPO DE
INVESTIGACIÓN
2. FASE EXPLORATORIA CUYO PROPÓSITO ES DE PERMITIR AL INVESTIGADOR FAMILIARIZARSE E INTERIORIZARSE CON PARTE DE LOS
CONOCIMIENTOS EXISTENTES DENTRO DEL CAMPO ÁMBITO QUE ES OBJETO DE INVESTIGACIÓN.
3. DISEÑO DE LA INVESTIGACIÓN UNA VEZ DELIMITADOS LOS OBJETOS DE LA INVESTIGACIÓN, HAY QUE DAR UN PASO MÁS Y VER COMO
ORGANIZAR EL CONJUNTO DE OPERACIONES BASICAS QUE PERMITEN LLEVAR ADELANTE EL PROCESO DE
INVESTIGACIÓN. NOS ESTAMOS REFIRIENDO AL DISEÑO DE LA INVESTIGACIÓN.
4. RECOLECCION DE LOS DATOS
PARA ESTA TAREA DE RECOPILACIÓN, EXISTEN NUMEROSOS PROCEDIMIENTOS VARIABLES CONFORMES A
LAS CIRCUNTANCIAS CONCRETAS DE LA INDOLE DE LA INVESTIGACIÓN. LA TÉCNICA DE RECOPILACION DE DATOS MAS UTILIZADA ES LA ENTREVISTA PERSONAL (CUESTIONARIO ESTRUCTURADO)
5. ELABORACION DE DATOS LOS DATOS RECOGIDOS MEDIANTE ALGUNOS DE LOS PROCEDIMIENTOS INDICADOS PROCEDENTEMENTE,
DEBEN SER ELABORADOS Y CLASIFICADOS CON ARREGLO A CIERTOS CRITERIOS DE SISTEMATIZACION, PARA
PROCEDER LUEGO AL RECUENTO DE LOS MISMOS CONFORME AL SISTEMA MÁS ADECUADO O FACTIBLE. SE
PROCEDE LUEGO AL TRATAMIENTO ESTADÍSTICO MATEMÁTICO DE LOS DATOS.
6. LA REDUCCIÓN DE LOS DATOS: LA LABOR ESTADÍSTICA CONSISTE EN LA REDUCCIÓN DE LOS DATOS, MEDIANTE PROCEDIMIENTOS DE
SÍNTESIS QUE RESUMEN Y SIMPLIFICAN LOS DATOSEN UNA EXPRESIÓN UNICA, SEGUNSEGUN VALORES Y
ATRIBUTOS IGUALES, LO CUAL PERMITEEL CONOCIMIENTO EFICAZ Y RAPIDO DE UN NUMERO ESTADÍSTICO.
7. ANÁLISIS E INTERPRETACION DE LOS DATOS: EN ESTA FASE, CUANDO SE REALIZA EL TRATAMIENTO ESTADÍSTICO-MATEMATICO DE TODA LA MASA DE LOS DATOS CLASIFICADOS Y TABULADOS.
La Investigación Estadística - Fases