facultad de ingenieria universidad de san carlos de …€¦ · el arte de programar en r: tarea y...
TRANSCRIPT
UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADO
2019
TRIMESTRE
11
Nombre del Cuso: SOFTWARE ESTADISTICOCódigo: MEST 102 Créditos: 3
Escuela: ESTUDIOS DE POSTGRADO Maestría a la que pertenece: ESTADISTICA APLICADA
Docentes: Ing. Luis Carlos Bolaños Méndez, MA.Edificio: T-3, ERIS Sección: A y B Salón del curso:
Sección A: 205 Sección B: ERIS
Horario delcurso:
Sección A: 07:00 a 10:00 Sección B: 14:00 a 17:00
Horas por semana del curso: 3 horas presenciales por sección
Trimestre: 1 Período: 23 de febrero al 18 de mayo de 2019
1. DESCRIPCIÓN DEL CURSO
La Estadística es una ciencia que ha avanzado vertiginosamente en los últimos 30 años, gracias a las aplicaciones computacionales. De esta manera el curso se orienta al diseño y análisis (tabular, gráfico y numérico) de bases del lenguaje R y R- studio. Así mismo se realizará el análisis de los datos.
2. OBJETIVOS
GENERAL1. Aplicar las herramientas
computacionales (lenguajes de programación, software estadístico y planillas electrónicas) en el análisis de bases de datos provenientes de investigaciones experimentales y no experimentales.
ESPECÍFICOSLograr que el participante al final del curso seacapaz de: Conocer las alternativas de software
estadístico para el análisis de datos. Adquirir los conocimientos sobre la
construcción de bases de datos. Adquirir los conocimientos sobre el análisis de datos (gráfico, numérico y tabular) provenientes de investigaciones experimentales y no experimentales.
UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADO
2019
TRIMESTRE
12
3. COMPETENCIAS TERMINALES
Al finalizar el curso el estudiante desarrolla las siguientes competencias
Describe las diferentes fases del procesamiento de datos con fines de análisis cuantitativo (estadístico)
Identifica las utilidades del uso de los programas estadísticos. Aplica métodos computacionales y estadísticos para la resolución de problemas. Define de forma adecuada un problema de investigación cuantitativa Plantea correctamente los modelos metodológicos a emplear.
4. CONTENIDO TEMÁTICO DEL CURSO
Unidad Tema
I
1. INTRODUCCIÓN AL ANÁLISIS DE DATOS UTILIZANDO R1. Importancia del análisis de datos, aspectos históricos.2. Principales programas y lenguajes utilizados para el análisis de datos
estadísticos en el mundo.3. Conceptos fundamentales de estadística: tipos de variables, escalas
de medición, clasificación de la estadística: paramétrica y no paramétrica.
4. Descarga e instalación de R y R Studio2.
II
3. EL ENTORNO EN R Y LOS DATA FRAMES1. El entorno en R2. Tipos de datos y variables 3. El Data-frame 4. Manipulación de data frame5. Estadísticas descriptivas6. Importar y exportar datos en R7. Ciclos8. Condicionales9. Funciones10. Reportes 11. Markdown y latex para R
12.III 4. PREPARANDO LOS DATOS Y GRAFICOS
1. Limpieza de los datos2. Valores Perdidos
UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADO
2019
TRIMESTRE
13
3. Valores extremos4. Gráficos con paquetes base de R5. Introducción a ggplot2
IV
5. DISTRIBUCIONES DE PROBABILIDAD Y PRUEBAS DE NORMALIDAD
1. Distribuciones discretas de probabilidad2. Distribuciones continuas de probabilidad3. Pruebas de Normalidad
V4. Estadística inferencial
1. Pruebas de hipótesis para la media2. Pruebas de hipótesis para la varianza
VI
5. Manejo avanzado de bases de datos y gráficos avanzados1. Librería dpyr2. El operador pipe3. Operaciones con grandes bases de datos4. Concatenaciones5. Dplyr+ggplot2
VII6. Programación
1. Shiny en R2. Montando aplicaciones en los servidores de R
5. CRONOGRAMA DE ACTIVIDADES
Sesi
ón
Fech
a
Objetivo de la sesión Contenidos a desarrollar Actividad Evaluación
Sesi
ón N
o.1
Fech
a: f
ebre
ro 2
3 de
201
9
Presentación del
docente
Descripción del
curso
Explorar las
herramientas
computacionales
existentes para el
análisis de datos
Instalación de R
studio
Importancia del análisis de datos, aspectos históricos.Principales programas y lenguajes utilizados para el análisis de datos estadísticos en el mundo.
Santana, E. (2014). El arte de programar en R:
Tarea y
ejercicios en
Clase
Sesi
ón N
o.2
Fech
a: m
arzo
2
de 2
019 Conocer e paquete R y
R studio y su entorno
Manipular deferentes
objetos
Conceptos fundamentales de estadística: tipos de
Clase magistral
Tarea y
ejercicios
en Clase
UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADO
2019
TRIMESTRE
14
Manipular y trabajar
con data frames
variables, escalas de medición, clasificación de la estadística: paramétrica y no paramétrica.Descarga e instalación de R y R Studio
Sesi
ón N
o.3
Fech
a: m
arzo
9 d
e 20
19
Aprender a importar
datos en diferentes
formatos
Limpiar de datos
Trabajar con datos
faltantes
Limpieza de los datosValores PerdidosValores extremos
Clase magistral
Tarea y
ejercicios
en Clase
Sesi
ón N
o.4
Fech
a: m
arzo
16
de
2019
Graficar con el
paquete base de R
Gráficos de dispersión
Gráficos de barras
Histogramas
Gráfico de cajas
Otros gráficos
Clase magistral
Tarea y
ejercicios
en Clase
Sesi
ón N
o.5
Fech
a: m
arzo
23
de
2019
Examen parcial Examen parcial Examen
parcial
Examen
parcial
Sesi
ón N
o.6
Fech
a: m
arzo
30
de
2019
Graficar con la
librería ggplot 2
de R
Gráficos en una variable
Gráficos en dos variables
Clase magistral
Tarea y
ejercicios en
Clase
Sesi
ón N
o.7
Fech
a: a
bril
6 de
20
19
Conocer
algunas
distribuciones
continuas y
discretas con R
Distribuciones continuas de
probabilidad
Distribuciones discretas de
probabilidad
Pruebas de
normalidad
Clase magistral
Tarea y
ejercicios en
Clase
Sesi
ón N
o.8
Fech
a: a
bril
27 d
e 20
19
Aplicar pruebas
estadísticas,
paramétricas y no
paramétricas
Pruebas de hipótesis para la
media
Pruebas de homogeneidad
e independencia
Análisis de la varianza
Clase magistral
Tarea y
ejercicios en
Clase
Sesi
ón
No Manejo de gran Librería dpyr Clase
magistralTarea y
ejercicios en
UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADO
2019
TRIMESTRE
15
cantidad de
datos, con la
librería dplyr
El operador pipeOperaciones con grandes bases de datosConcatenaciones Dplyr+ggplot2
Clase
Sesi
ón N
o 10
Fech
a: m
ayo
11 d
e 20
19
Presentación de
análisis de datos
con shiny
Librería shiny
1. Montar aplicaciones en
servidores de R
Clase magistral
Tarea y
ejercicios en
Clase
Sesi
ón N
o 11
Fech
a: m
ayo
4 de
201
9 1. Examen final 2. Examen final Examen
final
Examen final
6. NOTA DE PROMOCIÓN Y EVALUACIÓN DEL RENDIMIENTO ACADÉMICO
La nota de promoción es de 70 puntos en una escala de 0 a 100 puntos, de acuerdo con el Reglamento del sistema de Estudios de Postgrado de la USAC. La asistencia debe ser de al menosel 85%. La zona es de 70 puntos y la evaluación final es de 30 puntos, no hay exámenes de recuperación.
7. METODOLOGÍA
La metodología a utilizar se basa en clases presenciales utilizando ayuda audiovisual conpresentaciones en programas de computadora, así como la pizarra y marcadores. Se tomará énfasis en la participación activa del estudiante, generando y analizando bases de datos de investigaciones experimentales y no experimentales, trabajo de campo, ejercicios y discusiones engrupo. Se creará una comunicación por medio de internet para apoyar al estudiante.
UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADO
2019
TRIMESTRE
16
8. BIBLIOGRAFÍA
1. Wickham, H. (2014). Advanced r. Chapman and Hall/CRC
2. Teetor, P. (2011). R cookbook: Proven recipes for data analysis, statistics, and graphics. O'Reilly Media, Inc
3. Santana Sepúlveda, S., & Mateos Farfán, E. (2014). El arte de programar en R: un lenguaje para la estadística.
4. Felipe de Mendiburu (2013). agricolae: Statistical Procedures for Agricultural Research. R package version 1.1-4. http://CRAN.R-project.org/package=agricolae