conociendo a r (i)

11

Click here to load reader

Upload: deybi-morales-leon

Post on 25-Jul-2015

89 views

Category:

Documents


2 download

DESCRIPTION

Primer tomo de tutoriales de R el software estadístico libre.

TRANSCRIPT

Page 1: Conociendo a R (I)

Conociendo R (I)*

Deybi Morales León (Universidad Centroamericana UCA)

15/07/12

Este documento es parte de una colección de tutoriales elabora-dos para Grupo de Usuarios R de Nicaragua. R es un software es-tadístico (libre) de licencia GNU. Puede descargarlo desde http://www.r-project.org. En la elaboración de este tutorial se ha hecho uso solode softwares libres: Ubuntu, LYX, Latex, LibreO�ce y R. Apoyamosel uso del software libre para los países en vías de desarrollo.

1. ¾Qué es R?

R es un software estadístico con licencia GNU. Muchos lo consideran como lasintaxis que conforman el lenguaje R. El lenguaje R tuvo su origen del lenguajeS potente en operaciones estadísticas. A diferencia del lenguaje S, R no es com-ercial pero son dos lenguajes más utilizados en las investigaciones académicas,convirtiéndose R en una potente alternativa libre de lenguajes estadísticos comoStata, SAS, Matlab1, SPSS2 y de lenguajes económetricos como Eviews3.

Comparación entre Eviews, Stata, SPSS y R4

Potencia Di�cultad de uso5 Precio Uso prioritario

Eviews6 Alta Baja Alto Aplicación a la modelización econométricaSPSS Alta Baja Muy alto Docencia/profesionalStata Muy alta Media Medio/alto Investigación aplicadaR Máxima Alta Gratuito Investigación básica y aplicada

La potencia de R es máxima pero esto va acorde de su di�cultad alta porque noposee botones y menus que abarquen todas sus funciones. Pero esta di�cultad

*Revisiones: 12/07/12, 15/07/12 & 18/07/121No es un lenguaje meramente estadísticos, su alternativa libre directa se conoce como

Octave2Una alternativa libre directa se llama PSPP3Una alternativa libre directa se llama Gretl4Muñoz, Jordi. Curso de Introducción a Stata

1

Page 2: Conociendo a R (I)

se vence una vez cruzada su curva exponencial de aprendizaje de los aspectosbásicos de su lenguaje de programación, con un guía o tutor vencer esa curvase puede hacer en menos de una semana.

Es recomendarble crear script durante cada sesión de trabajo. Esto permiteexplotar al máximo su capacidad de programación. Se debe destacar que lasrevistas especializadas de investigaciones cientí�cas solicitan los archivos quecontienen la sintaxis de programación utilizadas en el programa estadísticos depreferencia.

R permite que su desarrollo sea trabajado por millones de usuarios alrededordel mundo. Actualmente es apadrínado por un extenso número de universidadesalrededor del mundo, conformándose grupos de investigadores que utilizan Rpara las distintas ramas de las ciencias creando paquetes para automatizar unconjunto de rutinas. En esta redacción R cuenta con aproximadamente 4000paquetes que expanden su operaciones estadísticas, matemáticas y capacidadesgrá�cas.

Los creadores de esta obra maestra fueron Robert Gentleman y Ross Ihaka delDepartamento de Estadística de la Universidad de Auckland en 1993 crearonR. Pero ahora su desarrollo actual es responsabilidad del R Development CoreTeam quienes han creado todo un proceso para mantener la calidad profesionalde R.

La primera versión estable de R vió la luz en el año 20007 poniendo a R enuna experiencia de desarrollo estable de 13 años. En la actualidad sale unanueva versión de R cada dos meses incluyendo la mejora de los paquetes loque lo convierte en el software que va a la mano de los nuevos descubrimientosestadísticos aplicados a las distintas ciencias. Debemos recordar que el lenguajesy entorno de programación de R facilita al usuarios crear las funciones que leson demandadas.

Para explotar la capacidad de R es necesario hacer uso de su lenguaje de pro-gramación. El usuario menos exigente puede hacer uso del paquete �Rcmdr� queagrega una interface compuesta de menú para rutinas comunes.

Características de R

R nos proporciona de muchas herramientas estadísticas (modelos linealesy no lineales, tests estadísticos, pruebas hipótesis análisis de series tempo-rales, algoritmos de clasi�cación y agrupamiento, etc.) y grá�cas.

R puede personalizarse según las necesidades de cada usuario existen unconjunto de paquetes que son agrupados según las temáticas: Econometría,Finanzas, cálculos, etc.

7A la redacción de este documento R está en su versión 2.15. Estamos por recibir la versión2.16 es una gran ventaja poder disponer en pocos minutos sin gastos de licencia de la últimaversión.

2

Page 3: Conociendo a R (I)

R posee un potente lenguaje de programación que permite al usuario crearsus propias funciones. Es muy parecido al c++ y el usuarios avanzadopuede manipular R desde ese entorno de programación.

R trabaja con objetos, los objetos son creados por usuarios cuando estenombra las salidas, indicadores y bases de datos. Esto evita volver a eje-cutar rutinas repetitivas durante se está trabajando.

R puede conectarse con bases de datos online. Actualmente R posee unaconexión con la Base de Datos de Indicadores de Desarrollo del BancoMundial. También puede conectarse a software online como ggplot2 ygoogleVis teniendo la posibilidad de crear grá�cas dinámicas y profesion-ales.

R puede trabajar para cálculos numéricos necesarios para álgebra lineal,adiciones, resolver ecuaciones, etc. Su limitante en esta área puede vencerseya que R puede hacer uso del lenguaje de cálculos simbólicos Yacas lo quepermite expandir su capacidad de cálculos con aplicaciones derivadas eintegrales avanzadas. Esto lo vuelve una seria competencia para matlaben esta área.

Se ha trabajo R con la capacidad para integrarse a otros programas co-mo LATEX para la creación de informes, paquetes para elaborar informesonlines, Excel para importar datos o hacer que Excel haga uso de las ca-pacidades de R, Gretl para expandir sus capacidades econométricas conR, Yacas para expandir el cálculo numérico de R, etc.

Su capacidad de simulación es extendida a distintas ciencias sociales,económicas y naturales.

R tiene el privilegio de tener abierta más de una base de datos a la vez.También tiene la opción de guardar un archivo llamado Workspace queagrupa todas las bases de datos utilizadas durante la sesión de trabajo enR. Además tiene la capacidad de guardar el historial de trabajo pudiendorecuperar en otra sesión de trabajo los objetos creados.

1.1. Grupo de Usuarios R Nicaragua.

Se ha conformado el grupo para Nicaragua que reúne a estudiantes y profe-sionales que utilizan o desean aprender R en Nicaragua. Actualmente el grupoestá compuesto de Estudiantes y licenciados de Economía que hacen uso de lasherramientas econométricas y grá�cas.

Fundadores del Grupo:

Lic. Deybi Morales León.

Jeferson Ruíz (Estudiante investigador)

3

Page 4: Conociendo a R (I)

Lic. Octavio Martínez

MSc. José Ángel Morales Torres (Director del Departamento de EconomíaAplicada UCA)

El grupo cuenta de 240 miembros registrados. El grupo es administrado por:

Lic. Jilber Urbina

Lic. Deybi Morales León

Lic. Dennis Cáceres

Jeferson Ruíz (Estudiante investigador)

Lic. Ixchen Triguero

El grupo realiza charlas y tutoriales como parte de las actividades. Trabajamosen la aplicación empírica de R para Nicaragua y buscamos su certi�cación enlos próximos cursos.

Se trabaja con bases de datos nacionales obtenidas del INIDE, BCN, MAGFOR,MIFIC y demás instituciones estatales o privadas.

Algunos objetivos del grupo son:

Realizar cursos de R que atienda a las demandas del mercado laboral.

Mejorar el nivel cuantitativo de la Carrera de Economía Aplicada de laUCA.

Donar tutoriales impresos sobre R a la Biblioteca José Coronel Urtecho.

Elaborar investigaciones económicas aplicadas a Nicaragua.

Expandir R a otras ciencias.

Somos un grupo sin �nes de lucro, cualquier apoyo al grupo Usuarios R Nicaragua,dirigirse a [email protected] o si tiene cuenta en face-book ingresa al grupo: https://www.facebook.com/groups/usuariosrnicaragua.

.

1.2. Capacidades grá�ca

Mapas para estadísticas espaciales.

La capacidades de R se ha expandidos hasta los shape�les8, haciendo uso deestos para presentar indicadores sociales directamente en los mapas. Permite

8Son archivos que contienen los croquis de los mapas de un país especí�co

4

Page 5: Conociendo a R (I)

la posibilidad de encontrar clústeres, es decir concentraciones referente a unindicador económico o social.

1.3. Grá�cas estadísticas

R permite desde la elaboración de grá�cas sencillas hasta grá�cas profesionales.Entre la capacidad grá�cas tenemos grá�cos dinámicos, grá�cos de dispersión,pasteles, barras, líneas, etc.

Algunos ejemplos empíricos.

5

Page 6: Conociendo a R (I)

6

Page 7: Conociendo a R (I)

1.4. Intefaces conocidas

R es un lenguaje de programación y tal es su importancia que su terminal oconsola es la parte más importante de sus interfaces. En Windows tenemos unainterface por defecto que se compone de la consola, menu para guardar, copiar,abrir editor de script, instalar paquetes, ayuda, etc.

7

Page 8: Conociendo a R (I)

En Linux, R no tiene interface por defecto pero puede utilizarse R desde laterminal. El usuario que desee trabajar de manera amigable con R desde linuxy aún desde windows puede descargar e instalar Rcommander el mismo que seinstala con el paquete �Rcmdr�, Tinn-R o Rstudio son editores especializado paraR. Los cursos y charlas de R los realizamos desde Rstudio pero aun tiene ciertaslimitantes como crear varias ventanas con grá�cos, introducir o editar bases dedatos desde una ventana parecida a LibreO�ce Calc o Excel, etc. Aunque tienemás ventajas útiles que desventajas en este y próximos tutoriales señalaremoscuáles comandos no son funcionales en Rstudio.

Veamos las interfaces más conocidas:

RGui, la interface por defecto en Window.

Esta interface de window posee una ventana �otante llamada consola que esla única que necesita R para trabajar por medio de líneas de comandos. Portal razón en linux, R puede trabajar directamente desde la terminal de linuxubuntu, fedora, debian, etc. R se ejecuta en estas terminales haciendo corrersolo la letra R.

8

Page 9: Conociendo a R (I)

Rcommander, interface con menus similares a los que posee Stata, Eviews ySpss.

Se asemeja a Stata y SPSS porque agrega menu para realizar rutinas estadísticasy grá�cas, así se evita la aplicación de comandos.

Tinn-R, una interface con editor universal pero pensado para R.

9

Page 10: Conociendo a R (I)

Es una interface avanzada que permite al usuario acostumbrarse a la sintaxisde R ya que colorea y autocompleta.

Rstudio, la interfaces para empezar a aprender programación en R.

10

Page 11: Conociendo a R (I)

Un editor en la ventana superior izquierda para elaborar los scripts, los scriptsson archivos guardados con extensión .R que poseen lineas de programaciónelaborada por el usuario, útiles para guardar y recuperar procesos. Estos scriptsse asemejan a program de Eviews y Do-File de Stata. Rstudio ha agregadosalgunas funcionalidades al editor como la capacidad de redactar informes enLATEX, crear informes web, visualizar bases de datos, etc.

El siguiente documento se llamará �Introducción R (II)�. Con-tendrá una introducción básica a la programación de R para ingresarbases de datos y manipular.

Comentarios y sugerencias para mejorar este documento:[email protected]

11