ayudantia stata.pdf

7
 UNIVERSIDAD ALBERTO HURTADO FACULTAD DE ECONOMÍA Y NEGOCIOS Econometría – Ingeniería Comercial para Profesionales Profesores: Roció Álvarez ; Gabriel Moraga Ayudante: Joaquín Nilo Elgueta.  joaquín.n ilo.e@gmail.com Ayudantía Nº1 Introducción de Stata 10 de abril de 2015 Introducción: El objetivo de esta ayudantía es introducir a los alumnos en el manejo del software estadístico Stata, entregando comandos y conceptos que les permitirán poder desarrollar la tarea asignada durante el semestre en curso" 1- ¿Qué es Stata? Stata es un paquete estadistico, que tiene todos los elementos necesarios para realizar análizar, manejar y graficar datos. 2- ¿Cómo luce Stata? Cuando se inicia el programa podemos distinguir 4 ventanas: #  Review: En esta ventana aparecen los comandos que han sido utilizados durante la sección. # Variables : Aquí se encuentra el listado de variables que contiene la base de datos en la que se esté trabajando. # Commands: En esta ventana se introducen los comandos que queremos aplicar para obtener el resultado deseado. #  Results:  Es la ventana principal, muestra los resultados de la aplicación de comandos en la ventana commands.

Upload: joaquin-alejandro-nilo-elgueta

Post on 03-Feb-2018

239 views

Category:

Documents


0 download

TRANSCRIPT

7/21/2019 Ayudantia Stata.pdf

http://slidepdf.com/reader/full/ayudantia-statapdf 1/6

UNIVERSIDAD ALBERTO HURTADOFACULTAD DE ECONOMÍA Y NEGOCIOS

Econometría – Ingeniería Comercial para ProfesionalesProfesores: Roció Álvarez ; Gabriel MoragaAyudante: Joaquín Nilo Elgueta.

joaquí[email protected]

Ayudantía Nº1Introducción de Stata

10 de abril de 2015

Introducción: El objetivo de esta ayudantía es introducir a los alumnos en el manejo del softwareestadístico Stata, entregando comandos y conceptos que les permitirán poder desarrollar la tarea asignadadurante el semestre en curso"

1- ¿Qué es Stata?

Stata es un paquete estadistico, que tiene todos los elementos necesarios para realizar análizar, manejar ygraficar datos.

2- ¿Cómo luce Stata?

Cuando se inicia el programa podemos distinguir 4 ventanas:

# Review : En esta ventana aparecen los comandos que han sido utilizados durante la sección.# Variables : Aquí se encuentra el listado de variables que contiene la base de datos en la que se esté

trabajando.# Commands : En esta ventana se introducen los comandos que queremos aplicar para obtener el

resultado deseado.# Results: Es la ventana principal, muestra los resultados de la aplicación de comandos en la ventana

commands.

7/21/2019 Ayudantia Stata.pdf

http://slidepdf.com/reader/full/ayudantia-statapdf 2/6

3- Reglas de trabajo

Para poder llevar un registro ordenado de todos los comandos que se utilizan y todas las instrucciones que sequieran ejecutar, tenemos dos archivos que son de mucha utilidad, el primero es el comandolog. Estecomando nos permite mantener un registro completo de cada sesion de Stata. Un archivo log es un archivoque contiene todo lo que tipeamos y todos los resultados que obtenemos de Stata. El segundo son losarchivos do o do-fileque contiene un conjunto de comandos de Stata. Este archivo puede crearse concualquier editor y la ventaja es que nos permite guardar nuestros comandos en sesiones anteriores y poderreproducirlos nuevamente.

Como cargar un archivo log:

# Directamente: file! log! begin log y lo guardamos como “ayudantia Stata.log”# Tipeando en la ventana de comando o en el do.file:“log using [dirección donde se guardara]/ [ruta de acceso]/ [nombre de archivo]

Por ejemplo: Si utilizamos la segunda manera (tipiamos en la ventana de comando o escribimos en nuestrodo-file)

En este archivo se irán guardando en formato texto, todo lo que se realice en Stata. (Sin contar los gráficos)

Lo ideal es combinar la utilización de un do-file y un log; el primero permite tener en forma ordenada todos

los comandos que se están utilizando y todas las instrucciones que se quieran ejecutar, el segundo guarda enun archivo de texto todos los resultados que surgen de este archivo do-file.

4- Como trabajar en Stata

Cuando iniciamos el programa es relevante saber dónde estamos trabajando o en que carpeta se estánguardando los resultados, donde están las bases de datos que ocuparemos, etc. Si no se sabe dónde, en quecarpeta o directorio está Stata podemos averiguarlo con el comando:

log using "ayudantia Stata"

7/21/2019 Ayudantia Stata.pdf

http://slidepdf.com/reader/full/ayudantia-statapdf 3/6

Comando: pwd

Si queremos cambiar el directorio de trabajo, ejemplo; crearemos una carpeta llamada “ayudantíaEconometría” y aquí guardaremos todo lo que hagamos en Stata y la base de datos entregada.

El comando para cambiar la carpeta es:

Ejemplo:

En este caso le estoy indicando a STATA que se ubique en la carpeta “ayudantia Stata”

* Es importante tener en cuenta el uso de las comillas al momento de computar el comando, siempre ycuando el nombre de la carpeta este separado. Para evitar que les salga “invalid syntax ”, pueden ponerel nombre de la carpeta sin espacios.

5- Que es y cómo cargar una base de datos en Stata

La base de datos es el primer paso para poder trabajar con Stata, debemos contar con ella y cargarla en el programa para poder realizar nuestro trabajo estadístico. Una base de datos es un conjunto (matriz) deinformación, donde se tienen filas y columnas que en conjunto forman la base de datos.

5.1 Bases de datos en extensión “.dta”

Las bases de datos en formato Stata tienen extensión “.dta”.

Ejemplo: La base de datos que ocuparemos para esta ayudantía es “WAGE2.dta”, lo que nos dice que nuestra base de datos esta guardada en formato compatible con Stata.

Existen dos maneras de cargar una base de datos:

A) Utilizando una base grabada en nuestro laptop, que tenga formato “.dta”. En este caso, podemos

apretamos el icono y buscar la dirección donde se ubica la base de datos.

B) La segunda opción es abrir la base directamente con un comando (dado que anteriormente yaestablecimos la dirección donde trabajariamos con Stata).

Ejemplo: Podemos copiar la ruta completa en donde esta la base de datos:

cd “ruta donde se encuentra la carpeta”

cd "/Users/josenilocea/Dropbox/UAH/UAH 2015/Ayudantias 2015/Econometria_ICP/Ayudantia Stata

use "/Users/josenilocea/Dropbox/UAH/UAH 2015/Ayudantias 2015/Econometria_ICP/Ayudantia Stata/WAGE2.dta”

7/21/2019 Ayudantia Stata.pdf

http://slidepdf.com/reader/full/ayudantia-statapdf 4/6

Otra opcción, es indicar directamente el comando y la base de datos que queremos ocupar. En elapartado anterior indicamos a Stata que trabajariamos en la carpeta “ayudantia de econometria”.Dentro de esta carpeta, se encuentra la base de datos que ocuparemos en esta ayudantía.

5.2 Bases de datos en formato EXCEL (xls, xlsx)

Los siguientes pasos muestran la forma mas simple de importar bases de datos en formato EXCEL:

# file ! import! Excel Spreadsheet! Browse… (buscamos el documento en la laptop)! Importfirst row as variable names (le decimos a Stata que la primera fila contiene a los nombres de lasvariables)! OK.

6- Principales Comandos

Este apartado se centra en entregar una descripción de algunos de los comandos mas utilizados, luego loaplicamos al ejemplo de la base de datos “WAGE2.dta” y el do-file que hemos construido. Para unarevisión completa de los comandos vean la bibliografia.

• help (h):Con este comando podemos obtener ayuda de Stata. Si computamos help “comando”,obtendremos ayuda específica para dicho comando.

Sintaxis: help command

• describe (d): Nos entrega un resumen de los contenidos de la base de datos, nos da informaciónsobre todas las variables que se encuentran en la base de datos. Además nos entrega informaciónsobre el número de variables, observaciones y tamaño de la base de datos.

Si solo queremos obtener información sobre algunas de las variables de la base de datos, después deescribir el comando se computa también la(s) variable(s) de interés.

Sintaxis: describe [varlist ] [,options]

Ejemplo: Utilizando la base de datos “WAGE2.dta”, podemos describir solamente la variable de interes, queen este caso esmarried.

• Count: Tal como su nombre lo indica, nos sirve para contar. Si solo tecleamos el comando “count ”nos contara las observaciones que hay en la base de datos. También, podemos utilizarlo para contarcon un condicionante, ejemplo:count if black==1 , nos cuenta todos los individuos de la base dedatos que cumplan con esa condicion.

married byte %10.0g married

variable name type format label variable label

storage display value

. describe married

use “WAGE2.dta”

7/21/2019 Ayudantia Stata.pdf

http://slidepdf.com/reader/full/ayudantia-statapdf 5/6

Sintaxis: count [if exp] [in r ange ]

• Summarize: Calcula y muestra cierta variedad de estadisticas univariadas.

Sintaxis: Summarize [varlist ] [weight ] [ifexp] [in range ] [,options]

Ejemplo: utilizando la base de datos “WAGE2.dta”. Aplicamos el comando y obtenemos, el numero deobservaciones, la media, la desviación estandar, el mínimo y el máximo.

• Tabulate: Permite hacer tablas de frecuencias con las variables de interes. Esta tabla nos indica elnumero de observaciones totales y de cada una de las categorias de las variables. Ademas, nos

entrega el porcentaje de cada una de las variables sobre el total y el porcentaje acumulado. Sintaxis: Tabulate varname [weight ] [ifexp] [in range ] [,options]

Ejemplo: Trabajando con la base de datos “WAGE2.dta”. Este pantallazo de Stata, nos muestra una tabla confrecuencias de individios con distintos años de educación y nos cuenta la frecuencia de individuos.

• Drop/keep: borra/mantiene observaciones (variables) que satisfacen cierta condicion. El ejemplomas claro es borrar/mantener una variable.

Sintaxis: drop/keep varlist

• Generate/replace: Este comando nos permite generar una nueva variable definida en base a unaexpresion numérica, la cual puede contener a otras variables. Replace reemplaza los contenidos deuna variable existente.

Sintaxis: generate newvar =exp [ifexp]

A continuacion, se muestran las expresiones mas utilizadas:

age 935 33.08021 3.107803 28 38

Variable Obs Mean Std. Dev. Min Max

. summarize age

7/21/2019 Ayudantia Stata.pdf

http://slidepdf.com/reader/full/ayudantia-statapdf 6/6

Ejemplo: En la base de datos tenemos la variableedad , si estamos interesados en generar la variable edad alcuadrado tipeamos:

Otro ejemplo, en la base de datos se tienen los años de educación como una variable. A partir de esta, podríamos generar una nueva variable (teduc ), que contenga el nivel de educación alvanzado por cadaindividuo (lo separaremos en menor que 12, igual a 12 y mayor a 12 años)

• Return list: cuando aplicamos un comando (sum, tabulate, describe, etc.), en la memoria temporaldel programa quedan guardadas las estadísticas; el nombre con el que cada unade estas se guarda se puede saber al tipiar “return list ”, después de aplicado el comando.

Ejemplo: De la base de datos “WAGE2.dta”, aplicamos el comando “sum” que nos entrega estadísticasdescriptivas, luego tipiamos “return list” y nos entregará por escalar cada una de las estadísticas anteriores.

Referencias:

• Apuntes: J. Vásquez, Curso Nivelación STATA Magíster en Políticas Públicas.http://www.microdatos.cl/doctos_apuntes/Nivelacion_Stata_MPP_2011.pdf

r(sum) = 12593 r(max) = 18

r(min) = 9

r(sd) = 2.196653882081251

r(Var) = 4.825288277662632

r(mean) = 13.46844919786096

r(sum_w) = 935

r(N) = 935

scalars:

. return list

educ 935 13.46845 2.196654 9 18

Variable Obs Mean Std. Dev. Min Max

. sum educ

gen age2=age^(2)