Sei sulla pagina 1di 5

modificacin y transformacin de variables

RECODE
recode x (1=2), gen(nx)
se recodifica la variable x, cambiando los valores 1 por valores 2, la variable
transformada se guarda como nx.

combinacion de bases de datos


Stata nos permite realizar diferentes tipos de fusiones de bases de datos, a
continuacin
presentaremos los dos formatos ms importantes, la adicin vertical (merge) y
horizontal (append).

Combinacin Vertical Append


Este comando agrega filas a la base de datos, las variables deben como regla
contener los mismos
nombres, el mismo tipo de variable y adems la base de datos sus variables
deben estar ordenadas de igual forma.
En nuestro ejemplo, a la base de datos HOMBRES vamos a adicionar los casos
correspondientes la
informacin de las mujeres as:
use hombres, clear
append using MUJERES

En la nueva base de datos se ha combinado la informacin hombres y mujeres


en una nica base de datos.
Es conveniente despus de este punto salvar save PERSONAS, replace
Combinacin Horizontal Merge
Se usa cuando se quieren traer nuevas variables de una base llamada using a
una base de datos ya
existente o master, ste comando une dos bases de datos utilizando una
variable en comn
(generalmente es una ID, llave o cdigo que identifica las observaciones de la
base de datos). Las
dos bases de datos deben estar guardadas en formato .dta, y deben estar
ordenadas de acuerdo a la variable que se va a pegar. El objetivo de este
comando es agregar variables (columnas).
Para pegar dos bases de datos (A.dta y B.dta), se deben realizar los siguientes
pasos:

1. Ordenar (sort) la base de datos B de acuerdo a las variables con las que se
har la unin de
las bases, es decir de acuerdo al ID, y guardar.
2. Abrir la base A y ordenarla de acuerdo al paso 1.
3. Usar el comando merge
4. Guardar la base de datos (save)

Si la base no est ordenada y contiene datos repetidos emerge el siguiente


error:
Using data not sorted
Master data not sorted

cambio en la organizacin de los datos


Cuando una base de datos tiene ms de una observacin por unidad de estudio
(individuo, pas,
empresa, etc.) nos puede interesar slo trabajar con una observacin por
unidad (collapse) o
mantener las observaciones distintas para cada individuo pero que se creen
como variables o
columnas distintas (reshape).
Collapse
Si se tiene una base de datos de hogares, cada observacin es un miembro del
hogar. Si cada hogar dispone de un identificador nico, entonces se puede
formar una base de datos alternativa que contenga una sola observacin por
hogar (en lugar de una observacin por individuo) para cada una de las
variables deseadas. Esta observacin puede contener la media, desviacin
estndar, suma u otro estadstico.
Ejemplo:
collapse (mean) edad (max) educacin (p50) ingreso, by(hogar)

Lo anterior crea una base de datos con cuatro variables, hogar, edad, ingreso y
educacin.

En Stata es posible colapsar bases de datos a travs del comando collapse.


Debe tenerse en cuenta:
1) La(s) variable(s) de agregacin: Variable(s) que definen las nuevas unidades
de observacin
u observaciones agregadas.
2) El(Los) criterio(s) de agregacin: Es la(s) operacin(es) matemtica(s) que
ser(n)
aplicados a la base de datos original para obtener las nuevas unidades de
observacin colapsadas:
suma, media, mediana, cuenta, percentil, etc.
3) La base de datos original ha sido modificada. Debera salvarse con un nuevo
nombre.
Por ejemplo, a partir de la base personas.dta, se puede obtener una base de
datos agregada por
localidad y sexo as:
collapse (mean) edu007, by(localid e03)
ANALISIS ESTADISTICO CON STATA
Se usa el comando SUM

Calculo de medias con MEAN

Intervalos de confianza

Creacin de tablas

Potrebbero piacerti anche