经常会遇到的情形是:我们有其他格式的数据,需要导入到 STATA 中进行分析,建议大家此时将其他格式数据复制到分析数据的文件目录下,然后直接用STATA 的导入数据文件命令导入原始数据,用程序模式进行处理,然后导出处理结果.这样做的最大好处是:既不会破坏最原始的数据文件,又使我们的每一步数据处理和分析过程都有迹可循.
1 insheet 命令
示例:3origin.xls”数据,将其打开并另存为“3origin.csv” ,(另存时请注意要选择“保存类型”下档衫歼拉单,选择 CSV(逗号分隔)这一项).然后在 STATA命令窗口中用下述命令导入
insheet using 3origin.csv,clear
也可以先将“3origin.xls”数据打开并另存为“3origin.txt” ,然后用下面的命令导入
insheet using 3origin.txt,clear
当数据中某个变量的位数特别长或者对导入数据的精度要求很高的时候,需要在该命令后面加double 选项.
insheet using 3origin.txt,double clear
2 infile命令
对于“3origin.txt”或“3origin.csv”,还可用 infile命令导入 STATA,此时需要先指出变量名.尤其要注意,当变量为字符型时,要先指明.
infile id str10 name gender minority economy math using origin.txt,clear
或者
infile id str10 name gender minority economy math using origin.csv,clear
3 infix命令
还有一种标准化的数据,每个变量的位数是确定的,不足时,前面用0补齐,以 origin数据的后面四个变量为例,其数据格式为
114068
128052
029076
024390
037096
115385
028536
129565
如果遇到这种数据格式,需要对照数据说明导入数据,相应的命令为:
infix gender 1 minority 2 economy 3-4 math 5-6 using origin.csv,clear
其中的数字为对应的数字位数.
4 outsheet 命令
与前述三个命令相反,有时我们需要将 STATA 数据导出为其他格式数据,比如文本格式或后缀为塌宴 acs 的格式:此时需要使用行冲outsheet 命令实现,该命令的基本格式如下.
outsheet using myresult.txt
outsheet using myresult.asc
此时建立的文件 myresult.txt第一行为变量名,第2~6 行为变量值.变量列间用Tab键分隔.如果不希望在第一行存储变量名,则可以使用nonames 选项.如果文件已经存在,则需要使用 replace 选项,相应的命令分别为.
outsheet using myresult.asc,nonames
outsheet using myresult.asc,nonames replace
5 使用 transfer 软件
首先声明枝盯蠢,我这个方法是:猛陪横向合并,也就是说样本量不变,但是增加了新的变量的操作方法。
我不能粘贴,不能从Excel中直接复制然后粘贴到stata中,也不能将stata1中的数据粘贴到stata2中。我的处理方法是:①将要复制的数据从Excel保存为stata格式,是单独一个stata文件-假设命名为stata3,只有你则指要复制的数据;②在stata中进行合并,打开主要的数据stata2,然后点击:data-combine datasets-merge two datasets-选择第四个按照observitions一对一合并,然后就可以把stata3中的数据全部合并到stata2中了。