教育装备采购网
第七届图书馆 体育培训

在Stata中用import fred命令导入数据

教育装备采购网 2018-11-29 09:14 围观1494次

  概述

  联邦储备经济数据库(FRED)由圣路易斯联邦储备银行持有,提供成千上万的时间系列来衡量经济和社会结果。新的Stata 15命令import fred从这个知识库中导入数据。

  这篇文章,将演示如何用import fred命令从FRED中导入数据。还将讨论import fred提供的,在数据管理中非常有用的元数据。然后演示如何使用高级功能:导入系列的多个版本,他们的观测值随时间的推移保持更新。

  新版本发布的数据将更新FRED的所有系列。有些系列,新的数据发布只是添加了观测值。而对于某些系列,一个新的数据发布可以改变先前公布的观测值,因为观测值被估计或计算。这些更改是随着源信息或公式以及方法的更改而做出更改的。例如,具体的国民生产总值(GNP)在某个季度的数据会随着更完整的源信息的更新而更新几次。

  更新的数据被成为vintage。Vintages发行的日期是确定的,比如我们说的“the July 10, 2017 vintage”。Import fred命令中的Vintage()选项允许您访问早期的vintage数据。

  以前的数据有几种用途。首先,导入vintage数据可以让您查看一个数据集,正如前面的文章中所看到的那样,这对于复制目的是有用的。其次,之前的年份用作稳健性检验,在某些情况下,研究您的结果是否在不同数据版本中是稳健的是有用的。第三,在某些应用工作中,有必要对信息进行条件化,而不是使用修改后的数据。

  在下面讨论的例子中,后来的数据显示,2008的深度衰退比早期的年份更严重。

  使用import fred 命令

  几乎跟所有的命令一样,您可以通过菜单驱动的图形用户界面(GUI)或者通过命令行界面访问import fred。通过菜单File>Import>Federal Reserve Economic Data (FRED)使用FRED知识库是最方便的。使用命令行界面对于重复的任务更简单。在这篇文章中,由于不同年份的应用几乎总是重复,所以我使用命令行界面。

  在进行所有的操作前,需要一个使用FRED的密钥,它可以从以下链接免费获取https://research.stlouisfed.org/docs/api/api_key.html

  单击上面的链接,选择Request or view your API keys,注册并获得一个密钥。然后,在Stata里输入

  

  来设置您的密钥。

  FRED的序列是根据字母数字代码识别的。FRED代码可能是模糊的。Import fred GUI和fredsearch命令可以极大地帮助您找到您想要的序列的代码。为了找到真正GNP的代码,我使用了fredsearch。该命令获取关键字列表,并搜索与这些关键字匹配的FRED系列.此外,FRED的系列中为国家、地区等都设有标签,而fredsearch可以严格的按照标签来搜索以匹配关键字。下面我使用fredsearch找到系列关键字real, gross, national和product。我添加了选项tag(usa)来限制搜索美国的数据系列。

  

  第一个结果是我们想要的,FRED代码是GNPC96。我使用import fred导入它。

  

  汇总表报告导入系列的数量,以及导入系列的最高和最低频率。前几个观测值是:

  

  datestr是一个包含观测日期的字符串变量。daten是Stata的日期变量跟datestr中的字符串日期对应。根据FRED约定,观测日期作为每天日期保存。例如,1947年第一季度的日期被记录为1947年1月1日。

  现在我们使用qofd()从daten中创建一个季度日期,然后tsset数据集:

  

  Import fred可以同时导入多个系列,并且可以导入不同频率的系列。它可以将高频系列聚集到所需的较低频率中,且可以在请求的日期范围内导入数据。

  导入和检验一系列年份数据

  在提供了必要的背景材料之后,我现在演示如何导入和绘制GNPC96系列年份数据。对这个系列的更新特别有趣,因为它们揭示了大衰退的低谷,而不是早期数据发布中看到的那样。

  我们可以通过一个import fred命令来导入实际GNP的多个年份,并指定一个系列的fred代码和所需的年份。

  

  上面输入的第一个命令是四个时间系列,每个日期指定一个命令。每个系列的名称包括其FRED代码和请求的日期,因此,GNPC96 20090415是gnpc96系列,它在2009年4月15日被请求查看。其余的命令生成季度变量,并将其指定为tsset变量。

  FRED系列包含有关该系列的元数据,包括数据源、系列标题、频率、单元和注释。import fred使您能访问这个元数据。每个导入系列的元数据存储在变量特性中。特征类似于记事本,但主要用于编程上下文。在import fred案例中,特征可以包含数据管理中有价值的信息。

  使用char list查看特征,被称为varname[charname]。在使用vintage数据时,两种特征是最主要的。特征保存在Last_Updated中,与您导入的年份相对应。

  

  与GNPC96 20090415相关联的实际年份是2009年3月26日。当您指定一个不是真正的年份的日期时,导入fred时优先导入要求的日期。

  特征Units包含了系列测量的单位。这种特性对于单位随时间变化的系列是有用的。例如,有些系列是为了通货膨胀而调整的,并将其编入基准年。基准年可以随着时间的推移变化。其他系列的单位不会随时间变化。我列出了我导入的四种vintage数据的单位。

  

  所有年份中的单位没有可比性。其中一个年份使用价格指数,2000年美元计算,另外两个使用2500美金计算,还有一个以2009美金计算。基准年的差异表现为国民生产总值(GNP)的水平变动。我们可以通过绘图来看到这些水平的位移。

  

  国民生产总值增长率的修正

  在这一节中,我举例说明,在这些年份中,对GNP的修订产生了惊人的不同的增长率。

  接下来的几张图表描述了2009年、2010年、2011年和2017年的实际国民生产总值增长情况。国民生产总值数据经常以增长率的形式来报告,通过使用增长率,我们消除了不同年份的基础年变化所带来的水平变化。

  每一个年份的增长率都是按实际国民生产总值的四分之一个百分比来计算的。我给每个年份都标上年份标签。

  

  之前的年份缺失值的之所以发生是因为,例如,2015年的观测数据不存在于2009年的年份中。下一个图表是从每一个年份计算的增长率。首先,绘制了2009年和2010年份的增长率。然后,我又绘制了所有四个年份的增长率。

  

  这个图表绘制了从2006年的每个季度开始到2009年4月15日和2010年4月15日GNP年份实际增长率。单位按季度百分比变化的,所以数值2表示季度增长率是2%。大多数修订都很小并且没有太大意义,特别是2006年和2007年。这两个年份的数据都显示,2008年实际GNP增长有所放缓,但2010年的数据表明,经济增长陷入了不利的领域,比2009年份估计的要早两个季度。最明显的修订是2008年的第二和第四季度的观测结果。2009年的报告显示,2008年第四季度,实际国民生产总值下降了约1.5%;2010年的数据下降了1.7%。

  

  这张图表增加了从2006年第一季度开始到2011年4月15日和2017年4月15日的实际国民生产总值的增长率。如前所述,2006年和2007年中对观测结果的修正是次要的。2011年和2017年的年份报告显示,与2009年相比,2008年的国民生产总值增长有所下降。最明显的是在2008年第四季度对观测结果的修正。2009年份报告显示,这一季度国民生产总值增长率为1.5%,但2017年份数据显示,国民生产总值的增长率下降了近3%。

  总结

  在这篇文章中,我演示了如何使用import fred以及如何导入多个系列的年份数据。还研究了2008年左右实际GNP的修正。大多数的修正影响都不大,但某些季度的修正数据量大,就会得出比之前的数据更严重的经济衰退和低谷。

  

点击进入北京天演融智软件有限公司展台查看更多 来源:教育装备采购网 作者:科学软件网 责任编辑:安健 我要投稿
校体购终极页

相关阅读

版权与免责声明:

① 凡本网注明"来源:教育装备采购网"的所有作品,版权均属于教育装备采购网,未经本网授权不得转载、摘编或利用其它方式使用。已获本网授权的作品,应在授权范围内使用,并注明"来源:教育装备采购网"。违者本网将追究相关法律责任。

② 本网凡注明"来源:XXX(非本网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,且不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负版权等法律责任。

③ 如涉及作品内容、版权等问题,请在作品发表之日起两周内与本网联系,否则视为放弃相关权利。

校体购产品