教育装备采购网
第七届图书馆 体育教师课题研修班

Ermistatas和Stata的ERM新命令

教育装备采购网 2018-11-26 11:34 围观1171次

  Ermistatas是我们目前最受欢迎的T恤。看到它,您就会明白为什么。

  

  我们称这个角色为Ermistatas,他正在思考——Ermistatas cogitatu。注意他的三个天线发射器和接收的电螺栓。即使在那些不使用Stata的人中,这件衬衫也很受欢迎,并引导他们提问。“谁或什么是Ermistatas,为什么他、她或者它应该得到一件T恤?”然后他们补充说,“为什么是三个而不是通常的两个触角?”

  Ermistatas是我们艺术和图形部门的作品,代表Stata 15的新命令,用于拟合扩展回归模型——我们创造的一个术语。 我们简称ERMs。新命令是:

eregress

fits linear regressions

eintreg

fits interval regression

eprobit

fits binary-outcome probit regression

eoprobit

fits ordinal-outcome probit regression

  Ermi有三个触角,因为新命令可以处理通常不能一起处理的三个问题。我将使用内生这个词来描述它们,但如果您不使用这个词,我已经包含了其他描述。ERM处理的问题是

  内生协变量或

  与误差相关的协变量

  内生选择或

  非随机选择或

  非随机缺失

外生性和内生性治疗分配或

  随机和非随机治疗分配

  如果您正在阅读替代性描述,就知道当经济学家使用内生一词时,他们的意思是“与模型的错误相关”。相关性的原因可以变化。变量可能是内生的,因为它的值是主体先前选择动作的结果,或者存在影响变量和结果的未观测到的混淆因素,或者变量仅通过误差进行测量。

  如果我的话没有使您兴奋,我并不感到惊讶。因为我不知道如何用几句话来激励您,所以我打开了T恤的图片,希望它能让您继续阅读。

  为什么hullabaloo

  Stata和其他统计软件包具有拟合内生协变量,样本选择和非随机处理分配的模型的特征。到目前为止,他们无法处理三者的组合。hullabaloo的另一个原因是ERM命令非常容易使用。尽管如此,我们还是要写一本258页的手册。这就是原因。

  ERM可以做什么?

  想象一下如何拟合模型

  

  如果y,x1,x2等的值满足通常的假设,则不需要ERM,这相当于它们与错误不相关。当y是连续的时,使用通常的线性回归命令,当y是二进制概率时,通常的probit命令,依此类推。

  其他时候,情况并不像您希望的那么简单在这些情况下,大多数研究人员在模型中引入了现实情况所需要的复杂性。这是一种有用和富有成效的方式。

  事实上,x1的值是受试者做出选择的结果—这是他们的学校教育—如果是,它是内生的,您将无法使用通常的命令来适应模型,因为还有其他,混淆影响y和x1的变量z。

  或者可能只有选择做某事的受试者才能观测到y,例如找工作。这是James Heckman在2000年获得诺贝尔奖的样本选择问题。

  或者可能是x2记录参与了肾癌的新治疗,并且医生只有在他们判断它将比传统治疗更有益于患者时才会为患者选择治疗。

  如果遇到部分或所有这些问题,您将很容易使模型复杂化,以解决实际情况所带来的问题。

  我希望您们以不同的方式进行,尽管是等同的。我希望您们考虑希望拥有的数据上拟合方程式,其中x1,y和x2没有我刚才描述的问题。实验对象没有选择x1;他们的教育水平是随机选择的。所有实验对象都观测到了y,不是因为他们选择了工作; 他们被迫工作。医生没有为他们认为有益的患者选择治疗x2;x2是随机选择的。在今天的现代世界中,这一切都不可能实现,谢天谢地,但把它放在一边。如果数据是通过这样的过程创建的,那么只需按常规方式拟合等式即可。您会拟合的获得

  

  的系数将是在另一个世界中观测到的。

  接下来,我想让您考虑一下您的数据。它是由数据生成过程(DGP)创建的,即具有所有复杂性的现实。您可以考虑一下DGP给您带来的所有问题。以这种方式思考ERM的方式。EMS在本质上是简单的。它得到了(b0,b1,...,bK)的值。

  

  如果数据没有DGP所引入的问题,那么ERMs所获得的值就是那些被观测到的值。您必须告诉ERMs有关DGP的信息,这样它就可以从真实数据中分离出系数,但是ERMs会这样做,并报告替代世界的结果。ERMs还将报告关于合适的DGP的信息,但是除了一件事之外,这些信息基本上是无用的。在对y进行预测时,您可以在替代世界获得预测,或者获得关于DGP的任何并发症的预测,无论是单独的还是一起的。

  简而言之,这就是ERM。ERM提供

  在内源变量所在的世界中,(b0,b1,...,bK)的拟合值不是内生的,样本选择没有发生,并且处理是随机分配的。

  许多其他拟合系数与DGP有关。

  能够在另一个世界中做出预测,以及通过重新引入DGP的任何影响来做出预测的能力,甚至比DGP的影响更大或更极端。

  我经常说统计学家很少回答研究人员提出的问题。如果研究人员问,“拟合系数为0.1或更大的几率是多少?”,统计学家回答说:“我无法回答这个问题,但我可以回答另一个问题,如果您站在您的头上眯着眼睛,这是有关系的。” ERMs是统计学家提供了您想要的东西的例子。唯一的代价是您必须要有不同的想法,并谨慎一些。

  您可以通过常规方式考虑方程系数和标准误差的报告,即使它们是统计学家(并且只有统计学家)希望存在的另一个世界。如果您想要重新引入DGP的问题的答案,就必须使用Stata的predict, margins或其他命令,这些命令将使用ERMs所提供的预测值及其标准误差来进行计算。这比听起来更容易。对于治疗效果的建模者,ERMs提供了计算ATET,ATEU和POMEANS的命令(治疗中的平均治疗效果,未治疗中的平均治疗效果和潜在结果均值)。显然,如果只有一个治疗效果的问题,Stata会提供其他命令,但这些命令无法解决这个问题:拟合内生性治疗臂模型,在治疗臂分配后随访观测丢失,并且如果您的数据足够丰富,则可以解释某些患者吸烟前的(内源性)选择。ERMs可以做到这一点。

  这本258页的手册解释了如何操作。正如我所说,这很简单但不同。值得您花时间。

  如果您是经济学家,您可以使用内生变量拟合Heckman模型,这些内生变量甚至可以在选择方程中!

  如果您是生物统计学家,您要明白,经典的Heckman模型所处理的东西将会丢失。 您担心的是那些被跟踪的人是不同的。如果您有影响丢失但不影响实验结果的变量,您可以对其进行测试并进行调整。允许选择方程中的误差与结果方程中的误差相关联。

  如果您是其他行业人员,您要明白,Heckman模型处理的是MNAR,不是随机的。

  无论您是谁,您都不能只拟合线性结果的模型,您可以用经过审查的结果或二进制的结果来匹配模型,或者排序的二进制结果,比如“一点点”,“更多”,和“很多”。

  

点击进入北京天演融智软件有限公司展台查看更多 来源:教育装备采购网 作者:科学软件网 责任编辑:安健 我要投稿
校体购终极页

相关阅读

版权与免责声明:

① 凡本网注明"来源:教育装备采购网"的所有作品,版权均属于教育装备采购网,未经本网授权不得转载、摘编或利用其它方式使用。已获本网授权的作品,应在授权范围内使用,并注明"来源:教育装备采购网"。违者本网将追究相关法律责任。

② 本网凡注明"来源:XXX(非本网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,且不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负版权等法律责任。

③ 如涉及作品内容、版权等问题,请在作品发表之日起两周内与本网联系,否则视为放弃相关权利。

校体购产品