PART 1如何写一篇比较规范的实证研究论文
今天就实证研究中的几个方面和大家聊聊。很高兴在微信课堂和大家轻松聊天,中间你们有什么问题就可以互动,咱们群里有本科生硕士生博士生,大家在学习过程中会经常会遇到如何写一篇比较规范的论文的问题,我的研究主要是实证方面的,所以就此点和大家具体交流一下。
我把实证研究文章的框架简单地列了几部分,仅个人观点,在经济学的文章写作中有纯理论的经济学的文章,也有实证研究方面的文章,它们写作的特点并不一样,我们一起讨论实证研究文章该怎么写,写作框架注意什么问题,每一部分应该关注哪些点,对于实证研究即Empirical study我在下面图片中主要列了六个部分。
这六部分其实我个人也把它叫做写文章的框架的八股文的格式,学术论文比较规范,我就这几个部分和大家探讨:
第一,为什么要写这篇文章,你做研究、写文章的意义是什么,也就是the importanceof your study,要把这一点回答清楚,你需要一个introduction,要在开题中回答这些问题。
在introduction中我们需要描述写实证文章背景有什么、目前了解到的信息有什么、明白提出的研究问题:是一个还是多个,这些问题都包括哪些方面,是微观层面的还是宏观层面的?你做这篇文章要从哪几个角度准备入手,它的重要性在哪? 举一个研究的例子,很多人听说过生态足迹ecological footprints,生态足迹最近在学术领域比较活跃,很多学者关注这个问题。
但是在不同的研究领域科学家研究的点不一样。比如说在science领域,就是纯科学领域,假设研究者想搞清楚食物消费的水足迹研究,科学家的研究就是想搞清楚为了生产一斤面包需要多少水或者也叫虚拟水,我们知道面包是通过小麦来的,但是在小麦生产过程中也是需要水的,所以在科学领域的研究学者在想用各种方法来考虑这一斤面包生产中需要多少斤原材料小麦,而生产这些小麦又需要多少水,在小麦的运输要又损耗掉多少水。这样研究者可以计算出来消费一斤面包,从生产领域和流通领域最终折算出来所需要的水是多少,但要注意在此过程中,在很多环节科学家测算的是H2O的存在形态,也就是你看不到水,但水的构成分子是存在的,也就是很多文献中所称的虚拟水virtualwater.那么这是science领域研究者要测算的问题。
在软科学领域即soft science领域, 比如说我们的经济领域,经济学家在想我们是研究那些因素影响到人的消费行为的?有很多社会的、经济的、环境的、人口的等各方面的因素会影响人们的食物消费,所以经济学家的问题就是哪些因素影响到面包的消费呢? 尽管都关注消费consumption问题,但这两个问题在science领域和soft science领域研究者关注的角度和层面截然不同。我们想知道,这些影响到食物消费的各方面的因素,最终怎么表现在生态上,比如说,水足迹的需求方面呢?
所以这样我们就提出了一个研究的问题,我们将回答食物消费对于生态,比如说,对水足迹承载力的研究,从这个角度提出这个问题了,那么研究的重要性也要回答,在science领域科学家只关注于虚拟水的折算问题,但经济领域只关注哪些因素影响食物消费的问题,为了研究我们提出的这个问题,我们就要把这两个领域角度交叉研究,也就是影响到食物消费的各个经济社会环境等因素最后如何折算成对生态的虚拟水的影响,这就是你提出研究的重要性。
为了搞清楚这个问题,我们既要完成science领域的文献阅读,也要完成经济领域的文献阅读,我的建议是对于一个研究问题。一般最起码得写约三十页左右的文献综述,这对于学生们说并不容易,尤其是你阅读的都是英文文献时。文献开始有个精读而且是个慢读过程,随着对问题不断研究深入,在别人的观点中慢慢找到自己感兴趣某一角度,某一观点,在某一分支中继续读下去,才能明白研究的重要性在哪几个点,最终才能提炼出introduction中我列出的这几点。所以说找到研究的重要性很不容易。
一般说论文写作万事开头难,最难的部分是introduction,要抓住审稿人的眼球,让他看完头头两段就被深深吸引,情不自禁看下面怎么做,在论文写作中introduction是需要修改最多的地方,introduction来源于一个认真艰苦的文献综述过程,导师们在培养学生时,也是在此阶段和你们亲密接触的阶段,这阶段的辛苦亲密是为了品尝最后甜美的论文结果。
为了回答清楚所研究的问题你需要读很多国内外文献,其实每一篇学术期刊、文章,它都有自己的摘要,都有introduction,认真读过的与你的研究问题相关的论文中的introduction,就会得到大量信息。所以我再次强调计划写好一篇规范论文之前,需要认认真真做好文献阅读,比较好的综述写作必须有,为了完成一篇文章你所读的文献摘要最起码要有30页左右。
这是第一个大的部分,即在实证研究introduction中要回答的问题。
第二部分是Theoretical framework即理论框架,经济学院学生学过的宏观经济学、微观经济学理论知识,为理论框架奠定了最重要的基础,假设你想研究消费领域,研究理性人在资源有限的情况下如何合理有效使用资源从而达到自己的效用最大化。消费者效用最大化问题受制于收入预算约束线,时间约束线,在这些条件约束下情况下你才能找到效用最大化的点,这个效用理论在研究消费的行为时,理论框架就来自于这一部分。具体到某一个研究来讲,在理论框架中很多研究学者给出一些创新的理论点,理论研究文章与实证研究不一样,实证研究是从实证中来验证理论假设是否成立,而理论研究中更多在理论框架中对理论模型突破创新。那么这第二个部分理论框架目前对学生来说不是那么困难的问题,毕竟你们有这一部分基础接触,比较容易开展。
第三个部分是实证研究方法部分Empirical Methods,包括几块,第一大块是Statistical/ econometric methods;第二个是Empiricalmodel specification;第三个是Estimation method。
关于实证研究方法这一部分,一般来说大多数同学刚开始接触感觉比较难,所以这一部分具体介入的课程就是计量经济学,计量经济学主要是在文章中帮你解决所列的三部分问题,第一部分就是统计计量方法有哪些,第二部分在这篇实证研究中模型是怎么界定的即specification,第三部分是模型对你要研究的未知参数、解释变量,估计方法都有什么。
大家觉得难的原因是因为计量经济学研究的框架和微观经济学、宏观经济学有区别,计量经济研究的角度和数学和其他概率统计有区别,在它搭建的这个框架下它认为影响你的被研究对象有很多因素,我们分析它的一些边际影响,但是我们还要控制住随机扰动项,在框架的界定下面我们需要利用数据,从一些未知总体中得到样本抽样,用样本抽样试图回答被研究变量的总体分布情况。
大部分的实证研究需要用到实证数据,这些数据就是我们的samples,这个sample的代表性我们就需要在数据的描述中给读者非常清楚的说明,数据的来源是第一手调研的数据,收集的资料还是归纳整理的aggregated宏观的数据?数据的类型在实证研究中也是多种多样,在你回答的问题中你选用的模型的框架都有什么,研究的问题不同,研究的模型框架也是大相径庭的。
不管在什么样的模型的框架下我们都要回答一个问题就是,这个样本所推断出来的样本分布中我们能否估计出来未知参数,这个未知参数是在每个既定范围内可以让我们对外的波动范围做出一个预测,做出一个判断,从而使得我们这个研究对于研究的经济预测我们可以做哪一部分的工作,这就是在我们的模型框架中试图要搞清楚的问题。还有就是说未知参数的估计方法,这个方法有很多种。
大部分同学都了解有OLS,有MLE还有GMM估计方法等等,实际上现在计量中,在估计上,有参数估计还有非参数估计方法,有各种各样找到未知参数估计量的方法,同学们在介入初期会感觉比较难,随着计量经济学的接触和学习就会感觉这一部分的技术难点不是一个大的问题。
那么,现在对于实证研究已经有了introduction,大家现在有理论的框架,我们确定了实证研究的方法,在实证研究中你要把你模型的估计结果进行讨论,那么就进入第四部分result discussion,这个result discussion实际上就是你要围绕着你研究的估计结果来讨论。因为每年毕业季学生们的论文写作中经常犯的一个问题就是,做了一堆分析但所讨论的结果并不是自己研究的,或者说他做了很多的分析,但是他并没有去琢磨分析的东西的经济意义有什么?
那么,具体点来讲,基于你的理论框架和你的实证模型的估计你的结论这些各个的因素,它能回答的问题是什么,也就是它的story,它的后面的经济学的故事是什么,你的经济学的直觉在中间,那么在你的假设检验过程中,是否验证了你的经济学的一些假设,对于这个模型的基本预测,你要做出什么解释。这都是你要在结果讨论中要逐一的仔细回答的问题,而不是说像有些同学笼统的把结果摆出来,不作分析,就扔给了导师。
另外一个需要说的是,在结果讨论中我们要对照着你在前面看过的文献中,别人的结论说了什么,你研究的story和别人的文献区别在于什么,所以在你的结果讨论中需要对比,你和前人的结论中一致的地方你需要标明出来,不一致的地方,它的原因是什么,是你的样本问题,你的模型的框架的问题,你的模型的估计的问题?你要把原因分析清楚,这样才能保证给在未来研究这个领域问题的学者提供一个研究这个问题的有建设性的观点。
这就是实证研究框架的几部分的简单的讨论。
在框架中下面一部分就是conclusion,基于你之前的研究,你的创新性的观点,你得出来的结论,你的conclusion中你要非常鲜明地提出你的观点是什么,在这个理论框架下你所支撑的你的数据的结论是什么,你的创新点是什么,还有你论文的不足之处有什么,都要逐一的进行说明。
PART 2实证研究文章中计量分析方法的“地位”
那我们开始第二部分的讨论。那么这一部分其实大家刚刚注意到我在实证研究的框架中关于这个实证研究方法我用一个红色的框框起来了,那么为什么框起来?我就想借这个机会和大家聊一下我的看法。
这个看法就是说到底在现在的经济学文章中那么这个计量研究方法它所占有的位置是怎么一回事?我想在我这个框架中大家可以看出来它自然是一个很重要的部分。但它绝对不是说这个部分就可以代表一篇经济学论文,这是两码事。但是现在研究领域中大家读期刊就感觉没有计量的模型好像这个文章就很难发出来,所以大家为了发一篇文章大家用各种数据做了很多的模型,我想聊一下我的看法,经济的计量模型只是为这个论文来服务的,绝对不要舍本逐末。
这个计量方法模型只是论文组成的一部分,它只是为了研究清楚你这个问题一个有效的工具,所以计量经济学是为我们宏观微观经济做服务的,它只是一个服务的工具,但不能替代我们的经济学。所以说并不是学好计量经济学,经济学就没有问题了,这纯粹是两码事,学好计量只是说明这个工具掌握的不错,但是经济学的基本的理论才是最最重要的部分。
但是因为在文章的研究中计量方法又占有一个比较重要的技术的服务的部分,所以就和大家分享一下,研究中常用的计量经济学的软件都有什么?那么这些软件它有哪些资源、链接?我想借这个机会和大家聊聊。
刚发的下面几个图片能看到其实就是在计量经济学中不同的老师常使用的不同的计量软件的使用界面,那么这些软件使用的难易程度自然是有差异的,对于高级微观,高级宏观,比较复杂的比较前沿的一些经济学研究问题那么我们需要借助一些在计量经济软件中一些编程的程序来帮助我们实现,对于我们一些基础的古典模型的理论就需要借助一些简单的编程的软件就可以实现。
头两个图片第一个图片是EViews,第二个是SPSS,这两个是在研究中模型估计中同学比较常用的软件,这两个软件我就把界面截图过来了,那么比较清楚得看到就是有很多下拉菜单,就像用excel似的,点击菜单,所点即所得,比较容易使用,比如在第二个图片SPSS你点击分析菜单,就会看到你是要统计描述,还是做一般线性模型分析,还是广义线性模型分析,还是做相关分析啊,所以进入链接就可以直接得出结果来。
那么后面两个图片第一个是SAS,第二个是Stata,那么这两个在我们学院用的比较多的,有同学用Stata和导师做课题的更多。这两个是功能比较强的,包括模型的界定啊,包含的模型所设定的参数的选择性特别多,相比EViews和SPSS,老师们用SAS和Stata更多一些,这两个软件各有千秋,像最初的Stata软件它内部的使用空间比较有限,所以对于分析大样本数据有一点力不从心,但是随着Stata8.0之后的版本就没有这个问题了,这个问题被克服了,那么SAS这个软件有一些老师可能会接触到,在国外的一些高校中老师在计量课程中用SAS的是比较多的,因为大部分公司或研究机构用SAS软件比较多,所以老师介绍这个软件给学生对于学生将来的就业会比较有用。
这两个软件大致一看就会发现与前两个软件有非常明显的区别,SAS的功能非常强大,在SAS软件使用中包括很多模块,所以我们经济学家如果你的研究是时间序列方向的,那么你可能就专门使用时间序列模块,如果你做受限因变量模型分析或者说其他的一般模型回归,那么像SAS STAT基本上就可以来实现。Stata下面也有很多模块,它有很多新的计量模型,新的计量估计方法,如果研究学者给它发表之后Stata公司就会通过编程人员把新的模块编程进去,最初我记得几年前我用Stata对于受限因变量中的Tobit模型,它的marginal effect求解的时候最初是没有的,但后期很快的这个模块就生成了就放到了软件中,你可以去下载,导入你的Stata,就可以运行。
当然你如果看Stata截图中你会清楚的看它也比较友好,它接近EViews与SPSS的操作界面,也可以点击,比如你点击statistics中,你点了统计中,那么下面就分了很多模块,分的很细,有参数估计方法,时间序列方法等等,它按照我们计量经济的模块来分,我们就可以按照菜单下面的分类来做我们的计量分析。
PART 3有关模型软件的资源分享
下面想和大家借助于微信的平台来分享一些资源,你要是想学习了解这一部分模型软件,相关模型软件书籍,例子,数据应该从什么地方去找到这些资源,我现在发几个图片,把这些资源,链接发给大家。
在这个实证研究中,不管你的模型有多少种,你的软件有多少种,它的所有的一个根本目的是为了解释我们这个经济学的研究问题,是为这个经济学研究的意义来服务的。所以千万不要舍本逐末,不要把做文章变为为了计量而完成模型的一个过程。然后弄了一堆,你就以为你的任务完成了。这是一个误区,我是希望大家同学们千万不要进入这个误区中。
下面一些资源。你们想去了解这一部分的模型的软件,和一些相关模型软件的使用书籍,以及相关的地址,资源。我接下来发一些图片和链接给大家
我以Stata为例给出了基本学习的书籍,它们都非常经典。它们都是从不同角度书写的,有的是从宏观角度,有的是从微观经济学角度。
以绿色的这本《regression models forcategorical dependent variables using stata》为例,它是比较前沿的。大家在这个分类回归数据中,它给出了很多的样本数据。还讲了每一个模型的理论框架是怎么一回事,stata这个程序语言是怎么了一步一步求出对于某个未知参数的估计值,然后它的边际效应,还有它的这个概率的预测值等等。是一本挺好的书。同时,这几本是大家相对于Stata可以参考的。
还有一个就是网址,也给大家说一下。UCLA大学www.ats.ucla.edu这个网站中有非常详尽的,常用的通用计量经济软件及还相关的数据,书籍。都配有比较好的讲解,大家可以在这个链接中找到有用的信息。
例如,以stata为例,进入UCLA的Academic Technology Service网站以后,可以看到这几个板块。其中,statistical analysis归纳了它的基本的统计分析都有什么,还给了很多例子。里面的textbook examples包含了一些这个的方面的书籍所给出的例子。 而Linksby topic则对于不同回归模型,按照分类把不同stata的命令都给列出来了。里面有Dada management,ANOVA分析,图片的制作,Regression,Logistic Regression,Survey Dada Analysis等等,你们结合自己的研究可以从这个地方找到相关的例子来看一看。
那么,如果你点击这个textbookexamples它给常用书分了几个层次。首先是Introductory Statistics介绍统计方面的书,里面两本书分别是David和Alan写的。这两本书是比较浅显易懂的。第二大块就是这个Regression Methods,关于回归方法的,有五本书,它们的方法本身也是各有千秋的。有的是从这个回归的角度,有的侧重于回归中的一个图形的分析,有的是侧重于这个回归中不同数据数据集的合并和使用等等。
举个例子,比如说这五本书的最后一本就是Neter写的《Applied Linear Statistical Models》,比较有特点。它的特点就是说,对于我们的实证研究中要用的这个计量的分析方法,他给出了两个大的例子。其中一个例子从头到尾穿越了每一章,分析了所有模型分析中,从模型的空间的搭建,到参数的估计,然后到这个样本的分布,到假释验证和prediction。他是用stata把这些全部给你列出来了。
第二个例子也是这本书。他是把所有的SAS命令穿越所有的章节,也是给你举例举出来了。所以如果大家感兴趣也可以参考一下这个书。
我的想法就是通过这个微信平台给大家分享一些资源啊,大家可以在下面自己学习然后通过这个网站的书籍和相关的数据,自己可以进行学习探索,使用这些软件。但是我再次说明我的个人的看法。计量经济绝对不是经济学,它只是为经济学服务的一个工具。所以说学习计量经济这个工具课程没有问题,但是更重要的是要把微观经济和宏观经济搞清楚,学明白。
今天我基本就讲到这个地方,跟大家也就是聊了一聊相关的实证研究的一些基本框架,方法。以及所用的软件和资源。今天的课堂到此结束,谢谢大家。