介绍评估

PDF版本

随机评价是一种使用随机分配来分配资源的影响评价,运行程序,或者将政策作为研究设计的一部分来应用。与所有影响评估一样,随机评估的主要目的是确定一个程序是否有影响,更具体地说,量化这种影响有多大。影响评估通常通过比较那些(个人)的结果来衡量项目有效性,社区,学校,等)对那些没有接受这个项目。这样做有很多的方法,但随机评估通常被认为是最严格的,其他一切都是平等的,产生最准确的(即。无偏见的)结果。

以下内容的副本,下载介绍评估.

什么是评价,为什么要评价??

为什么要评价??
评价的目的并不总是清晰,特别是那些已经观看过调查的人,输入的数据,然后接下来的报告存档只收集灰尘。这是最常见的由其他人当评估实施。
如果,另一方面,负责项目日常操作的人员有关键问题,评估可以帮助找到答案。作为一个例子,负责分发氯丸的非政府组织可与当地实地工作人员交谈,并听取勤奋使用氯丸的家庭的故事,偶尔看到他们的健康状况有所改善。但是每次下大雨,诊所充满患有腹泻疾病。非政府组织可能会好奇,“如果人们使用氯来处理他们的水,为什么下雨时他们生病了?即使水更多的污染,氯气应该能杀死所有的细菌。”这个非政府组织可能想知道,这些氯丸是否真的能有效地杀灭细菌。人们使用它在正确的比例?也许我们的现场工作人员没有告诉我们真相。也许收益人不使用药物。也许他们甚至没有收到。然后当面对这个事实时,现场工作人员声称,在雨季,很难到达家庭和分发药片。家庭,另一方面,会回答,他们大多数努力使用药片在降雨期间,大大,药丸帮助他们。
与组织中的不同级别的个人以及利益相关者交谈可以揭示正在发生的事情的许多故事。这些故事可以作为理论的基础。但是合理的解释和答案并不一样。评估包括对正在发生的事情提出假设,然后检验这些假设。
什么是评价??
“一词”评价”可以相当宽泛的解释。它对不同的人意味着不同的东西和组织。工程师,例如,可能评估或测试一个产品设计的质量,材料的耐久性,生产过程的效率,或者是桥梁的安全。批评人士评估或审查饭店的质量,电影或书。儿童心理学家可以评估评估幼儿的决策过程。
J-PA威廉希尔老虎机L的研究人员评估了旨在改善世界威廉体育网址穷人福祉的社会计划和政策。这就是所谓的项目评估。
简单地说,项目评估是为了回答这个问题,“我们的计划或政策进展如何?“这取决于可以有不同的影响是在问问题,和他们说话。例如,如果捐助者问非政府组织主任我们的节目进展如何?“她可能暗示,“你一直在浪费我们的钱吗?“这让人觉得很好奇。另外,如果政客问她的选民,“我们的节目进展如何?“她可以暗示,“我们的计划是否满足您的需要?我们怎样才能使你们做得更好?“方案评价,因此,可能与积极或消极的情绪有关,取决于它是否由要求问责学习欲望.
威廉体育网址J-PAL与政府合作,非政府组织,捐赠者,和其他合作伙伴更感兴趣学习问题的答案:我们的项目是如何起作用的?这个问题可以通过影响评估回答。进行影响评估的方法有很多。但J-PAL采用的是随机评价。威廉体育网址
在一个非常基本的水平,随机评价可以回答以下问题:这个计划有效吗??但如果仔细设计和实现,它还可以回答问题,,它有多有效?有没有意外的副作用?谁受益最大?谁受伤了?为什么它工作或不工作?什么教训可以应用于其他情况下,或者计划扩大?这个项目的成本效益如何?它与其他旨在实现类似目标的程序相比如何??回答这些问题(同样有趣,如果不是更有趣的问题,影响评估应该是更大一揽子评估和练习的一部分。遵循Rossi提出的综合评价框架,FreemanLipsy,这个包在后面的章节中有介绍:
1.需求评估
2。程序理论评价
3.过程评价
4。影响评估
5。成本效益,成本效益,成本对比分析
6。目标,结果,测量
前两个评估(需要和程序理论)检查程序或政策试图满足什么需求,以及通过什么步骤来实现这些目标。理想情况下这些步骤应该正式制定的实施计划,在建立影响评估之前。
过程评估对于项目经理来说很有用,并且可以测量里程碑和可交付成果是否按时完成。许多组织已经建立了跟踪过程的系统——通常被归类为监视和评估(M&E)。
影响评估旨在衡量方案或政策是否成功实现其目标。
最后,成本-效益和成本-效果分析对于项目的更大政策含义是有用的。首先,我们来看看项目所获得的利益是否值得付出代价。第二个方案比较这个方案的好处和设计实现类似目标的方案。
在进行任何评估,评价,或分析,必须考虑如何衡量进展。衡量进展的指标——记住项目的目标和预期结果——需要认真的思考和数据收集系统。这包括目标,结果与测量。
1.需求评估
介绍了程序和政策来解决一个特定的需要。例如,我们可以观察到,一个社区的腹泻发病率特别高。这可能是由于受污染的食物或水,卫生不好,或者任何可能的解释。需求评估可以帮助我们找出问题的根源以及那些最容易受到伤害的人。
例如,这个问题可能是由于有机肥料的径流污染了某些社区使用的饮用水。
需要评估是确定社会问题的性质和范围的系统方法,定义要服务的目标群体,以及确定满足该问题所需的服务。
需求评估是至关重要的,因为程序将是无效的,如果不妥善设计满足需要的服务或者实际上并不存在的需要。所以,例如,如果源污染的饮用水污染是农业,投资于诸如厕所和污水系统等卫生基础设施可能无法解决问题。需要评估可使用公开可用的社会指标进行,调查和普查,访谈,等。
2。程序理论评价
社会计划或政策被引入以满足社会需要。满足这种需求通常比发现并按下单个魔术按钮需要更多的思考,或者吃药。对于决策者来说,它要求确定导致不良结果的原因(参见需求评估),从一大堆选项中选择一个策略来尝试产生不同的结果。
例如,如果人们饮用不洁的水,一种方案可以设计成通过改善卫生基础设施来防止水受到污染,而另一种方案可以设计成使用氯来处理受污染的水。一项提议的干预措施可能针对那些应对污染负责的人。另一个目标可能是那些喝水的人。一种策略可能基于这样的假设,即人们不知道他们的水是脏的,另一个,他们知道但无法获得氯,甚至另一个,,尽管意识和访问,人们选择不氯化他们的水由于其他原因(例如。错误的信息,味道,成本,等)。这些项目必须同时导航能力约束(金融、人类,以及制度)以及它们所处环境的政治现实。在构思适当的应对措施时,政策制定者隐含地做出关于什么是最佳方法的决定,及其原因。当这种心理锻炼以一种结构化的方式明确记录下来时,政策制定者正在进行所谓的项目评估理论,或设计评估.
一个程序理论评估模型程序背后的理论,提出了改善目标社会条件的合理可行的方案。如果目标和假设不合理,那么,这个计划是否有效的前景就很渺茫了。程序理论评估包含首先阐明程序理论,然后评估如何满足目标需求的人口。项目中使用的方法包括理论评估逻辑框架的方法变化的理论.
3.过程评价
在它发射之前,一个程序存在于概念中——作为一个设计,描述或计划(参见程序理论评估)。但一旦发射,该计划符合实际情况:组织是否有足够的人员配备和培训?职责分配得好吗?中间的任务被完成准时吗?如果程序旨在提供氯片家庭治疗不洁净的水,例如,正确的氯片数量是否按时到达适当的配送中心??
过程评估,亦称为实施评估项目过程评估,分析程序操作的有效性,实现,和服务交付。在进行过程评估时,调用程序监控(如监测和评估:M&E)。过程评估帮助我们确定,例如:
·服务和目标是否适当一致。
·是否按预期向适当的接收者提供服务。
•服务交付组织。
•项目管理的有效性。
·如何有效地利用方案资源。
过程评估常常被管理者作为衡量成功的标准,例如:氯片的分布每周达到预期受益者的80%。这些基准可以由程序管理员设置,有时由捐助者提供。在很多大型组织中,监测进展是内部监测和评价(M&E)部门的职责。为了确定是否满足基准,数据收集机制必须到位。
罗西彼得,等。评价。一个系统的方法。千橡市:圣人出版物,1999。
4。影响评估
计划和政策旨在实现某个目标(或一组目标)。例如,氯分布程序可以实现专门应对水源性疾病的高发地区。我们想知道这个项目是否成功的目标。这不是一样的问,“氯杀死细菌吗?“或“氯的消耗有害吗?“这些问题可以回答在一个真实的实验室。为了我们的计划达到停止疾病的目标,钱必须分配,必须购买药片,分配机制必须到位,家庭必须收到平板电脑,家庭必须使用药片,并且家庭不能消耗未经处理的水。一个项目评估帮助我们确定所有这些要求是否都得到了满足,以及我们的目标是否真的达到了预期的目标。
作为一个正常的操作,如。基本簿记,产生某些信息,比如运了多少箱氯片。这种类型的信息可以用于过程评估。但它不能告诉我们,我们是否已经成功地减少了腹泻的发生率。为了测量影响,我们必须使用更直接的人数等指标报告患有腹泻在过去的两个月。
影响评估衡量一个项目的成功,其中成功可以广义地或狭义地定义。他们帮助我们清除从成功的更有效的干预措施,也帮助我们改进现有的项目。
影响评估的主要目的是确定一个程序是否有影响(对一些关键的结果),更具体地说,量化有多大这种影响是。影响是什么?在氯的案例中,其影响在于人们由于这项计划而比没有这项计划时健康得多。或者更具体地说,腹泻的发病率比其他情况要低得多。
把这个数字改正比听起来更困难。有可能测量接受该方案的人群中腹泻的发生率。但是“要不然他们会怎样无法直接衡量,就像纳粹赢得了第二次世界大战后,无法衡量今天的美国经济一样,或者,如果1928年在伦敦亚历山大·弗莱明肮脏的实验室里没有发现青霉素,那么确定今天最致命的疾病。德国可能会成为世界上占主导地位的经济,或者,纳粹几年后可能会下降。可能是小伤口仍然是最大的杀手之一,或者,一些近亲青霉素可能被发现在另一个实验室的一个不同的世界的一部分。在氯的案例中,可能没有氯,人们会一直和以前一样生病。或者它是可能的,他们就会开始沸腾水相反,氯的唯一作用就是用一种技术代替另一种技术,这表明人们实际上并没有因为氯而变得更健康。
影响评估通常通过比较那些(个人)的结果来评估项目有效性,社区,学校,(等)谁参加了反对那些谁没有参加的方案。影响评估的关键挑战是找到一群没有参与的人,但是非常相似的是,这些参与者没有接受这个计划。在这个比较组中,我们尽可能接近于测量的结果。否则参与者会怎样。”有很多的方法,每个方法都有它自己的假设。
5。成本-效益/效果/比较分析
两个组织可能想出非常不同的策略来解决同样的问题。如果社区供水,例如,被污染导致腹泻的大量发生,一个非政府组织可以倡导投资于现代水和卫生基础设施,包括污水处理系统,管道水,等。另一个非政府组织可以提出一个分配系统,向家庭免费提供氯片,在家里处理他们自己的水。如果这两种方法被证明同样有效,每一种方法都使腹泻发病率降低80%,地方政策制定者是否也同样乐于实施一个与另一个?可能不会。他们还需要考虑每种战略的成本。
在一个偏远村庄的现代基础设施投资很可能会非常昂贵。在这种情况下,选择可能是明确的。然而,的选择并不总是黑白。一个更现实的(但仍然是假设的)选择是,在基础设施投资中减少80%的腹泻,而氯气分配项目的成本是价格的1/100,和减少50%的腹泻。
一个成本效益分析量化活动的收益和成本,并将它们放入相同的度量(通常通过将货币价值放在收益上)。它试图回答这个问题:计划生产足够的收益大于成本?或者换句话说,社会富裕或贫穷后这投资吗?试图用货币来量化儿童健康的益处,然而,是有一定难度的,主观的。因此,时的确切价值利益缺乏广泛的共识,这种类型的分析可能产生比说明更有争议的结果。当存在多种类型的益处和商定的货币化方法时,这种方法最有用。
一个成本效益分析采取一个程序的影响(例如。腹泻发病率减少百分比;除以项目成本,产生一个统计数字,比如:每花1美元预防腹泻的病例数。这不能判断减少腹泻的价值。
最后,一个成本比较分析将采取多个方案,并使用相同的单位进行比较,允许决策者要求:每美元,这些策略中每一种都减少多少腹泻??
看到纸上”“发展中国家信息政策的比较成本-效果分析:教育应用的一般框架“更多信息。
6。目标,结果和衡量
在进行项目评估时,政府和非政府组织经常被要求将一个项目的任务提炼成几个结果那可以理解,将用于定义成功。更增加了这个困难,每个结果必须进一步简化为指示器比如对调查问题的回答,或测试上的得分。
不仅令人畏惧,此任务可能看起来不可能,请求可能出现,荒谬的。在这个过程中,评估人员会觉得他们只关心数据和统计数据,而不关心项目目标人群的生活。
对于某些目标,相应的指标自然跟随。例如,如果分发氯片的目的是减少水传播疾病,相关结果可以是减少腹泻.相应的指标,,腹泻发病率,可能来自一个问题在家庭调查,受访者被要求直接“有人在家庭遭受腹泻在过去一周吗?““
对于其他目标,如“赋予妇女权力,“或“提高公民意识结果可能不会下降整齐。这并不意味着大多数目标都是不可估量的。相反,在设计相应的指标时,必须有更多的思考和创造力。例如之间的结果,见文章。

什么是随机化,为什么随机??

什么是随机化??
在其最简单的意义上来说,随机化是指掷硬币时发生的情况,一个骰子被铸造,或者一张纸上的名字是盲目地从篮子里抽出来的,以及翻转的结果,铸造,或画决定接下来会发生什么。也许,硬币翻转的结果决定了谁必须做一些家务;模具的角色决定谁能得到一大笔钱;画的名字决定谁来参与一些活动,或者是一项调查。当这些工具(硬币、模具,彩票)用来做决定,结果可以说是偶然的,或者,,随机.
为什么人们让机会决定他们的命运?有时,因为他们认为这是公平的。其他时候,因为不确定性增加了兴奋的因素。统计学家使用随机化是因为,如果有足够的人随机选择参加调查,方便地,这些个人选择的属性代表他们被选中的整个群体。换言之,关于他们的发现可能对更大的群体是真实的。使用一个彩票被称为代表性样本随机抽样随机选择.
从同一人群中随机选择一组,他们二者都代表更大的组。他们不仅统计等效大集团;它们之间在统计学上也是等价的。相同的逻辑发扬如果超过两组随机选择。当以这种方式选择两个或多个组时,我们可以说,个人随机分配分组。这就是所谓的随机分配.(随机指派也是所有个人更大的组将随机分成不同的组。和之前一样,所有组代表更大的组,在统计上相当于对方。)随机分配是随机评价的关键要素。
接下来,在一个简单的随机评估中(包括两组),一组接收正在评估的程序,而另一组不接收该程序。如果我们要用这种方法来评价一个净水工程,我们将随机分配个人两组。开始时,两组统计学与(预计将有相同的轨迹前进)。然后我们介绍让他们不同的东西。一组将获得水净化程序,另一个也不会。然后,过了一段时间,我们可以测量两组个体的相对健康。因为他们在一开始,在统计学上等效看到后来任何差异可以归因于一个水净化项目给了你,另一个没有。
随机评估都被许多的名字:
·随机对照试验
•社会实验
•随机分配研究
•随机实地试验
•随机对照实验
随机评估是称为影响评估的更大评估集合的一部分。随机评价通常被认为是影响评价的金标准,因为他们始终产生最精确的结果。
像所有影响评价,随机评估的主要目的是确定一个程序是否具有影响,更具体地说,量化有多大这种影响是。影响评估通常通过比较那些(个人)的结果来衡量项目有效性,社区,学校,(等)谁参加了反对那些谁没有参加的方案。这样做的方法有很多。
区分随机评估从其他非随机性影响评价是参与(同时)决定随机-在程序开始之前。这个随机分配在临床试验中,当测试新药的有效性(和副作用)时,用来确定谁服用药物,谁服用安慰剂的方法。与临床试验一样,那些在影响评估中的人随机分配“治疗组(即有资格接受治疗。这个程序)。他们比那些被随机分配到“对照组–那些没有收到程序的人。因为在实验开始时,各组的成员(治疗和对照组)没有系统性的不同,它们之间随后出现的任何差异都可以归因于治疗而不是其他因素。相对于非随机评估的结果,随机评估的结果是:
•少受方法论的争论
·易于传达
·更有可能说服规划资助者和/或决策者
除了量化计划导致的预期结果之外,随机评估还可以量化意外副作用(好坏)的发生。和其他影响评估方法一样,随机评估还可以阐明为什么程序具有或未能产生期望的影响。
1.随机化的环境中”评价”“
随机评价是一种使用特定方法创建比较组的影响评价,尤其是,随机分配方法。影响评估是项目评估,其重点是衡量项目的最终目标或结果。有许多类型的评估可以与项目相关——不仅仅是简单地测量有效性。(见评价是什么?)
2。随机化方法
为了更好地理解该方法是如何工作的,见“如何进行随机评价。”“
为什么随机化??
影响是什么?在氯的案例中,其影响在于人们由于这项计划而比没有这项计划时健康得多。或者更具体地说,多少降低腹泻的发病率是超过了原本的。
把这个数字改正比听起来更困难。有可能测量接受该方案的人群中腹泻的发生率。但是“要不然他们会怎样(称为(反事实)不可能直接测量,只能推断。
建立比较小组
影响评估通常通过比较那些(个人)的结果来评估项目有效性,社区,学校,(等)谁参加了反对那些谁没有参加的方案。影响评估的关键挑战是找到一群没有参与的人,但与会者非常相似,特别地,参与者如果没有收到节目。在这个比较组中,我们尽可能接近于测量的结果。否则参与者会怎样。”因此,我们估计的影响只是一样好我们的对照组是等价的。
创建比较组的方法有很多。有些方法比其他方法做得更好。其他一切都是平等的,随机评估做最好的工作。它们产生了一个统计上完全相同对照组,因此产生最精确的(公正)的结果。或者更明确地说:其他方法往往产生误导性的结果,导致政策制定者做出与事实相反的决定。
这些方法不总是给我们一个错误的答案,但他们依赖更多的假设。当假设成立时,答案是公正的。但这通常是不可能的,,总是困难的,确保假设是正确的。事实上,很可能,大多数关于评估有效性的争论都是由关于这些假设是否合理的分歧所激起的。
除了逃避关于假设的辩论,随机评估产生的结果,很容易解释。可以找到更多的信息在我们的为什么随机化文件。可以找到比较常见评估方法的表在这里.
何时进行随机评估
根据在程序或政策生命周期中进行评估的时间,通过严格评估程序或政策变化而增加的价值。评价不应该过早:当程序仍成形,扭结正在被熨平。评价不应该太晚了:钱已经分配后,以及程序,滚出去,这样就不再有空位供对照组使用。
一个理想的时间是在试点阶段的程序或扩大。在这些阶段经常有重要的问题,评估者想回答:这个项目是如何起作用的?在不同人群中有效吗?某些方面是否比其他方面工作得更好,并且可以其他“改进?当人口增加时,它是否有效??
在试验阶段,一个项目对特定人群的影响是未知的。该计划本身可以是新的或可以是针对新群体的既定计划。在这两种情况下项目领导和决策者可能希望更好地理解程序的有效性,以及它如何可能改善。根据定义,的试点项目将达到只有部分目标人群,使进行随机评价成为可能。在试验阶段之后,如果程序被证明是有效的,导致增加的支持,反过来,分配的资源更多,它可以被复制或放大,以达到剩余的目标群体。
一个及时评估的例子是PROGRESA,有条件的现金转移计划在墨西哥在1997年推出。政策给母亲现金赠款为他们的家庭,只要他们确保他们的孩子参加了学校定期和接收计划接种疫苗。的政党,执政前的68年,机构革命党,在即将选举面临不可避免的失败。选举失败的一个可能的结果是,取消了诸如PROGRESA等现有的项目。为项目的生存提供支持,PRI计划明确展示该政策在改善儿童健康和教育成果方面的有效性。
PROGRESA最初作为试点项目在七个州的农村地区实施。墨西哥政府的506个社区抽样的飞行员,随机分配320人进行治疗,186人进行对比。一年后比较治疗组和对照组,人们发现它成功地改善了这些儿童水平的结果。希望,该计划的受欢迎程度从最初的支持者和直接受益者扩大到整个国家。
人们普遍预计失败后革命制度党在2000年选举中,新政党,PAN掌权,并继承了一个非常受欢迎的节目。不是拆除PROGRESA,潘程序的名字改成了“机会”,并在全国范围内扩展。
该计划很快就被复制在其他国家,尼加拉瓜等厄瓜多尔,和洪都拉斯。在墨西哥的领导下,这些新国家在扩大规模之前进行了试点研究,以测试类似PROGRESA的项目对其人口的影响。
什么时候随机评价不合适??
随机评估可能不合适:
1.在评估宏观政策时。
没有评估者的政治权力进行随机评价不同的货币政策。我们不能随意地将浮动汇率分配给日本和其他国家,而固定汇率分配给美国和不同的国家集团。
2。当拒绝给控制组一个项目是不道德的或在政治上不可行的。
如果没有资源限制,为了实验而拒绝某些患者已经证实其疗效的药物是不道德的。
3.如果程序正在改变过程中实验。
如果实验进行到一半,程序从提供水处理溶液到提供水处理溶液和厕所,很难解释程序的哪一部分产生了观察到的结果。
4。如果实验条件下的程序与正常条件下的程序有显著差异。
在实验期间,如果鼓励或给予奖励,参与者可能更倾向于使用水处理解决方案。在正常情况下,不鼓励或激励,更少的人可能真正使用水处理溶液,即使他们拥有并知道如何使用它。作为告诫,这种类型的评估在测试概念证明方面可能有价值。它只是问问题,“这个程序或政策可以有效吗?“它不会将产生可归纳的结果。
5。如果RCT太耗时或太昂贵,因此不具有成本效益。
例如,由于政府的政策,一个组织可能没有足够的时间来试验一个项目并在推出之前对其进行评估。
6。如果威胁如磨损和溢出太难以控制和伤害实验的完整性。
一个组织可能决定测试除虫药物对特定学校入学率的影响。因为驱虫药物具有溢出效应(一个学生的健康影响另一个学生的健康),很难准确测量药物的影响。在这种情况下,一个解决方案可能是随机在学校层面上而不是在一个学生的水平。
7.如果样品尺寸太小。
如果参与飞行的主题太少,即使计划成功,可能没有足够的观测统计检测产生影响。

如何进行随机评价

计划评估
在规划一个评估组织识别关键问题是很重要的。从这些,我们可以确定有多少问题可以从以前的影响评估或改进的系统得到回答过程评价.如果我们没有找到所有的答案,然后,我们必须选择几个最优先的问题,这将是我们影响评估的主要重点。最后,我们应该制定计划,尽可能多地回答问题,记住,更少的高品质影响的研究更有价值比许多劣质产品。
评估的第一步就是重新审视项目的目标,我们希望这些目标是如何实现。一个逻辑框架或变化模型的理论可以帮助这个过程。(参见项目理论评估)作为评估项目目标和策略的一部分,我们必须考虑的关键结果,预期的途径来实现这些结果,以及合理的里程碑,表明我们正沿着正确的道路前进。像预期的那样在一个评价,这些成果和里程碑将需要加以衡量,因此变成了“指标“最终“数据。”(见目标,结果,和测量)
只有在我们有一个良好的途径,影响范围,以及如何衡量进展的计划,能不能考虑一下实际设计的评价。
如何设计评估
评估设计需要大量的思考。首先是概念部分:我们计划从这个评估中学到什么?相关问题是什么?预期结果是什么?他们怎么能被测量??
接下来是设计问题:
•适当的随机化水平和单位是什么??
•适当的随机化方法是什么??
•在政治之外,行政和道德约束,哪些技术问题会损害我们研究的完整性,我们如何在设计中减轻这些威胁??
·我们将如何实施随机化??
回答我们的问题所需的样本数量是多少?(研究中需要包括多少人,作为参与者,但是作为调查对象呢?)
1.随机化单位
在设计我们的评估时,我们必须决定我们将随机化到什么程度:什么单位将被随机分配?它将个人或团体的个人,如家庭、村庄,区,学校,诊所,教会组织,公司,和信用协会?(当我们将个体分组随机化时,尽管我们关心和测量个体的结果,这被称作集群随机试验例如)如果我们设法保证足够为一千户家庭治疗污染水氯药片(的说,1万个家庭使用同一污染水源的饮用水,我们会随机分配吗家庭治疗和控制组织吗?这意味着,一些家庭将得到氯片,但是他们的一些近邻将被拒绝服用氯丸。那可行吗?伦理的??
对于这种类型的程序,在一个比家庭还要小的单位进行随机化可能是不可行的,例如个体层次。这意味着,家庭中的一些孩子被给予氯丸,而他们的一些兄弟姐妹没有。如果所有家庭成员都喝同一罐经过处理的水,个人随机化的身体不可能,不顾道德的考虑。
也许适当的单元随机化的社会,在一些社区将得到氯,其他社区不会,但是在一个“待遇”社区家庭(暗示所有的邻居)有资格接收药片。在确定适当的随机化水平时,有许多事情需要考虑,只有两个伦理和可行性。下面列出了七个注意事项。
·治疗计划以什么单位为目标??如果氯片是溶解在水储罐,在我们地区所有家庭通常已经拥有,然后可以选择一些家庭接受氯气,和其他人没有。在这种情况下,随机化的单位会在家庭层面。然而,如果储罐通常位于外部并由一群家庭使用,然后是不可能随机分配一些家庭在集群控制小组的所有相同的(治疗)喝水的家庭治疗。然后,最自然的随机化单位可能是集群的家庭”使用普通水箱的。
·分析的单位是什么??如果评估涉及社区水平的影响,那么最自然的随机化水平可能是社区。例如,设想我们的结果测量是发病率住院由于腹泻,是最经济的测量使用行政记录在社区诊所,此外,那些记录仍然是匿名的。我们无法区分住院患者是来自治疗家庭还是控制家庭。然而,如果整个社区都在治疗组,我们可以比较治疗社区和对照社区的临床记录。
·评估设计公平吗??程序应该被视为公平。如果我被拒绝服用氯丸,但我的近邻会接待他们,我可能会生邻居的气,对非政府组织感到愤怒,我可能不太愿意在检验员敲我的门时填写一些关于氯气使用的调查问卷。而且这个非政府组织可能不热衷于让社区成员不安。另一方面,如果我的整个社会没有得到它,但邻近的社区确实如此,我可能从来没有听说过他们的节目,所以没什么好抱怨的了;或者我可以认为这只是一个村级的选择和我的村庄选择不投资。当然,人们可能同样不满一个社区的设计。我们可以试着扩大随机化的单位,或者想想其他的策略来减轻人们的不满。没有人得到帮助的事实可能是不公平的。(参见道德问题)但是考虑到我们不能帮助每一个人(通常是由于能力限制),我们希望改进和评估,我们如何能够以同时允许我们创建等效的控制组的方式进行分配,我们试图帮助的人们认为这是公平的。
·随机评估在政治上是否可行??它可能不是可行的政治随机在家庭层面。例如,社区可以要求所有有需要的人得到援助,使它不可能随机在个人或家庭的水平。在某些情况下,领导者可能要求她所在社区的所有成员都得到帮助。或者她可能比没有接受治疗的风险(她的村庄被分配到对照组)更舒适地随机选择一半接受治疗(有把握)。在一种情况下,她可以遵守研究,在另一种情况下,她可能不会。
·随机评估在逻辑上是否可行??有时,从后勤上来说,无法确保一些家庭仍然存在。控制家庭。”例如,如果氯分布需要招聘一个商人在每个村庄,设置一个村庄成员挑选他们的药片的摊位,要求分销代理人筛选出控制家庭可能是低效的。这会增加官僚作风,浪费时间,并且歪曲了真正的程序应该是什么样子。或者即使商家可以很容易地进行筛选,家庭可以简单地与他们分享药片对照组邻居.然后对照组会受到程序的影响,并且不再是一个好的比较组。(记住,比较组代表没有程序的生活。(参见:……影响评价是什么?)在这种情况下,将有意义的随机在村庄层面,然后简单的雇佣商人在治疗村庄和无法控制的村庄。
·需要考虑哪些溢出和其他影响??即使它是可行的在家庭水平随机给一些家庭氯片,而不是另一些可能不是可行的包含在家庭治疗的影响。如果对照组的个体受到项目存在的影响-他们受益于较少生病的邻居(溢出效应),或者喝的水治疗邻居(不符合随机分配,转入治疗组,它们不再代表一个好的比较组。
·样本大小和权力做什么我们需要检测程序的影响??检测真实效果的能力取决于样本大小。当越来越多的人从一个更大的人口,采样统计上,它们更好地表示总体(参见样本选择和样本大小)。例如,如果我们调查两千个家庭,在家庭一级进行随机(1000次治疗,一千个控制,我们有效样本量为二千家庭。但是,如果我们在村级随机,每个村子有一百户人家,那么我们只有10个治疗村和10个控制区。在这种情况下,我们可能在家庭层面上测量腹泻,但因为我们随机在村庄层面,我们有可能拥有一个接近十个的有效样本(尽管我们正在调查两千个家庭)!事实上,有效样本大小,可能是十到二千,这取决于村子里的家庭和村民同胞有多相似。(见:样本大小)有效样本大小为10,我们可能无法检测到真正的影响。这可能会影响我们选择适当的随机化水平。
有许多因素在确定适当水平的随机化。评估人员不能简单地坐在电脑前,按下一个按钮,产生一个列表,并将评估设计强加给千里之外的组织。评估人员必须对实施组织有深刻和广泛的理解,他们的计划,背景和工作伙伴关系来确定适当的随机化在特定情况下的水平。
2。不同的随机化方法
如果我的组织能保证每天有一千粒氯丸,因此,我可以每天从符合条件的两千个家庭中招待一千个,我可以选择永久地对待同一千个家庭。或者,我可以每隔一天旋转一次,每一个家庭都有喝到干净的水这样的一个日子。我可能觉得后一种选择毫无意义。如果每个人都喝半天脏水,我希望零影响任何人。所以我可以选择一千个每天接受这种药物的家庭。如果随机化,我可能会执行一个简单的“彩票确定哪些数千家庭得到避孕药:我写所有二千名到一小片纸,把这些纸片放进篮子里,动摇了篮子,闭上眼睛,拿出一千张纸。直观地说,这将被调用,一个彩票设计。
另外,如果我要轮换家庭而不是每天,每一年,和随机分配的顺序他们得到治疗,然后两年中就有一年的家庭会被认为是治疗组,另一年,他们将成为对照组的一部分。如果我在每年年底衡量结果,这叫做旋转设计。
说我今年每天能吃到500粒药,但是明年我希望每天有一千人,第二年,每天两千人。我可以在第一年随机选择五百户家庭服用避孕药,第二年,又添上一个五百剩下的千人在第三年拿到。这将被称为,一个分阶段设计。
有七个可能的随机化设计了彩票的设计,分阶段设计,旋转设计,鼓励设计,不同级别的治疗设计,和两阶段随机化。这些设计不一定相互排斥。它们的优缺点进行了总结这个表.
3.威胁的设计
一个溢出效应发生在一个程序旨在帮助目标参与者无意中影响对照组(不论是积极的还是消极的)。如果计划没有实施,比较组应该代表结果(参见反事实)。如果程序已经触及这个比较组,它模仿反事实的角色现在被削弱了,并且随后的影响度量可能存在偏差。存在减轻溢出效应的方法,例如,改变随机化水平。
例如,疾病的一个来源可能是饮用受污染的水。但是另一个消息来源是和邻居生病的孩子玩耍。如果我在对照组,这个节目对我的邻居很好,和那些邻居不再生病,那减少了我生病的机会。即使我可能是在对照组,我现在受到邻居的待遇的影响。我不再代表一个好的比较组。这就是所谓的溢出效应,特别是积极的溢出效应。为了减轻这种情况,我们可以在社区层面进行随机化。这样做意味着如果我们的社区被分配到控制组,我和我所有的邻居都享有同样的地位。我不太可能玩的孩子从一个不同的社区,因此不太可能受到影响的干预。或者如果分配给治疗组,我们不会积极影响他人。
另一种可能是,我的家庭已经分配到对照组,但是我的邻居在治疗组,所以我妈妈知道他们的水是干净的,她送我去他们家喝酒。从某种意义上说,我发现我的方式为治疗组,虽然我被分配到对照组。当人们故意蔑视他们的治疗指定(有意或无意),结果,结果改变了,这将被认为是交叉效应.就像溢出物一样,通过交叉我不再代表一个好的比较自我显然是受该计划的存在。和之前一样,改变随机化水平可以减轻交叉效应。
4。随机化力学
一旦确定了随机化的单位和方法,现在是随机分配个人的时候了,家庭,社区,或治疗组或对照组的任何单位。
一般开始时,我们需要一张(个人,户主(或村庄)名字。接下来,有几种方法可以继续进行。我们可以写名字在一小片纸,把这些纸片放进篮子里,动摇了篮子,闭上我们的眼睛,把一千张纸。这些将组成治疗组,其余的可能是对照组。(反之亦然)我们可以做到这一点,作为一个公共的一部分彩票.同样地,我们可以往下走,一个接一个地掷硬币,以确定治疗状态。然而,我们并不总是把学习人数精确地分成两半。我们可能希望治疗组包括30%,对照组包括70%。或者,如果我们有一个具有三个周期的逐步插入方法,我们可能想把人口分成三组。也很常见,我们将同时测试多种治疗,也需要几个小组。在这些更复杂的评估设计中,硬币翻转是不够的。我们将编写一个计算机程序随机名称分配给组。
有时我们没有事先列表。例如,如果个人进入有疟疾症状的诊所,是否实施世界卫生组织标准的决定点”必须治疗或另一个增强的现场,被称为点随机化.治疗可以由诊所的护士用掷硬币的方法决定。但是,我们也许会担心,如果护士对哪种治疗更好和哪种病人更多有看法,她就会忽视随机分配。配得上”比其他人。替代方案可以包括计算机化或基于手机的随机化。
通常情况下,在随机化之前,将目标群体分成亚组。例如,一群人可以根据性别分成更小的群体,种族,或年龄。或者村庄可以划分为地理区域。在随机化之前将该分组称为子组分层.然后,在每个地层(子组)中进行随机化练习。这样做是为了确保治疗组和对照组在每个组内具有均衡的治疗和控制比例。可以想象,在一个小样本,我们发现没有分层,我们得到更多的女性比男性在治疗组。分层的主要目的是统计,并且与样本大小有关。分层的决定与结果是否有偏见无关。
5。样本选择和样本大小
实验必须足够敏感,以检测治疗和对照组之间的结果差异。设计的灵敏度通过统计功率来衡量,哪一个除其他因素外,取决于样本大小,即,单位随机分配的数量和单位调查的数量。
再一次,让我们以社区中的水传播疾病为例。让我们假设我们选择向家庭分发氯片,以测试其对腹泻发病率的影响。但是让我们也假设我们的测试阶段只有非常有限的预算,因此,我们希望尽量减少包括在调查中的家庭数量,同时仍然确保我们能够知道发病率的任何变化是否是由于氯片剂引起的,而不是随机发生的。有多少家庭应该接受这些药片,应该调查多少?五户够吗?100?200?许多家庭应该如何在对照组?统计能力的测试帮助我们回答这些问题。
有关如何估计所需样本大小的更多信息,见:
迪弗洛,以斯帖,Glennerster,瑞秋,克雷默,迈克尔,“使用随机化发展经济学研究:工具包”威廉希尔老虎机(2006)。麻省理工学院经济系工作文件No.06-36。
布卢姆,H.S.(1995):最小可探测效果:一个简单的方法来报告的统计实验设计的力量,“评价审查19,54~56。

如何实现和获得的结果吗

如何实施
一旦评估设计完成,涉及的评估者必须保持监测数据收集以及实施干预的评估。如果响应者在数据收集阶段退出,则结果可能受到磨损偏倚,损害他们的有效性。本节讨论磨损问题。数据收集阶段的其他威胁,例如测量仪器差,报告偏倚,等,是同样重要的是,但这里不介绍。有关数据收集的最佳实践,请参见:
迪顿a.《家庭调查分析》(1997)。世界银行国际复兴开发银行
在实施干预,随机化的完整性应该保持不变。除非有意纳入研究的设计,溢出和交叉点应最小化,或者至少,有充分文件记载的(背景见设计的威胁。)
1.数据收集的威胁
当评估人员未能收集关于被选为原始样本一部分的个体的数据时,就会发生损耗。注意到治疗组和对照组,通过随机分配,在开始时构造为统计上相同。对照组的目的是类似于反事实-如果治疗组没有提供治疗会发生什么。(参见:为什么随机?)如果退出研究的个人是相同的治疗组和对照组,这意味着耗尽对照组仍是一个有效的反事实的枯竭的治疗组,这将减少我们的样本量,并且可以缩短我们的结果可以推广的目标人群,但它不会妥协真理”这些结果(至少适用于受限人群)。
例如,假设我们的研究区域是农村,,许多家庭成员绝大部分时间工作在城市地区。进一步假设我们创建的样本和收集基线数据在收成移民家庭成员回家时,顺便可供我们研究。如果我们收集endline数据在非高峰季节,移民家庭成员将会回到他们的城市工作,为我们的调查将不可用。假设在治疗组和对照组中这些人是相同的,我们的研究将会只局限于非移民。如果对照组中的非移民人口代表了治疗组中的非移民人口的良好反事实,我们的影响估计将完全有效,但仅适用于非移民人口。
然而,如果消耗在两组不同的形状,而剩下的对照组不再是一个好的反事实,这可能偏见我们的结果。使用我们的水源性疾病的例子,假设对照组有更多的孩子和母亲生病。因此,那些通常在非高峰季节移居城市的年轻人会留下来帮助家庭。家庭被分配到对照组endline中含有更多的移民。治疗组和对照组的基线人口统计学现在有所不同(而最初,他们平衡)。这些移民是完全可行的,工作高峰期,通常更健康。现在,尽管我们的治疗成功培育出健康的孩子和母亲平均我们组包含更多健康的农民工,平均而言。当测量腹泻的发病率,对照组中健康移民的结果可以抵消他们患病家庭成员的影响。然后,当比较的治疗和控制组织,我们可以看到没有影响,可以得出治疗是无效的。这个结果将是错误的,具有误导性。
在这个简化示例中,通过从样本中移除所有移民,我们可以在比较组和实验组之间强制重新建立平衡。通常情况下,然而,那些能够可靠地识别真实和潜在的磨擦者(那些消失的人)的特征还没有被测量,或者无法观察。预测摩擦可以像预测的那样困难参与非随机试验。同样地,磨损的偏见可以选择偏见在进行因果推论一样有害。
2。溢出和交叉
当对照组中的个体受到治疗的某种影响时,溢出就会发生。例如,如果某些儿童在氯气分配研究的对照组中,但与治疗组儿童玩耍,他们现在有了不太可能生病的朋友,,因此不太可能会生病。在这种情况下,它们受到程序的间接影响,即使他们被分配到对照组。个人交叉”控制那些找到直接治疗方法的人。例如,如果对照组儿童的母亲送其孩子从治疗组家庭的供水中饮用,她正在设法进入治疗组。公正的遵从性是一个广泛的术语,它封装了跨界车,以及治疗那些故意选择不参加(或将其水氯化)的个人,在这个例子中)。
当一项研究受到溢出和交叉的影响,在许多情况下,仍然可能产生有效的结果,使用统计技术。但是这些假设都有,其中很多假设是我们在转向随机化时试图避免的。例如,如果可以使用观测变量预测溢出,他们可以控制。公正地遵守,如果我们假设那些不服从的人干预的影响,出于同样的原因,交叉的个体受到与治疗组相同的影响,我们可以推断出我们的计划的影响。但正如为什么随机部分中所讨论的,我们假设,公司越少我们站在当声称干预造成任何测量结果。
如何获得结果
在干预结束时(或至少干预的评估期间),必须收集终结线数据以测量最终结果。假设随机分配的完整性是维持,数据收集管理良好,现在是分析数据的时候了。最简单的方法是测量治疗组的平均结果,并将其与对照组的平均结果进行比较。差异代表了程序的影响。为了确定这种影响在统计学上是否显著,一个可以测试意味着平等,使用一个简单的学习任务。随机评估的许多好处之一是,可以在没有先进统计技术的情况下测量影响。可以进行更复杂的分析。例如,可以运行对其他特征的回归控制来增加精度。然而,随着分析的复杂性增加,潜在失误的数量增加。因此,在进行此类分析时,评估人员必须具有知识和谨慎。
值得注意的是,当获得结果时,我们没有百分之百确定地揭露真相。我们已经制作了一个估计接近真相有一定程度的概率。更大的样本容量,(较小的标准错误将会和某些我们越多。但我们永远不能100%确定。
这一事实导致在分析中的两个非常常见的陷阱:
·多重结果:随机化不保证估计影响是完全准确的。测量的影响是客观的,但它仍然是一个估计。随机的机会为围绕真理的错误留有余地。经常地,这个估计会非常接近事实。偶尔地,这个估计会稍微偏离一些。很少,它将显著偏离。如果我们看一个结果度量,有一些机会,明显偏离事实。但这不太可能。如果我们看许多措施,结果大多数会很接近,但有些会偏离。我们观察的指标越多,越有可能一个或多个显著偏离。例如,假设我们分发的用于防治水传播疾病的氯丸在我们的水净化计划中有缺陷或从未使用过-如果比较20种结果措施,事实上,一个比较很有可能表明健康状况显著改善,而另一个比较则表明由于我们的项目,健康状况显著下降。因此,如果我们最终看到足够的结果测量值,我们将会偶然发现治疗组和对照组之间有显著的不同。这不是问题,本身。当评估者出现问题时,数据挖掘,“观察结果,直到她发现有重大影响,报告这一个结果,没有报告在搜索中发现的其他无关紧要的结果。
·分组分析同样,正如评估人员可以通过查看许多不同的结果度量来挖掘数据一样,评估者还可以挖出重大科研成果通过观察不同群体孤立。例如,可能氯对整个家庭健康没有明显的影响。也许是合理的看它是否影响孩子在家庭中,尤其是女孩。但是我们可能会比较不同年龄段的男孩和女孩,不同家庭组成的,以不同的组合。我们可能会发现,有一个更好的健康治疗组的子群男孩在6和8岁之间,碰巧有一个妹妹,一个祖父母住在家里,在那里,家庭拥有电视和牲畜。我们甚至可以编造一个合理的故事,解释为什么这个子组会受到影响,而其他子组不会受到影响。但如果我们在发现对其他子群的一系列不重要的影响之后偶然发现了这一积极影响,很可能不同的是由于简单随机机会我们的节目。
如何得出政策含义
进行了完美的随机评估,并对结果进行诚实的分析,有了一定的信心,我们可以得出结论,我们的计划如何影响这个特定的目标人口。例如:我们的氯气分配方案使目标人群中儿童腹泻的发病率降低了20%。这句话是科学合理的,或内部有效.我们设计的严谨不能告诉我们,然而,如果在不同的目标人群中复制,则相同的程序是否具有相同的影响或任何影响,或者扩大规模。与内部有效性不同,良好的随机评估可以提供,,外部效度,或概括性,更难获得。为了推断这些结果将如何在不同的上下文中应用,我们需要背离科学的严谨,并开始依靠假设。根据我们对评估上下文的了解,和其他场合下我们想推广结果,我们的假设可能或多或少是合理的。
然而,我们选择的方法-随机评估-并不以牺牲外部有效性为代价提供内部有效性。外部效度是一个函数的程序设计,服务提供商,受益人,以及进行方案评价的环境。任何程序的结果评价受到这些相同的语境现实当用于推断类似的计划或政策实施。随机评估给我们带来的是更加肯定我们的结果至少在内部是有效的。

关于随机评估的常见问题和关注

把人分配给控制组合乎道德吗?可能否认他们获得有价值的干预??
如果有确凿的证据表明干预是有效的,并且有足够的资源为每个人服务,这将是不道德的拒绝一些人访问计划。然而,在许多情况下,我们不知道干预是否有效(它可能造成伤害),如果有足够的资源来为大家服务。当这些条件存在时,随机评估不仅是伦理,但能够生成证据通知扩大有效的干预措施,或转移资源从低效的干预措施。
当一个程序首次推出时,或者超额订阅,财务和后勤方面的限制可能会妨碍组织为每个人服务。在这种情况下,随机化可能是比其他选择方法(例如,随机化)更公平的选择谁将访问程序的方式。先来,第一次服役。进行随机评价可以改变选择过程,但不是参加者人数。
还可以进行随机评价,而不否认获得干预。例如,我们可以随机选择接受鼓励的人来报名,而不会拒绝任何感兴趣的参与者获得干预。在其他情况下,它可能是有用的比较两个不同版本的干预,比如现有版本和添加了新组件的版本。
有没有可能以低成本进行随机评估,而不必等待数年的结果??
收集原始调查数据通常是评估中最昂贵的部分,但这并非随机评估所独有的。同样的,通过利用现有的行政数据衡量结果,以相对较低的成本进行评估的可能性越来越大,而不是收集调查数据。
所需的时间长度来衡量干预的影响很大程度上取决于感兴趣的结果。例如,教育干预(如长期结果。收入和就业)需要比短期结果更长时间的研究,比如考试成绩,可以从行政记录中获得。
最后,进行随机评估的时间和费用应当与所产生的证据的价值以及继续实施干预而不了解其有效性的长期成本相平衡。
随机评估能告诉我们不仅仅是否干预工作,但是又如何以及为什么呢??
如果设计和实现正确,随机评估不仅可以告诉我们干预是否有效,而且回答其他一些技术问题。例如,随机评估可以测试不同版本的干预,以帮助确定哪些组件是必要的因为它是有效的,提供信息对中间结果以检验干预的理论的变化,并比较干预的影响在不同的子组。
然而,与任何单独的研究中,随机评估只是更大的难题中的一部分。通过将一个或多个随机评估的结果与经济理论相结合,描述性证据,以及当地知识,我们可以更深入地理解干预的影响。
随机评估的结果是否可推广到其他情况??
概括性问题对于在特定上下文中测试特定干预的任何影响评估都是常见的。适当设计和实施的随机评估在确保干预措施在其原始背景下的影响的估计是不偏倚方面,与其他影响评估方法相比具有明显的优势。
此外,可以设计随机评估来解决可概括性问题。随机评估可能测试一个干预在不同的上下文中,或者在新的环境中测试基于证据的干预的复制。将描述干预成功的必要条件的变化理论与每个新背景中的条件的当地知识相结合,还可以告知干预的可复制性和更普遍的政策教训的发展。

随机评价史

1.临床试验
1747年,詹姆斯·林德用科学实验证明了柑橘类水果在预防坏血病方面的益处时,引入了对照和实验组的概念。由于他的工作,林德被认为是临床试验之父。将受试者随机分配给对照组和治疗组的方法,然而,直到20世纪20年代才开始发展。
2。农业试验
20世纪20年代,当内曼和费希尔在单独的农业实验中进行第一次随机试验时,随机化被引入科学实验。费舍尔的田野实验工作以他具有里程碑意义的著作而告终,实验设计,这是一个主要的大部分增长的催化剂随机评估。
3.社会事业
随机试验介绍了政府赞助1960年和1990年之间的社会实验。而不是在动植物上进行的小规模实验,这些新的社会实验的规模明显更大,并且集中在作为感兴趣对象的人身上。进行社会政策实验的想法源于1960年代的争论福利制度的优点。后来在欧洲和美国,社会实验模型被用来评估其他项目,如电价方案,就业计划,和住房补贴。从那时起,社会实验已经在跨学科和世界各地的各种环境中用于指导政策决策。3.
托马斯,邓肯·P·P水手,坏血病和科学。皇家医学会杂志。90(1997)。
莱维特史提芬DJohn A.名单。2009。“经济学野外实验:过去,现在,以及未来。”欧洲经济评论(1):53队。
3.同上
谁进行随机评估??
威廉体育网址j - pal成立于2003年的网络附属教授进行影响评价使用随机评估(重新)方法来回答问题对减贫至关重要。威廉体育网址j - pal子公司也进行非随机研究,威廉希尔老虎机和其他许多人和组织开展REs。
j - pa威廉体育网址l建国以来,超过200组织与j - pal分公司再保险。威廉体育网址在扶贫开发中的关键球员,REs的概念现在相当有名。
美国前十名基金会,,四个工作的六个国际发展合作与j - pal附属再保险。威廉体育网址其中包括比尔和梅林达盖茨基金会,这个福特基金会,这个威廉和弗洛拉休利特基金会,和约翰。D。还有凯瑟琳T.麦克阿瑟基金会.
在前十个多边组织中,,3.四人与再保险(j - pal下属威廉体育网址世界银行,这个亚洲开发银行,联合国儿童基金会,和美洲开发银行)十人中有六人已经派出工作人员参加J-PAL的培训课程。威廉体育网址William Hill手球
“大八”救济组织,,4拯救儿童基金会,,天主教救济会,,护理,和乐施会与一个j - pal附属再保险。威廉体育网址这个国际救援委员会就是自己做RE。和六个八已经派出员工j - pal的培训课程。威廉体育网址William Hill手球
政府也与j - pal合作分支机构。威廉体育网址主要援助国合作伙伴包括美国(美国国际开发署,,MCC)法国(Le Ministre de la Jeunesse et des因为活性物)瑞典和英国(英国国际发展部)发展中国家政府伙伴都在国家一级(例如,发展中国家)。肯尼亚教育部和塞拉利昂政府权力下放秘书处)以及国家以下各级(例如:这个安得拉邦政府,这个古吉拉特邦污染控制委员会,和拉贾斯坦邦警察)。
在J-PAL子公司的支持威廉希尔老虎机或指导下,已经建立了许多研究中心。威廉体育网址这些研究中心威廉希尔老虎机经常运行分公司“REs每个再保险和雇佣员工。这些研究中心威廉希尔老虎机包括:创新贫困行动(异丙醇),,小额信贷中心,,国际发展中心提供的证据的政策设计,,中心有效的全球行动,,IDEAS42,和小企业金融中心.
私人公司也进行随机评估的社会项目。数学政策研究威廉希尔老虎机Abt Associates是两个例子。
当衡量禀赋。
另外两个致力于国际发展但没有与J-PAL合作的是W.K.威廉体育网址凯洛格基金会和戴维和露西尔帕卡德的基础。我们判断这四个国家拥有美国国内。重点是盖蒂信托,罗伯特·伍德·约翰逊基金会莉莉捐赠公司和安德鲁·W。梅隆基金会。
3.以所给予的官方发展援助来衡量,包括世界银行,非洲开发银行集团,全球基金,亚洲开发银行,国际货币基金组织,联合国儿童基金会,近东救济工程处,美洲开发银行,联合国开发计划署的,以及世界粮食计划署。
4当用年度预算来衡量时。这些都是世界展望会,拯救孩子,天主教救济机构,护理,无国界医生,乐施会,国际救援委员会和慈悲团。

关于随机评估的更多资源,见:

请注意,这里引用的实践研究资源是为特定的研究和培训需要而策划的威廉希尔老虎机,并且仅用于信息目的。William Hill手球拜托电子邮件我们更多信息。