新能源上网电价定价相关理论及研究述评

时间：2023-02-12 理论教育版权反馈

【摘要】：早期研究者大多认为自然垄断的自然属性需要政府规制。随着研究者对自然垄断的理解变迁，规制思想也逐渐变迁。这些激励性规制工具设计的理论模型特征是尽可能反映现实可观测的契约成本、企业与规制者的目标、信息结构。激励性规制理论为研究自然垄断行业的规制问题提供了新的工具；而激励性规制工具的使用，有助于促使被规制企业努力降低成本，改善服务，从而增加整个社会的福利水平。

2.3.1 政府规制理论研究动态

规制（regulation，或译管制、监管），最早起源于亚里士多德与柏拉图对私人权力是否进行限制的争论上。政府规制起源于19世纪的美国。政府规制理论经历了公共利益规制理论、利益集团规制理论、激励性规制理论、规制框架下的竞争理论四大理论变迁（张红凤，2006）。

1）公共利益规制理论

公共利益规制理论（public interest theory of regulation）认为，自然垄断厂商为追求利润最大化的必定会利用其垄断地位来垄断产品价格，导致经济净福利损失，消费者福利水平降低。单纯依靠市场机制无法改变这一状况，出现市场失灵。政府代表的是公共利益，应该对垄断厂商实施价格管制、直接控制以纠正市场失灵，保护公众利益，提高社会福利。

不少研究者从自然垄断的属性出发，研究政府规制自然垄断产业的理论依据。英国古典经济学家约翰·斯图尔特·密尔认为，垄断权力者一旦掌握了土地，就会产生地租，地租就是自然垄断的结果。亚当斯认为自然垄断具有规模递增的技术经济特征，政府应该对规模递增的产业进展进行管制。早期研究者大多认为自然垄断的自然属性需要政府规制。后来经济学家从经济学角度分析自然垄断规制依据。夏基和鲍莫尔·潘札与威利格提出，自然垄断最显著的特征应该是其成本的劣加性（subadditivity）。成本劣加性意味着由一家企业提供整个产业的产品成本比两家以上的企业提供的产品成本更低。此外，还出现基于可维持理论、伯格和奇尔哈特的强弱自然垄断理论、维斯库斯等的永久性和短暂性自然垄断理论等。随着研究者对自然垄断的理解变迁，规制思想也逐渐变迁。这些研究为后来的放松管制提供了理论依据。该理论下的主要规制方式有报酬率规制和成本加成规制，其基本特征是，允许被规制企业利用服务收费回收总成本，并允许有一个合理的资本报酬率。这些规制方法可以保证被规制企业能回收成本或正常运营，但缺少对企业降低成本的激励。例如，在投资回报率规制下，受利润最大化和过度投资倾向，造成生产效率低下，从而降低了整个行业的资源配置效率，这就是A-J效应（Averch，Johnson，1962）。

20世纪70年代之前，公共利益理论理论一直处于正统地位。这一理论假定政府管制可以带来更高的效率，然而，这一假定的合理性并没有得到充分证明。Stigler（1971）通过对1912—1937年美国电价规制的效果研究表明，规制导致价格下降的效果甚微，并没有出现理论预见的高效率。实践中的规制效果与理论预见的严重不一致，促使一部分经济学家开始重新考虑规制的原因，利益集团理论应运而生。

2）利益集团规制理论

利益集团规制理论（interest group theory of regulation）是指规制者被特定的利益集团所俘虏，成为其获利的工具。

Stigler认为，规制并不是政府对公共需要的有效反应，而是产业中的部分厂商利用政府权力为自己谋取利益的一种努力；规制过程被个人和利益集团利用来实现自己的欲望，政府规制是为适应利益集团实现收益最大化的产物。Stigler在1971年发表的《经济规制论》一文中用经济学方法分析了规制的产生，政治家对规制的供给与产业部门对规制的需求相结合，即规制的最根本目的是谋求自身利益最大化。

Sam Peltzman（1976）通过对市场失灵和政府规制结果的预测，推断政府规制在经济干预的有效性基础上进一步发展了规制俘虏理论。他认为无论规制者是否获得利益，被规制产业的产量和价格并没有多大差异，其主要差别体现在各利益集团间的收入分配。规制者不会只为单独的一个经济利益主体服务，即规制并不总是有利于生产者，也会有利于消费者。G. Becher（1983）提出了利益集团为获得有利规制而展开竞争的理论。该理论从被规制者入手，研究各利益集团如何通过施加政治影响来形成政治均衡。此外，“规制机构生命周期理论”认为，规制机构起初能独立运用规制权力，但逐渐被垄断企业所俘虏。“合谋理论”则认为初始的规制一开始就受被规制者与其他利益集团的影响，即政府规制者一开始就被俘虏。

尽管利益集团理论似乎解释了部分规制失效的原因，但存在的缺陷也比较多。第一，缺乏坚实理论依据，如无法解释规制者为什么会被某个特定的利益集团所俘虏；当规制多个集团时，被规制者会被什么样的集团所俘虏。第二，无法解释许多现实问题，如为什么许多产业被规制后，利润水平会下降；为什么有些规制产业后来又被放松规制。

3）激励性规制理论

20世纪90年代以来，随着博弈论、信息经济学和机制设计理论等经济学前沿理论和分析方法被更多引入产业经济学研究，一种新的自然垄断规制理论——激励规制理论得以产生。

激励性规制理论以信息不对称作为立论前提，把规制问题看作一个委托代理问题，关注规制者与被规制者之间的对策互动，主要以政府最优规制为目的，设计激励机制。激励机制设计借助于机制设计理论（Hurwicz，1970；T. Groves，1973）的有关原理，运用博弈论、信息经济学等理论和分析方法，主要解决如何诱导企业说真话的激励规制合同，以提高规制的效率。法国经济学家Laffort、Tirole（1993）在对激励规制理论进行系统阐述的基础上，提出了激励规制理论的一般分析框架。

激励性规制政策的设计就是在基于信息不对称的前提条件下寻找使规制者目标函数最大化的合约。如Wilson（1969）、Ross（1973）、Mirrlees（1971）等提出的委托代理理论为研究信息不对称下的政府规制问题提供了一个有效的理论工具。在实践中，目前国外应用的激励性规制工具种类较多，如价格上限制、特许权投标、利润分享制、联合回报率制等。这些激励性规制工具设计的理论模型特征是尽可能反映现实可观测的契约成本、企业与规制者的目标、信息结构。假设政府的目标是追求社会福利最大化，考虑了规制过程中规制者与被规制者的信息不对称性，制定最优规制方案。

激励性规制理论为研究自然垄断行业的规制问题提供了新的工具；而激励性规制工具的使用，有助于促使被规制企业努力降低成本，改善服务，从而增加整个社会的福利水平。以前的激励性规制研究主要集中在对被规制企业的经济性规制方面，大多数规制手段也都属于经济性规制的范畴。在当前的市场经济条件下，随着社会发展，政府规制既包括经济性规制，也包括环境、资源等多方面的社会性规制，因此规制理念和规制手段也需要进行改变。

4）规制框架下的竞争理论

可竞争市场理论是美国经济学家Baumol以及Panzer和Willig等人在芝加哥学派产业组织理论的基础上提出来的。该理论假设企业可以自由进入或退出产业或市场；退出完全无成本；进入者在生产技术、产品质量方面无差异。该理论认为一个产业不论是否是自然垄断，只要沉淀成本为零，潜在进入者的威胁会提供充分有效的市场规制，约束在位者实行竞争性定价和以零利润下的最低成本来进行有效率的生产。只要市场是竞争的，规制者就不需要对自然垄断的在位企业进行规制。

可竞争市场理论的核心是让市场机制发挥作用，对政府规制的政策思路及其措施产生了较大的影响，为后来西方各国的放松规制实践提供了一定的理论依据。然而，在现实中，真正符合可竞争市场理论假定条件的产业并不多，该理论关于沉没成本为零的假定更是受到许多经济学家质疑，在适用范围方面存在着很大的局限性。

A. Shleifer（1985）将标尺竞争理论引入规制理论领域。该理论主张：在一个存在多家同类企业的自然垄断产业中，以标杆经营成本为标准，促使被规制企业降低成本。标杆经营成本通常是其他同类企业的成本或降低成本的支出的平均值。垄断产业中的同类企业的成本如果度量正确和完全，则标尺竞争结果将是有效的；如果被规制企业采取非合谋行为，则标尺竞争的优点和经济绩效将较为显著。否则，标尺竞争难以有效（张红凤，2006）。

综合政府规制理论，为本书研究新能源上网电价定价机制具有非常重要的借鉴意义。其一，从公共利益规制理论向利益集团规制理论的变迁过程中，一直回答的是“为什么规制”，只是解释规制的原因和分析方法发生了变化。至今西方规制仍然存在这两种范式。本书认为在实际生活中，由于信息不对称，政府也往往会被某些利益集团俘虏，规制目标最终仅仅实现了某些主体的利益。政府可以通过规制实现资源的重新转移或分配，使各方利益均衡，因此政策制定需要在多个利益主体间进行利益权衡，以保证规制目标的实现。其二，借鉴激励性规制理论主要权衡多个主体间的利益，设计最优激励机制。实现规制目标，应降低信息不对称，使规制目标和利益主体之间的利益目标相一致，引入多重利益主体的相互制衡。其三，规制框架下的竞争理论则衡量的主要是规制的效果问题。然而实践中的竞争无法完全取代规制，规制与竞争并存，二者应该是一种互补关系。新能源上网定价机制不应该将市场竞争和规制对立起来。

2.3.2 新能源上网电价研究述评

搜集并系统归纳当前国内外关于可再生能源上网电价定价与利益协调的文献，期望为本书研究提供有益的方法或思路参考。可再生能源上网电价定价研究主要集中在上网电价定价机制比较或电价定价依据等方面。

1）上网电价定价机制比较

可再生能源上网电价定价机制主要有固定价格制、竞价投标制、配额制。P. Menanteau （2003）、李星光和武春友（2008）将可再生能源电价规制制度划分为以价格为基础和以数量为基础两种类型，固定电价制就是以价格为基础的规制政策，即直接确定并规制电力的价格。而竞价投标制和配额制都是以数量为基础的规制制度，即规制者通过对可再生能源的产量加以限制，来间接规制电力价格。上网电价定价机制的这种划分方式通常用于比较各类定价机制的实施效果。Trine Krogh Boomsma等（2012）采用实物期权方法得出固定价格制最有利于投资者最快作出投资决策。Steffen Nielsen等（2011）比较丹麦电力系统的可再生资源定价机制，得出政府定价对可再生资源未来发展有利。固定价格制降低了投资者风险，减少了腐败滋生，比市场手段更能巩固当地所有权（Toke D，Lauber V，2007）。K. V. Alphen等（2008）发现在合理的可再生能源补贴政策下，价格制比配额制更能促进可再生能源应用。P. Menanteau（2003）发现要实现可再生能源技术创新来内化环境成本，固定价格制度优于招标制，而配额制的有效性还需市场结构、规则等实践检验。此外，还有C.A.Batlle（2011）、L. Butler （2008）等着眼于消费者福利角度的政策效果。考虑可再生能源技术，Juan Rivier Abbad（2010）提出在可再生能源技术不太成熟的阶段建议采用竞价上网政策和固定电价政策，而在技术相对成熟的情况下，建议采用可交易绿色证书政策。史丹、杨帅（2012）对可再生能源的价格补贴政策和实践效果相关的研究成果进行评述。以上定价机制效果研究大多基于可再生能源发展、消费者福利或投资者决策等角度，而从满足主体利益协调角度，研究既能协调发电企业和电网企业的经济收益，又满足社会福利最大化的定价机制设计，已有文献似乎较少关注。

2）上网电价定价依据

有的研究者从参与主体利益角度研究上网电价形成。曹武军（2012）在完全竞争的市场环境下，建立了贝叶斯博弈模型分析电网企业和光伏企业如何博弈形成上网电价。王健、路正南（2012）运用最优控制理论，通过建立社会福利最大化目标下考虑贴现的可再生资源消费模型，分析了可再生资源再生率及贴现率对最优价格路径的影响。Florian Leuthold等（2008）研究通过将福利最大化和电流技术特性联系起来构建为德国风电上网节点定价，为欧洲电力系统有效定价提供了有效理论基础。还有研究者从资源稀缺性或可再生能源的环境价值来定价。Ibrahim Iskin等（2012）使用层次分析法，在化石能源定价基础上，考虑可再生能源的特性，将社会经济环境因素考虑到定价中。刘岩、于渤、洪富艳（2011）基于可持续发展理论中的自然资源边际成本定价原理，将从上网电价与资源的稀缺性和能源的短缺挂钩，从价值角度分析了可再生能源定价方法。冯宗宪、姜昕、王青（2010）考虑可耗竭资源、跨期分配的动态效率标准和代际公平标准，认为资源价格应由边际直接成本、边际环境成本和边际使用者成本三部分构成。新能源上网电价是发电企业、电网企业和政府博弈的结果，也是同常规能源电力博弈的结果，已有研究大多仅从单一层面的成本或收益体现电价是明显不足的。

总之，就新能源上网电价定价而言，国外的相关研究比国内丰富，研究方法、研究内容及研究范围非常广泛，但国外的研究主要侧重于定价机制政策实施效果比较。定价制度的研究大多出现在研究报告中，新能源上网定价的理论依据研究成果还较少。更重要的是，在研究中新能源发展目标、模式及实现路径是存在差异的，对参与主体的行为进行约束和优化均不能脱离这个差异，价格应该体现这些差异。因此，本书在定价中将考虑发展目标的差异性。

2.3.3 新能源利益研究述评

激励机制设计的根本问题是利益。新能源作为可再生能源中的一部分，许多文献对其经济效益、环境效益进行了研究。经济效益评估常采用成本效益分析方法。曾鸣、田廓（2010）研究了分布式发电在降低线损和电价、节能减排、减少发电容量以及延缓配电网建设投资等方面的经济效益。魏玲和杨明皓（2009）、V.H. Me´ndez等（2006）研究带给配电公司的收益、Thomas E Hoff等（1996）、Alireza Soroudi、Mehdi Ehsan等（2011）研究带给电力系统尤其是配电系统的技术收益以及经济收益。胡骅（2008）、F. Gullí（2006）研究了分布式发电带给用户的收益。Shafiqur Rehman 等人（2007）应用日平均太阳能辐射量和日照时间等气象数据，研究了沙特阿拉伯国家 5MWp并网光伏系统的成本。孙艳伟、王润（2011）应用净现值和单因素敏感性分析工具，建立了光伏发电成本的计算模型。还有学者对可再生能源发电项目的环境效益进行评估，通常将发相同电量的煤电产生的污染排放物作为可再生能源的环境效益，因此，将环境效益与经济效益一起进行研究。Jose'L Bernal- Agust'n等（2006）应用净现值和资本回收期等参数，对西班牙并网光伏系统进行经济和环境性分析。钱科军、袁越（2008）构建分布式发电的环境效益定量模型。胡庶等（2006）建立分布式发电带来的降低线损、电价以及环境效益等评估模型。张希良（2007）等人以敦煌8MWp 并网光伏发电项目为案例，评价了我国西部地区发展光伏的市场竞争力、社会成本效益和不同政策工具的作用效果。当然还有研究者单独对可再生能源进行能源资源环境价值分析，主要依据的是可持续发展理论，使用边际思想来度量价格。于渤、黎永亮（2005）基于可持续发展理论在最优增长模型基础上，通过加入环境和资源约束建立了一个耗竭性能源资源价值分析模型，提出能源资源价值应包括边际代际机会成本、边际生产成本和边际环境成本三部分。就研究方法而言，成本效益分析方法在经济收益度量中得到较为广泛的应用，而边际分析方法在资源环境收益中应用较为广泛。研究思路大体是针对可再生能源带给某一主体的经济、环境收益进行衡量，但缺少从不同主体角度分析可再生能源的经济环境收益形成及刻画，对此，本书将进行弥补和创新。

2.3.4 博弈论发展及应用动态

博弈论（game theory），有时也称为对策论，或者赛局理论，是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。最早的博弈论思想可以追溯到我国古代的《孙子兵法》，它虽然没有用数学的方法量化分析博弈各方的实力对比，但它已经清楚、全面、多视角地阐述了博弈的基本原理、过程以及可能的结果，其典型案例就是春秋时代的“田忌赛马”。1928 年，冯·诺依曼将其系统化、理论化，标志着博弈论作为一门科学正式诞生，目前其在生物学、经济学、国际关系学、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。一个完整的博弈包括三个方面的内容：博弈方，即博弈过程中独立决策、独立承担后果的个人和组织；博弈方选择的全部行为或策略的集合；博弈方的收益，即各博弈方作出决策选择后的得失。博弈论分为非合作博弈和合作博弈两个分支。

1）非合作博弈理论发展及应用

1838年，Cournot Augustin发表了Researches into the Mathematical Principles of the Theory of Wealth，论述了寡头竞争模型及其均衡解，被认为是现代非合作博弈论核心的概念——纳什均衡的最早版本。20世纪初，数学家开始研究博弈论。当时二人零和博弈是研究严格竞争博弈的潮流。在这种博弈中，一个人有所得必然意味着另一个人有等量的损失。在这一期间，关于二人零和博弈的研究成果较为丰富，与之相联系产生了许多具有广泛适用性的概念和成果，如博弈的扩展形式、策略的定义与形式、个体理性的概念等，初步形成了一套严格竞争博弈的分析方法，后来成为更为一般的理论基础。1913年，Zermelo证明了博弈论中真正的第一个定理，即二人的有限游戏中，如果双方皆拥有完全信息，排除运气因素，那么先行或后行者必有一方有必胜或必不败的策略。1928年，John Von Neumann证明了最小最大定理，指出如果二人零和博弈中各参与者具有有限多个纯策略，则该博弈是确定的。尽管这些定理后来受到了质疑，但从博弈论的发展史看，最小最大定理已经成为非合作博弈论中纳什均衡理论的基础，已成为博弈论发展的重要基石。

1944年，冯·诺依曼和摩根斯特恩合著了Theory of Games and Economic behavior一书。该书不仅详述了严格竞争理论，还增加了许多新的研究成果，包括合作博弈的观念、联盟形式及其Neumann-Morgenstern稳定集等；并且简明易懂地阐述了Ramsey于1931年发展起来的公理化预期效用理论，更重要的是该书将二人博弈推广到n人博弈结构，并将博弈论系统地应用于经济领域，从而奠定了这一学科的基础和理论体系。20世纪40年代，1941年Kakutani证明的不动点定理、1940年Lyapounov关于向量测度的值域定理和1949年John Von Neumann的选择定理，为博弈论和经济学中均衡的存在性以及其他证明提供了完备的数学工具和方法，为博弈论发展提供了严格且坚实的理论基础。

20世纪50年代，John Nash在1949年年末提出了纳什均衡的概念，对合作博弈和非合作博弈进行了明确的划分，划分依据主要是局中人是否沟通；Nash认为冯·诺依曼和摩根斯特恩发展的合作博弈理论，是对局中人可能形成的各类型联盟的相互关系进行分析，而非合作博弈的假设是每个局中人独立行动，与任何其他的局中人都不合作或不沟通。后来的进一步研究表明，局中人之间是否沟通并不能成为根本的划分依据，划分的关键是看能否达成协议以及协议是否有约束力。A.W.Tucker于1950年定义了囚徒困境问题。纳什均衡和囚徒困境的研究标志着现代非合作博弈的建立。L.S.Shapley定义了联盟对策的值的概念，开创了随机博弈理论，并与D.B.Gillies合作创立了核心概念，与John Milnor一起发展了局中人组成连续的第一批博弈论模型；H.W.Kuhn研究了行为策略和完全再现。在冯·诺依曼和摩根斯特恩的积极参与下，在普林斯顿大学举行了三次博弈论会议，普林斯顿大学出版社出版了四卷经典的《博弈论论文集》。1957年，R.D.Luce和H.Raiffa出版了有巨大影响的Games and Decisions， Introduction and Critical Survey。从此，以军事领域应用为主的博弈论的应用转入以经济学为主。随着20世纪后期信息经济学的发展，非合作博弈在研究不对称信息情况下市场机制效率问题中发挥了重要作用，从而使得非合作博弈相对于合作博弈在经济学中占据了主流地位。约翰·纳什的博士论文《非合作博弈》（1950）、《n人博弈中的均衡点》（1950）和《非合作博弈》（1951）论文中，介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念，也就是不限于二人零和博弈。该解概念后来被称为纳什均衡。通过不断放松一系列严格假定，尤其是严格的理性人假定，博弈论不断发展。1960年，谢林在《冲突的策略》一书中对博弈论进行了重新定位，认为像战争、罢工、谈判、价格战等这样的冲突都具有非零和博弈的性质。基于这个性质，他构建了许多合作与冲突模型，将博弈论的分析范围沿着两个方向扩展：其一，试图识别在形成相互一致的预期中具有启发意义的因素，即相互依赖决策理论；其二，试图揭示实际策略博弈中可能发生的基本行动和这些行动所依赖的结构因素，即对执行、交流和策略行动的分析。1965年，莱因哈德·泽尔腾将纳什均衡的概念引入了动态分析，提出了子博弈完美纳什均衡（subgame perfect Nash equilibrium）概念；1967—1968年，约翰·C·海萨尼把不完全信息引入博弈论研究，提出贝叶斯纳什均衡（Bayesian Nash Equilibrium）概念。1975年，莱因哈德·泽尔腾引入动态博弈（dynamic game）和不完全信息博弈，提出完美贝叶斯纳什均衡（perfect Bayesian Nash equilibrium）。

从1994普林斯顿大学博弈论专家约翰·纳什被授予诺贝尔经济学奖开始，至今共有6届诺贝尔经济学奖与博弈论的研究有关，包括1996年、2001年、2005年和2012年。诺贝尔经济学奖对博弈论的青睐，反映出博弈论在经济学领域发挥着重要作用，无论是信息经济学、心理学还是实验经济学，其中都渗透着博弈论的思想，有些甚至已经成为博弈论深入发展的一部分。博弈论的应用深入各门学科之中，得到了前所未有的拓展，取得了空前的繁荣。

2）合作博弈理论发展及应用

与非合作博弈相比，合作博弈是参与者能够联合达成一个具有约束力且可强制执行的协议的博弈类型。能否形成约束力的协议，是区别于非合作博弈的重要特征。合作博弈强调的是集体理性，强调效率、公正、公平；而非合作博弈强调的是个人理性，博弈的结果可能是有效的，也可能是无效的。事实上，博弈论的早期开创者纳什、夏普利、哈撒尼、莱因哈德·泽尔腾和奥曼等人对非合作和合作博弈均作出了奠基性贡献。合作博弈主要经历了完全合作博弈和不完全合作博弈两个阶段。

（1）完全合作博弈。完全合作博弈阶段的博弈论主要研究的是局中人完全参与合作的情景。1944年，冯·诺依曼和摩根斯特恩在《博弈论与经济行为》（Theory of Game and Economic Behavior）中首次提出合作博弈（cooperative game）的概念（J. Von Neumann，O. Morgenstern， 2007）。此后，合作博弈逐步发展起来。这一阶段博弈论主要研究联盟合作、利益分配等问题。20世纪50年代至今，Gillies、Shapley和Shubik等人的研究引发了核心、夏普里值的研究，使得完全合作博弈的解更加完善。

1953年，D.B.Gillies引进核的概念作为研究稳定集合的一个工具，稳定的判定依据是如果没有偏离是有利的，则一个结果是稳定的。后来Sengupta严格证明了核的稳定性。1953年， Shapley和Shubik把核发展为一个解的概念。Shapley值是基于参与人在联盟中的边际贡献的期望得益，是从边际贡献角度考虑局中人的利益分配，从而揭示利益分配的原因，主要解决局中人最关心的支付问题。Shapley首先对主观的公平与合理等概念作了公理化描述，然后寻求是否有满足这些公理的解。如果对一个解的性质或公理要求太多，则这样的解可能不存在；如果要求少，则又可能有许多解。夏普利值是满足三个公平性质的唯一解。夏普利值的解概念及其公理化刻画使合作博弈在理论上取得了重要突破。Shapley值由于其简单性和唯一性在各个领域得到广泛应用。

但Shapley并没有考虑局中人的优先联盟问题，1977年，Owen引入了优先联盟博弈修正值，部分修改Shapley值的联盟值，使其能够解释哪些联盟更能有效地谈判或协调。1969年， Schmeidler提出核仁概念，核仁关注最大化最小剩余，从平均主体角度来比较不同联盟所能带来的剩余大小。核仁解的优势体现在核仁总存在，且是唯一的，这一解的缺陷就是计算比较烦琐。相比而言，Shapley值计算简便，符合实际，因此Shapley值在合作博弈中具有重要地位。博弈论中的稳定性概念通常是静态的。核、核仁、Owen、Shaply等均衡概念均是静态的。这些解认为如果没有局中人可以通过一步偏离某种状态后马上获益，则该种状态为均衡状况。尽管某个局中人通过一步偏离某种状态后不能获益，但可能会影响联盟的结构发生根本性变化。不少学者为了克服这些弱点，提出了最大一致集（Chwe）、最大谨慎一致集（Mauleon）等。

合作博弈的解种类较多，不同的解性质各异，现有的应用联盟稳定性分析的研究大多采用联盟各成员平均分配利润或Shapley值作为合作博弈的解。研究者大多采用数理方法推导某个结论，或者研究某种算法，相对而言，这些解在实际应用中的研究并不多。

（2）不完全合作博弈。现实中存在许多局中人不是完全参与合作，仅仅是某种程度的参与联盟，对于这种情形的研究，使得合作博弈从完全合作的形式，扩展到不完全合作博弈的情形。托马斯·谢林的冲突管理理论、Aubin 等的模糊联盟合作博弈正是以此为对象展开研究。谢林在美苏冷战的背景下，以国家战略管理为分析对象，致力于非数理的不完全合作博弈研究。区别于完全合作博弈理论，谢林的冲突管理理论认为，冲突双方之间除了利益冲突之外，往往还存在某种共同利益；参与人在选择博弈战略时，并非完全合作，也不完全参与。而1974年Aubin引入了模糊合作联盟博弈，由于研究引入完整的数学分析模型，这使得不完全合作博弈理论更加完美。随着不完全合作博弈理论发展，如何达成联盟或博弈策略的研究也是这类合作博弈研究的重要分支。奥曼把“可转移效用”理论扩展为一般的不可转移效用理论。由于效用不可转移，不同参与人的效用不可直接比较，只有通过威慑才能达成有约束力的合作。那么如何达成有约束力的合约，对此问题研究比较经典的研究成果有以下几个。

①无限次重复博弈。无限次重复博弈是指参与人可通过某种可置信的威胁来约束彼此的行为从而达成合作解。这种可置信的威胁不是合约，但同样可以起到约束彼此行为的作用，如触发策略，即参与人之间首先合作，如果对方在某一阶段不合作，则参与人以永远不合作来报复或者惩罚对方。2002年，Arnold和Schwalbe经过研究发现，随着博弈次数趋向正无穷，所有参与人都按最优反应原则进行决策，结果会收敛到吸收状态，但吸收状态不一定包含核，然而，如果允许参与人在有可能得到更好结果的时候以很小的概率偏离最优反应原则，那么所有的吸收状态都是核配置。这种包含联盟形成在内的动态博弈的均衡解收敛于核配置。

②谈判博弈（bargaining games）。又称讨价还价博弈，其核心思想是通过威慑对方而形成有约束力的合约，并在该合约的约束下最大化自己的收益。比较典型的模型有纳什（1950）最早利用公理化方法对两人讨价还价博弈问题的纳什讨价还价解进行了求解，并证明了议价解是唯一满足效用测度无关性（invariance）、Pareto有效性（efficiency）、无关选择的独立性（independence of irrelevant alternatives）和对称性（symmetry）这四个公理的解（Anbarci N， Sun C，2011）。Rubinstein从非合作博弈的角度出发研究两人议价问题，得出与纳什议价解同样的结果。Harsanyi等经过研究得出纳什议价解同样适用于信息不完全情况下两人合作博弈的议价问题的研究。此外，大量的实验经济学研究也为纳什议价解的合理性和稳定性奠定了坚实的理论基础。

针对对称性公理中假定各参与方有着同样讨价还价的能力，与现实不符合，1971年，Menil和George假定参与方具有不同的讨价还价能力，把纳什的结论推广到更为一般的情形，称之为一般纳什讨价还价解或非对称纳什讨价还价解。Roth考虑参与者谈判力量对谈判结果的影响，提出广义的纳什议价模型。1977年，Brito和Intriligator证明在一定条件下，当博弈不断重复时，讨价还价解就逐渐收敛于纳什讨价还价解。Kihlstrom等研究风险厌恶的两人合作博弈的议价问题，指出纳什议价解下博弈者的效用会随对手风险厌恶程度的提高而增加。

纳什的讨价还价理论由于以复杂的数理理论为基础，侧重定理的推导，实际应用的难度较大。在Stalh（1972）有限期轮流出价博弈模型的基础上，以色列经济学家阿里尔·鲁宾斯坦通过把双方对蛋糕轮流出价的过程看作一个合作博弈的过程，成功将其扩展到无限期的情形，由此建立了鲁宾斯坦分蛋糕模型。

此外，Jorgensen和Yeung（1999）提出策略性让步博弈，是基于非合作的谈判问题，不要求事先存在具有约束力的协议，但是能通过非合作的讨价还价达成谈判各方的合作（董保民，2008）；是在不存在有约束力的合约情况下，通过以可置信的威胁实现有约束力合约的效果。

③博弈论分析可再生能源发电过程中的利益冲突。许多研究者应用博弈论分析可再生能源发电过程中的利益冲突问题。夏阳、王革华、赵勇（2005）分析了风电并网的技术研发、化石燃料消费税的征收等环节的博弈行为，用博弈模型模拟风电上网各利益主体的相互作用和相互影响及其决策均衡。王晓天（2012）分析了再生能源发电企业与电网企业造成可再生能源发电并网困难问题的利益冲突问题。在解决利益冲突的利益分配问题研究成果中，研究可再生能源供应链各主体收益分配机制的研究并不多见。国内有王晓天（2012）针对当前可再生能源发电并网困难问题，运用演化博弈论，建立可再生能源发电企业与电网企业合作演化博弈模型，分析其动态演化过程，考虑常规能源电力价格、补贴率、初始投入的边际成本和分配系数等参变量对利益分配系数的影响。而研究者大多是从常规能源电力供应链的角度，使用博弈论和供应链理论对供电成本和收益进行分配。如赵晓丽、乞建勋（2007）采用Shapley值法研究煤电企业供应链的合作利益分配机制；崔九翠、周敏（2011）研究煤电企业的利益分配机制；屈少青、张森林、陈皓勇等（2011）研究不确定需求下协调电力供应链各市场成员利益达到整体效益最优问题。窦迅、李扬等（2010）从发电商、售电商及用户的整体利润角度出发，应用供应链思想，设计了激励发电商真实报价的机制。戴宇、杨洪明等（2010）研究从燃料供应发输售用电的电力供应链协调问题，主要考虑输电网约束条件下，在电力供应链中引入收入共享契约，耦合燃料商、发电商、用户、独立系统调度员的优化决策，建立了基于收入共享契约的电力供应链协调模型，以使链上成员的个体理性决策达到供应链整体绩效最优。

总的说来，博弈论、供应链理论应用于多方利益协调的研究较多，方法本身特性与优势是其重要的原因；不少研究者常常根据研究目的和研究对象将经典的博弈模型或供应链模型进行拓展与改进。这些研究对本书在方法论上有极大的借鉴价值和参考意义。尽管不少文献研究电力供应链各主体利益协调问题，但大多研究从主体行为策略角度解决整体供应链利益协调问题，较少考虑政策作为外生变量对各方利益协调的影响。各主体在不同市场及规制条件下的博弈行为是不同的。本书将应用博弈理论的研究成果对新能源电力交易市场中各参与主体的博弈策略及对应的收益进行分析，这将为新能源定价激励机制设计打下理论基础。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈