1、博弈論概述

  博弈論又稱為“對策論”,一種使用嚴(yán)謹(jǐn)數(shù)學(xué)模型來解決現(xiàn)實世界中的利害沖突的理論。由于沖突、合作、競爭等行為是現(xiàn)實世界中常見的現(xiàn)象,因此很多領(lǐng)域都能應(yīng)用博弈論,例如軍事領(lǐng)域、經(jīng)濟領(lǐng)域、政治外交,解決諸如戰(zhàn)術(shù)攻防、國際糾紛、定價定產(chǎn)、兼并收購、投標(biāo)拍賣甚至動物進(jìn)化等問題。

  博弈論的研究開始于本世紀(jì),1944年諾依曼和摩根斯坦合著的《博弈論和經(jīng)濟行為》一書的出版標(biāo)志著博弈理論的初步形成,隨后發(fā)展壯大為一門綜合學(xué)科。1994年三位長期致力于博弈論研究實踐的學(xué)者納什、海薩尼、塞爾頓共同獲得諾貝爾經(jīng)濟學(xué)獎,使博弈論在經(jīng)濟領(lǐng)域中的地位和作用得到權(quán)威性的肯定。

  2. 博弈論的基本原理和方法

  文獻(xiàn)[1][2]用淺白的語言敘述了博弈論的思想精髓和基本概念。文獻(xiàn)[3][4]更注重理論上的分析和數(shù)學(xué)的嚴(yán)謹(jǐn)。概括起來,博弈論模型可以用五個方面來描述

  G={P, A, S, I, U}

  P: 為局中人,博弈的參與者,也稱為“博弈方”,局中人是能夠獨立決策,獨立承擔(dān)責(zé)任的個人或組織,局中人以最終實現(xiàn)自身利益最大化為目標(biāo)。

  A: 為各局中人的所有可能的策略或行動的集合。根據(jù)該集合是否有限還是無限,可分為有限博弈和無限博弈,后者表現(xiàn)為連續(xù)對策,重復(fù)博弈和微分對策等。

  S:博弈的進(jìn)程,也是博弈進(jìn)行的次序。局中人同時行動的一次性決策的博弈,成為靜態(tài)博弈,如齊威王和田忌賽馬;局中人行動有先后次序,稱為動態(tài)博弈,如下棋。

  I: 博弈信息,能夠影響最后博弈結(jié)局的所有局中人的情報,如效用函數(shù),響應(yīng)函數(shù),策略空間等。打仗強調(diào)“知己知彼,百戰(zhàn)不殆”,可見信息在博弈中占重要的地位,博弈的贏得很大程度依賴于信息的準(zhǔn)確度與多寡。得益信息是博弈中的重要信息,如果博弈各方對各種局勢下所有局中人的得益狀況完全清楚,稱之為完全信息博弈(game with complete information),例如齊威王和田忌賽馬,各種馬的組合對陣的結(jié)果雙方都不嚴(yán)而喻。反之為不完全信息博弈(game with incomplete information),例如投標(biāo)拍賣,博弈各方均不清楚對方的估價。在動態(tài)博弈中還有一類信息:輪到行動的博弈方是否完全了解此前對方的行動。如果完全了解則稱之為“具有完美信息”的博弈(game with perfect information),例如下棋,雙方都清楚對方下過的著數(shù)。反之稱為“不完美信息的動態(tài)博弈”(game with imperfect information)。由于信息不完美,博弈的結(jié)果只能是概率期望,而不能象完美信息博弈那樣有確定的結(jié)果。

  U:為局中人獲得利益,也是博弈各方追求的最終目標(biāo)。根據(jù)各方得益的不同情況,分為零和博弈和變和博弈。零和博弈中各方利益之間是完全對立的。變和博弈有可能存在合作關(guān)系,爭取雙贏的局面。

  還有另一類型博弈稱為多人合作博弈,例如安理會投票表決,OPEC聯(lián)合限產(chǎn)保價等問題。這類問題重點放在聯(lián)盟利益的分配上,它的理論和方法廣泛應(yīng)用于利益損失的共同分擔(dān)問題。多人合作博弈的研究方法主要是特征函數(shù)模型。以個可能的聯(lián)盟為定義域,特征函數(shù)表示各個聯(lián)盟的得益(N是局中人的數(shù)目),它的分配解必須符合一定的合理性和穩(wěn)定性,它的解的概念也發(fā)展成多種多樣,包括穩(wěn)定集、核心、核仁、Shapely值等。解的多樣性符合現(xiàn)實世界復(fù)雜多樣的需要,針對不同的問題選擇或創(chuàng)造合適的解的概念是博弈論深入研究的課題。

  不管博弈各方是合作、競爭、威脅還是暫時讓步,博弈論模型的求解目標(biāo)就是使自身最終的利益最大化,這種解建立在對方也采取各自“最好策略”為前提,各方最終達(dá)到一個力量均衡,也就是說誰也無法通過偏離均衡點而獲得更多的利益。這就是博弈論求解的本質(zhì)思想。

  3、博弈論與電力市場

  博弈論是研究市場經(jīng)濟的重要工具。電力作為特殊的商品,它的生產(chǎn)、運輸、銷售和消費也逐漸走向市場化。世界范圍內(nèi)很多國家的電力工業(yè)走向放松管制、引進(jìn)競爭的進(jìn)程中,遇到很多前所未有的新課題,運用博弈論來分析解決其中一些問題是一個研究方向。 用博弈論模擬電力市場,模擬的結(jié)果可能更加接近實際,為市場模式設(shè)計提供依據(jù)。另外,電廠或用電用戶作為市場的參與者,可以用博弈論來分析市場,研究如何報價獲利最大。

  正確運用博弈論關(guān)鍵要針對電力市場的特點正確選擇模型和解的概念。例如:力量相當(dāng)?shù)膬蓚區(qū)域電網(wǎng)之間交換功率的情形比較適合用古諾模型和Nash談判解方法;而自備電廠與公用電網(wǎng)之間的交易可能更適合用Stackleberg模型。還有局中人結(jié)盟問題:如何識別合作伙伴,結(jié)盟利益如何在聯(lián)盟內(nèi)分配。電力市場環(huán)境下,電網(wǎng)輸電作為一項服務(wù),它的網(wǎng)損、固定資產(chǎn)投資如何在網(wǎng)絡(luò)使用者之間分擔(dān)。這些分配問題有不同的概念的解:穩(wěn)定集,核心,核仁,Shapely值等,如何合理選擇或創(chuàng)造最接近實際的解的概念也是面臨的課題。

  博弈的結(jié)果是依賴于擁有的信息,采用什么樣的信息披露政策是設(shè)計電力市場模式的一個方面。例如:電廠競價上網(wǎng),一個成功的報價不僅取決于自己的實力,還有賴于他人如何報價。但是各方往往不清楚互相之間成本、報價等信息,因為這些信息都是各自的商業(yè)秘密。如何處理這種信息既不完全也不完美的博弈是一個重要的課題。反過來,博弈的實驗結(jié)果也為電力市場披露怎樣的信息提供依據(jù)。

  博弈論和電力市場理論都是很年輕的科學(xué),兩者都有廣闊的發(fā)展天地,兩者的結(jié)合可以互相促進(jìn)。

  4、博弈論在電力市場中的應(yīng)用

  4.1自備電廠與公用電網(wǎng)之間的交易

  開放發(fā)電市場的進(jìn)程中,擁有自備電廠的用戶是一類特殊的市場參與者,它既是用電用戶,也可以是電力的供應(yīng)者。隨著電力市場深入發(fā)展和工業(yè)的進(jìn)步,自備電廠將成長為一支生力軍。

  文獻(xiàn)[5]用博弈論來分析評價在分時定價的環(huán)境下?lián)碛凶詡潆姀S的用戶(NCP)對定價的影響作用。NCP既可以從公用電網(wǎng)購電,也可以自己發(fā)電來滿足自身需求。為解決兩者的沖突,作者提出了三種博弈模型:非合作Nash博弈模型,合作博弈模型和超博弈模型。作者構(gòu)造了三個局中人:公用電網(wǎng),普通用戶,帶自備電廠的用戶(NCP),并且假設(shè)它們的需求函數(shù)、邊際成本、收益函數(shù)等均是線性的,通過數(shù)字模擬得出了一些有趣的結(jié)果:①NCP的加入促使公用電網(wǎng)降低出售給NCP的電價;②沖突還使普通用戶得到更多益處。該文為解決自備電廠與公用電網(wǎng)的相互作用提供了很有用的分析思想。但是尚有三點可以進(jìn)一步改進(jìn):①該文尚未考慮NCP將自己多余的自發(fā)電賣給公用電網(wǎng)的情況;②該文將公用電網(wǎng)和NCP置于平等的市場地位可能不符合實際市場,如果公用電網(wǎng)規(guī)模很大,NCP數(shù)目很多但規(guī)模小,考慮Stackerlberg模型更符合兩者實際;③該文假設(shè)公用電網(wǎng)的目標(biāo)函數(shù)是整個社會利益最大化,而并非是自身利益最大化,這個假設(shè)不符合電力市場需要解除管制的發(fā)展方向。

  文獻(xiàn)[ 6]部分解決了以上問題,它重點放在自備電廠和公用電網(wǎng)相互作用的方式的選擇:公用電網(wǎng)回購NCP多余電力(buy-back system)或者公用電網(wǎng)收取NCP運轉(zhuǎn)電力的過網(wǎng)費(wheeling charges)。該文分析了在不同市場環(huán)境下,各方的得益情況,得出了一些可能只有用博弈論才能得出的結(jié)論。

  4.2區(qū)域間輸電交易分析

  互聯(lián)網(wǎng)間短期電力交換是一種經(jīng)濟運行的手段。白曉民等在文獻(xiàn)[7]中應(yīng)用Nash博弈論來分析簡單的兩區(qū)域系統(tǒng)單時段交易分析,得出雙方都可接受的交換功率和交易價格。在此基礎(chǔ)上,文獻(xiàn)[8]提出了一種兩階段迭代計算方法來處理外部交易計劃與內(nèi)部經(jīng)濟調(diào)度的協(xié)調(diào)。該文所用的博弈模型是二人非零和對策,采取合作型對策,應(yīng)用 Nash談判公理作為仲裁程序,決策出雙方都可接受的交換功率和交易價格。應(yīng)該指出,白曉民等的分析是基于完全信息的博弈也即博弈雙方均對對方在各種情況下的得益了解非常清楚。如果缺少這方面的信息,又應(yīng)該如何分析處理呢?這個問題值得進(jìn)一步深入探究。

  4.3轉(zhuǎn)運市場中電網(wǎng)的固定成本分?jǐn)倖栴}

  運轉(zhuǎn)市場中一個難題是網(wǎng)絡(luò)輸電服務(wù)定價,這個定價能夠給網(wǎng)絡(luò)使用者一個信號,以達(dá)到全網(wǎng)最優(yōu)化;并且能夠補償網(wǎng)絡(luò)的投資者,網(wǎng)損、變動成本、固定成本等費用在網(wǎng)絡(luò)使用者中合理分?jǐn);同時能夠正確激勵網(wǎng)絡(luò)增容。節(jié)點實時價格(nodal spot price)制度可以解決網(wǎng)損和網(wǎng)絡(luò)阻塞問題。但是文獻(xiàn)[9]的作者認(rèn)為節(jié)點實時價格制度不能完全回收輸電系統(tǒng)的固定投資,為了解決雙邊貿(mào)易中輸電系統(tǒng)固定成本公正分?jǐn)倖栴},作者提出了基于多人合作博弈模型,可以計算出逐條線路逐筆交易的分?jǐn)傎M用。文中使用“核仁”作為模型的解。該方法的優(yōu)點:①使用“核仁”而不用Shapely值,因為“核仁”處于核心,分配值更加穩(wěn)定和易于被各方接受;②提供了一種激勵,減輕線路過載。

  4.4 基于Pool或PX模式的多邊貿(mào)易市場

  電力市場環(huán)境下的博弈具有行動策略隨機性、信息隱蔽性,這些特點都給建模和計算造成困難,從而限制了實際應(yīng)用。各種文獻(xiàn)在處理這種不確定信息環(huán)境下的決策問題中,通常需要假設(shè)或者估計對方的信息,方法各有特色。

  在文獻(xiàn)[10]作者認(rèn)為在完全競爭的市場環(huán)境下,市場參與者相對于市場規(guī)模都顯得很小,市場影響力很小。在這種情況下,優(yōu)化報價決策不需要博弈的思想。文中作者認(rèn)為電力市場屬于不完全競爭市場,單個市場參與者對市場是有影響力的,其模型本質(zhì)上屬于不完全信息的非合作博弈。例如:每個參與者只知道自己的成本信息,而不知道對方的成本等信息。在這種情況下作者提出了這樣的一個問題:在無法完全了解對方的信息情況下,參與者如何投標(biāo)(選擇高價投標(biāo)還是低價投標(biāo))才能使自己收益最大。該文通過轉(zhuǎn)化的方式把不完全信息的博弈變?yōu)樾畔⑼耆煌昝赖膭討B(tài)博弈來求解。每個市場參與者均對自己的對手可能的出價進(jìn)行分類,并對每一類的可能性進(jìn)行概率估計,形成一個概率意義上的期望收益矩陣,用Nash平衡點的概念求解矩陣,得到問題的解。

  文獻(xiàn)[11][12]作者提出了一種談判模型。每一個局中人進(jìn)行決策時,都同時執(zhí)行以下兩個步驟:①對可能的合作對象按照一定的指標(biāo)進(jìn)行優(yōu)先排序;②按照談判優(yōu)先順序,逐一進(jìn)行討價還價,談判的規(guī)則與程序是預(yù)先設(shè)定好的。該文的特色是談判對象的優(yōu)先順序表的形成。排序的準(zhǔn)則基于該局中人A對關(guān)于他人的信息的了解程度。先分別對其他局中人的成本信息進(jìn)行分類,并對每一類出現(xiàn)的可能性進(jìn)行概率估計。然后假設(shè)與某局中人B進(jìn)行合作,互相交換共享所擁有的信息,聯(lián)合成博弈的一方,剩下的局中人結(jié)合為博弈的另一方。這樣的博弈模型的Nash平衡點是概率意義上的期望值,作為與B合作的優(yōu)先指標(biāo)。對每個局中人都進(jìn)行一遍以上計算,得到了A的談判對象優(yōu)先順序表。每個局中人都有自己的一張優(yōu)先順序表。最后按照預(yù)先設(shè)定的談判規(guī)則與程序,各方同時進(jìn)行合作談判,談判要解決如何合理分配或均衡比單干多出的利益。

  該文關(guān)鍵的一點:正確掌握對方的成本、策略等信息。各方可能從每一次博弈的結(jié)果中得到有用的反饋信息,并用這種反饋來更新自己的知識庫,提高對他人了認(rèn)識。遺憾的是作者并沒有提到如何實現(xiàn)這樣重要的學(xué)習(xí)過程。該文的模擬算法中的一個缺點:計算量隨局中人的數(shù)目和每個局中人類型的數(shù)目的增長呈指數(shù)增長。

  對于多邊貿(mào)易模式的電力市場,文獻(xiàn)[13]提出了多代理理論模型,解決貿(mào)易合作問題,文中的模型基于完全信息的博弈模型。模擬的過程包括四個階段:①確定自身成本等信息;②與對方互相交換信息,互相尋求合作伙伴;③按照預(yù)先設(shè)定的準(zhǔn)則和協(xié)議進(jìn)行聯(lián)合分組,形成一個談判對象優(yōu)先順序表,這個順序表獲得方法于[11][12]的方法不一樣。作者采用公平性合作標(biāo)準(zhǔn)和Shapely值來確定這個順序表;④按照優(yōu)先順序表進(jìn)行雙邊談判。作者認(rèn)為這四個階段可以反復(fù)迭代進(jìn)行,直至沒有人愿意改變合作格局為止或者達(dá)到預(yù)先設(shè)定的計算時間。作者在文中考慮了多種情況,但是模型仍偏于簡單。

  4.5用博弈論解釋和實現(xiàn)算法

  文獻(xiàn)[14]用博弈論來解釋拉格朗日松弛法法解決機組經(jīng)濟組合的算法。該文認(rèn)為在電力市場的環(huán)境下,競爭各方均以實現(xiàn)自身利益最大化為目標(biāo),旋轉(zhuǎn)備用的約束變得軟起來,PX(power exchange)機構(gòu)可能通過松弛這一約束進(jìn)一步降低成本。該文提出了一種基于博弈論的算法獲取最優(yōu)的旋轉(zhuǎn)備用。

  作者認(rèn)為拉格朗日松弛法的拉格朗日乘子是有經(jīng)濟含義的,松弛旋轉(zhuǎn)備用的乘子 被看作是提供備用的價格信息,各時段的旋轉(zhuǎn)備用根據(jù)這個信息不斷在規(guī)定的高低兩種備用水平之間調(diào)整(例如:為t時段負(fù)荷)。根據(jù)優(yōu)化原理,如果拉格朗日函數(shù)存在鞍點,則鞍點是原問題的最優(yōu)解。

  鞍點的概念與博弈論中的Nash平衡點有非常相似之處,如以上公式所示;诖讼敕,作者構(gòu)造了兩廠商博弈模型。其中一局中人P代表整個實際電網(wǎng)的利益,它控制的決策變量是p,u(p向量表示各機組分配的有功,u向量表示機組啟停),目標(biāo)是使整個系統(tǒng)成本最低。另一個局中人Q,是一個假想的發(fā)電商,它以價格向P銷售備用容量和有功容量。雙方就旋轉(zhuǎn)備用交易進(jìn)行討價還價,最終達(dá)到一個平衡的交易量和交易價格。作者證明以上博弈過程的Nash平衡解就是拉格朗日函數(shù)的解;谝陨辖Y(jié)論,作者設(shè)計了自適應(yīng)的次梯度算法尋求平衡點,其中一個關(guān)鍵技術(shù)作者設(shè)計了廠商P對廠商Q備用容量報價的反應(yīng)函數(shù) 該函數(shù)將 映射到備用容量的兩種水平之間(例如:5%Dt-%Dt,Dtt時段負(fù)荷),形成一個隨價格信息變動的備用容量。根據(jù)廠商Q是否了解廠商P的反應(yīng)函數(shù),模型可細(xì)分為兩種:Nash模型(不了解對方反應(yīng)函數(shù))和Stackelberg模型(Q了解P的反應(yīng)函數(shù)),作者認(rèn)為后一種模型掌握的信息較多,因此收斂的速度和優(yōu)化的效果梢好于前一種模型。

  用博弈論來解釋并且設(shè)計一些算法是一個新鮮而具有挑戰(zhàn)性的課題。博弈論本身就是帶有優(yōu)化功能的一門嚴(yán)謹(jǐn)?shù)臄?shù)學(xué),不過它更具有人的邏輯思維的色彩,融合了一些用別的方法難以表達(dá)的信息。

  5、結(jié)論

  本文在介紹博弈論的基本模型和求解思想與方法的基礎(chǔ)上初步揭示了博弈論在電力市場中的應(yīng)用狀況,所列文獻(xiàn)一定程度反映了該領(lǐng)域的研究概貌和發(fā)展方向。電力市場本身是一項新興的系統(tǒng)工程,很多問題懸而未決,新的問題不斷涌現(xiàn)。博弈論作為這項復(fù)雜工程的新興的有力工具,必將隨著電力市場的深入發(fā)展而發(fā)展。