基于有限次重復博弈的網球發球策略分析
作者:李丹時間:2013-12-12 16:40:02 來源:才智 閱讀次數:917次 ]
關鍵詞:博弈論; 有限次重復博弈; 模型
網球是一項優美而激烈的體育運動,通常在兩個單打球員或兩隊雙打組合之間進行。現代網球運動誕生于19 世紀的英國伯明翰, 在20 世紀中,網球在世界各地得到廣泛發展,并成為一項世界性的體育運動,最受關注的網球比賽則是每年舉辦的網球四大滿貫賽事。
本文依照網球發球過程單次博弈過程,進而分析有限次博弈過程中每次發球的時間間隔對比賽結果的影響以及發球過程中方式轉換。
1. 單次博弈中網球發球策略的博弈分析
參與人1 與參與人2 在參賽前屬于兩個博弈主體,他們之間的博弈屬于完美記憶博弈,也就是在博弈過程中,每個參與者都不會忘記曾經執導的任何信息,清楚他們前面所作選擇的行動。這也是體育博弈論的精髓,采用相對應的策略對應對方的策略,其中,發球在網球比賽過程中是完美博弈過程的充分體現。每個人都有最適合自己的拋球高度,最適合自己的擊球點,這和身高是沒關系的, 當然,高個子發球天生就有優勢,因為他發球點高。每個網球運動員都有自己的習慣,如納達爾左手持拍,球風剛猛凌厲,跑動能力極強;費德勒正反手平衡,恰到時機的上網攔截,讓對手很難找到真正的空隙;德約科維奇靈活的步伐,穩定偽底線相持,出色的二發技術。
在網球競賽中,發球的策略最為重要,但不能采用單一的比賽策略,選擇單一的模式往往是愚蠢的,也是不可能成功的。猜對對方發球過程中運用左手還是右手是制勝的法寶,假設兩名運動員A 和B,下面我們運用矩陣來
圖1 單次博弈中網球發球模型分析
2 . 基于有限次重復博弈的網球發球模型分析
如圖1 所示,網球發球過程單次博弈對雙方球員只是一個熟悉的過程,雖然在之前對對方的了解已經很充分,但在比賽過程中還是需要當時的場景做出自己的判斷,假如運動員每次的行為只依賴當前行為,記為,對所有參與人都用同樣的貼現因子來貼現其未來收益。我們希望考察均衡收益是如何隨著期界T 變化的。也就是每個運動員在單次博弈后進入下次博弈時的間隔時間。為了使不同期界的收益之間具有可比性,我們用同樣的單位對煤氣收益進行標準化表示,因此,一個行動序列的(標準化)收益是:
這被稱作“平衡貼現收益”。因此標準化只是改變了權重,因而標準化形式和現值形式都代表了同樣的偏好。通過把所有的收益用同期平均收益來度量,標準化的形式更容易揭示出當貼現因子和期界發生變化時而產生的變化。例如,從0 期到T 期每期收益為1 的現值為;而這一收益流的平均貼現值為1。
我們從博弈只進行一次的情形開始。這時,猜對對方的發球方式使絕對優勢策略,納什均衡點在猜對對方反手發球;如果博弈進行有限次,隨著雙方運動員與體力的消耗,那么子博弈完美要求最后的一次發球必然是反手發球,這樣才能在較量中得到優勢。根據逆向遞推法,則唯一的子博弈完美博弈均衡就是猜對發球方每次都選擇反手發球。
不過網球發球博弈中也存在另外一種子博弈完美均衡:“開始時發球方采用正手發球,只要發球方一直贏的狀態下,發球方會一直采用正手發球,直到有一次征收發球失敗,在以后的博弈過程中, 一直采用反手發球。”使用這樣的策略,就會面臨兩類子博弈:A 類是接球方無論猜對與否都沒有贏得發球方,B 類是在第i 次開始接球方贏得對方,使得發球方在下次發球時反手發球。如果一個運動員在A 類的每個子博弈都執行這一策略,則他的平均貼現收益是1;但如果他在時間t 偏離這一策略,并在此后(一直在B 類子博弈中)都執行此策略,那么他的(標準化)收益是:
當時,顯然其(標準化)收益小于1。對于B 類子博弈中的任何歷史ht,從t 期往后一直奉行這一策略的收益是0,偏離一次后再奉行該策略,在t 期收益為-1,以后仍然是0。因此,在任何子博弈中,沒有參與人可以從偏離一次后再奉行這一特定策略中獲得好處,根據單階段偏離條件,這一策略組合也就形成一個子博弈完美均衡。
3. 結論與討論
隨著貼現因子大小的變化,可能會有許多其他的完美均衡。有耐心的參與人之間的重復博弈不僅可以使合作意味著有效的收益成為可能,而且也導致了更多其他均衡結果。如果我們固定一個納什均衡(如A 類納什均衡),發球方在最后一期T 必定實施欺騙, 因為對實施A 類時任何以正概率出現的歷史hT,欺騙都將提高他在第T 期的收益而且也沒有遭受失敗的可能。因此,我們可以知道, 在網球發球過程中,運動員不可能遵循單一的發球方式,接球方也不可能采用固定不變的方式。
參考文獻:
[1] 李益群,謝亞龍. 體育博弈論[M]. 北京體育大學出版社, 2002.
[2] Fudenberg,Tirole.Game Theory[M].Beijing:China Renmin University Press,2010.
[3] 王成夫. 試論體育博弈論的理論基礎[J]. 武漢體育學院學報,2000.
[4] 羅強,武振盛.“囚徒困境”與網球比賽中發球策略的博弈分析[J]. 文化教育,2005.
本站論文資源均為來自網絡轉載,免費提供給廣大作者參考,不進行任何贏利,如有版權問題,請聯系管理員刪除! 快速論文發表網(www.6scc.cn)本中心和國內數百家期刊雜志社有良好的合作關系,可以幫客戶代發論文投稿.
投稿郵箱:ksfbw@126.com
客服Q Q:
82702382
聯系電話:15295038833
本站論文資源均為來自網絡轉載,免費提供給廣大作者參考,不進行任何贏利,如有版權問題,請聯系管理員刪除!
上一篇:主觀概率在貧困生等級認定中的應用
下一篇:淺談機電一體化的未來發展