Aumann, R. J., Correlated equilibrium as an expression of Bayesian rationality, Econometrica, Vol. 55, No.1, pp. 1-18, 1987 p2,p3,p4 概念: ベイズ理論(あるプレーヤーがある戦略をとるという予想に基づいてそれが起こる とされる確率)とゲーム理論(ある事象が起こる確率は均衡に基づく)をあわせる ことにより、ベイズ合理性の結果としての相関均衡を考えることができる ナッシュ均衡は、他のプレイヤーがとっている戦略に対して最適の戦略をとる状態 においてどのプレーヤーも戦略をかえる動機をもたない状態であるが、全プレイヤ ーが他のプレーヤーがとる戦略を知っているという限定的な前提をおいている。 本研究では、1) 各プレイヤーはすべての「世界の状態」に対して主観的な確率分 布をもっており、2) 各プレイヤーは与えられた情報から予測できる利得を最大化 する戦略をとる,ということが共有知識になっている 前提にて、 各プレイヤー によって選択された戦略が相関均衡を形成する合理的な根拠を示す事を目的とす る。 p5,p6,7 定義と定理: 相関戦略では、プレイヤーはランダムな事象の観測に基づいて行動を選択するが, 混合戦略では観測が独立であるのに対し,相関戦略では独立でなくてもよい 各プレイヤーに行動をとるよう提案して他のプレイヤーがそれに従うとしたとき に,その提案から戦略を変えても利得が増えないときを均衡状態とする 2人ゲームを例に、条件付き期待利得をもちいて、相関戦略の確率分布pjkが次の式 を満たす場合にのみ相関均衡分布となる定理を証明 Σk(h1jk-h1qk)pjk≧0 for all j,q in S1, Σk(h2jk-h2qk)pjk≧0 for all j,q in S2 p8 相関均衡分布: ペイオフマトリクスが      player2-A player2-B player1-A (6,6) (2,7) player1-B (2,7) (0,0) である 2人チキンゲームにおける例  ありうる戦略(A,A),(A,B),(B,A)において、 戦略Bが提案された場合利得7が得られる 戦略Aが提案された場合戦略をかえないと期待利得4>かえたときの期待利得3.5 以上により戦略はかえない。この場合の相関均衡分布は次のようになる。      player2-A player2-B player1-A 1/3 1/3 player1-B 1/3 0 p9,p10,11 ベイズ合理性: Ω:可能な全ての世界の状態 それに属する要素ω:個々の状態, 各プレイヤーiに ついての Ω 上の事前確率をpi,各プレイヤーiについての Ω の情報分割を“飾り 付き”pi 本物の世界の状態 ω∈P∈"飾り付き”Pi  の要素とすると iは、iが知っているPのいくつかの要素は世界の真の状態であることを知っているが、 どれが本物かは知らない。 与えられたωの状態で全員がすべてを知っているが、だれも真のωが真実かを知ら ない。 (議事録責任にて原文より追記) Ωの微小分子をとりだした”飾りつき”pの一部 分という形で、すべてのプレイヤーにおける不確実性の状態をあわらすことが可能 である=情報分割 前提としてすべての事前確率 pi が等しいとする。 s(ω):=(si(ω),...,sn(ω))を状態ωで選ばれるn個の行動の組とする 情報に基づき利得を最大化する行動をとるとき, 「プレイヤーiが状態ωでベイズ合理的である」と言う。 主要定理 各プレイヤーが世界の各状態においてベイズ合理的であるならば,n組の行動sの分 布は相関均衡分布となる。 および証明 p12,p13 相関均衡の例: 混合戦略均衡の、各プレイヤーがどのように行動するかが共有知識になっている 状態の構造は不自然 相関均衡は、プレイヤー同士、互いにどう予測しあっているか知らない状態 3人ゲームの例 3人が共通で知っている情報はビジネススクールの事だけ なにかの戦略に対して、なんか同じような行動をとるだろう っていうことがまず あって プレーヤー1と2からみれば、プレイヤー3は同じ学校に通っているから1と2が おなじ行動をとるだろうと思う と思われる そのなかで利得の高い方を選ぶと いうことから、 この利得表では(2,2,2)が相関均衡 p14,p15,16,p17 相関均衡に関する議論: ベイズ理論のもとではどんな情報シグナルを受け取った場合でも意思決定者は自 由だが、世界の状態の一部ωから通告される選択を強いられているようにみえる →外部の観察者からみた状態とかんがえる。外部の観察者にとって,各プレイヤー の選択は世界の状態の一部分であり、彼らの好きなものを知らないだけ あるプレイヤーにとって、他のプレイヤーの情報分割”飾り付き”piは不確実性の あるものではなく、共有知識となる。 世界の状態の完全な記述であるωに対し、プレイヤー2のリストにはωとは区別の つかない世界の状態である他のω’が含まれる。したがってωの記述は”飾り付き” p2の構造を含むことになり、他の同じような”飾り付き”piも同様である。 ωの記述は”真の”知識ではなく、コードブックや辞書のようなもの。”飾り付き” piも同様に辞書における分類方法 というようなものである。 事前確率においても同様であり、ベイズ的視点では、各プレーヤはΩにおける事前 確率をもっており、他のプレイヤーの事前確率についてプレイヤー誰かの一部に不 確実性があることはない。各プレイヤーの事前確率はすべてのプレイヤーの共有知 識となる。 (議事録責任にて原文より追記) 各プレイヤーは自身の事前確率と情報分割だけを利用して結論にいたるのであり、 数々の情報分割や他人の事前確率を知っているかどうかは関係がない。 Ω、pと”飾り付き”Pi、sからなるシステムを情報システムとよぶ。主たる理論は ベイズ合理性のもとにあり、すべての情報システムは相関均衡に一致する。ベイズ 合理性のもとではすべての情報システムは相関均衡に一致し、逆も成り立つ。 プレイヤーが混合戦略をとりたい場合,各プレイヤーが自分のとる行動を知ってい るという仮定は成り立つのだろうか、。 混合戦略は他の人のかく乱のためであっ て自分には必要なく、混合戦略は決断を助けるための方法であって各プレイヤーは 最終的には事前に決断している。プレイヤーが自分自身に対して混合戦略を適用し た場合は、このこと事態をSiの要素としてのひとつの行動と考えればよい。 (斉藤) p13でプレイヤー3が、プレイヤー1と2が同じビジネススクールに通っていると いうことが何を意味するのか知らないと書いてあることの意味は? 福山 行動がおなじビジネススクールに通っているからといってどういう行動につなが るかは知らないので、そこからはプレイヤー3の推論になる。しかし手がかりがな いから、おなじ行動をとるだろうと考える というふうに1、2も考える という ことが相関均衡 (原) 真の情報に対して、情報分割=ビジネススクールに通っている というところまで 知っている ということ。1、2は3にそう知られている ということを知ってい る ということ 例えば駐車場探索のカーナビが、全員の自動車についていて、ある駐車場の駐車所 可能台数の残りが全員の車にそなえつけられているカーナビでわかる というこ とを全員が知っている というのが情報分割 しかし、あと1台に入れるかどうかに対してみんながどう考えるかはわからない  みたいなこと。 (羽藤)  メッセージは必ずしも完全情報で出されない、だれかが知らない事があればそれは 前提ということにでならない。 フェースブックとか政府からとか、だされる情報がちがうときにみんながどう推論 するか みたいなこと。もうすこしいい例があればいいのだが。 (福山)  実際どういう場面があるのか、あまりイメージできない。 (羽藤)  株式市場などは限定情報での推論で動いている。原発なども、セシウムの情報によ って避難するとかしないとか みんながどう推論して、避難することによる不利益 を想定するとか、集落移転などはあてはまるような気がする。 ================================================ まとめ: ベイズ理論(プレイヤーがある戦略をとる予想に基づきそれが起こるとされる確 率)とゲーム理論(ある事象が起こる確率は均衡に基づく)を合わせ、ベイズ合理 性の結果としての相関均衡を考えることができる。ナッシュ均衡は全プレイヤーが 他のプレイヤーがとる戦略と確率を知っているという限定的な前提をおくが、相関 均衡は、各プレイヤーが1)すべての「世界の状態」に対し主観的な確率分布をもつ、 2) 与えられた情報から予測できる利得を最大化する戦略をとる,ということが共 有知識となるとき、各プレイヤーへの行動提案やシグナルに対して他のプレイヤー が従うときに自分の戦略を変えても利得が増えない状態である。 相関均衡分布における、相関戦略の確率分布がみたすべき式の提示とその証明、 すべての事前確率 pi が等しいとした前提では、s(ω):=(si(ω),...,sn(ω))を状態ωで選 ばれるn個の行動の組とし、各プレイヤーが世界の各状態において、情報に基づき 利得を最大化する行動をとる=「プレイヤーiが状態ωでベイズ合理的である」なら ば,n組の行動sの分布は相関均衡分布となる ことの定理としての証明、事例その 他について論じている