最適化理論/ゲーム理論

提供: Internet Web School

(版間での差分)

2020年11月24日 (火) 09:11時点における版

A,Bがじゃんけんを繰り返し,毎回,勝ったほうが10点を得るゲームを行う. A,Bが繰り出す手によって得られる得点をAの視点から表にしたものが以下である。

Aはどのように「グー」「チョキ」「パー」の手を繰り出していけば、得点が最大になるだろうか？例えばAが「グー」を出し続けていけば,Bはそれを観て「パー」を出し続けて,Bは勝ちを繰り返すことができる. Aが「グー」「チョキ」「パー」をこの順に規則的に繰り返していけば,Bはそれを観て「パー」「グー」「チョキ」　という対抗手段を講じて勝ちを繰り返すことができる.

結局,Aは「グー」「チョキ」「パー」を不規則に出すことになる.それでは,それぞれどのような確率で出せば得点の期待値を最大にできるか？　という問題に帰着するだろう.

Aが「グー」「チョキ」「パー」を出す確率をそれぞれ \(p_1,p_2,p_3\)とする.

\(0 \le p_1,0 \le p_2,0 \le p_3 \qquad p_1+p_2+p_3=0 \qquad (1) \)

ここで問題の簡単化のため,得点表のそれぞれ要素の値を正数とするため各要素に10を加えておく. Aが得点の期待値を求めれば

Bが「グー」を出すときは

\(10p_1+0p_2+20p_3 \)

Bが「チョキ」を出すときは

\(20p_1+10p_2+0p_3 \)

Bが「パー」を出すときは

\(0p_1+20p_2+10p_3 \)

\(20p_1+10p_2+0p_3 \)

\(0 \le p_1,0 \le p_2,0 \le p_3 \qquad p_1+p_2+p_3=0 \qquad (1) \)

である. この問題に解が存在するとすれば,その得点の期待値\(0 \lt G\) とすれば

ゲーム理論

最適化理論/ゲーム理論

提供: Internet Web School

2020年11月24日 (火) 09:11時点における版

表示

個人用ツール

案内

検索

ツールボックス

@@ 7 行: / 7 行: @@
 「パー」「グー」「チョキ」　という対抗手段を講じて勝ちを繰り返すことができる.
-結局,Aは「グー」「チョキ」「パー」を不規則に出すことになる.それでは,どのようなそれぞれ確率で出せば
+結局,Aは「グー」「チョキ」「パー」を不規則に出すことになる.それでは,それぞれどのような確率で出せば
 得点の期待値を最大にできるか？　という問題に帰着するだろう.
@@ 17 行: / 17 行: @@
 ここで問題の簡単化のため,得点表のそれぞれ要素の値を正数とするため各要素に10を加えておく.
-Aが「得点の期待値を求めれば
+Aが得点の期待値を求めれば
 Bが「グー」を出すときは