アニメ好きでもゲーム好きでもない、純粋なポケモン好きによるポケモン対戦中心の雑記。コメント返信は遅め。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

行動論について

構築論に関しては基本的な整備は大体終わったように思えるので、今度は行動論の基礎を整備したいと思う。
但し、内容的な完成度は構築論よりも圧倒的に低いと思う。まだ試行錯誤の段階で、未完成な状態であるためだ。

内容的には、考察して有益なものであることは保証しない。寧ろ殆ど無益とさえ思った上で考察している。
非常に、異常に長くなるが、興味があってかつ暇な方はどうぞw

*行動論とは

行動論の研究目標は「行動(立ち回り)を改善すること」であり、従って行動を改善するための手段を研究することが行動論ということになる。
構築論は大雑把には、「(上手く立ち回れば)勝てるパーティを作ること」が目標であったので、勿論行動論と構築論は密接に結びついている。
因みに、行動論と構築論はその目的で分類している。議論の内容で分類すると、人に依って内容が違う事から私の議論にしか分類が適用できないし(それはあまり問題にはならないが)、それ以上に私の場合2つの議論内容は重複しまくっているからだ。
これは既に、構築の段階で具体的な立ち回りも想定したことから明らかだろう。

多くの場合、まず「強いパーティ」が天から与えられ、その上でどう立ち回るか考えるという、構築論→行動論という風潮があるように感じられるのだが(しかも行動論は真剣に考えず、天から与えられたパーティがどのようなものか解読すべく天の声の解釈ばかりに専念している場合が多い)、私の意見は当然ながらそれとは対立するものになる。

因みに育成論というのは完全に構築論の一部で、役割と存在意義とを分けて考える構築論に存在する。
役割は個体が単独で持ちうるのだから、それぞれの種族について、型に依ってどのような役割が持てるか調べる事ができる訳で、それを育成論と呼んでいるという事になる。
そして構築論は、基礎を整備してしまえば後は只管育成論になることも確認しておきたい。多くの攻略サイトで育成論が飛び交っているのもこのためだ。
また育成論は、構築論の一部である以上、ある程度構築論の考えを共有していないと話が通じないと思う。
実際私は、多くの攻略サイトのにある育成論を理解する事ができない。ゲー研会員が攻略サイトをあまり見ないのも多かれ少なかれこのことに由来すると推測される。


*行動論の分類

ここからは行動論に関する私の意見を述べることにする。

私としては、行動論を2種類に分類するのがいいのではないかと思っている。

1つ目は、想定された敵に対する勝ちパターンを発見するための行動論であり、構築論と密接に結びついている。
わかりやすく言うならば、「基本的立ち回りと構築のための行動論」である。
仮想対戦において勝てるかどうかを判定する際、本来ならば勝てるところを、(経験不足に依ると思われる)知識不足のために、見過ごしてしまう(又はその逆)可能性がある。
例えば、スカーフガブ・ヘラクロスvsボーマンダという2対1の構図を考えよう。ボーマンダはいかく込みでガブリアスのげきりんを耐え、スカーフガブはりゅうせいぐんを持っていないとする。
この時、前者は勝利が確定している。一度ヘラクロスに交代し、ヘラクロスが倒れてからスカーフガブを出せばよい。交代でいかくの効果を解除するという、単純だが重要なテクニックである。
こういったテクニックを整理することも第1の行動論に分類される(だがこれはつまらない)。

第2の行動論は、実際の対戦において、想定外の状況に陥った時に素早く対応するための行動論であり、実に面白いが甚だ未完成である。
「即興的立ち回りのための行動論」である。

第1の行動論も第2の行動論も研究する事に大差はなく、単に目的で分けているだけだが、目的意識をはっきりさせるために分類している。
重要な違いと言えば、第1の行動論はテクニック的側面が強いが、第2の行動論は分析的側面が強いという事だろう。
第1の行動論では相手のパーティが最初から(幾つかに)想定されており、それに勝てるようなパーティを作る(見つける)ための行動論である一方、第2の行動論は先に状況を分析する道具を整備し、その道具を使って与えられた状況を分析し、分析結果を行動選択のお役に立てるための行動論だからだ。


*基本的な用語の整理

これ以降では用語の使い方に微妙な部分が多いので、まず用語を整理する。

☆構築情報
自分と相手のパーティにどのような個体がいるかの情報。

☆状況
構築情報は勿論、それぞれの個体の現在体力と場に出ている味方・敵の情報も含めた概念。隣り合う2つのターンの間に存在する。

☆初期状況
ターン0とターン1の間の状況。ターンに番号を振るための基準になる。特に初期状況の時に場に出ている個体を初期個体と呼ぶ。

☆行動
1ターンにおける選択。交代(交代先指定)と居座り(技指定)がある。

☆立ち回り
プレイヤーの(1回の対戦における)行動全体。

☆行動手順
各状況に応じて直後のターンでの自分の行動を決めていく方法(を相手のすべての行動、すべての状況に対して定めた表)。又は、状況に対し行動を返す函数(多価函数でもよい)。

☆勝ちパターン
ある行動手順が存在し、相手の任意の立ち回りについてその行動手順に自分が従うと自分が勝つような状況。その行動手順のことを勝利行動という。

☆決定状態
自分・相手どちらかにとって現状況が勝ちパターンであること。特に、自分にとってなら勝ち決定状態、相手にとってなら負け決定状態と言う。

☆均衡状態
決定状態でないこと。

こんなもの。適宜追加する。


この用語を認めるならば、より正確に第1の行動論と第2の行動論を分類できる。
即ち、第1の行動論では「決定状態か均衡状態か」のみに着目して、与えられた相手の状況に応じてその状況が勝ちパターンとなるような自分の状況を求めるのに対し、第2の行動論では各均衡状態に対し意味付け(分析)を行い、行動選択の基準とするのである。

以降では、行動論の分析的側面の拙い考察をする。


*分析的行動論(第2の行動論)における分析のための準備

これ以降では非常に未完成色が強くなる事に注意されたい。

まず、分析をするのには、対象が複雑過ぎるだろう。
複雑になっている主な原因は、運要素ではないかと思う。
ここで運要素は、確率的に変動しうるものとして定義するのが妥当だろう。
分析したい(し易い)のは、運要素を排除した理想的対戦モデルなのだから、すべての確率を近似的に1か0とみなしてしまえるような場合を考える事にしたい。
或いは、期待値的な問題で運要素を無視するのが不自然と考えられる場合には、そのまま期待値をとってしまって無理矢理運要素を排除するということも考えられる。

その意味で、第1の行動論で勝ちパターンを探す時の対戦モデルは、運要素を排除した理想的なモデルであったと考えるべきだろう。
勿論、勝ちパターンだと言っても、運要素を復活させた時に実際どれだけの確率で勝てるかという「誤差」も、大体把握しておく必要があるのは言うまでもないだろう。


さて、理想的対戦モデルにおいて、均衡状態と言っても、単に自分と相手の位置が全くの横一線で、両者の位置関係は決定状態になるまで対等である、というのはあまり自然な考えではないだろう。
何故なら、もしこの考えを認めるなら、行動論の大雑把な結論は、「相手の行動次第で勝ち決定状態になる行動を優先度3、相手の行動次第で負け決定状態になる行動を優先度1、それ以外の行動(相手がどう行動しても均衡状態のままの行動)を優先度2とし、優先度の高い順に行動すべし」となり、極めて不自然となるからである。
勿論、「この行動をとった時に勝ち決定状態となる相手の行動の多さ」で優先度を更に細かくしてもいいのだが、もしそうするとしても、簡単な2対2のモデルを説明できなくなる(下の例1参照)。
このことから、「自然な行動」として行動原理を要請することになる(*行動原理の項参照)。


*例1

攻撃する側→受ける側:削る体力の最大体力に対する百分率
という表記を採用する。この表記は以降の記事でも使う事にする。

A1→B1:0%、B2:100%
A2→B1:100%、B2:50%
B1→A1:35%、A2:0%
B2→A1:35%、A2:100%
素早さ:B1>B2>A1>A2
初期個体:A1対B1

わかりにくければ、
A1=サンダー(10まんボルト)
A2=ドサイドン(じしん)
B1=サンダース(10まんボルト)
B2=スターミー(なみのり)
として解釈。

ややこしいので、場に出ているのが誰と誰なのか、紙に書いて確認しながら追ってほしい。現在の体力も付記しておくとよりわかり易いだろう。


?)ターン1でA居座りB居座りの時

ターン2でBがB1で居座る時、AがA1で居座ると、その時点でB2での2体無条件突破が成立し、Bは勝ち決定。
よってAがA2に交代する時のみ考える。

ターン3でBがB2に交代する時、AがA2で居座ると、ターン4でAがA2で居座るとA2が倒れ、A1に交代してもA1が倒れるので、Bの勝ち決定。
よってAがA1に交代する時のみ考える。

ターン4でBがB1に交代する時、AがA1で居座るとターン1終了後、A2に交代するとターン2終了後と同じ状況になり、循環以下同様。

ここで、常にBが常に先に行動を決めていた(行動手順に従っていた)のであり、Aは行動手順に従っていた訳ではなく、Bの「同じターンでの」行動を参照して行動を決めていた。
Bはこの行動手順に従っている限り(勝てるとも限らないが)負ける事はない。
この状況を、広義の決定状態と呼ぶが、普通の決定状態と区別する必要がない場合が殆どなので、決定状態と言った時には広義の決定状態も含んでいるものと解釈する事にしたい。

総合して、この時Bの勝ちが決定。


?)ターン1でA居座りB交代

B2が倒れ、Aの勝ちが決定する。


?)ターン1でA交代B居座り

ターン2でAがA1に交代する時、BがB1で居座ると負けが決定するので(?と同じ状況)、AはA2で居座るとする。BはB2に交代するとしよう。

ターン3でAがA2で居座る時、BがB2で居座るとA2が倒れ負けが決まるので、AはA1に交代するとする。BはB2で居座るとしよう。

ターン4でAがA2に交代する時、BがB2で居座ると負けが決まるので、A1で居座るとしよう。BはB1に交代するとしよう。

ターン5でAがA1で居座る時、BがB1で居座るとB2により2体無条件突破が確定し負けが決まるので、A2に交代するとする。
ところがこの時、BがB2に交代すると、Aは負けが決定。

よって、任意のAの行動手順に対しAが負けるようなBの立ち回りが存在し、Aは勝ちが決定していない。


ターン2でBがB1で居座る時、AがA2で居座るとB1が倒れ負けが決まるので、B2に交代するとする。AはA2で居座るとする。

ターン3でBがB1に交代する時、AがA2で居座るとB1が倒れ負けが決まるので、B2で居座るとする。AはA1に交代するとしよう。

ターン4でBがB2で居座る時、AがA1で居座るとB2が倒れ負けが決まるので、B1に交代するとする。
ところが、AがA2に交代すると、Bの負けが決まる。

よって、任意のBの行動手順に対しBが負けるようなAの立ち回りが存在し、Bは勝ちが決定していない。


総合して、両者ともに勝ちが決定しておらず、決定状態でないので均衡状態。

?)ターン1でA交代B交代

ターン1でBがB2で居座る時、AはA2で居座るとA2が倒れAの負けが決定。
よってAがA1に交代する時のみ考える。

ところがこれは?のターン終了後と同じ状況で、Bの勝ちが決定。
よって、あるBの行動手順が存在し、Aの任意の立ち回りに対しBが勝ち、Bの勝ちが決定している。

___

???を総合すると、

ターン1でA居座り→Aの負け決定orAの勝ち決定
ターン2でA交代→均衡状態orAの負け決定

となっていて、前述の不自然な考え方だとAはターン1で居座る方がいいように見える。
しかし感覚的には、この判断は間違っているように思えるし、AがA2に交代するのを読んでBがB2に交代する事に対する2次的な読みとしてAのターン1での居座りを考えるのなら勿論構わないが、最初から居座る方がいいとしか判断できないのでは問題があると思われる。

因みに、多くの場合、この例で用いたような単純化された対戦モデルを扱う。


*行動論の基本定理(準備の続き)

例のために準備が中断されたが、ここで再開しよう。さて、便宜のための用語の定義をする。

状況1が状況2の「劣状況」である。
⇔状況1と状況2の初期状況が等しく、状況1における任意の自分の個体の現在体力は状況2における同個体の現在体力以下で、状況1における任意の相手の個体の現在体力は状況2における同個体の現在体力以上。

状況1が状況2の「強状況」である。
⇔状況2が状況1の劣状況である。

ここで「劣」は「自分」にとっての劣であり、対戦モデルを常に一人称(自分)対二人称(相手)の構造で捉えているからこそ意味を持つ。
この定義をした上で、次が成り立つ。

【定理】
状況1が状況2の劣状況だとする。この時、状況2が勝ち決定状態でないならば、状況1も勝ち決定状態でない。
(証明)
対偶、即ち、状況1が勝ち決定状態だと仮定すると状況2も勝ち決定状態になる事を示す。
仮定より、状況1に勝利行動が存在。この勝利行動は状況2でも勝利行動である。よって状況2は勝ち決定状態である。
(証明終)

この証明だと、「状況2でも勝利行動である」のところがすごく突っ込めるけど、数学ではないからあまり細かい事は気にしないように(マテ。

ここで、対偶の形で定理を述べた方がすっきりしているのに、何故定理をこの形にしたのかというと、実際に調べたいのは「均衡状態であること」だからだ。
といっても、分析の対象外である決定状態をいかに発見し排除するかという視点も重要なので、対偶としての定理も重要である。
この形にしたのは寧ろ、対偶を証明することでどちらの形も紹介したかったからという理由が大きい。

この定理は、単純だが、実に興味深い主張をしている。
これは、構築情報を固定して、状況を幾つか書き並べた時に、それらの状況は無関係に羅列されるのではなく、何らかの関係性をもって並ぶということを示唆する(少なくとも、ある状況の劣状況について、そのある状況が勝ち決定状態でないという条件により、劣状況が制約を受ける事になる)。
そしてまさに関係性が示唆されるが故に、状況は分析するに値するのだ。
例えば2つの構築情報の等しい均衡状態が与えられたとして、もし一方が他方の劣状況になっているのなら、同じ均衡状態でも一方が他方から何らかの制約を受けていると考えるのが尤もらしいだろう。
その意味で、この定理は「行動論の基本定理」とでも呼ぶのに相応しい定理だろうと、私は思う。


*行動原理

例でも言ったように、「均衡状態では自分と相手の位置が全くの横一線で、両者の位置関係は決定状態になるまで対等である」という考えには無理があるらしいとわかった。
この考えは、行動論の基本定理から「均衡状態同士にも何らかの関係性がある」ことが示唆される事からも、受け入れ難い考え方だとわかるだろう。

そこで、「自然な行動」の存在を要請したい。「自然な行動」とは大雑把には、「第一に考えるべき行動」であり、また相手がとると考えられる行動である。
次の要請+定義をしよう。

自然だとされる行動手順が存在し、その行動手順を「行動原理」と呼ぶ。また、行動原理に即していない行動を「読み」と呼ぶ。

ここで、何をもって「自然」と称するのかは難しい問題ではある。実を言うと、どういう行動手順を行動原理とすればいいかは殆ど解明されていない、というのが私の現状である。よって、暫定的に、次の基本則を行動原理として採用したい。

番号順にとる行動を考える。
1、現状況が勝ちパターンなら、最適な勝利行動に従う。
2、場の敵が倒れるまで相手が居座り続けるという制約を課した時(以降、単に制約下)、現状況が勝ちパターンになるならば、制約下での最適な勝利行動に従う。
3、相手の構築を場の敵1体に制限した時(以降、単に制限下)、現状況が勝ちパターンであるなら、制限下での最適な勝利行動に従う。
4、居座る。

ここで、行動手順1が「最適である」とは、「任意の行動手順2と、行動手順1、2それぞれの実行中における任意の状況1、2に対し、状況1が状況2の劣状況となるならばその2つの状況は等しい」こととする。

両辺を否定すると、行動手順1が「最適でない」とは、「ある行動手順2にがあって、行動手順1、2それぞれの実行中においてある状況1、2が存在し、状況1が状況2の劣状況でかつその2つの状況は等しくない」ことになる。
こちらの方がわかり易いかどうかは難しい問題である。

ややこしい定義なので、どこかにおかしいところがありそうな気がする。
例えば、勝利行動なら存在するけど最適な勝利行動が存在しない、ということになったりすると困る。
均衡状態では最適な行動手順は存在しないのだが(自分のある行動手順に対して、相手は立ち回り次第で勝ちも負けもするので、最適なものがあると仮定すると矛盾)、勝利行動なら最適なものが存在するのではないかというのは、甘い幻想かもしれない。
感覚的には、下の例2でありうるような、不自然な勝利行動(例2の場合、制約下)を排除しているものと理解してもらいたい。

まだ未完成なこの基本則は、今後適宜修正されるであろう。
とりあえず1は問題無いのだが、2を経由しただけですぐさま稚拙な行動である3に移ってしまうのが自然かは甚だ疑問である。個体数が少ない時は問題無さそうだが、6対6で考えた時に自然な行動を言い表せているかどうかは疑わしい。
また、「最適」が上手く定義できているかどうかも問題である。
もし私の議論に興味を持たれた方がいれば、この基本則が妥当かどうかを具体例で検証し、もし不自然と思われる例が見つかれば是非とも報告してほしい。
勿論、この基本則よりも行動原理に相応しい行動手順を発見された場合も、是非とも報告されたい。


*例2

A1→B1:50%、B2:100%
A2→B1:100%、B2:35%
B1→A1:35%、A2:35%
B2→A1:35%、A2:100%
素早さ:A2>B2>B1>A1
初期個体:A1対B1

「A=自分」として考える。均衡状態である事が確かめられるので(略)、Aは基本則の上では2番以降の行動をとることになる。
ここで、制約下では、これは勝ちパターンである。即ち、速やかにターン1でA2に交代してB1を仕留めれば良い。
しかし、実はターン1はA1で居座りターン2でA2に交代しても、これは制約下で勝利行動となる。

ここで、ターン1で居座る事は、直感的に明らかに無駄な行動である。この「無駄」を解消するのが「最適」という概念であるということだ。

*状況分析

ここにきて、漸くまともに状況分析ができるようになった。行動原理を要請したことで、状況の自然な推移が予測できるようになったからだ。
更にもし、「行動原理の一意性」をも要請するなら、状況の自然な推移も一意に定まる。これを用いて、次の概念を導入する。

上位→両者が行動原理に従った時勝つ側
下位→両者が行動原理に従った時負ける側

行動原理が「一意である」について、少し注意を述べておく。
行動手順の定義のところで、行動手順とは状況に対し行動を返す函数だと言ったが、この定義を用いると、行動原理が一意とは、行動原理が一価函数なることとなる。
また、行動原理の一意性を要請しなくても、行動原理に従う時勝つ側負ける側が一意に定まる事のみ要請しておけば問題無い。
更には、そうでなくとも、行動原理によって勝つ側負ける側が一意に定まる状況にのみ、上位・下位という用語を定めるとしてもいいだろう。

さて、上位・下位といっても、均衡状態ならば下位には勝てる立ち回りが存在するのだから、勝つ望みは残っている。
しかし、行動原理に従っていると負けが期待されるのだから、下位側が勝つには、何回か読みを行う必要があるだろう。
そこで、読みについての概念も導入しておく。

☆最小読み数
相手が常に行動原理に従うと仮定した時、自分が勝つために行う読みの回数の最小値。均衡状態のときのみ定義する。

☆妥当な読み
直後に相手が行動原理に従う時、自分がその読みを行う事で直後の状況での最小読み数が減るような読み。

☆決定的読み
直後のターンで相手が行動原理に従う時、自分がその読みに従う事で直後の状況が勝ちパターンとなる読み。特に、自分が上位であった場合逃げ切り読みといい、下位であった場合逆転読みということにする。

☆妥当な行動
行動原理に従った行動、妥当な読み、又は逃げ切り読み。


これらの概念は、定義であると同時に、行動選択における重要な資料を提供している。

例えば、自分が上位であった時、とりあえずは行動原理に従っていようとか、相手の逆転読みが来ると踏んで、逆転読みされる可能性のあるターンに逆に読みを行い、相手の逆転読みを防ぐとか(それが同時に逃げ切り読みであれば尚嬉しい)、はたまた逆転読みが存在する前に早々と逃げ切り読みで決着を付ける、といった事が考えられる。

自分が下位なら、どのターンに妥当な読みを行うか考えることになるだろうが、最後の妥当な読みが逆転読みとなるように調節したり(すなわち上位になった瞬間に勝ち決定状態になる)、或いは相手が早々撃ってくる逃げ切り読みを防いだり、というように、行動の指針を立て易くなる。

これは勿論、あくまで行動の指針を立てる際の「参考」にしかならないのだが、実際の問題として、「このターンでの行動はコレ!」と一義的に決めてしまうのはどう考えてもまずいのであるから(それならその方針を行動原理とすればいいし、そもそも均衡状態なのに最初から勝ち負けが決まってしまいかねない)、分析の道具だけ与えてあとは各人に任せる、とした方が、現実に即しているのではないかと思う。
問題はこの道具が有用であるか否かだ。


*今後の課題

この議論がまだまだ未完成であることは今まで言ってきた通りである。現に、以下に示すように、多くの未解決問題もある。

☆均衡状態という条件の下で初期状況を動かした時、最小読み数がどのような値をとるか。

☆逃げ切り読みが初めて存在するターンは逆転読みが初めて存在するターンより常に早い(又は同時)だろうか。


更に、「そもそもにして状況を分析したところで行動が改善されるのか」という本質的な疑問もある。役に立たないと言われても否定はできない。

この疑問に答えるとしても、「私の形式の行動論は、勝ちを目標とする人間が考えるべきものではなく、この種の考察をしたいと思う人間が考えるものなのだろう」以外に答える術は持ち合わせていない。


補足をしておくと、行動論を用いて「決定力の速度」についての研究が盛んに行われてた事があるらしい。
といっても私は「決定力」が何なのかは知らない。

行動論は所謂普通の対戦考察と大分違う方向に走ってる気がするが、趣味で考えているだけだからまぁ問題はないだろう。。。
スポンサーサイト
コメント
コメントの投稿
管理者にだけ表示を許可する
プロフィール

リィズ

Author:リィズ
ポケモンが好きで主に対戦を考察する。
東京大学ゲーム研究会(TGA)所属。
乱数調整の解説記事へは、下のリンクから行けます。

リンク
このブログをリンクに追加する
最新記事
最新コメント
カテゴリ
カレンダー
05 | 2017/06 | 07
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 -
月別アーカイブ
Twitter
アクセスカウンター
RSSリンクの表示
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。