Discussion Papers 2024

CIRJE-J-311 長期的顧客指標のためのAdaptive Minimax Regret (AMR) による確率型A/Bテスト
"Probability-based A/B testing with Adaptive Minimax Regret (AMR) criterion for long-term customer metrics"
Author Name

阿部誠(Makoto Abe)

Date

August 2024

Full Paper

PDF file (only Japanese version available)

Remarks  
Abstract (in Japanese) Abstract (in English)

経済学では不確実性を、確率で評価できる「リスク」と確率が未知である「曖昧性」の2種類に区別する。リスク下の意思決定では、事象がもたらす効用をその確率で重み付けた期待効用が最大になるような選択をすることが合理的な行動である。一方、確率が未知な曖昧性下では、どのように意思決定をするべきなのだろうか。

本論文では、まず、このような曖昧性下において、確率は未知だが区間のみ分かっている状況での意思決定基準の1つである最大リグレット最小化(Minimax Regret)基準を紹介する。具体例として、既存と新規2台スロットマシンで、前者の当選確率は既知であるが、後者の当選確率は未知で確率の区間のみ分かっているとしよう。この場合、最大リグレット最小化基準による最適な行動は、この2台のスロットをそれぞれ一定の確率でランダムに引くことになる。

次に、効用が長期的な指標の場合、この指標の区間不確実性は時間が経つにつれて減少していく。そこで、その時点で得られた情報に基づいて、最大リグレット最小化基準による確率を更新しながら効用を最大化するAdaptive Minimax Regretを導入する。上述の、既存と新規2台のスロットマシンのケースでシミュレーション検証を行った結果、導入手法はバンディット・アルゴリズムに匹敵する高いパフォーマンスをもたらした。このAMRを使ったマーケティングへの応用として、ターゲットとなる顧客の平均生存期間(効用)が一番長くなる逐次的なキャンペーン施策、確率型A/Bテストを提案した。

Evaluating long-term metrics like customer lifetime requires an extended observation period. We propose Adaptive Minimax Regret, which permits companies to make an optimal decision under minimax criteria based on the current information at hand and update it sequentially, enabling them to respond before knowing the complete results of long-term metrics.