best-arm-identification バンディット問題の理論とアルゴリズムを読んでの実装メモ 逐次削除方策(successive reject policy) https://www.kspub.co.jp/book/detail/1529175.html