少し（というか結構）前になりますが、2017年9月に「速習強化学習 ―基礎理論とアルゴリズム―」という本を刊行しましたので、簡単に紹介します（Twitter, FBでは告知しましたがブログがまだでした）。

f:id:sotetsuk:20180102223653p:plain

GoogleのAlphaGoによるプロ棋士打破は，人工知能がヒトを超えた学習を行った歴史的出来事として認識された。強化学習はここで重要な役割を果たしてているだけでなく，自動運転やロボット制御などの重要な分野への応用も知られ，いま世間の強い関心を集めている。その一方，日本語で強化学習を体系的に学べる教科書は多くはなく，代表的な教科書であるSutton and Barto (1998)とその訳書も出版から20年が経とうとしている。

　本書はトップ会議のチュートリアルで利用されたり，2010年の出版以降わずか数年で500弱の引用がされたりという事実からも窺えるように，入門書として広く読まれている良書である。本書の内容は動的計画法などの基本的かつ重要なアルゴリズムに始まり，比較的新しい手法も体系的に網羅しつつもコンパクトに自己完結している。原著の出版から7年あまり経つが，近年の発展は本書で掲載されたアルゴリズム・アイデアをその基礎においている。特に本書では，深層学習を利用した深層強化学習を含む最近の発展に，本書で紹介されたアルゴリズムがどのように使われているかを解説した訳者補遺を追加することで，本書と最先端の研究との橋渡しをしている。

どんな本？

この本は、Csaba Szepesvari著、"Algorithms for Reinforcement Learning"の訳書です。原著は、強化学習の教科書として最も有名なSutton and Barto (1998) の次に有名なテキストだと思います。対象読者は学部上級以上で、前提知識として微積・線形・確率統計に加え機械学習についても基本的な知識があるのが好ましいです。

非常に薄くコンパクトな本ですが、一番の特徴としては原著者自身が、

本書のゴールは読者に対してこの美しい分野（強化学習）を垣間見る機会を提供することである.

と言及している点から伺えるように、 強化学習の基礎理論について綺麗に体系的に説明している点 だと思います（原著は薄いですが、決してただ要点を掻い摘んだだけではありません）。また、20近くのアルゴリズムについて擬似コードが付いているので、理解の助けになります。さらに、深層強化学習に関する節も訳者補遺として追加しましたので、最近の話題についてもキャッチアップできる内容だと思います。

FAQ

ついでに、よく頂くコメント・疑問に簡単にお答えしておきます。

難しいんだけど...

確かに強化学習そのものの難易度を差し引いても少し難しめの本になります。挫折された方は他の資料で挑戦してみてから戻ってみても良いかもしれません。英語が問題なければ個人的にはD. Silverの講義ビデオと資料が理論・実例のバランスが良く、カバーしているトピックも豊富でオススメです。和書では今のところ"Sutton and Bartoの和訳"と"これからの強化学習"などがあります（MLPシリーズも発刊予定です）。ただ、難しめといっても、そうした記述は限定的なので、難しい部分は気にせず読み飛ばしていただければいいのではないかと個人的には思います。そうすれば、上記の資料とそんなに難易度は変わらないはずです。

なぜ邦題が「速習」になったの？

薄いので、ですね。訳者陣でいくつか案を上げて出版社の方の意見も勘案して決まりました。ちょっと難易度に関しては誤解を招きかねないタイトルだったかもしれません。繰り返しになりますが対象読者は学部上級以上ですので、決して難易度が易しいわけではありません。

SNS上等での言及

勝手にではありますが、いくつか掲載させていただきます。

強化学習について網羅的に扱いつつコンパクトにまとまった良書の翻訳本（PFNの前田さんも訳者参加）。疑似コードによる解説が充実しており、直感的に理解しながら読める。付録には最新の強化学習の紹介が充実している。https://t.co/3ygzbrI3zn
— Daisuke Okanohara (@hillbig) 2017年10月6日

「速習強化学習」献本頂きました。同じグループの訳者 @ikki407 から。強化学習の導入的な内容から TRPO/GAE/A3C/Dueling Network/AlphaGo 等の深層強化学習の最近進展話題まで、の速習。ぜひ。 https://t.co/LyAQugz4BX pic.twitter.com/0jIi8CR2S8
— Koichi Hamada (@hamadakoichi) 2017年9月21日

https://twitter.com/muripo_life/status/933161408199409665

今は「速習強化学習」があるからゼミもやりやすそう。薄いのに重要な基礎の部分から最近のやつまでコンパクトに分かりやすくまとまってる。
— じんべえざめ (@jinbeizame007) 2017年10月20日

速習強化学習、端的に言ってすごいよかった
— Lain Matsuoka/松岡玲音 (@lain_m21) 2017年11月10日

www.qachi.info

s0sem0y.hatenablog.com

新入生の中で強化学習をやりたいというコアな人に一応言うと，「速習強化学習」という本を，薄いから本当に速習できると思って始めの一冊として買うと死ねます
いい本ですが，そもそも原題が「Algorithms for Reinforcement Learning」という速習要素がないガチガチ理論の本なので…
— えるエル (@learn_learning3) 2019年3月10日

そこら辺も議論に上がってて敢えて、easy learning じゃなくて fast learningという意味でタイトルをつけた記憶がありますが、誤解を生む可能性があったのは大変申し訳ない。。。
機械学習に触れたことのある学部上級生向けの本です。https://t.co/WZHiaNWzwh https://t.co/8oqCcY5ok4
— 望月駿一@Ubie (@smochi_pub) 2019年3月10日

確かに翻訳着手の時期を考えると、深層強化学習の黎明期なので難しいところですね…
付録の深層強化学習は現在の基準で考えても、初学者含め誰でも参考にできる内容だと思います
初学者には難しいですが、まともなRL本がほぼなかった日本でこの本が翻訳されたのは本当に良いことだったと考えてます！
— えるエル (@learn_learning3) 2019年3月10日

f:id:sotetsuk:20190510163412p:plain — https://speakerdeck.com/learn_learning3/qiang-hua-xue-xi-niokeruhao-qi-xin?slide=144

sotetsuk's tech blog

sotetsuk's tech blog

速習強化学習を刊行しました

どんな本？

FAQ

難しいんだけど...

なぜ邦題が「速習」になったの？

SNS上等での言及