本文へスキップします。

【参】モーダルJS:読み込み
書籍DB:詳細


強化学習アルゴリズム入門
「平均」からはじめる基礎と応用

  • 著者曽我部 東馬
  • 定価3,300円 (本体3,000円+税)
  • 判型A5
  • 212頁
  • ISBN978-4-274-22371-6
  • 発売日2019/05/24
  • 発行元オーム社
  • 紙の書籍を買う
  • 電子書籍を買う

お問合せ

常備書店一覧

内容紹介

「平均」という観点から強化学習の基本が理解できる!

AlphaGoがプロ棋士を破った2016年以降、強化学習や深層強化学習はさまざまな分野から注目を集めています。しかし、専門書では難解な専門用語や数式が多用されるため、初学者にとってはハードルが高い状態が続いていました。
本書は、そのハードルの高さを解消することを目的に制作されました。平均という初歩的な数学を使うことで、「価値」「探索」「マルコフ性」といった強化学習の基本をわかりやすく解説します。
また、各アルゴリズムについては、「多腕バンディット問題」および「グリッドワールド問題」のいずれかを用いて、比較しやすい状態で解説します。そのため、各アルゴリズムの特徴や差異がわかりやすくなっています。さらに、中核的なアルゴリズムについては、PythonとMATLABの2種類のコードを、オーム社のWebサイトおよびGithubで配布します。配布コードを実行することで、「原理→数式→プログラム」という一連の流れを直感的に把握できます。

【本書の特徴】
・難解な強化学習の原理を、中高生にもなじみ深い「平均値の計算」という観点からわかりやすく解説します。
・さまざまなアルゴリズムを、共通する例題を用いて特徴がわかりやすいように比較します。
・PythonとMATLAB、2種類のコードを配布します。
※Pythonのバージョンは3です。

目次

ダウンロード

ここでは、本書で使用したサンプルコードとデータを圧縮ファイル(zip形式)で提供しています。9784274223716.zip(約530KB)をダウンロードし、解凍してご利用下さい。

  • 本ファイルは、本書をよくお読みの上ご利用ください。本ファイルに含まれるPythonおよびMATLABコードの著作権は、本書の著作者である曽我部東馬氏に帰属します。
  • 本ファイルを利用したことによる直接あるいは間接的な損害に関して、著作者およびオーム社はいっさいの責任を負いかねます。利用は利用者個人の責任において行ってください。また、ソフトウェアの動作・実行環境、操作についての質問には一切お答えすることはできません。

正誤表

正誤表はございません。

この商品をシェアする