最新刊
強化学習アルゴリズム入門 「平均」からはじめる基礎と応用
(2019/06/07)※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。 「平均」という観点から強化学習の基本が理解できる! AlphaGoがプロ棋士を破った2016年以降、強化学習や深層強化学習はさまざまな分野から注目を集めています。しかし、専門書では難解な専門用語や数式が多用されるため、初学者にとってはハードルが高い状態が続いていました。 本書は、そのハードルの高さを解消することを目的に制作されました。平均という初歩的な数学を使うことで、「価値」「探索」「マルコフ性」といった強化学習の基本をわかりやすく解説します。 また、各アルゴリズムについては、「多腕バンディット問題」および「グリッドワールド問題」のいずれかを用いて、比較しやすい状態で解説します。そのため、各アルゴリズムの特徴や差異がわかりやすくなっています。さらに、中核的なアルゴリズムについては、PythonとMATLABの2種類のコードを、オーム社と著者のWebサイト、およびGithubで配布します。配布コードを実行することで、「原理→数式→プログラム」という一連の流れを直感的に把握できます。 【本書の特徴】 ・難解な強化学習の原理を、中高生にもなじみ深い「平均値の計算」という観点からわかりやすく解説します。 ・さまざまなアルゴリズムを、共通する例題を用いて特徴がわかりやすいように比較します。 ・PythonとMATLAB、2種類のコードを配布します。 ※Pythonのバージョンは3です。 第1章 平均から学ぶ強化学習の基本概念 第2章 各アルゴリズムの特徴と応用 第3章 関数近似手法 第4章 深層強化学習の原理と手法
この著者の作品2
オーム社の作品12
ゲーム理論からの社会ネットワーク分析
完全図解 空調・給排水衛生設備の基礎知識早わかり
マンガでわかる溶接作業
家電製品協会 認定資格シリーズ 2024年版 スマートマスター資格 公式テキスト
2024年版 二級建築士試験合格セミナー 建築構造
これだけマスター 浄化槽設備士試験 (改訂3版)
LTspiceで動作を見ながらOPアンプ回路を理解する ー基本的な活用から実用に必須な理論までー
プログラミングElixir 第2版
実装 強化学習 Cによるロボットプログラミング
今日から使えるファインチューニングレシピ ーAI・機械学習の技術と実用をつなぐ基本テクニック ー
家電製品協会 認定資格シリーズ 2025-2026年版 家電製品エンジニア資格 AV情報家電 ー基礎と製品技術ー 公式テキスト
いちばんやさしい二種電工技能試験 (第3版)