本を探す

本のタイトル検索キーワードを入力してください。

スペースキーで開閉します。

書名・副題書名・副題

書名・副題のキーワードを入力してください。

ISBNコード、JANコード ISBNコード、JANコード

ISBNコード、JANコードを入力してください。

シリーズ名・レーベル名シリーズ名・レーベル名

シリーズ名・レーベル名を入力してください。

著者名著者名

著者名を入力してください。

出版社名出版社名

出版社名を入力してください。

発行(予定)年月

発行年数開始年

開始年を西暦で入力してください。

年開始月

開始月を入力してください。

月～終了年

終了年を西暦で入力してください。

年終了月

終了月を入力してください。

月

出版社を探す

これからの強化学習

編著：牧野　貴樹
編著：澁谷　長史
編著：白川　真一

紙版

出版社サイト。ためし読み電子版。

内容紹介

◆強化学習は「ポストビッグデータ」の技術である！
人工知能，金融工学，ロボット制御，言語処理，生産現場やサービスの最適化，あらゆる分野に応用が広がる強化学習．十分なデータが与えられることが前提とされる他の機械学習法と異なり，「足りないデータを集めながら最適化すること」に力点を置く強化学習は，ビッグデータの先を行くための重要な技術となることが期待されます．

◆強化学習の「いま」を知り，「これから」を切り拓くための1冊．
本書では，この分野を代表する執筆陣が集い，強化学習の基礎・発展・応用を多面的に解説します．
・基礎：強化学習の動作原理と基本アルゴリズムを，初学者でも分かるように導入．
・発展：より複雑な問題に対処し，高度な研究に進むための，さまざまな発展的手法を解説．
・応用：マルチロボットシステムの制御，対話処理，医療データ分析，囲碁の対局など広範な応用例・研究事例を通して，強化学習の活用法を紹介．人間の行動や脳の動作を説明するモデルとしての理論・実験も解説．

――強化学習の基礎を学びたい方，発展的手法に触れたい方，応用可能性を一望したい方に最適な1冊！

第1章　強化学習の基礎的理論
強化学習とは／強化学習の構成要素／価値関数に基づくアルゴリズム／改善に基づくアルゴリズム／部分観測マルコフ決定過程と強化学習

第2章　強化学習の発展的理論
統計学習の観点から見たTD学習／強化学習アルゴリズムの理論性能解析とベイズ統計による強化学習のモデル化／逆強化学習／試行錯誤回数の低減を指向した手法：経験強化型学習XoL／群強化学習法／リスク考慮型強化学習／複利型強化学習

第3章　強化学習の工学応用
高次元・実環境における強化学習／連続的な状態・行動空間への拡張：マルチロボットシステムへの適用／対話処理における強化学習／マルチエージェント系の報酬設計／自然言語処理における逆強化学習・模倣学習の適用／医療臨床データ分析への応用／深層学習を用いたQ関数の学習：Atariと囲碁への応用

第4章　知能のモデルとしての強化学習
脳の意思決定機構と強化学習／内発的動機付けによるエージェントの学習と発達