1口(1社3名まで受講可能)でのお申込は、

 受講料  が格安となります。





  
 入門 逆強化学習による報酬関数推定

  


 S190329K2

 

開催日時:2019年3月29日(金) 10:30-16:30

会  場:オームビル(東京都千代田区神田錦町3‐1)
受 講 料:1人様受講の場合 46,000円[税別]/1名

     1口でお申込の場合 57,000円[税別]/1口(3名まで受講可能)

 


画像認識セミナー日程表  新宣伝セミナー日程表

 

 講 師


 増山 岳人 氏

     名城大学 理工学部 電気電子工学科
     准教授 博士(工学)



< 講師紹介 >
主経歴
  2013年 中央大学理工学部精密機械工学科 助教
  2016年 名城大学理工学部電気電子工学科 准教授 現在に至る

専門・得意分野
  知能ロボティクス・強化学習

本テーマ関連の学会・協会・団体等
  ロボット学会、人工知能学会

セミナーポイント
   強化学習は,a) システムに対する要求が明確である一方,b) それを満足する
 システムの挙動の設計が困難な問題に対して有効なアプローチの1つです.ここで,
 a)のシステムに対する要求は,学習者の意思決定に対する評価である報酬関数に
 よって表現されます.しかし,報酬関数は学習の安定性や効率などにも影響を与え
 るため,その設計は煩雑になりがちです.また,そもそもシステムに対する要求を
 報酬関数として書き下すことが困難な問題も存在します.
   このような背景から,手動で報酬関数を設計する代わりに他者の振る舞いを観測し,
 その振る舞いを説明する報酬関数を推定する,逆強化学習と呼ばれるアプローチが
 考案されました.本セミナーでは,強化学習の原理と特徴を俯瞰した上で,逆強化
 学習の基本的な考え方を解説します.また,代表的な逆強化学習手法及び関連する
 研究事例についても紹介します.受講者がご自身で逆強化学習を実装し,試してい
 ただくためのサポートとなるよう,基礎的な内容に重きを置いたセミナーを目指します.


受講後、習得できること
  ・逆強化学習の基本的な原理
  ・代表的な逆強化学習手法の概要
  ・報酬関数推定を介した強化学習の有用性と課題





 講義項目

  1 はじめに

  2 強化学習
    2.1 概要
    2.2 問題設定
    2.3 ベルマン方程式
    2.4 離散系における強化学習
    2.5 連続系における強化学習

  3 逆強化学習
    3.1 概要
    3.2 強化学習と逆強化学習
    3.3 問題設定
    3.4 基本的な考え方
    3.5 線形モデル
    3.6 非線形モデル

  4 研究事例の紹介

  5 まとめ



 

 お1人様      受講申込要領 1口(1社3名まで) 受講申込要領  セミナー 総合日程 画像認識 セミナー日程 新宣伝 セミナー日程