☆☆☆Web配信セミナー☆☆☆
S230928AW
☆☆☆本セミナーは、Zoomを使用して、行います。☆☆☆
開催日時:2023年11月21日(火)10:30-16:30
受 講 料:お1人様受講の場合 53,900円[税込]/1名
1口でお申込の場合 66,000円[税込]/1口(3名まで受講可能)
★本セミナーの受講にあたっての推奨環境は「Zoom」に依存しますので、ご自分の環境が対応しているか、
お申込み前にZoomのテストミーティング(http://zoom.us/test)にアクセスできることをご確認下さい。
★インターネット経由でのライブ中継ため、回線状態などにより、画像や音声が乱れる場合があります。
講義の中断、さらには、再接続後の再開もありますが、予めご了承ください。
★受講中の録音・撮影等は固くお断りいたします。
<略歴> | 2001年 東京大学 工学部 機械情報工学科 卒業 2006年 東京大学大学院 情報理工学系研究科 知能機械情報学専攻 博士課程修了 2006年〜2007年 東京大学大学院 情報理工学系研究科 助手 2007年〜2011年 東京大学大学院 情報理工学系研究科 助教 2011年〜2015年 東京大学大学院 情報理工学系研究科 講師 2015年 東京工業大学 情報理工学(系)研究科 准教授 2016年 東京工業大学 情報理工学院 准教授 現在に至る。 |
|
逆強化学習は統計を基盤とした機械学習と最適制御の学際領域を担う,近年発達著しい研究領域である.強化学習が「成功」と「失敗」の繰り返しの経験から,ロボットに最適な動作を自律獲得させる学習の仕組みであるのに対し,逆強化学習は,明文化が難しい熟練者の巧みなスキルを機械に自律獲得させる,見まねを通じた学習の枠組みになっている.熟練者のうまみ=「報酬」を,観察に基づき推定する枠組みとみなせるため,逆強化学習は,強化学習の逆問題に相当するものである.そのため逆強化学習は模倣学習と呼ばれるほか,逆最適制御とも呼ばれる.これは,強化学習の実応用で問題となる報酬関数の設計など,明文化が難しいスキルの「コツ」といったものをモデル化することに適した技術であり,人行動のモデル化とも関連した応用も多い.例えば状況に応じた運転経路・目的地予測,人と人とのインタラクション行動の予測,運転の好みに応じた追い越し運転予測といった応用などがある.
|