- 「逆強化学習法を用いた行動解析」 沖縄科学技術大学院大学 神経計算ユニット 教授 銅谷 賢治

「逆強化学習法を用いた行動解析」 沖縄科学技術大学院大学 神経計算ユニット 教授 銅谷 賢治

「沖縄科学技術大学院大学 新技術説明会」(2019年1月22日開催)にて発表。https://shingi.jst.go.jp/list/oist/2018_oist.html

【新技術の概要】
本技術は人や動物等の複雑な行動を理解するための手法で、観察された行動から行動者が何を報酬/コストとして意思決定し行動しているのかを効率良く推定する(報酬関数及...
「沖縄科学技術大学院大学 新技術説明会」(2019年1月22日開催)にて発表。https://shingi.jst.go.jp/list/oist/2018_oist.html

【新技術の概要】
本技術は人や動物等の複雑な行動を理解するための手法で、観察された行動から行動者が何を報酬/コストとして意思決定し行動しているのかを効率良く推定する(報酬関数及び価値関数を推定する)アルゴリズムである。この技術はWebサイト訪問者の好みの解析や、ロボットによる熟練技術の模倣学習への応用が想定される。

【従来技術・競合技術との比較】
本技術は、(1)密度比推定により制御付き及び制御無し状態遷移確率の比を学習すること、(2)正則化最小二乗法により遷移確率の比と互換性がある報酬/コスト関数及び価値関数を推定することで、他の逆強化学習方法よりも少ないデータ量、及び計算量で効率よく報酬関数と価値関数の推定が可能である。

【新技術の特徴】
・制御対象のダイナミクスを必要としない
・データ効率が良い
・計算効率が良い

【想定される用途】
・人間の行動の解釈
・ロボットの模倣学習

#情報

channel新技術説明会

※本サイトに掲載されているチャンネル情報や動画情報はYouTube公式のAPIを使って取得・表示しています。

Timetable

動画タイムテーブル

動画数:2147件