atyou say the more in the fuure the reward is - more are we uncertain of it? i didn't get it-can you explain with an example ?(00:05:15 - 00:09:47)
Deep Q Learning for Video Games - The Math of Intelligence #9
Siraj Raval
※本サイトに掲載されているチャンネル情報や動画情報はYouTube公式のAPIを使って取得・表示しています。
Timetable
動画タイムテーブル
動画数:471件