RSS

「強化学習」 - おすすめピックアップ動画

※本サイトに掲載されているチャンネル情報や動画情報はYouTube公式のAPIを使って取得・表示しています。

Videos

動画一覧

動画数:155件

【強化学習】Q学習 - データを用いて最適方策を学習【強化学習の基礎アルゴリズム】RL vol. 14 #176 #VRアカデミア #ReinforcementLearning

【強化学習】Q学習 - データを用いて最適方策を学習【強化学習の基礎アルゴリズム】RL vol. 14 #176 #VRアカデミア #ReinforcementLearning

ついにあの「Q学習」がやってきた! データから最適方策を学習できる素敵アルゴリズムであり、この子はベルマン最適作用素のデータ近似で学習を進めます。 深層強化学習の革命児 DQN の元ネタでもあるQ学習を抑え、素敵な強化学習ライフを始めましょう! 【プレイリスト】 https://www.youtube.com/playlist?list=PLhDAH9aTfnxI1OywfnxXCDTWGtYL2NxJR 【目次】 To Be Appeared 【参考文献】 分析モデル入門 https://amzn.to/3Ng0nC7 私の本! この動画シリーズは、この第3部 強化学習 の内容を動画向けにアレンジ、大幅追加、大幅削除したものです。 合わせてみていただくと分かり易いかと! 強化学習(第2版) https://amzn.to/3K4QsR8 Sutton 先生の「強化学習」本の和訳です。分厚いですが、時間があり、基礎をしっかり学びたい人におすすめ! ちなみに、英語版は公式で pdf もダウンロードできます → http://incompleteideas.net/book/ 強化学習 (機械学習プロフェッショナルシリーズ) https://amzn.to/44R2XYr 理論家向けの方にはこちら! しっかりと数式が解説されており、基礎の理論をしっかりと学ぶことができます。 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 https://amzn.to/3XYDrOM 手を動かしながら学びたい人向け! サンプルコードとともに、基礎的な強化学習アルゴリズムを学べます! 将棋AIで学ぶディープラーニング https://www.amazon.co.jp/dp/B07B7JJ929 強化学習というと、将棋 AI を思い浮かべる人も少なくないはず! そういう人におすすめ! 将棋 AI 向けの強化学習は、他の参考文献にある方法とはかなり異なる方法で作られます。 将棋を目指す方は、ぜひこれを見てみてください! 更に強いのを作るならこれ → https://amzn.to/3pU1aDa 強化学習の基礎と深層強化学習 https://www.slideshare.net/ShotaImai3/rlssdeepreinforcementlearning 合間に広告が貼ることが極めて重い欠点ですが、内容は素晴らしく、全体感を見渡すことができます。 【宣伝:本も買ってね!】 データサイエンスに頻出の分析モデルを、全領域、深く、書きあげました! 本質を捉えたデータ分析のための分析モデル入門 https://amzn.to/3Ng0nC7 【宣伝2:クラファンやってるよ!】 活動継続のためのご支援をお願いしています。詳細はこちら! クラファン(月額)はこちら → https://community.camp-fire.jp/projects/view/709000 (クラファン始めた理由の動画 → https://www.youtube.com/watch?v=vXY34njwL4o ) 【終わりに】 ご視聴ありがとうございました! 面白かったら高評価、チャンネル登録お願いします。 動画の質問、感想などは、コメント欄や Twitter にどうぞ! お仕事、コラボのご依頼、インターンの応募は、公式 WebPage や Twitter の DM からお願い致します。 AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-official/top 動画生成:AIcia Solid (Twitter: https://twitter.com/AIcia_Solid/ ) 動画編集:AIbis Solid (妹) ======= Logo: ChikakoHorioさん ( https://twitter.com/ChikakoHorio ) Model Design by: ばんちょうさん( https://twitter.com/k_ban_ )ママ! 3D Model by: キツネツキさん( https://twitter.com/_kitsune_tsuki_ ) パパ!
2024年04月05日
00:00:00 - 00:34:10
【強化学習】強化学習は行動選択の科学である【広大な分野だけどコアはこれ!】RL vol. 1 #151 #VRアカデミア #ReinforcementLearning

【強化学習】強化学習は行動選択の科学である【広大な分野だけどコアはこれ!】RL vol. 1 #151 #VRアカデミア #ReinforcementLearning

強化学習についての解説シリーズを始めます! Q. 強化学習とは? → A. 行動選択の科学です。 非常に膨大な研究と実践が広がる強化学習ですが、一言で言うならこれだと思う! 【プレイリスト】 https://www.youtube.com/playlist?list=PLhDAH9aTfnxI1OywfnxXCDTWGtYL2NxJR 【目次】 To Be Appeared 【参考文献】 分析モデル入門 https://amzn.to/3Ng0nC7 私の本! この動画シリーズは、この第3部 強化学習 の内容を動画向けにアレンジ、大幅追加、大幅削除したものです。 合わせてみていただくと分かり易いかと! 強化学習(第2版) https://amzn.to/3K4QsR8 Sutton 先生の「強化学習」本の和訳です。分厚いですが、時間があり、基礎をしっかり学びたい人におすすめ! ちなみに、英語版は公式で pdf もダウンロードできます → http://incompleteideas.net/book/ 強化学習 (機械学習プロフェッショナルシリーズ) https://amzn.to/44R2XYr 理論家向けの方にはこちら! しっかりと数式が解説されており、基礎の理論をしっかりと学ぶことができます。 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 https://amzn.to/3XYDrOM 手を動かしながら学びたい人向け! サンプルコードとともに、基礎的な強化学習アルゴリズムを学べます! 将棋AIで学ぶディープラーニング https://www.amazon.co.jp/dp/B07B7JJ929 強化学習というと、将棋 AI を思い浮かべる人も少なくないはず! そういう人におすすめ! 将棋 AI 向けの強化学習は、他の参考文献にある方法とはかなり異なる方法で作られます。 将棋を目指す方は、ぜひこれを見てみてください! 更に強いのを作るならこれ → https://amzn.to/3pU1aDa 強化学習の基礎と深層強化学習 https://www.slideshare.net/ShotaImai3/rlssdeepreinforcementlearning 合間に広告が貼ることが極めて重い欠点ですが、内容は素晴らしく、全体感を見渡すことができます。 【宣伝:本も買ってね!】 データサイエンスに頻出の分析モデルを、全領域、深く、書きあげました! 本質を捉えたデータ分析のための分析モデル入門 https://amzn.to/3Ng0nC7 【終わりに】 ご視聴ありがとうございました! 面白かったら高評価、チャンネル登録お願いします。 動画の質問、感想などは、コメント欄や Twitter にどうぞ! お仕事、コラボのご依頼は、公式 WebPage や Twitter の DM からお願い致します。 AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-official/top 動画生成:AIcia Solid (Twitter: https://twitter.com/AIcia_Solid/ ) 動画編集:AIbis Solid (妹) ======= Logo: ChikakoHorioさん ( https://twitter.com/ChikakoHorio ) Model: http://3d.nicovideo.jp/works/td44519 Model by: W01fa さん ( https://twitter.com/W01fa )
2023年07月21日
00:00:00 - 00:09:40
【強化学習】TD法 - 期待と不安が交じるベルマン作用素のデータ近似【強化学習の基礎アルゴリズム】RL vol. 13 #174 #VRアカデミア #ReinforcementLearning

【強化学習】TD法 - 期待と不安が交じるベルマン作用素のデータ近似【強化学習の基礎アルゴリズム】RL vol. 13 #174 #VRアカデミア #ReinforcementLearning

TD 法は期待と不安が入り交じった気持ちのアルゴリズム! 多くの強化学習手法の基礎なので、バッチリ抑えておきましょう! 次回から、TD 法の発展として、Q 学習や SARSA などをお届け! 【プレイリスト】 https://www.youtube.com/playlist?list=PLhDAH9aTfnxI1OywfnxXCDTWGtYL2NxJR 【目次】 To Be Appeared 【参考文献】 分析モデル入門 https://amzn.to/3Ng0nC7 私の本! この動画シリーズは、この第3部 強化学習 の内容を動画向けにアレンジ、大幅追加、大幅削除したものです。 合わせてみていただくと分かり易いかと! 強化学習(第2版) https://amzn.to/3K4QsR8 Sutton 先生の「強化学習」本の和訳です。分厚いですが、時間があり、基礎をしっかり学びたい人におすすめ! ちなみに、英語版は公式で pdf もダウンロードできます → http://incompleteideas.net/book/ 強化学習 (機械学習プロフェッショナルシリーズ) https://amzn.to/44R2XYr 理論家向けの方にはこちら! しっかりと数式が解説されており、基礎の理論をしっかりと学ぶことができます。 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 https://amzn.to/3XYDrOM 手を動かしながら学びたい人向け! サンプルコードとともに、基礎的な強化学習アルゴリズムを学べます! 将棋AIで学ぶディープラーニング https://www.amazon.co.jp/dp/B07B7JJ929 強化学習というと、将棋 AI を思い浮かべる人も少なくないはず! そういう人におすすめ! 将棋 AI 向けの強化学習は、他の参考文献にある方法とはかなり異なる方法で作られます。 将棋を目指す方は、ぜひこれを見てみてください! 更に強いのを作るならこれ → https://amzn.to/3pU1aDa 強化学習の基礎と深層強化学習 https://www.slideshare.net/ShotaImai3/rlssdeepreinforcementlearning 合間に広告が貼ることが極めて重い欠点ですが、内容は素晴らしく、全体感を見渡すことができます。 【宣伝:本も買ってね!】 データサイエンスに頻出の分析モデルを、全領域、深く、書きあげました! 本質を捉えたデータ分析のための分析モデル入門 https://amzn.to/3Ng0nC7 【宣伝2:クラファンやってるよ!】 活動継続のためのご支援をお願いしています。詳細はこちら! クラファン(月額)はこちら → https://community.camp-fire.jp/projects/view/709000 (クラファン始めた理由の動画 → https://www.youtube.com/watch?v=vXY34njwL4o ) 【終わりに】 ご視聴ありがとうございました! 面白かったら高評価、チャンネル登録お願いします。 動画の質問、感想などは、コメント欄や Twitter にどうぞ! お仕事、コラボのご依頼、インターンの応募は、公式 WebPage や Twitter の DM からお願い致します。 AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-official/top 動画生成:AIcia Solid (Twitter: https://twitter.com/AIcia_Solid/ ) 動画編集:AIbis Solid (妹) ======= Logo: ChikakoHorioさん ( https://twitter.com/ChikakoHorio ) Model Design by: ばんちょうさん( https://twitter.com/k_ban_ )ママ! 3D Model by: キツネツキさん( https://twitter.com/_kitsune_tsuki_ ) パパ!
2024年03月22日
00:00:00 - 00:37:39
【強化学習】収益 - 「期待」「割引」収益ってなんだ!?【こいつを最大化します】RL vol. 6 #159 #VRアカデミア #ReinforcementLearning

【強化学習】収益 - 「期待」「割引」収益ってなんだ!?【こいつを最大化します】RL vol. 6 #159 #VRアカデミア #ReinforcementLearning

強化学習では生の収益ではなく期待割引収益を最大化することが多いです。 「割引」は特に深くて、単なる数学的都合ではなく、実務上・最適化上も大切な意味を持っています。 収益の定義の謎を一気に解明していきましょう! 【プレイリスト】 https://www.youtube.com/playlist?list=PLhDAH9aTfnxI1OywfnxXCDTWGtYL2NxJR 【目次】 To Be Appeared 【参考文献】 分析モデル入門 https://amzn.to/3Ng0nC7 私の本! この動画シリーズは、この第3部 強化学習 の内容を動画向けにアレンジ、大幅追加、大幅削除したものです。 合わせてみていただくと分かり易いかと! 強化学習(第2版) https://amzn.to/3K4QsR8 Sutton 先生の「強化学習」本の和訳です。分厚いですが、時間があり、基礎をしっかり学びたい人におすすめ! ちなみに、英語版は公式で pdf もダウンロードできます → http://incompleteideas.net/book/ 強化学習 (機械学習プロフェッショナルシリーズ) https://amzn.to/44R2XYr 理論家向けの方にはこちら! しっかりと数式が解説されており、基礎の理論をしっかりと学ぶことができます。 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 https://amzn.to/3XYDrOM 手を動かしながら学びたい人向け! サンプルコードとともに、基礎的な強化学習アルゴリズムを学べます! 将棋AIで学ぶディープラーニング https://www.amazon.co.jp/dp/B07B7JJ929 強化学習というと、将棋 AI を思い浮かべる人も少なくないはず! そういう人におすすめ! 将棋 AI 向けの強化学習は、他の参考文献にある方法とはかなり異なる方法で作られます。 将棋を目指す方は、ぜひこれを見てみてください! 更に強いのを作るならこれ → https://amzn.to/3pU1aDa 強化学習の基礎と深層強化学習 https://www.slideshare.net/ShotaImai3/rlssdeepreinforcementlearning 合間に広告が貼ることが極めて重い欠点ですが、内容は素晴らしく、全体感を見渡すことができます。 【宣伝:本も買ってね!】 データサイエンスに頻出の分析モデルを、全領域、深く、書きあげました! 本質を捉えたデータ分析のための分析モデル入門 https://amzn.to/3Ng0nC7 【終わりに】 ご視聴ありがとうございました! 面白かったら高評価、チャンネル登録お願いします。 動画の質問、感想などは、コメント欄や Twitter にどうぞ! お仕事、コラボのご依頼は、公式 WebPage や Twitter の DM からお願い致します。 AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-official/top 動画生成:AIcia Solid (Twitter: https://twitter.com/AIcia_Solid/ ) 動画編集:AIbis Solid (妹) ======= Logo: ChikakoHorioさん ( https://twitter.com/ChikakoHorio ) Model: http://3d.nicovideo.jp/works/td44519 Model by: W01fa さん ( https://twitter.com/W01fa )
2023年10月13日
00:00:00 - 00:34:40
【強化学習】方策反復法 - 方策評価と方策更新の繰り返しで最適方策を見つけよう!【GPIの元ネタ】RL vol. 11 #170 #VRアカデミア #ReinforcementLearning

【強化学習】方策反復法 - 方策評価と方策更新の繰り返しで最適方策を見つけよう!【GPIの元ネタ】RL vol. 11 #170 #VRアカデミア #ReinforcementLearning

方策反復法は、かなり多くの強化学習アルゴリズムの元ネタになっている手法で、これを深く理解すれば、深層強化学習の複雑なアルゴリズムもかなり理解で切るようになります! みんなもレッツ Policy Iteration! 【プレイリスト】 https://www.youtube.com/playlist?list=PLhDAH9aTfnxI1OywfnxXCDTWGtYL2NxJR 【目次】 00:00 オープニング 00:50 方策反復法 05:23 方策評価 10:55 連立1次方程式? 14:56 解の存在について 16:05 計算方法について 17:19 ベルマン作用素 23:35 方策更新 28:06 まとめ 33:30 エンディング 34:20 エンディングトーク 【参考文献】 分析モデル入門 https://amzn.to/3Ng0nC7 私の本! この動画シリーズは、この第3部 強化学習 の内容を動画向けにアレンジ、大幅追加、大幅削除したものです。 合わせてみていただくと分かり易いかと! 強化学習(第2版) https://amzn.to/3K4QsR8 Sutton 先生の「強化学習」本の和訳です。分厚いですが、時間があり、基礎をしっかり学びたい人におすすめ! ちなみに、英語版は公式で pdf もダウンロードできます → http://incompleteideas.net/book/ 強化学習 (機械学習プロフェッショナルシリーズ) https://amzn.to/44R2XYr 理論家向けの方にはこちら! しっかりと数式が解説されており、基礎の理論をしっかりと学ぶことができます。 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 https://amzn.to/3XYDrOM 手を動かしながら学びたい人向け! サンプルコードとともに、基礎的な強化学習アルゴリズムを学べます! 将棋AIで学ぶディープラーニング https://www.amazon.co.jp/dp/B07B7JJ929 強化学習というと、将棋 AI を思い浮かべる人も少なくないはず! そういう人におすすめ! 将棋 AI 向けの強化学習は、他の参考文献にある方法とはかなり異なる方法で作られます。 将棋を目指す方は、ぜひこれを見てみてください! 更に強いのを作るならこれ → https://amzn.to/3pU1aDa 強化学習の基礎と深層強化学習 https://www.slideshare.net/ShotaImai3/rlssdeepreinforcementlearning 合間に広告が貼ることが極めて重い欠点ですが、内容は素晴らしく、全体感を見渡すことができます。 【宣伝:本も買ってね!】 データサイエンスに頻出の分析モデルを、全領域、深く、書きあげました! 本質を捉えたデータ分析のための分析モデル入門 https://amzn.to/3Ng0nC7 【宣伝2:クラファンやってるよ!】 活動継続のためのご支援をお願いしています。詳細はこちら! クラファン(月額)はこちら → https://community.camp-fire.jp/projects/view/709000 (クラファン始めた理由の動画 → https://www.youtube.com/watch?v=vXY34njwL4o ) 【終わりに】 ご視聴ありがとうございました! 面白かったら高評価、チャンネル登録お願いします。 動画の質問、感想などは、コメント欄や Twitter にどうぞ! お仕事、コラボのご依頼、インターンの応募は、公式 WebPage や Twitter の DM からお願い致します。 AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-official/top 動画生成:AIcia Solid (Twitter: https://twitter.com/AIcia_Solid/ ) 動画編集:AIbis Solid (妹) ======= Logo: ChikakoHorioさん ( https://twitter.com/ChikakoHorio ) Model Design by: ばんちょうさん( https://twitter.com/k_ban_ )ママ! 3D Model by: キツネツキさん( https://twitter.com/_kitsune_tsuki_ ) パパ!
2024年01月26日
00:00:00 - 00:34:57
15分で分かる!機械学習とは何か【AI・データサイエンス入門】

15分で分かる!機械学習とは何か【AI・データサイエンス入門】

AI(人工知能)やデータサイエンスにほぼ必要不可欠な「機械学習(マシンラーニング)」ですが、一体どういう技術なのでしょうか? また「教師あり学習」「教師なし学習」「強化学習」の概要についてもご紹介しました。 初学者の方の、勉強の取っ掛かりになれば幸いです。 #データサイエンス #機械学習
2021年01月09日
00:00:00 - 00:16:04
【強化学習】価値反復法 - いきなり最適方策を推定!【GPIの元ネタ】RL vol. 12 #172 #VRアカデミア #ReinforcementLearning

【強化学習】価値反復法 - いきなり最適方策を推定!【GPIの元ネタ】RL vol. 12 #172 #VRアカデミア #ReinforcementLearning

価値反復法では、ベルマン最適作用素を用いることで、いきなり最適方策を手に入れることができます。マルコフ決定過程を知る必要があり、状態数が多いと使えないですが、これも基礎で大事なアルゴリズムです! 【プレイリスト】 https://www.youtube.com/playlist?list=PLhDAH9aTfnxI1OywfnxXCDTWGtYL2NxJR 【目次】 00:00 オープニング 00:42 価値反復法とは 03:25 今の状況のおさらい 04:47 復習 07:31 ベルマン最適作用素 12:48 最適方策を計算 15:18 まとめ 17:37 エンディング 【参考文献】 分析モデル入門 https://amzn.to/3Ng0nC7 私の本! この動画シリーズは、この第3部 強化学習 の内容を動画向けにアレンジ、大幅追加、大幅削除したものです。 合わせてみていただくと分かり易いかと! 強化学習(第2版) https://amzn.to/3K4QsR8 Sutton 先生の「強化学習」本の和訳です。分厚いですが、時間があり、基礎をしっかり学びたい人におすすめ! ちなみに、英語版は公式で pdf もダウンロードできます → http://incompleteideas.net/book/ 強化学習 (機械学習プロフェッショナルシリーズ) https://amzn.to/44R2XYr 理論家向けの方にはこちら! しっかりと数式が解説されており、基礎の理論をしっかりと学ぶことができます。 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 https://amzn.to/3XYDrOM 手を動かしながら学びたい人向け! サンプルコードとともに、基礎的な強化学習アルゴリズムを学べます! 将棋AIで学ぶディープラーニング https://www.amazon.co.jp/dp/B07B7JJ929 強化学習というと、将棋 AI を思い浮かべる人も少なくないはず! そういう人におすすめ! 将棋 AI 向けの強化学習は、他の参考文献にある方法とはかなり異なる方法で作られます。 将棋を目指す方は、ぜひこれを見てみてください! 更に強いのを作るならこれ → https://amzn.to/3pU1aDa 強化学習の基礎と深層強化学習 https://www.slideshare.net/ShotaImai3/rlssdeepreinforcementlearning 合間に広告が貼ることが極めて重い欠点ですが、内容は素晴らしく、全体感を見渡すことができます。 【宣伝:本も買ってね!】 データサイエンスに頻出の分析モデルを、全領域、深く、書きあげました! 本質を捉えたデータ分析のための分析モデル入門 https://amzn.to/3Ng0nC7 【宣伝2:クラファンやってるよ!】 活動継続のためのご支援をお願いしています。詳細はこちら! クラファン(月額)はこちら → https://community.camp-fire.jp/projects/view/709000 (クラファン始めた理由の動画 → https://www.youtube.com/watch?v=vXY34njwL4o ) 【終わりに】 ご視聴ありがとうございました! 面白かったら高評価、チャンネル登録お願いします。 動画の質問、感想などは、コメント欄や Twitter にどうぞ! お仕事、コラボのご依頼、インターンの応募は、公式 WebPage や Twitter の DM からお願い致します。 AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-official/top 動画生成:AIcia Solid (Twitter: https://twitter.com/AIcia_Solid/ ) 動画編集:AIbis Solid (妹) ======= Logo: ChikakoHorioさん ( https://twitter.com/ChikakoHorio ) Model Design by: ばんちょうさん( https://twitter.com/k_ban_ )ママ! 3D Model by: キツネツキさん( https://twitter.com/_kitsune_tsuki_ ) パパ!
2024年02月25日
00:00:00 - 00:18:58
【強化学習】全体像を見据えておこう【2つのループが特徴】RL vol. 3 #153 #VRアカデミア #ReinforcementLearning

【強化学習】全体像を見据えておこう【2つのループが特徴】RL vol. 3 #153 #VRアカデミア #ReinforcementLearning

強化学習は全体像の把握が大変! それをまず最初に紹介します。 2つのループを意識しながら色々勉強していきましょう! 【プレイリスト】 https://www.youtube.com/playlist?list=PLhDAH9aTfnxI1OywfnxXCDTWGtYL2NxJR 【目次】 To Be Appeared 【参考文献】 分析モデル入門 https://amzn.to/3Ng0nC7 私の本! この動画シリーズは、この第3部 強化学習 の内容を動画向けにアレンジ、大幅追加、大幅削除したものです。 合わせてみていただくと分かり易いかと! 強化学習(第2版) https://amzn.to/3K4QsR8 Sutton 先生の「強化学習」本の和訳です。分厚いですが、時間があり、基礎をしっかり学びたい人におすすめ! ちなみに、英語版は公式で pdf もダウンロードできます → http://incompleteideas.net/book/ 強化学習 (機械学習プロフェッショナルシリーズ) https://amzn.to/44R2XYr 理論家向けの方にはこちら! しっかりと数式が解説されており、基礎の理論をしっかりと学ぶことができます。 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 https://amzn.to/3XYDrOM 手を動かしながら学びたい人向け! サンプルコードとともに、基礎的な強化学習アルゴリズムを学べます! 将棋AIで学ぶディープラーニング https://www.amazon.co.jp/dp/B07B7JJ929 強化学習というと、将棋 AI を思い浮かべる人も少なくないはず! そういう人におすすめ! 将棋 AI 向けの強化学習は、他の参考文献にある方法とはかなり異なる方法で作られます。 将棋を目指す方は、ぜひこれを見てみてください! 更に強いのを作るならこれ → https://amzn.to/3pU1aDa 強化学習の基礎と深層強化学習 https://www.slideshare.net/ShotaImai3/rlssdeepreinforcementlearning 合間に広告が貼ることが極めて重い欠点ですが、内容は素晴らしく、全体感を見渡すことができます。 【宣伝:本も買ってね!】 データサイエンスに頻出の分析モデルを、全領域、深く、書きあげました! 本質を捉えたデータ分析のための分析モデル入門 https://amzn.to/3Ng0nC7 【終わりに】 ご視聴ありがとうございました! 面白かったら高評価、チャンネル登録お願いします。 動画の質問、感想などは、コメント欄や Twitter にどうぞ! お仕事、コラボのご依頼は、公式 WebPage や Twitter の DM からお願い致します。 AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-official/top 動画生成:AIcia Solid (Twitter: https://twitter.com/AIcia_Solid/ ) 動画編集:AIbis Solid (妹) ======= Logo: ChikakoHorioさん ( https://twitter.com/ChikakoHorio ) Model: http://3d.nicovideo.jp/works/td44519 Model by: W01fa さん ( https://twitter.com/W01fa )
2023年08月04日
00:00:00 - 00:12:45
【強化学習】教師あり学習とは何が同じで何が違う?【実は共通点も多い!】RL vol. 2 #152 #VRアカデミア #ReinforcementLearning

【強化学習】教師あり学習とは何が同じで何が違う?【実は共通点も多い!】RL vol. 2 #152 #VRアカデミア #ReinforcementLearning

意外にも!強化学習には教師あり学習との共通点が結構あります。 同じところは同じと認識するのがまずは大事! ついでに、強化学習の難しさの根源 = 素晴らしさも紹介! 【プレイリスト】 https://www.youtube.com/playlist?list=PLhDAH9aTfnxI1OywfnxXCDTWGtYL2NxJR 【目次】 To Be Appeared 【参考文献】 分析モデル入門 https://amzn.to/3Ng0nC7 私の本! この動画シリーズは、この第3部 強化学習 の内容を動画向けにアレンジ、大幅追加、大幅削除したものです。 合わせてみていただくと分かり易いかと! 強化学習(第2版) https://amzn.to/3K4QsR8 Sutton 先生の「強化学習」本の和訳です。分厚いですが、時間があり、基礎をしっかり学びたい人におすすめ! ちなみに、英語版は公式で pdf もダウンロードできます → http://incompleteideas.net/book/ 強化学習 (機械学習プロフェッショナルシリーズ) https://amzn.to/44R2XYr 理論家向けの方にはこちら! しっかりと数式が解説されており、基礎の理論をしっかりと学ぶことができます。 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 https://amzn.to/3XYDrOM 手を動かしながら学びたい人向け! サンプルコードとともに、基礎的な強化学習アルゴリズムを学べます! 将棋AIで学ぶディープラーニング https://www.amazon.co.jp/dp/B07B7JJ929 強化学習というと、将棋 AI を思い浮かべる人も少なくないはず! そういう人におすすめ! 将棋 AI 向けの強化学習は、他の参考文献にある方法とはかなり異なる方法で作られます。 将棋を目指す方は、ぜひこれを見てみてください! 更に強いのを作るならこれ → https://amzn.to/3pU1aDa 強化学習の基礎と深層強化学習 https://www.slideshare.net/ShotaImai3/rlssdeepreinforcementlearning 合間に広告が貼ることが極めて重い欠点ですが、内容は素晴らしく、全体感を見渡すことができます。 【宣伝:本も買ってね!】 データサイエンスに頻出の分析モデルを、全領域、深く、書きあげました! 本質を捉えたデータ分析のための分析モデル入門 https://amzn.to/3Ng0nC7 【終わりに】 ご視聴ありがとうございました! 面白かったら高評価、チャンネル登録お願いします。 動画の質問、感想などは、コメント欄や Twitter にどうぞ! お仕事、コラボのご依頼は、公式 WebPage や Twitter の DM からお願い致します。 AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-official/top 動画生成:AIcia Solid (Twitter: https://twitter.com/AIcia_Solid/ ) 動画編集:AIbis Solid (妹) ======= Logo: ChikakoHorioさん ( https://twitter.com/ChikakoHorio ) Model: http://3d.nicovideo.jp/works/td44519 Model by: W01fa さん ( https://twitter.com/W01fa )
2023年07月28日
00:00:00 - 00:09:55
90分で覚える!Pythonによる機械学習の基本〜教師なし学習編〜【Pythonデータサイエンス超入門】

90分で覚える!Pythonによる機械学習の基本〜教師なし学習編〜【Pythonデータサイエンス超入門】

機械学習をPythonで実装できるようになりましょう! 質問・リクエスト等のお気軽なコメントや、Super Thanksによる応援を頂けますと大変励みになります! 【ソースコードのコピペ用ページ】 https://analysis-navi.com/?p=4118 0:00 イントロダクション 2:17 機械学習とは? 12:40 次元削減 18:02 ├ Pythonによる次元削減の実行 24:08 ├ 寄与率の計算 26:06 ├ 結果の図示 28:10 ├ 結果の解釈 33:14 └ PCA以外の手法 42:24 クラスタリング 45:43 ├ Pythonによるクラスタリングの実行 46:06 ├ 階層クラスタリング 50:06 ├ 非階層クラスタリング(K-means) 54:43 ├ 結果の図示 58:05 ├ クラスタ数の推測(エルボー法) 1:01:39 └ X-means 1:09:36 アソシエーション分析(バスケット分析) 1:13:47 ├ Pythonによるアソシエーション分析の実行 1:19:46 └ ネットワーク図の作成 1:24:39 クロージング 【キーワード】 教師あり学習 強化学習 PCA(主成分分析) SVD(特異値分解) t-SNE UMAP 単結合法(最短距離法) 完全結合法(最長距離法) 郡平均法 ウォード法 Support(支持度) Confidence(信頼度) Lift(リフト値) #Python #データサイエンス #データサイエンス
2022年12月03日
00:00:00 - 01:26:29
【強化学習】マルコフ決定過程 - 強化学習の問題設定を決めてくれるやつ【5つのうち大事なのは2つ!】RL vol. 4 #155 #VRアカデミア #ReinforcementLearning

【強化学習】マルコフ決定過程 - 強化学習の問題設定を決めてくれるやつ【5つのうち大事なのは2つ!】RL vol. 4 #155 #VRアカデミア #ReinforcementLearning

マルコフ決定過程 (MDP) が強化学習の問題設定を与えてくれます。 なんか定義見るとやばい集合2連打から始まりますが、大事なのはそれ以外の3つ(のうち特に2つだけ) ポイントを抑えて MDP と仲良くなりましょう! ※強化学習は広い分野です。これ以外の定式化もたくさんあります。別のものに出会ったら、それを学んでみてください! 【プレイリスト】 https://www.youtube.com/playlist?list=PLhDAH9aTfnxI1OywfnxXCDTWGtYL2NxJR 【目次】 To Be Appeared 【参考文献】 分析モデル入門 https://amzn.to/3Ng0nC7 私の本! この動画シリーズは、この第3部 強化学習 の内容を動画向けにアレンジ、大幅追加、大幅削除したものです。 合わせてみていただくと分かり易いかと! 強化学習(第2版) https://amzn.to/3K4QsR8 Sutton 先生の「強化学習」本の和訳です。分厚いですが、時間があり、基礎をしっかり学びたい人におすすめ! ちなみに、英語版は公式で pdf もダウンロードできます → http://incompleteideas.net/book/ 強化学習 (機械学習プロフェッショナルシリーズ) https://amzn.to/44R2XYr 理論家向けの方にはこちら! しっかりと数式が解説されており、基礎の理論をしっかりと学ぶことができます。 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 https://amzn.to/3XYDrOM 手を動かしながら学びたい人向け! サンプルコードとともに、基礎的な強化学習アルゴリズムを学べます! 将棋AIで学ぶディープラーニング https://www.amazon.co.jp/dp/B07B7JJ929 強化学習というと、将棋 AI を思い浮かべる人も少なくないはず! そういう人におすすめ! 将棋 AI 向けの強化学習は、他の参考文献にある方法とはかなり異なる方法で作られます。 将棋を目指す方は、ぜひこれを見てみてください! 更に強いのを作るならこれ → https://amzn.to/3pU1aDa 強化学習の基礎と深層強化学習 https://www.slideshare.net/ShotaImai3/rlssdeepreinforcementlearning 合間に広告が貼ることが極めて重い欠点ですが、内容は素晴らしく、全体感を見渡すことができます。 【宣伝:本も買ってね!】 データサイエンスに頻出の分析モデルを、全領域、深く、書きあげました! 本質を捉えたデータ分析のための分析モデル入門 https://amzn.to/3Ng0nC7 【終わりに】 ご視聴ありがとうございました! 面白かったら高評価、チャンネル登録お願いします。 動画の質問、感想などは、コメント欄や Twitter にどうぞ! お仕事、コラボのご依頼は、公式 WebPage や Twitter の DM からお願い致します。 AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-official/top 動画生成:AIcia Solid (Twitter: https://twitter.com/AIcia_Solid/ ) 動画編集:AIbis Solid (妹) ======= Logo: ChikakoHorioさん ( https://twitter.com/ChikakoHorio ) Model: http://3d.nicovideo.jp/works/td44519 Model by: W01fa さん ( https://twitter.com/W01fa )
2023年09月01日
00:00:00 - 00:19:05
【強化学習】方策 - 行動選択の担い手【こいつを学習します】RL vol. 5 #157 #VRアカデミア #ReinforcementLearning

【強化学習】方策 - 行動選択の担い手【こいつを学習します】RL vol. 5 #157 #VRアカデミア #ReinforcementLearning

方策が行動選択を担います。その方策を紹介! 強化学習といえば、この方策がいい感じになる(= 収益の最大化)ように学習することだと言えます。 【プレイリスト】 https://www.youtube.com/playlist?list=PLhDAH9aTfnxI1OywfnxXCDTWGtYL2NxJR 【目次】 To Be Appeared 【参考文献】 分析モデル入門 https://amzn.to/3Ng0nC7 私の本! この動画シリーズは、この第3部 強化学習 の内容を動画向けにアレンジ、大幅追加、大幅削除したものです。 合わせてみていただくと分かり易いかと! 強化学習(第2版) https://amzn.to/3K4QsR8 Sutton 先生の「強化学習」本の和訳です。分厚いですが、時間があり、基礎をしっかり学びたい人におすすめ! ちなみに、英語版は公式で pdf もダウンロードできます → http://incompleteideas.net/book/ 強化学習 (機械学習プロフェッショナルシリーズ) https://amzn.to/44R2XYr 理論家向けの方にはこちら! しっかりと数式が解説されており、基礎の理論をしっかりと学ぶことができます。 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 https://amzn.to/3XYDrOM 手を動かしながら学びたい人向け! サンプルコードとともに、基礎的な強化学習アルゴリズムを学べます! 将棋AIで学ぶディープラーニング https://www.amazon.co.jp/dp/B07B7JJ929 強化学習というと、将棋 AI を思い浮かべる人も少なくないはず! そういう人におすすめ! 将棋 AI 向けの強化学習は、他の参考文献にある方法とはかなり異なる方法で作られます。 将棋を目指す方は、ぜひこれを見てみてください! 更に強いのを作るならこれ → https://amzn.to/3pU1aDa 強化学習の基礎と深層強化学習 https://www.slideshare.net/ShotaImai3/rlssdeepreinforcementlearning 合間に広告が貼ることが極めて重い欠点ですが、内容は素晴らしく、全体感を見渡すことができます。 【宣伝:本も買ってね!】 データサイエンスに頻出の分析モデルを、全領域、深く、書きあげました! 本質を捉えたデータ分析のための分析モデル入門 https://amzn.to/3Ng0nC7 【終わりに】 ご視聴ありがとうございました! 面白かったら高評価、チャンネル登録お願いします。 動画の質問、感想などは、コメント欄や Twitter にどうぞ! お仕事、コラボのご依頼は、公式 WebPage や Twitter の DM からお願い致します。 AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-official/top 動画生成:AIcia Solid (Twitter: https://twitter.com/AIcia_Solid/ ) 動画編集:AIbis Solid (妹) ======= Logo: ChikakoHorioさん ( https://twitter.com/ChikakoHorio ) Model: http://3d.nicovideo.jp/works/td44519 Model by: W01fa さん ( https://twitter.com/W01fa )
2023年09月22日
00:00:00 - 00:11:02
【強化学習】ベルマン期待方程式 - 2手先を読んで価値を算出【強化学習の基礎方程式】RL vol. 9 #166 #VRアカデミア #ReinforcementLearning

【強化学習】ベルマン期待方程式 - 2手先を読んで価値を算出【強化学習の基礎方程式】RL vol. 9 #166 #VRアカデミア #ReinforcementLearning

難解なベルマン方程式も「2手先を読む」という観点で見ればスッキリ!VからQ、QからVの1手先の方程式と合わせてどうぞ! このベルマン期待方程式は、学習でめちゃ使うので、ここで押さえておきましょう! 1:25の行動価値関数のベルマン方程式から割引率γが抜けていました。正しいものは36:17頃のまとめにあります。 26:55の状態価値関数のベルマン方程式、36:20の行動価値関数の1手先の未来の式から、p(r | s, a) のあとの r が抜けていました。 動画内の誤り一覧 http://bit.ly/error_asp 【プレイリスト】 https://www.youtube.com/playlist?list=PLhDAH9aTfnxI1OywfnxXCDTWGtYL2NxJR 【目次】 0:00 イントロ 1:04 ベルマン期待方程式とは 2:57 記号の復習 9:57 ベルマン方程式の正体に迫る 11:32 ステップ1:状態の次は行動 15:27 ステップ2:行動の次は報酬と次の状態 20:27 γが入る理由 26:07 ステップ3:いざベルマン方程式! 30:40 数学的証明 36:17 まとめ 38:54 エンディングトーク 【紹介した過去動画】 TBA 【参考文献】 分析モデル入門 https://amzn.to/3Ng0nC7 私の本! この動画シリーズは、この第3部 強化学習 の内容を動画向けにアレンジ、大幅追加、大幅削除したものです。 合わせてみていただくと分かり易いかと! 強化学習(第2版) https://amzn.to/3K4QsR8 Sutton 先生の「強化学習」本の和訳です。分厚いですが、時間があり、基礎をしっかり学びたい人におすすめ! ちなみに、英語版は公式で pdf もダウンロードできます → http://incompleteideas.net/book/ 強化学習 (機械学習プロフェッショナルシリーズ) https://amzn.to/44R2XYr 理論家向けの方にはこちら! しっかりと数式が解説されており、基礎の理論をしっかりと学ぶことができます。 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 https://amzn.to/3XYDrOM 手を動かしながら学びたい人向け! サンプルコードとともに、基礎的な強化学習アルゴリズムを学べます! 将棋AIで学ぶディープラーニング https://www.amazon.co.jp/dp/B07B7JJ929 強化学習というと、将棋 AI を思い浮かべる人も少なくないはず! そういう人におすすめ! 将棋 AI 向けの強化学習は、他の参考文献にある方法とはかなり異なる方法で作られます。 将棋を目指す方は、ぜひこれを見てみてください! 更に強いのを作るならこれ → https://amzn.to/3pU1aDa 強化学習の基礎と深層強化学習 https://www.slideshare.net/ShotaImai3/rlssdeepreinforcementlearning 合間に広告が貼ることが極めて重い欠点ですが、内容は素晴らしく、全体感を見渡すことができます。 【宣伝:本も買ってね!】 データサイエンスに頻出の分析モデルを、全領域、深く、書きあげました! 本質を捉えたデータ分析のための分析モデル入門 https://amzn.to/3Ng0nC7 【終わりに】 ご視聴ありがとうございました! 面白かったら高評価、チャンネル登録お願いします。 動画の質問、感想などは、コメント欄や Twitter にどうぞ! お仕事、コラボのご依頼は、公式 WebPage や Twitter の DM からお願い致します。 AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-official/top 動画生成:AIcia Solid (Twitter: https://twitter.com/AIcia_Solid/ ) 動画編集:AIbis Solid (妹) ======= Logo: ChikakoHorioさん ( https://twitter.com/ChikakoHorio ) Model: http://3d.nicovideo.jp/works/td44519 Model by: W01fa さん ( https://twitter.com/W01fa )
2023年12月22日
00:00:00 - 00:40:04
【分析モデル入門】本を出します!【是非買ってね!】 #137 #VRアカデミア #分析モデル入門

【分析モデル入門】本を出します!【是非買ってね!】 #137 #VRアカデミア #分析モデル入門

データサイエンスに必須の分析モデルを、ほぼ全部解説した本をだします! 使い方のサクッと解説に加え、原理数式の深い解説もあるよ! 本質を捉えたデータ分析のための分析モデル入門 ↓予約・購入はこちら!↓ https://amzn.to/3Ng0nC7 Voicy 始めたよ! ↓こちらから聴けます↓ https://voicy.jp/channel/2216 ▼目次 序章 分析モデルを学ぶための準備 第1部 定型データの扱い 第1章 回帰分析 第2章 回帰分析の結果の評価と解釈 第3章 ロジスティック回帰分析 第4章 機械学習を用いた回帰・分類 第2部 非定型データの扱い 第5章 深層学習入門 第6章 画像の分類 第7章 物体検出とセマンティックセグメンテーション 第8章 基本的な自然言語処理手法 第9章 深層学習を用いた自然言語処理モデル(前半) 第10章 深層学習を用いた自然言語処理モデル(後半) 第11章 統計的言語モデル 第12章 付加構造があるデータの扱い 第3部 強化学習 第13章 強化学習とは 第14章 強化学習の技法 第15章 深層強化学習の技法 第4部 データから知見を得る方法 第16章 クラスタリング 第17章 因子分析・主成分分析 第18章 データの関連を調べる分析 第19章 データの背後の構造を用いる分析 第5部 線形回帰分析の深い世界 第20章 多重共線性 第21章 発展的な回帰分析 ▼終わりに ご視聴ありがとうございました! 面白かったら高評価、チャンネル登録お願いします。 動画の質問、感想などは、コメント欄やTwitterにどうぞ! お仕事、コラボのご依頼は、公式 WebPage や TwitterのDMからお願い致します。 AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-official/top 動画生成:AIcia Solid (Twitter: https://twitter.com/AIcia_Solid/ ) 動画編集:AIris Solid (妹) (Twitter: https://twitter.com/AIris_Solid/ ) ======= Logo: ChikakoHorioさん ( https://twitter.com/ChikakoHorio ) Model: http://3d.nicovideo.jp/works/td44519 Model by: W01fa さん ( https://twitter.com/W01fa )
2022年07月08日
00:00:00 - 00:08:44
【強化学習】価値関数 - 最適化の主役はこいつ!【価値関数を通して収益最大化】RL vol. 7 #161 #VRアカデミア #ReinforcementLearning

【強化学習】価値関数 - 最適化の主役はこいつ!【価値関数を通して収益最大化】RL vol. 7 #161 #VRアカデミア #ReinforcementLearning

強化学習では、直接的に期待割引収益を最大化するのは激しく難しいので、2種の「価値関数」を使い倒します! 最初は混乱するかもなので、何度も見返してください~! 【プレイリスト】 https://www.youtube.com/playlist?list=PLhDAH9aTfnxI1OywfnxXCDTWGtYL2NxJR 【目次】 00:00 オープニング 00:40 復習 02:42 価値関数とは 10:12 価値関数の使い方 16:40 エンディング 17:00 エンディングトーク 【参考文献】 分析モデル入門 https://amzn.to/3Ng0nC7 私の本! この動画シリーズは、この第3部 強化学習 の内容を動画向けにアレンジ、大幅追加、大幅削除したものです。 合わせてみていただくと分かり易いかと! 強化学習(第2版) https://amzn.to/3K4QsR8 Sutton 先生の「強化学習」本の和訳です。分厚いですが、時間があり、基礎をしっかり学びたい人におすすめ! ちなみに、英語版は公式で pdf もダウンロードできます → http://incompleteideas.net/book/ 強化学習 (機械学習プロフェッショナルシリーズ) https://amzn.to/44R2XYr 理論家向けの方にはこちら! しっかりと数式が解説されており、基礎の理論をしっかりと学ぶことができます。 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 https://amzn.to/3XYDrOM 手を動かしながら学びたい人向け! サンプルコードとともに、基礎的な強化学習アルゴリズムを学べます! 将棋AIで学ぶディープラーニング https://www.amazon.co.jp/dp/B07B7JJ929 強化学習というと、将棋 AI を思い浮かべる人も少なくないはず! そういう人におすすめ! 将棋 AI 向けの強化学習は、他の参考文献にある方法とはかなり異なる方法で作られます。 将棋を目指す方は、ぜひこれを見てみてください! 更に強いのを作るならこれ → https://amzn.to/3pU1aDa 強化学習の基礎と深層強化学習 https://www.slideshare.net/ShotaImai3/rlssdeepreinforcementlearning 合間に広告が貼ることが極めて重い欠点ですが、内容は素晴らしく、全体感を見渡すことができます。 【宣伝:本も買ってね!】 データサイエンスに頻出の分析モデルを、全領域、深く、書きあげました! 本質を捉えたデータ分析のための分析モデル入門 https://amzn.to/3Ng0nC7 【終わりに】 ご視聴ありがとうございました! 面白かったら高評価、チャンネル登録お願いします。 動画の質問、感想などは、コメント欄や Twitter にどうぞ! お仕事、コラボのご依頼は、公式 WebPage や Twitter の DM からお願い致します。 AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-official/top 動画生成:AIcia Solid (Twitter: https://twitter.com/AIcia_Solid/ ) 動画編集:AIbis Solid (妹) ======= Logo: ChikakoHorioさん ( https://twitter.com/ChikakoHorio ) Model: http://3d.nicovideo.jp/works/td44519 Model by: W01fa さん ( https://twitter.com/W01fa )
2023年11月17日
00:00:00 - 00:17:35
【強化学習】GPIと構造図 - 4つの対象の関係を図示して混乱と決別する!【強化学習は、探索と学習のループ】RL vol. 8 #164 #VRアカデミア #ReinforcementLearning

【強化学習】GPIと構造図 - 4つの対象の関係を図示して混乱と決別する!【強化学習は、探索と学習のループ】RL vol. 8 #164 #VRアカデミア #ReinforcementLearning

【神回】強化学習特有の Generalized Policy Iteration という考え方をお伝えしつつ、 強化学習4つの対象と、その関係と、GPI のループの図示を紹介します。 これでかなり強化学習は学びやすくなると思う!!! 【プレイリスト】 https://www.youtube.com/playlist?list=PLhDAH9aTfnxI1OywfnxXCDTWGtYL2NxJR 【目次】 0:00 イントロ 01:38 本編スタート! 02:03 復習 04:28 Generalized Policy Iterationとは 07:52 強化学習の勉強の難しさ 11:24 強化学習4つの対象 15:06 エンディングトーク 【紹介した過去動画】 第3回:【強化学習】全体像を見据えておこう【2つのループが特徴】 https://www.youtube.com/watch?v=_DX4HoyjnNU 第7回:【強化学習】価値関数 - 最適化の主役はこいつ!【価値関数を通して収益最大化】 https://www.youtube.com/watch?v=SI6CfIzEMF8 【参考文献】 分析モデル入門 https://amzn.to/3Ng0nC7 私の本! この動画シリーズは、この第3部 強化学習 の内容を動画向けにアレンジ、大幅追加、大幅削除したものです。 合わせてみていただくと分かり易いかと! 強化学習(第2版) https://amzn.to/3K4QsR8 Sutton 先生の「強化学習」本の和訳です。分厚いですが、時間があり、基礎をしっかり学びたい人におすすめ! ちなみに、英語版は公式で pdf もダウンロードできます → http://incompleteideas.net/book/ 強化学習 (機械学習プロフェッショナルシリーズ) https://amzn.to/44R2XYr 理論家向けの方にはこちら! しっかりと数式が解説されており、基礎の理論をしっかりと学ぶことができます。 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 https://amzn.to/3XYDrOM 手を動かしながら学びたい人向け! サンプルコードとともに、基礎的な強化学習アルゴリズムを学べます! 将棋AIで学ぶディープラーニング https://www.amazon.co.jp/dp/B07B7JJ929 強化学習というと、将棋 AI を思い浮かべる人も少なくないはず! そういう人におすすめ! 将棋 AI 向けの強化学習は、他の参考文献にある方法とはかなり異なる方法で作られます。 将棋を目指す方は、ぜひこれを見てみてください! 更に強いのを作るならこれ → https://amzn.to/3pU1aDa 強化学習の基礎と深層強化学習 https://www.slideshare.net/ShotaImai3/rlssdeepreinforcementlearning 合間に広告が貼ることが極めて重い欠点ですが、内容は素晴らしく、全体感を見渡すことができます。 【宣伝:本も買ってね!】 データサイエンスに頻出の分析モデルを、全領域、深く、書きあげました! 本質を捉えたデータ分析のための分析モデル入門 https://amzn.to/3Ng0nC7 【終わりに】 ご視聴ありがとうございました! 面白かったら高評価、チャンネル登録お願いします。 動画の質問、感想などは、コメント欄や Twitter にどうぞ! お仕事、コラボのご依頼は、公式 WebPage や Twitter の DM からお願い致します。 AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-official/top 動画生成:AIcia Solid (Twitter: https://twitter.com/AIcia_Solid/ ) 動画編集:AIbis Solid (妹) ======= Logo: ChikakoHorioさん ( https://twitter.com/ChikakoHorio ) Model: http://3d.nicovideo.jp/works/td44519 Model by: W01fa さん ( https://twitter.com/W01fa )
2023年12月08日
00:00:00 - 00:16:17
忙しい人のための忙しい人のためのTransformer - #1 #vrアカデミア

忙しい人のための忙しい人のためのTransformer - #1 #vrアカデミア

Transformer ってほんとすごいよね。 AIcia Solid Project では、統計や機械学習、深層学習に強化学習の動画を投稿しているよ!(あと、数学の動画もたまに) 他の動画も見てねー!
2023年10月23日
00:00:00 - 00:00:46
【強化学習】ベルマン最適方程式 - 最適方策は収益が最大なのだ【強化学習の基礎方程式②】RL vol. 10 #168 #VRアカデミア #ReinforcementLearning

【強化学習】ベルマン最適方程式 - 最適方策は収益が最大なのだ【強化学習の基礎方程式②】RL vol. 10 #168 #VRアカデミア #ReinforcementLearning

最適方策という強い方策がありまして、それ使っておけばあらゆる場面で収益最大になるんです。 その場合のベルマン方程式がベルマン最適方程式。再び2手先を読む考え方で、今後大活躍します! 誤字脱字多くてごめんなさい! 【プレイリスト】 https://www.youtube.com/playlist?list=PLhDAH9aTfnxI1OywfnxXCDTWGtYL2NxJR 【目次】 00:00 オープニング 00:43 おわび 00:59 本編スタート! 01:22 最適方策 03:51 ベルマン最適方程式 07:28 記号の復習 13:10 ベルマン最適方程式の正体 13:30 ステップ1:状態の次は行動 17:12 ステップ2:行動の次は報酬と次の状態 20:07 ステップ3:いざベルマン最適方程式! 24:32 まとめ 26:34 エンディング 27:14 エンディングトーク 【参考文献】 分析モデル入門 https://amzn.to/3Ng0nC7 私の本! この動画シリーズは、この第3部 強化学習 の内容を動画向けにアレンジ、大幅追加、大幅削除したものです。 合わせてみていただくと分かり易いかと! 強化学習(第2版) https://amzn.to/3K4QsR8 Sutton 先生の「強化学習」本の和訳です。分厚いですが、時間があり、基礎をしっかり学びたい人におすすめ! ちなみに、英語版は公式で pdf もダウンロードできます → http://incompleteideas.net/book/ 強化学習 (機械学習プロフェッショナルシリーズ) https://amzn.to/44R2XYr 理論家向けの方にはこちら! しっかりと数式が解説されており、基礎の理論をしっかりと学ぶことができます。 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 https://amzn.to/3XYDrOM 手を動かしながら学びたい人向け! サンプルコードとともに、基礎的な強化学習アルゴリズムを学べます! 将棋AIで学ぶディープラーニング https://www.amazon.co.jp/dp/B07B7JJ929 強化学習というと、将棋 AI を思い浮かべる人も少なくないはず! そういう人におすすめ! 将棋 AI 向けの強化学習は、他の参考文献にある方法とはかなり異なる方法で作られます。 将棋を目指す方は、ぜひこれを見てみてください! 更に強いのを作るならこれ → https://amzn.to/3pU1aDa 強化学習の基礎と深層強化学習 https://www.slideshare.net/ShotaImai3/rlssdeepreinforcementlearning 合間に広告が貼ることが極めて重い欠点ですが、内容は素晴らしく、全体感を見渡すことができます。 【宣伝:本も買ってね!】 データサイエンスに頻出の分析モデルを、全領域、深く、書きあげました! 本質を捉えたデータ分析のための分析モデル入門 https://amzn.to/3Ng0nC7 【宣伝2:クラファンやってるよ!】 活動継続のためのご支援をお願いしています。詳細はこちら! クラファン(月額)はこちら → https://community.camp-fire.jp/projects/view/709000 (クラファン始めた理由の動画 → https://www.youtube.com/watch?v=vXY34njwL4o ) 【終わりに】 ご視聴ありがとうございました! 面白かったら高評価、チャンネル登録お願いします。 動画の質問、感想などは、コメント欄や Twitter にどうぞ! お仕事、コラボのご依頼は、公式 WebPage や Twitter の DM からお願い致します。 AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-official/top 動画生成:AIcia Solid (Twitter: https://twitter.com/AIcia_Solid/ ) 動画編集:AIbis Solid (妹) ======= Logo: ChikakoHorioさん ( https://twitter.com/ChikakoHorio ) Model: http://3d.nicovideo.jp/works/td44519 Model by: W01fa さん ( https://twitter.com/W01fa )
2024年01月12日
00:00:00 - 00:27:53
【AI論文解説】Gumbel回帰を利用した新しい強化学習! Extreme Q-learning #ICLR2023

【AI論文解説】Gumbel回帰を利用した新しい強化学習! Extreme Q-learning #ICLR2023

【AI論文解説】はディープラーニング・機械学習に関する論文を紹介する動画シリーズです。(プレイリスト: https://www.youtube.com/playlist?list=PLbtqZvaoOVPCqfmnrBfo9Xv5mtDr0LjQZ ) 今回は、ICLR2023で発表されるGumbel回帰を利用した強化学習アルゴリズム、Extreme Q-learningを紹介します。 注:7pの右上のβに対応する積分は、行動aの空間全体で積分したものになります。 【紹介論文】 ・EXTREME Q-LEARNING: MAXENT RL WITHOUT ENTROPY  【論文リンク】https://arxiv.org/pdf/2301.02328.pdf 【プロジェクトページ】https://div99.github.io/XQL/ -- ソニーが提供するオープンソースのディープラーニング(深層学習)フレームワークソフトウェアのNeural Network Libraries( https://nnabla.org/, https://github.com/sony/nnabla/ )に関連する情報を紹介する動画チャンネルを開設しました( https://www.youtube.com/c/nnabla )。Neural Network Librariesのチュートリアル・Tipsに加え、最先端のディープラーニングの技術情報(講義、最先端論文紹介)などを発信していきます。チャンネル登録と応援よろしくおねがいします! 同じくソニーが提供する直感的なGUIベースの深層学習開発環境のNeural Network Console( https://dl.sony.com/ )が発信する大人気のYouTubeチャンネル( https://www.youtube.com/channel/UCRTV5p4JsXV3YTdYpTJECRA )でもディープラーニングの技術講座やツールのチュートリアルを多数公開しています。こちらもチャンネル登録と応援よろしくおねがいします。
2023年02月27日
00:00:00 - 00:31:54
【AI技術研修】nnabla-rlによる深層強化学習入門 第1回「深層強化学習とは?」

【AI技術研修】nnabla-rlによる深層強化学習入門 第1回「深層強化学習とは?」

本動画は「nnabla-rlによる深層強化学習入門」の第1回の動画です。イントロダクションとして、本研修で扱う内容と深層強化学習とは何か?について説明します。 -- ソニーが提供するオープンソースのディープラーニング(深層学習)フレームワークソフトウェアのNeural Network Libraries( https://nnabla.org/, https://github.com/sony/nnabla/ )に関連する情報を紹介する動画チャンネルを開設しました( https://www.youtube.com/c/nnabla )。Neural Network Librariesのチュートリアル・Tipsに加え、最先端のディープラーニングの技術情報(講義、最先端論文紹介)などを発信していきます。チャンネル登録と応援よろしくおねがいします! 同じくソニーが提供する直感的なGUIベースの深層学習開発環境のNeural Network Console( https://dl.sony.com/ )が発信する大人気のYouTubeチャンネル( https://www.youtube.com/channel/UCRTV5p4JsXV3YTdYpTJECRA )でもディープラーニングの技術講座やツールのチュートリアルを多数公開しています。こちらもチャンネル登録と応援よろしくおねがいします。
2022年10月17日
00:00:00 - 00:15:22
「強化学習100題」の解説(40/100)

「強化学習100題」の解説(40/100)

書籍『ゼロから作るDeep Learning ❹ 強化学習編』ではオンライン上に「強化学習100題」を用意しています。この動画では「強化学習100題」の解説を行います。 ■強化学習100題 https://koki0702.github.io/dezero-p100/ ■解説動画プレイリスト https://www.youtube.com/watch?v=6GgmwT7fJWg&list=PLfEIaAl7qmZqLEvo3fE1wP0bSZ7jWA9u5 ■書籍「ゼロから作るDeep Learning ❹ 強化学習編」 https://www.amazon.co.jp/dp/4873119758/ref=cm_sw_em_r_mt_dp_X5TN6AVE21JRKS874ZGQ
2022年07月17日
00:00:00 - 00:01:40
「強化学習100題」の解説(39/100)

「強化学習100題」の解説(39/100)

書籍『ゼロから作るDeep Learning ❹ 強化学習編』ではオンライン上に「強化学習100題」を用意しています。この動画では「強化学習100題」の解説を行います。 ■強化学習100題 https://koki0702.github.io/dezero-p100/ ■「ゼロから作るDeep Learning ❹ 強化学習編」 https://www.amazon.co.jp/dp/4873119758/ref=cm_sw_em_r_mt_dp_X5TN6AVE21JRKS874ZGQ
2022年07月17日
00:00:00 - 00:01:57
「強化学習100題」の解説(25/100)

「強化学習100題」の解説(25/100)

書籍『ゼロから作るDeep Learning ❹ 強化学習編』ではオンライン上に「強化学習100題」を用意しています。この動画では「強化学習100題」の解説を行います。 ■強化学習100題 https://koki0702.github.io/dezero-p100/ ■「ゼロから作るDeep Learning ❹ 強化学習編」 https://www.amazon.co.jp/dp/4873119758/ref=cm_sw_em_r_mt_dp_X5TN6AVE21JRKS874ZGQ
2022年07月16日
00:00:00 - 00:01:39
「強化学習100題」の解説(38/100)

「強化学習100題」の解説(38/100)

書籍『ゼロから作るDeep Learning ❹ 強化学習編』ではオンライン上に「強化学習100題」を用意しています。この動画では「強化学習100題」の解説を行います。 ■強化学習100題 https://koki0702.github.io/dezero-p100/ ■「ゼロから作るDeep Learning ❹ 強化学習編」 https://www.amazon.co.jp/dp/4873119758/ref=cm_sw_em_r_mt_dp_X5TN6AVE21JRKS874ZGQ
2022年07月17日
00:00:00 - 00:00:58
【nnablaRLアルゴリズム解説】Deep Q-Network (DQN)

【nnablaRLアルゴリズム解説】Deep Q-Network (DQN)

nnablaRLアルゴリズム解説は、Neural Network Librariesを利用して強化学習を実行するためのライブラリ、nnablaRLを使うにあたり、必要となる強化学習の各アルゴリズムの概要などを説明していく動画です。 今回はシリーズの第2回として、Deep Q-Network (DQN) について説明しました。 DQNのアルゴリズムの概要やnnablaRLでDQNを使うための方法を紹介します。 nnabla-rlのプロジェクトページはこちら:https://github.com/sony/nnabla-rl 00:00 イントロダクション 01:11 Deep Q-Network (DQN) とは何か? 10:42 nnablaRLでDQNを利用する方法は? 【参考文献】 ・V. Mnih et al., “Human-level control through deep reinforcement learning”, nature, 518(7540):529–533, 2015 https://www.nature.com/articles/nature14236 ・H. van Hasselt et al., “Deep Reinforcement Learning with Double Q-learning.”, AAAI 2016 https://arxiv.org/pdf/1509.06461.pdf ​ ・R.S.Sutton and A. G. Barto “Reinforcement Learning: An Introduction.”, The MIT press, Cambridge MA. 1998​ -- ソニーが提供するオープンソースのディープラーニング(深層学習)フレームワークソフトウェアのNeural Network Libraries( https://nnabla.org/, https://github.com/sony/nnabla/ )に関連する情報を紹介する動画チャンネルを開設しました( https://www.youtube.com/c/nnabla )。Neural Network Librariesのチュートリアル・Tipsに加え、最先端のディープラーニングの技術情報(講義、最先端論文紹介)などを発信していきます。チャンネル登録と応援よろしくおねがいします! 同じくソニーが提供する直感的なGUIベースの深層学習開発環境のNeural Network Console( https://dl.sony.com/ )が発信する大人気のYouTubeチャンネル( https://www.youtube.com/channel/UCRTV5p4JsXV3YTdYpTJECRA )でもディープラーニングの技術講座やツールのチュートリアルを多数公開しています。こちらもチャンネル登録と応援よろしくおねがいします。
2022年01月31日
00:00:00 - 00:15:36
【LIVE】強化学習で将棋を指したい!【part17. Docker tutorial 5】 #VRアカデミア

【LIVE】強化学習で将棋を指したい!【part17. Docker tutorial 5】 #VRアカデミア

さいきん、数学系の YouTuber で将棋が流行ってるので、私も指したくなりました。 将棋を学習していこうと思います。 参考文献はこちら 将棋AIで学ぶディープラーニング | 山岡 忠夫 |本 | 通販 | Amazon https://amzn.to/37Nkx4h 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 https://amzn.to/39qDoUK RL の pdf http://incompleteideas.net/book/RLbook2020trimmed.pdf
2022年03月29日
00:00:00 - 00:39:15
【LIVE】強化学習で将棋を指したい!【part14. Docker tutorial 2】 #VRアカデミア

【LIVE】強化学習で将棋を指したい!【part14. Docker tutorial 2】 #VRアカデミア

さいきん、数学系の YouTuber で将棋が流行ってるので、私も指したくなりました。 将棋を学習していこうと思います。 参考文献はこちら 将棋AIで学ぶディープラーニング | 山岡 忠夫 |本 | 通販 | Amazon https://amzn.to/37Nkx4h 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 https://amzn.to/39qDoUK RL の pdf http://incompleteideas.net/book/RLbook2020trimmed.pdf
2022年01月16日
00:00:00 - 01:18:17
機械学習における様々な学習方法のについて違いを理解する #K_DM

機械学習における様々な学習方法のについて違いを理解する #K_DM

この動画では、以下にリストアップした様々な○○学習という言葉について、それがどういうものを指しているのかを概説します。この動画を見る前に、教師あり学習と教師なし学習にかんする動画( https://youtu.be/8v5UFHLHQog )を見るとイメージが付きやすいかもしれません。 ----------------------------- ★目次 00:00 タイトル 00:50 問題設定とは 02:40 教師あり学習(supervised learning) 03:13 教師なし学習(unsupervised learning) 04:02 半教師あり学習(semi-supervised learning) 05:19 弱教師あり学習(weak-supervised learning) 06:21 自己教師あり学習(self-supervised learning) 07:29 トランスダクティブ学習 (transductive inference) 08:18 オンライン学習(sequential learning) 09:19 能動学習(active learning) 10:00 強化学習(reinforcement learning) 11:04 まとめ ----------------------------- ★SNS twitter: https://twitter.com/intent/follow?screen_name=_K_DM ブログ: https://kdm.hatenablog.jp/ コード置き場: https://k-dm.work/ja/ ----------------------------- ★BGM Let’s! https://dova-s.jp/bgm/play8503.html ----------------------------- ★このチャンネルについて 週に一回ペースで機械学習・データサイエンスに関する情報を発信します!よろしければチャンネル登録お願いします。大変励みになります。 #機械学習 #データ分析 #機械学習 #AI #データ分析 #python #解説 #データサイエンス
2021年09月29日
00:00:00 - 00:12:51
「強化学習100題」の解説(98/100)

「強化学習100題」の解説(98/100)

書籍『ゼロから作るDeep Learning ❹ 強化学習編』ではオンライン上に「強化学習100題」を用意しています。この動画では「強化学習100題」の解説を行います。 ■強化学習100題 https://koki0702.github.io/dezero-p100/ ■解説動画プレイリスト https://www.youtube.com/watch?v=6GgmwT7fJWg&list=PLfEIaAl7qmZqLEvo3fE1wP0bSZ7jWA9u5 ■書籍「ゼロから作るDeep Learning ❹ 強化学習編」 https://www.amazon.co.jp/dp/4873119758/ref=cm_sw_em_r_mt_dp_X5TN6AVE21JRKS874ZGQ
2022年07月28日
00:00:00 - 00:01:31
「強化学習100題」の解説(29/100)

「強化学習100題」の解説(29/100)

書籍『ゼロから作るDeep Learning ❹ 強化学習編』ではオンライン上に「強化学習100題」を用意しています。この動画では「強化学習100題」の解説を行います。 ■強化学習100題 https://koki0702.github.io/dezero-p100/ ■「ゼロから作るDeep Learning ❹ 強化学習編」 https://www.amazon.co.jp/dp/4873119758/ref=cm_sw_em_r_mt_dp_X5TN6AVE21JRKS874ZGQ
2022年07月16日
00:00:00 - 00:01:44