【深層学習】Scaling Law - 大きい Transformer は強い【ディープラーニングの世界vol.38】#123 #VRアカデミア #DeepLearning

大きい Transformer はすごい。もっと大きい Transformer はもっとすごい。
GPT-3 や、近年の巨大言語モデル研究につながる偉大な研究です！
ここまではっきり熱力学的（？）な性質出ると面白いですよね。

▼参考文献
Kaplan, Jared, et al. "Scaling laws for neural language models." arXiv preprint arXiv:2001.08361 (2020).
https://arxiv.org/abs/2001.08361
原論文！！！
グラフがきれい！！！！！見て！！！！！！！！

Scaling Law な小猫遊さん
https://twitter.com/jaguring1/status/1385447598006292488?t=cGEjUp1WsyY1Gh99wsPWcg&s=19
https://twitter.com/jaguring1/status/1413725445166563329?t=m4NAF0mcZeOqYl9rykCYtg&s=19

【2019年版】自然言語処理の代表的なモデル・アルゴリズム時系列まとめ - Qiita https://qiita.com/LeftLetter/items/14b8f10b0ee98aa181b7
いろいろこれを参考にして動画を作っています

▼目次
そのうち出すよ！

▼終わりに
ご視聴ありがとうございました！
面白かったら高評価、チャンネル登録お願いします。
動画の質問、感想などは、コメント欄やTwitterにどうぞ！
お仕事、コラボのご依頼は、公式 WebPage や TwitterのDMからお願い致します。

AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-official/top
動画生成：AIcia Solid (Twitter: https://twitter.com/AIcia_Solid/ )
動画編集：AIris Solid (妹) (Twitter: https://twitter.com/AIris_Solid/ )

=======

Logo: TEICAさん ( https://twitter.com/T_E_I_C_A )
Model: http://3d.nicovideo.jp/works/td44519
Model by: W01fa さん ( https://twitter.com/W01fa )

チャンネル登録

AIcia Solid Project

📋 #AIciart

※本サイトに掲載されているチャンネル情報や動画情報はYouTube公式のAPIを使って取得・表示しています。

概要カレンダー動画一覧タイムテーブルチャンネル分析

Timetable

動画タイムテーブル

よく話題になっている単語を表示する

動画数：293件

字幕を含める

【深層学習】Scaling Law - 大きい Transformer は強い【ディープラーニングの世界vol.38】#123 #VRアカデミア #DeepLearning

AIcia Solid Project

Timetable

よく話題になっている単語

オープニング

価値反復法とは

今の状況のおさらい

復習

ベルマン最適作用素

最適方策を計算

まとめ

エンディング

機械学習のまとめとは

利用規約

プライバシーポリシー

お問い合わせ

その他のデータベース