動画一覧 - データサイエンス塾!! - 機械学習のまとめ データサイエンス塾!!の動画一覧です。 https://ml.streamdb.net/videos-rss/c/UCPe1g8YvrjAbGty-5zPWU8g Sat, 16 Sep 23 12:00:13 +0900 Excelで始める「統計的因果推論」超入門!〜正しく効果測定しよう〜 https://ml.streamdb.net/timelines/v/Gsx4VI9kBeM Sat, 16 Sep 23 12:00:13 +0900 Excelで始める「統計的因果推論」超入門!〜正しく効果測定しよう〜 単純な相関分析や回帰分析では、データの背後に潜む真の「原因と結果」の関係を見極めることは難しいことが多いです。統計的因果推論はデータから因果関係を明らかにするための強力なツールです。これによりビジネスの意思決定や研究活動など、さまざまな分野での課題解決に役立てましょう! Super Thanksによる応援や、お気軽なコメントを頂けますと大変励みになります! 【Excelファイルのダウンロードサイト】 https://analysis-navi.com/?p=4135 【目次】 0:16 統計的因果推論とは? 9:17 仮説検定 14:41 回帰分析 23:29 RDD(回帰不連続デザイン) 29:09 DID(差の差法/差分の差分法) 41:37 ITSA(分割時系列デザイン) 【キーワード】 t検定 F検定 重回帰分析 ChatGPT 平行トレンド仮定 #エクセル #データ分析 #統計学 #データサイエンス #データサイエンス 【祝】登録者10,000人までの軌跡【ありがとうございます】 https://ml.streamdb.net/timelines/v/3K5QXsK98CE Thu, 29 Dec 22 11:00:00 +0900 【祝】登録者10,000人までの軌跡【ありがとうございます】 いつもありがとうございます。今回はExcelで登録者1万人までの推移を調べてみました。 登録者が2万人、3万人に達する時期の予測なども行っています。 #データサイエンス #データサイエンス 90分で覚える!Pythonによる機械学習の基本〜教師なし学習編〜【Pythonデータサイエンス超入門】 https://ml.streamdb.net/timelines/v/_jSATI96oSo Sat, 03 Dec 22 12:00:12 +0900 90分で覚える!Pythonによる機械学習の基本〜教師なし学習編〜【Pythonデータサイエンス超入門】 機械学習をPythonで実装できるようになりましょう! 質問・リクエスト等のお気軽なコメントや、Super Thanksによる応援を頂けますと大変励みになります! 【ソースコードのコピペ用ページ】 https://analysis-navi.com/?p=4118 0:00 イントロダクション 2:17 機械学習とは? 12:40 次元削減 18:02 ├ Pythonによる次元削減の実行 24:08 ├ 寄与率の計算 26:06 ├ 結果の図示 28:10 ├ 結果の解釈 33:14 └ PCA以外の手法 42:24 クラスタリング 45:43 ├ Pythonによるクラスタリングの実行 46:06 ├ 階層クラスタリング 50:06 ├ 非階層クラスタリング(K-means) 54:43 ├ 結果の図示 58:05 ├ クラスタ数の推測(エルボー法) 1:01:39 └ X-means 1:09:36 アソシエーション分析(バスケット分析) 1:13:47 ├ Pythonによるアソシエーション分析の実行 1:19:46 └ ネットワーク図の作成 1:24:39 クロージング 【キーワード】 教師あり学習 強化学習 PCA(主成分分析) SVD(特異値分解) t-SNE UMAP 単結合法(最短距離法) 完全結合法(最長距離法) 郡平均法 ウォード法 Support(支持度) Confidence(信頼度) Lift(リフト値) #Python #データサイエンス #データサイエンス #データサイエンス 80分で学ぶ!Pythonによる回帰分析の基本【Pythonデータサイエンス超入門】 https://ml.streamdb.net/timelines/v/VkwYc2fbMA4 Sat, 10 Sep 22 09:30:11 +0900 80分で学ぶ!Pythonによる回帰分析の基本【Pythonデータサイエンス超入門】 様々な場面で活躍するデータ分析手法「回帰分析」をPythonで実行できるようになりましょう! ライブラリはstatsmodelsを使用しています。 質問・リクエスト等のお気軽なコメントや、Super Thanksによる応援を頂けますと大変励みになります! 【ソースコードのコピペ用ページ】 https://analysis-navi.com/?p=4101 0:00 イントロダクション 4:33 回帰分析とは? 14:22 Pythonで回帰分析を行う準備 17:11 ダミー変数の作成 19:30 回帰分析の実行 23:03 回帰分析の結果の解釈 30:27 Formula APIによる回帰分析の実行 34:00 特徴量エンジニアリング 41:38 未来予測 45:12 グラフ作成による精度確認 52:26 ラッソ回帰、リッジ回帰、Elastic Net 1:05:45 ロジスティック回帰 1:19:25 ポアソン回帰 1:22:15 クロージング 【キーワード】 線形回帰 p値 交互作用 多重共線性(マルチコ) 価格弾性力 L1正則化/L2正則化 MSE(平均二乗誤差) RMSE(二乗平均平方根誤差) リンク関数 #Python #データサイエンス #データサイエンス #データサイエンス 1時間で分かる!Seabornによるグラフ作成入門【Pythonデータサイエンス超入門】 https://ml.streamdb.net/timelines/v/uUcdlJiAYBM Sat, 16 Jul 22 12:00:21 +0900 1時間で分かる!Seabornによるグラフ作成入門【Pythonデータサイエンス超入門】 グラフ作成用ライブラリ「seaborn」「matplotlib」の使い方の超入門編です。 質問・リクエスト等のお気軽なコメントや、Super Thanksによる応援を頂けますと大変励みになります! 【CSVダウンロード&ソースコードのコピペ用ページ】 https://analysis-navi.com/?p=4086 【Twitterリンク】 https://twitter.com/t_nsmk 【目次】 0:00 オープニング 3:14 折れ線グラフ(lineplot) 13:11 棒グラフ(barplot) 19:56 ヒストグラム(histplot) 27:28 散布図(とその仲間たち) 29:11 ├ scatterplot:散布図 34:13 ├ lmplot:回帰直線付き散布図 37:17 ├ kdeplot:等高線風散布図 40:43 ├ jointplot:ヒストグラム付き散布図 43:15 └ pairplot:全ペアによる散布図 45:01 箱ひげ図(とその仲間たち) 46:19 ├ boxplot:箱ひげ図 54:20 ├ violinplot:バイオリンプロット 55:58 ├ stripplot:散布図風ヒストグラム 57:05 └ swarmplot:散布図風ヒストグラム2 58:37 ヒートマップ 1:00:05 ├ heatmap:ヒートマップ 1:03:46 └ clustermap:階層クラスタ付きヒートマップ #python #データサイエンス #データサイエンス #データサイエンス 1時間ちょっとで学ぶ!Pandasの基本【Pythonデータサイエンス超入門】 https://ml.streamdb.net/timelines/v/m6KjM1clGpA Sat, 18 Jun 22 12:00:27 +0900 1時間ちょっとで学ぶ!Pandasの基本【Pythonデータサイエンス超入門】 データ分析ライブラリ「pandas」の使い方の超入門編です。 質問・リクエスト等のお気軽なコメントや、Super Thanksによる応援を頂けますと大変励みになります! 【CSVダウンロード&ソースコードのコピペ用ページ】 https://analysis-navi.com/?p=4074 【目次】 0:00 オープニング 3:47 pandasとは 6:03 第一章:データの確認 6:03 ├ CSVの読み込み 11:08 ├ 一部の行/列の抽出 17:08 ├ 条件による行の抽出(フィルター) 20:58 ├ データの並び替え(ソート) 23:20 └ CSVへの書き出し 27:43 第二章:データの集計 28:07 ├ データの集計 30:59 └ 条件ごとのデータの集計 36:39 第三章:データの整形 38:34 ├ 重複行処理 44:46 ├ 欠損値処理 51:19 └ 形状変換 55:35 第四章:データの結合 59:58 ├ joinによる結合 1:02:50 ├ mergeによる結合 1:07:30 └ concatによる結合 1:09:46 クロージング 【キーワード】 内部結合(inner join) 左外部結合(left join) 右内部結合(right join) 外部結合(outer join) #Python #データサイエンス #データサイエンス #データサイエンス 2時間で学ぶ!Pythonの基本【Pythonデータサイエンス超入門】 https://ml.streamdb.net/timelines/v/R3DGb8G0JAk Sat, 28 May 22 12:00:19 +0900 2時間で学ぶ!Pythonの基本【Pythonデータサイエンス超入門】 Pythonでデータ分析をしてみたい人のための基礎講座シリーズ、第一弾です。 まずはお使いのパソコンでPythonを使えるようにし、基本的なPythonの構文を学びましょう。 質問・リクエスト等のお気軽なコメントや、Super Thanksによる応援を頂けますと大変励みになります! 【ソースコードのコピペ用ページ】 https://analysis-navi.com/?p=4054 【目次】 0:45 導入 3:58 なぜデータサイエンス×Pythonを学ぶのか 13:18 Pythonを使う準備(Anacondaのインストール) 17:31 JupyterLabの基本操作 25:20 print文/コメント 29:15 変数/データ型 37:07 数値型の基本操作 42:13 文字列型の基本操作 49:53 if文 1:00:04 for文 1:04:50 while文 1:14:02 リスト/タプル/辞書 1:29:41 関数 1:36:54 クラス/インスタンス 1:50:41 クロージング #Python #データサイエンス #データサイエンス #データサイエンス 1時間で覚える「Googleスプレッドシート」によるデータ分析・超入門! https://ml.streamdb.net/timelines/v/t4FLfC0-GJw Sun, 27 Mar 22 12:00:19 +0900 1時間で覚える「Googleスプレッドシート」によるデータ分析・超入門! Googleが世に放った表計算アプリ「Googleスプレッドシート」を使ってデータ分析してみましょう。 Excelとの違いや基本操作のご説明から、回帰分析・仮説検定まで取り扱います。 【目次】 0:00 はじめに 1:51 基本的な操作 3:28 エクセルとの違い 10:27 フィルター 12:50 基本的な関数(sumif、averageif、vlookupなど) 20:17 ピボットテーブル 26:15 基本的なグラフ(折れ線グラフ、棒グラフ) 32:00 相関分析(+散布図) 38:03 回帰分析 43:12 仮説検定(t検定) 59:12 おわりに #統計学 #データサイエンス #データサイエンス #データサイエンス 【1分統計学】大数の法則ってなに? #Shorts https://ml.streamdb.net/timelines/v/tq8J3SfjRVk Sun, 20 Mar 22 12:00:14 +0900 【1分統計学】大数の法則ってなに? #Shorts 統計学の超・基本定理である大数の法則とは一体どんな法則なのでしょうか? サイコロや日本人の平均身長の例を取ってご説明します。 #統計学 #データサイエンス #データサイエンス これで完璧!Excelデータ分析・完全講義【応用編】 https://ml.streamdb.net/timelines/v/56pmYCZZuN8 Sun, 13 Mar 22 12:00:02 +0900 これで完璧!Excelデータ分析・完全講義【応用編】 エクセルでさらに自由に統計解析やデータアナリティクスができるようになりましょう。 質問・リクエスト等のお気軽なコメントや、Super Thanksによる応援を頂けますと大変励みになります! 【Excelファイルのダウンロードサイト】 https://analysis-navi.com/?p=4032 【入門編はこちら】 https://youtu.be/xz151IIp6us 【目次】 ■ 集計の集計ワザ 1:49 プラスアルファのグラフ ├ 1:56 バブルチャート └ 9:39 パレート図/ABC分析 13:53 データの結合(XLOOKUP) ■ 分析の応用ワザ 20:22 カイ二乗検定 38:15 プラスアルファの重回帰分析(ダミー変数、交互作用) 1:03:33 時系列分析 ├ 1:04:11 時系列データの集計 └ 1:08:34 時系列データの予測 1:17:10 ソルバー ├ 1:17:44 整数最適化 └ 1:31:56 組み合わせ最適化 【キーワード】 絶対参照 ダミー変数 交互作用 指数平滑法 整数計画問題 ビジネス統計スペシャリスト #エクセル #データ分析 #統計学 #データサイエンス #データサイエンス 【1分統計学】偽陽性・偽陰性ってなに? #Shorts https://ml.streamdb.net/timelines/v/UxQBf8wXz6U Sun, 06 Mar 22 12:00:10 +0900 【1分統計学】偽陽性・偽陰性ってなに? #Shorts 最近良く聞くようになった「偽陽性」「偽陰性」ですが、その意味を正しく理解していますか? この2つの指標を複合的に考えないと、怪しい人に騙されてしまうかも?しれません。。。 【キーワード】 偽陽性(第一種過誤、α過誤) 偽陰性(第二種過誤、β過誤) #統計学 #データサイエンス #データサイエンス 初学者から2時間で習得!Excelデータ分析・完全講義 https://ml.streamdb.net/timelines/v/xz151IIp6us Sun, 27 Feb 22 12:00:18 +0900 初学者から2時間で習得!Excelデータ分析・完全講義 エクセルで自由自在に統計解析やデータアナリティクスができるようになりましょう。 質問・リクエスト等のお気軽なコメントや、Super Thanksによる応援を頂けますと大変励みになります! ※内容としては過去動画のまとめですが、内容の補足や追加をしたため全て撮り直しております。 【Excelファイルのダウンロードサイト】 https://analysis-navi.com/?p=4032 【応用編はこちら】 https://youtu.be/56pmYCZZuN8 【目次】 ■ 導入 0:37 なぜExcelのデータ分析を学ぶ必要があるのか ■ 集計のワザ 7:10 フィルターの使い方 11:03 基本的な関数 19:08 基本的なグラフ(導入) ├ 19:30 棒グラフ ├ 22:58 折れ線グラフ ├ 26:24 散布図 ├ 28:29 ヒストグラム └ 33:42 箱ひげ図 38:31 ピボットテーブル ■ 分析のワザ 44:36 相関分析 56:13 仮説検定(導入) ├ 57:00 t検定 └ 1:11:35 分散分析[ANOVA] 1:23:20 回帰分析(導入) ├ 1:25:55 単回帰分析 └ 1:39:13 重回帰分析 【キーワード】 データサイエンス F検定 多重共線性(マルチコ) ビジネス統計スペシャリスト #エクセル #データ分析 #統計学 #データサイエンス #データサイエンス 【1分統計学】Excelで相関分析してみよう! #Shorts https://ml.streamdb.net/timelines/v/YccnB6j8U14 Sun, 20 Feb 22 12:00:10 +0900 【1分統計学】Excelで相関分析してみよう! #Shorts エクセルで相関係数を求めてみます。関数で行う方法と、対象列がたくさんある場合に一気に実行する方法を紹介します。 宜しければ以下の動画もご参考にしてください。 【"相関係数"自体の1分解説】 https://youtu.be/D1zFF5Yzv4Q 【丁寧な説明】 https://youtu.be/e-Xwr4yc24A #統計学 #Excel #データサイエンス #データサイエンス Pythonで遺伝的アルゴリズムによる数理最適化をしてみよう〜DEAP入門〜 https://ml.streamdb.net/timelines/v/HD2klICg-bA Sun, 13 Feb 22 12:00:04 +0900 Pythonで遺伝的アルゴリズムによる数理最適化をしてみよう〜DEAP入門〜 最適化問題を解くための手法のひとつ、「遺伝的アルゴリズム」をPythonで実装していきます。 計算量が多すぎて数値的に答えを出せない問題でも、「出来る限り答えに近づける」というアプローチを取るため、基本的にはどんな問題にも適用可能な手法です。 【参考リンク】 https://deap.readthedocs.io/en/master/api/tools.html#deap.tools.selTournament #データサイエンス #データサイエンス 【1分統計学】中央値・最頻値(メジアン・モード)ってなに? #Shorts https://ml.streamdb.net/timelines/v/WrWoIlBmX6g Sun, 06 Feb 22 12:00:10 +0900 【1分統計学】中央値・最頻値(メジアン・モード)ってなに? #Shorts データの代表値である中央値と最頻値の意味をご紹介します。「平均値」だけではダメなのでしょうか? #統計学 #データサイエンス #データサイエンス XAI(説明可能なAI)ってなに?〜SHAP値の読み方〜 https://ml.streamdb.net/timelines/v/uD-SPmBd504 Sun, 30 Jan 22 12:00:15 +0900 XAI(説明可能なAI)ってなに?〜SHAP値の読み方〜 AIがその予測結果に至った理由を人間にも理解しやすいようにする技術、XAI(Explainable AI)のご紹介です。 XAIとは一体どんな技術で、どのように使うのでしょうか? 【キーワード】 Model Induction Interpretable Model #データサイエンス #データサイエンス 【1分統計学】Excelでt検定を実行しよう! #Shorts https://ml.streamdb.net/timelines/v/3EzkR4PL1Lc Sun, 23 Jan 22 12:00:02 +0900 【1分統計学】Excelでt検定を実行しよう! #Shorts 2つのデータに「有意差」があるか調べる手法の1つ「t検定」をエクセルで実行してみましょう! 【丁寧に解説している動画はこちら】 https://youtu.be/xs4HqZCuSFA #統計学 #Excel #データサイエンス #データサイエンス Pythonでアソシエーション分析(バスケット分析)してみよう〜分析からネットワーク図の作成まで〜 https://ml.streamdb.net/timelines/v/uBkQ7dhSByc Sun, 16 Jan 22 12:00:32 +0900 Pythonでアソシエーション分析(バスケット分析)してみよう〜分析からネットワーク図の作成まで〜 「よく同時に購入されている商品」を調べる分析手法、バスケット分析をmlxtendライブラリを用いて実行していきます。 また、NetworkXによるネットワーク図の作成も実行します。 #データサイエンス #データサイエンス 【1分統計学】正規分布ってなに? #Shorts https://ml.streamdb.net/timelines/v/z4VE7zlHjwU Sun, 09 Jan 22 12:00:19 +0900 【1分統計学】正規分布ってなに? #Shorts 統計学を学ぶと何度も出てくる「正規分布(ガウス分布)」とは一体何なのでしょうか? #統計学 #データサイエンス #データサイエンス 黒マスの無いクロスワードパズルを作る会 https://ml.streamdb.net/timelines/v/6tO_nRTBct8 Sun, 02 Jan 22 12:00:02 +0900 黒マスの無いクロスワードパズルを作る会 誰もが1度はやった事がありそうな「クロスワードパズル」ですが、文字が入らない「黒ます」の存在しない問題は作れるのでしょうか? 頭で考えても難しいので、Pythonに頑張ってもらいました。 #データサイエンス #データサイエンス 【1分統計学】Excelで箱ひげ図を作ろう! #Shorts https://ml.streamdb.net/timelines/v/iGTBr8WjeZM Sun, 26 Dec 21 12:00:10 +0900 【1分統計学】Excelで箱ひげ図を作ろう! #Shorts データの分布が"ぱっと見"で分かる便利な図、「箱ひげ図」をエクセルで簡単に作りましょう! #統計学 #Excel #データサイエンス #データサイエンス 「危険度」を数値で評価しよう!オッズ比&リスク比 https://ml.streamdb.net/timelines/v/wJtwdv8J-do Sun, 19 Dec 21 12:00:17 +0900 「危険度」を数値で評価しよう!オッズ比&リスク比 臨床試験などで良く使用される危険度を測る指標、オッズ比とリスク比の意味や使い分け方についてです。 「オッズ」という言葉がなぜ競馬で使われるのか、「オッズ」とロジスティック回帰分析の関係性、とといった話もしています。 【キーワード】 コホート研究 ケースコントロール研究 ロジスティック回帰分析 #データサイエンス #データサイエンス 【1分統計学】相関係数ってなに? #Shorts https://ml.streamdb.net/timelines/v/D1zFF5Yzv4Q Sun, 12 Dec 21 12:00:11 +0900 【1分統計学】相関係数ってなに? #Shorts 2つの変数の関係性を表す「相関」を正しく理解し、正しく使いましょう! #統計学 #データサイエンス #データサイエンス Pythonで数理最適化してみよう〜PuLPによるオペレーションズリサーチ入門〜 https://ml.streamdb.net/timelines/v/HcVSSBFNcKM Sun, 05 Dec 21 12:00:05 +0900 Pythonで数理最適化してみよう〜PuLPによるオペレーションズリサーチ入門〜 ナップサック問題、巡回セールスマン問題に代表される「数理最適化」はビジネスの場でも大活躍します。 どのように役立ち、どのように実現するのか、、、ぜひ本動画の内容をご活用ください。 【キーワード】 ・線形計画問題 ・整数計画問題 ・組合せ最適化問題 #データサイエンス #データサイエンス 【1分統計学】Excelでヒストグラムを作ろう! #Shorts https://ml.streamdb.net/timelines/v/_hmXXGbOb2I Sun, 28 Nov 21 12:00:10 +0900 【1分統計学】Excelでヒストグラムを作ろう! #Shorts エクセルで綺麗なヒストグラムを作る方法を1分で学びましょう! #統計学 #Excel #データサイエンス #データサイエンス アンケート調査、何人に取れば充分?【必要サンプル数の計算方法】 https://ml.streamdb.net/timelines/v/_srUPcc9uKA Sun, 21 Nov 21 12:00:10 +0900 アンケート調査、何人に取れば充分?【必要サンプル数の計算方法】 支持政党調査から社員・顧客の満足度調査まで、「アンケート調査」は重要な示唆をもたらしてくれる大事なリサーチです。 しかし、アンケート調査は正しく行わなければ無意味なものとなってしまいます。まずは「アンケート集計に必要な人数の決め方」を知りましょう。 【動画で紹介したツール】 https://analysis-navi.com/?p=641 #データサイエンス #データサイエンス 【1分統計学】分散・標準偏差ってなに? #Shorts https://ml.streamdb.net/timelines/v/WYTZeZSp5Qo Sun, 14 Nov 21 12:00:08 +0900 【1分統計学】分散・標準偏差ってなに? #Shorts 初のショート動画です。60秒で統計学を学びましょう!初回は「分散・標準偏差の使い方と計算方法」を扱います。 #統計学 #データサイエンス #データサイエンス Pythonで生存時間分析してみよう〜カプランマイヤー曲線の書き方、など〜 https://ml.streamdb.net/timelines/v/KOdFcIR2txg Sun, 07 Nov 21 12:00:05 +0900 Pythonで生存時間分析してみよう〜カプランマイヤー曲線の書き方、など〜 「イベントの発生時間」に焦点を当てたデータ分析手法である生存時間解析をPythonで実行してみましょう。 本動画ではカプランマイヤー推定量の描き方から、セミパラメトリックモデルにおける「Cox比例ハザードモデル」、そしてノンパラメトリックモデルにおける「ログランク検定」についてご紹介しています。 パラメトリックモデルについては最尤推定による統計モデリングの動画をご参照ください。 https://youtu.be/gTppKU8yZpU #データサイエンス #データサイエンス 統計学の超基本定理!「大数の法則」「中心極限定理」とは何か【数式なし】 https://ml.streamdb.net/timelines/v/HaV_8BWl37k Sun, 31 Oct 21 12:00:15 +0900 統計学の超基本定理!「大数の法則」「中心極限定理」とは何か【数式なし】 統計学を学ぶと序盤に登場する2つの重要定理「大数の法則」「中心極限定理」ですが、勘違いされている例も散見されます。 正しく理解し、活用するようにしましょう。 #データサイエンス #データサイエンス 【エクセル】YouTube登録者数の平均値は?中央値は? https://ml.streamdb.net/timelines/v/sfczfB1Lk88 Sun, 24 Oct 21 12:00:17 +0900 【エクセル】YouTube登録者数の平均値は?中央値は? YouTube登録者数の分布を調査し、そこから中央値や平均値などを推定してみます。あなたのチャンネルは上位何%に位置するでしょうか? 確率分布には対数正規分布を仮定し、Excelの関数とソルバー機能を使用してフィッティングを行なっています。 【Social Brade】 https://socialblade.com/ #データサイエンス #データサイエンス