なぜn-1で割るのか?がわかる!標本分散と不偏分散の違いと使い分けを徹底解説!

Поделиться
HTML-код
  • Опубликовано: 12 сен 2024
  • 今回は、標本分散と不偏分散の違いと、不偏分散はなぜ平方和をn-1で割って算出するのか?についてわかりやすく解説します。
    「分散を計算するなら、不偏分散を使うのが正解だ。」と誤解されがちですが、標本分散を使うべき場面と不偏分散を使うべき場面があり、ちゃんとした使い分けが重要なんですよ。
    QC検定のお勉強にもお役立てください。
    皆さまのお役に立てる動画配信をしていきますので、応援していただけると嬉しいです(^-^)
    =======================
    【関連動画】
    ▼中心極限定理。統計学で正規分布がよく出てくる理由のひとつがこれ!
      • 中心極限定理。統計学で正規分布がよく出てくる...
    ▼【試験対策】分散の公式で計算時間短縮![証明]
      • 【試験対策】分散の公式で計算時間短縮![証明]
    ▼不偏分散が本当に『不偏性』を持つのかシミュレーションで確かめてみた。
      • 不偏分散が本当に『不偏性』を持つのかシミュレ...
    =======================
    チャンネル登録はこちら
    ☞ / @datasciencelab.
    #QC検定1級成績優秀表彰者が解説します

Комментарии • 52

  • @gonzanankai2625
    @gonzanankai2625 2 года назад +7

    どの動画も簡潔で非常に分かりやすいです。今まで、公式や用語を何となく暗記していましたが、これでスッキリしました。また、例題があるので理解しやすいです。ありがとうございました。

    • @DataScienceLab.
      @DataScienceLab.  2 года назад

      コメントありがとうございます(^-^)
      こちらこそ、嬉しいコメントをありがとうございます!

  • @user-sb3gp3op1x
    @user-sb3gp3op1x 2 года назад +4

    なぜn-1で割るのか理解できていませんでしたが、ご説明のおかげでスッキリしました!ありがとうございます。引き継ぎ他の動画でも勉強させていただきます!

  • @三輪大先生
    @三輪大先生 Год назад +1

    高校数学や情報Ⅰを教えている塾講師です。今一つ納得できなかったところだったのですが、謎が解けました。
    素晴らしい動画です。ありがとうございます。

    • @DataScienceLab.
      @DataScienceLab.  Год назад +1

      コメントありがとうございます(^-^)
      お役にたてて嬉しく思います!

  • @こけし-h3g
    @こけし-h3g 7 дней назад

    あああああ…なるほど…めちゃくちゃ助かりました

  • @user-ib4db2qh1t
    @user-ib4db2qh1t 9 месяцев назад +2

    分かりやすかったです。ありがとうございます。

  • @user-qv5gw1zw7t
    @user-qv5gw1zw7t 7 месяцев назад +1

    わかりやすすぎる。本当にありがとうございます。

  • @user-pr8oz9zx5t
    @user-pr8oz9zx5t 2 года назад +4

    動画の5:09前後の「まとめ」の冒頭箇所(母分散と標本分散の大小比較)ですが、実際に計算してみると、標本分散の方が大きくなるケースがありました。
    (以下の計算根拠は、動画内にある数式を基に計算したものです。)
    例えば、母集団の要素として10個の数字{2,8,5,9,6,4,6,8,7,7}があるとします。当該母集団の平均は6.2、偏差平方和は39.6、分散は3.96となります。
    一方母集団から5つのサンプル{2,8,9,6,7}を抽出した場合、サンプルの平均は6.4、偏差平方和は29.2、分散は5.84となります。
    以上のことから、母分散≧標本平均とはならい場合がある気がするのですが、当方が何か勘違いして理解しているのであれば、是非ご教授くださいませ。
    よろしくお願いします。

    • @DataScienceLab.
      @DataScienceLab.  2 года назад +5

      コメントありがとうございます(^-^)
      そのとおりですね。
      低い確率で、標本が偏ってサンプリングされた場合は、標本分散のほうが大きくなる場合も確かにありますね。
      サンプリング→標本分散を計算する、を何度も繰り返した時に、それらの標本分散の平均は必ず母分散よりも小さくなります。
      よって、標本分散の『期待値』が必ず母分散よりも小さくなる、と説明するべきでした。
      ご指摘いただきありがとうございます!
      また、混乱させてしまい、申し訳ありませんでした(>-

    • @user-sm9ce1kk5r
      @user-sm9ce1kk5r Год назад +1

      あなたのおかげでひらめきました。ありがとうございます。

  • @qchan7
    @qchan7 2 года назад +1

    素晴らしい教材をありがとうございます!
    勉強になりました。

  • @user-cg3cu1gd7t
    @user-cg3cu1gd7t 2 месяца назад +1

    わかりやす過ぎて飛ぶ

  • @Fun-Fan6
    @Fun-Fan6 3 года назад +2

    他のチャンネルでも色々見てたけれど、やっと今意味がわかった!!!
    ありがとうございます!!
    自分メモ
    2:31
    3:45

    • @DataScienceLab.
      @DataScienceLab.  3 года назад +1

      お役に立ててよかったです(^-^)

  • @user-fy2hq2xg8o
    @user-fy2hq2xg8o Год назад +1

    わかりやすかった

  • @user-om2ec4lc3q
    @user-om2ec4lc3q Год назад +1

    わかりやすい動画ありがとうございます!最近勉強し始めたので初歩的な質問になってしまうのですが、標本平均の分散を足したら母分散に近づくのがなぜかよく分かりません。良かったら教えて貰えると幸いです。

    • @DataScienceLab.
      @DataScienceLab.  11 месяцев назад +1

      母集団からサンプリングした標本によって、母分散を推定したいという場面で、本来であれば、各データと母平均の差の二乗の総和を計算したいところですが、母平均が不明なので標本平均で置き換えたとします。
      この時、母平均はただひとつの決まった値であるのに対して、標本平均はサンプリングの度に異なる値となります(ばらつきを持ちます)。
      つまり、標本分散は母分散よりも過小にばらつきを見積もっていることになります。
      よって、その標本平均のばらつき分を補正してあげると辻褄が合うわけです。

  • @user-xq3xh7vn5x
    @user-xq3xh7vn5x Год назад +2

    わかりやすい動画ありがとうございます!
    初歩的な質問で申し訳ないのですが、Excelで標準偏差計算する時、大きく分けてSTDFV.PとSTDFV.Sがあり、前者は母標準偏差、後者は標本の標準偏差とありました。ですが、前者はnで割り、後者はn-1で計算されるようでした。動画の解説と逆な気がしたのですが、これはExcel特有なのでしょうか。

    • @DataScienceLab.
      @DataScienceLab.  Год назад +1

      "stdev.p"は"var.p"で計算した標本分散の平方根で計算されます。
      "stdev.s"は"var.s"で計算した不偏分散の平方根で計算されます。
      "var.p"は『引数を母集団全体とみなして、母集団の分散(標本分散)を返します』と説明があるかと思います。これは、10このデータで計算するなら、その10このデータ自体の分散を計算するということです。
      "var.s"は『標本に基づいて、母集団の分散の推定値(不偏分散)を返します』と説明があるかと思います。これは、10このデータで計算するなら、その10このデータを使って、10このデータをとってきた元の母集団の母分散の推定値を計算するということです。
      Excelの説明書きが少々ややこしいのですが、前者がnで割る標本分散、後者がn-1で割る不偏分散のことであり、動画の解説と同じです。

    • @user-xq3xh7vn5x
      @user-xq3xh7vn5x Год назад +1

      ありがとうございます!
      すいません、少し混乱しているので具体例で確認させていただきたいです…
      例えば、1ロット100個あるものから、10個を抜き取ってデータを取得した場合、
      1.10個そのものの標準偏差を算出する場合は、stdev.p
      2.10個のデータから母集団の標準偏差を推測した場合はstdev.s
      と捉えてよろしいでしょうか。

    • @DataScienceLab.
      @DataScienceLab.  Год назад +2

      概ねその理解で合ってます!
      正確には、不偏分散は、無限母集団の母分散の良い推定量です。
      有限母集団からサンプリングした標本で有限母集団の母分散を推定する際には『有限修正』が必要です。
      ※母集団が、1ロット(100個)であるという指定がある場合は、その母集団は有限母集団になります。

  • @user-ks6uj1nl8u
    @user-ks6uj1nl8u 2 года назад +2

    非常にわかりやすい解説有難うございます。
    不変分散と標本分散の違いを明確に説明している書籍を持っていなかったので大変助かりました。
    概要欄の中心極限定理の動画が閲覧できなくなっているので、恐縮ですが、再度、動画をアップしてくださいますようお願い致します。

    • @DataScienceLab.
      @DataScienceLab.  2 года назад +1

      コメントありがとうございます(^-^)
      申し訳ございません(>-

    • @user-ks6uj1nl8u
      @user-ks6uj1nl8u 2 года назад +1

      @@DataScienceLab. 様。
      有り難うございます。
      すみません。不変分散ではなく、不偏分散でした。

    • @DataScienceLab.
      @DataScienceLab.  2 года назад +1

      たいした間違いではないと思います(^-^)
      これは私の考えになりますが、学問として統計学を学ぶのであれば用語を正しく使うことが求められると思いますが、統計学を実務で使ってデータを価値に変換するために重要なのは『用語を正しく使うこと』≪『本質の理解』だと考えています!

  • @makio3922
    @makio3922 3 года назад +1

    めっちゃわかりやすすぎました!ありがとうございました!

    • @DataScienceLab.
      @DataScienceLab.  3 года назад +1

      コメントありがとうございます!
      お役に立ててうれしいです(^-^)

  • @tky4336
    @tky4336 2 года назад +2

    質問失礼します。
    (標本分散) 1/n Σ(x -xbar)^2

    (標本平均の分散) σ^2/n
    がなぜ (母分散)σ^2 になるのでしょうか?
    母分散の不偏推定量になるってだけで
    σ^2になる訳ではないのではないでしょうか?

    • @DataScienceLab.
      @DataScienceLab.  2 года назад +1

      解説に『期待値』が抜けています。
      標本分散の『期待値』+標本平均の分散=母分散、です。
      言葉足らずで申し訳ありませんでした(>_

  • @tky4336
    @tky4336 2 года назад +4

    統計学全くの初学者です
    質問失礼します
    3:07
    左辺(母分散)と右辺(標本分散)
    割る数がどちらもnという文字で表されていますが 中身は違いますよね?
    左辺のnは(母数)で右辺のnは(標本の大きさ)
    ですよね?

    • @tky4336
      @tky4336 2 года назад +1

      それとも同じでしょうか?

    • @DataScienceLab.
      @DataScienceLab.  2 года назад +2

      コメントありがとうございます!
      中身は違います。
      同じ『n』を使ってしまったのでわかりにくかったですね、すみません(>_

    • @YOUSUPERTERIO
      @YOUSUPERTERIO 8 месяцев назад

      ​@@DataScienceLab.
      主様、動画に感謝します。
      質問者の方と同じ疑問を持ったのですが、母と標準でサンプル数が異なるなら、4:59の通分はNGではないのでしょうか?

    • @YOUSUPERTERIO
      @YOUSUPERTERIO 8 месяцев назад

      ​@@DataScienceLab.
      すみません、勘違いでした。

  • @ph4746
    @ph4746 Год назад +2

    標本分散と標本平均の分散の違いがわからないです、、😭
    前者は母集団から1回だけn個のデータを取ってきて、後者は母集団からn個のデータを取ってくるのを?回やって、1回1回の平均の分散を求めている、という理解で合ってますでしょうか?👀

    • @DataScienceLab.
      @DataScienceLab.  Год назад +2

      標本分散は、単純にnこのデータで計算した分散(偏差の二乗の総和÷n)です。
      母集団からnこサンプリングして計算した標本平均Xbarは、サンプリングの度に異なりますが、そのXbarが従う分布の分散が、標本平均の分散です。

    • @ph4746
      @ph4746 Год назад +1

      ご説明くださりありがとうございます😊
      データサイエンスLab.さんのご返信の内容は理解できましたが、今度はその標本分散と標本平均の分散の和が母分散に近づく理由を教えていただけますでしょうか🙏
      なんとなくイメージはつくのですが加法性っぽいものが成り立つのかなぁと思いまして。。

    • @DataScienceLab.
      @DataScienceLab.  Год назад +2

      こちらの動画が参考になると思います!
      ▼不偏分散が本当に『不偏性』を持つのかシミュレーションで確かめてみた。
      ruclips.net/video/St5SximKYpg/видео.html

    • @ph4746
      @ph4746 Год назад +1

      @@DataScienceLab. ありがとうございます、見てみます!

  • @user-ot2dl6pb5u
    @user-ot2dl6pb5u 2 года назад +3

    分かりやすい解説動画をありがとうございます!
    もしよろしければ、式展開の際に、σ^2(1-1/n)がσ^2(n-1/n)に変換した理由をお教えいただければ幸いです!
    他の説明は理解できましたが、そこだけ気になりました!

    • @DataScienceLab.
      @DataScienceLab.  2 года назад +1

      コメントありがとうございます(^-^)
      右辺と左辺の1/nを相殺するためです!
      『1-1/n』だと1/nが消せませんが、『(n-1)/n』にすれば1/nを消せるからです。

    • @user-ot2dl6pb5u
      @user-ot2dl6pb5u 2 года назад +1

      @@DataScienceLab. こちらこそ、丁寧なご解説ありがとうございます!
      質問の仕方が曖昧ですみません...
      『1-1/n』をどうすれば、『(n-1)/n』に変換できるのか知りたいです!
      両辺n倍したら、『n-n/n』になると思いまして...

    • @DataScienceLab.
      @DataScienceLab.  2 года назад +1

      1-1/n = n/n - 1/n = (n-1)/n
      例えば『1-1/5』を計算する時に、1-1/5 = 5/5 - 1/5 = (5-1)/5 = 4/5 と計算しているのと同じ考え方です!

    • @user-ot2dl6pb5u
      @user-ot2dl6pb5u 2 года назад +1

      ​@@DataScienceLab. なるほど!おかげ様で理解できました!!
      他の動画もご覧させていただいて、分かりやすくて助かってます!
      ありがとうございます!!

    • @DataScienceLab.
      @DataScienceLab.  2 года назад +1

      それは良かったです(^-^)
      お役に立てて大変嬉しく思います!

  • @yuyakecoffee1970
    @yuyakecoffee1970 Год назад +1

    なるほどー

  • @kenjitakashima3035
    @kenjitakashima3035 2 года назад +1

    標本分散と不偏分散のアルファベット合っていますでしょうか?

    • @DataScienceLab.
      @DataScienceLab.  2 года назад +3

      統計学で用いられる各種記号は、文献によってまちまちで統一されていないので、お手持ちの参考書で使用されている記号に読み替えて理解していただければと思います!

  • @user-jd7mf8cl3y
    @user-jd7mf8cl3y Год назад +1

    標本分散 2.5じゃないの?

    • @DataScienceLab.
      @DataScienceLab.  Год назад +1

      標本分散は(偏差の二乗の総和÷データ数)で計算するので、10÷5で2です。
      ↓よかったらこちらの動画をチェックしてみてください。
      ▼なぜn-1で割るのか?がわかる!標本分散と不偏分散の違いと使い分けを徹底解説!
       ruclips.net/video/LE-sKjbMAA0/видео.html