標準偏差のサンプルサイズがいくら必要なのか解説します。N=30揃えておけば良い理由がついに明らかに!

Поделиться
HTML-код
  • Опубликовано: 17 ноя 2024

Комментарии • 16

  • @熊野コミチ統計とお仕事チャン

    メンバー限定リンク
    ruclips.net/channel/UCxGR5omDLIXBu6yOrvOJ-2wjoin
    Udemy メーカーの現役技術者による研究開発のための統計学
    www.udemy.com/course/lcqlkbch/?referralCode=79ACEBEBD6763BAFDAB8
    note 統計学を活かす 解析しやすい数値化のノウハウ
    note.com/komichi_kumano/n/n7684d2ef6bd9

  • @oscosc7285
    @oscosc7285 3 года назад +3

    長年モヤモヤしていた疑問が晴れできました。ありがとうございます!

  • @Dr.Ks_Labo
    @Dr.Ks_Labo 3 года назад +3

    暗算レベルで試算してみます。
    平方和~χ2分布で,その期待値=df,分散=2df ですから,
    標本分散のt値のようなもの(標準誤差/期待値)を考えると,
    √(2df)/df=√(2/df)
    ここでdf≒N(正確にはN-1)なので30とすると概略1/4=0.25
    分布の非対称性とか無視して正規近似すると95%信頼区間は概略,
    期待値±0.5倍だから期待値の0.5倍~1.5倍つまり最大/最小≒3
    これは分散に対する試算だから標準偏差に換算すると√3≒1.7
    わりと熊野さんの計算と一致しますね。

  • @samrai2828
    @samrai2828 3 года назад +3

    つまりは、N=30だと、信頼区間比(95%区間の上限/下限)が1.7くらいなので、
    サンプルから計算した標準偏差が母標準偏差に対して±25%くらいの精度に収まるって理解でいいでしょうか?

  • @先生にごい
    @先生にごい 2 года назад +1

    いつも分かりやすい解説ありがとうございます。σ2乗の信頼区間を念頭に置いて、
    第1項と第3項の比をnに対して調べるとn30で1.7倍とかn50で1.5倍とかになる事は理解
    できました。ところが、スタートの不等号式を1項で割り算すると1<σ2乗/1項<3項/1項
    となります。カイ2乗分布から求めた比は、「σ2乗/1項」じゃないのかしらと悩んでいます。
    よろしければ少ししコメントいただくと大変ありがたいです。

    • @熊野コミチ統計とお仕事チャン
      @熊野コミチ統計とお仕事チャン  2 года назад

      すいません、ちょっと質問の意図が理解しきれていないので「σ2乗/1項じゃないかしら」に関して疑問に思われている部分を詳細に教えていただけないでしょうか。

    • @先生にごい
      @先生にごい 2 года назад

      丁寧に拾っていただきありがとうございます。
      ホワイトボードの上段の式(δカレット2乗/C2の2乗)<σ2乗<(δカレット2乗/C1の2乗)の3つ項を
      第1項の(δカレット2乗/C2の2乗)で割ると、1<σ2乗/(δカレット2乗/C1の2乗)<C2の2乗/C1の2乗と
      なります。 これで第3項もとにカイ2分布からの比を考えていくと、求めたいグラフが描けます。
      しかしながら、真ん中の項は、「σ2乗ではなく、σ2乗/(δカレット2乗/C1の2乗)」
      ではないのかしらと思われ悩んでおります。(平方根をとる事は悩みの本質でないので省略してます)

    • @先生にごい
      @先生にごい 2 года назад

      たびたびすいません。理解できたかも知れないです。
      σ2乗は、下限値<σ2乗<上限値。(式①)
      ここで、下限値上限値は、1回の実験につき、普遍分散とnに依存するカイ2乗分布で定まる数値。
      不等式①を下限値で割ると1<σ2乗/下限値<上限値/下限値=nによって決まるカイ2乗比の数値(式②)。
      式②の意味は、不等号の真ん中の式は、1より大きくnによって決まるカイ2乗比の数値より小さい。
      式②に下限値をかけて、
      下限値<σ2乗<(nによって決まるカイ2乗比の数値)×下限値。
      σ2乗は、下限値を基準にこの範囲にある。
      (平方根は省略)

  • @高橋亙-m3g
    @高橋亙-m3g Год назад +1

    製薬業の工場勤務で、1年単位で年次報告を作成しています。
    そのなかで管理図を作成していますが、古い品目は年に数ロットしか生産しません。
    社内標準では年間10ロットに満たない場合は過去の実績を含めて、10ロット以上で工程能力指数Cpkを算出することになっています。
    わりとCpkが1.0未満になることがあるので説明に苦労しています。
    標準偏差は少なくとも30くらいは必要、とありましたので、10ロット程度ではうまく評価できないのではないかと思いました。
    その前に、バッチ生産で年間数ロットしか生産しない品種はCpk判定する意味がないのではないかと思い始めています。

    • @熊野コミチ統計とお仕事チャン
      @熊野コミチ統計とお仕事チャン  Год назад

      年間跨いでも本当に安定していたらCpkも安定するという理屈なのでしょうね。
      特にCpkを下げる外れ値ロットが本年度だと結構胃が痛い状況かもですね。対策というか心構えとしては、希少ロットは作る際に過去ロットと合わせてCpk算出して外れるようだったらその場で是正というやり方しか無いのかなと。
      ただ年次報告書という形でCpk出させるって習慣は不健全な気がしますね。性質上絶対「なぜあの時ちゃんとしなかったのか」って議論に陥りがちなので。

    • @高橋亙-m3g
      @高橋亙-m3g Год назад +1

      @@熊野コミチ統計とお仕事チャン さま
      希少ロットは過去ロットと合わせてCpk判定する場合
      10ロットは少なすぎますよね?
      最低でも30ロット、ということになりますか?
      信頼精度を無視するならば10でも良いのかもしれませんが
      その結果、Cpk<1.0が頻発するならば意味がないので。

    • @熊野コミチ統計とお仕事チャン
      @熊野コミチ統計とお仕事チャン  Год назад

      まぁ少ないですね。こういう場合は工程能力指数の区間推定という手法も手です。
      ruclips.net/video/ljVJCceHgY4/видео.html

    • @高橋亙-m3g
      @高橋亙-m3g Год назад +1

      @@熊野コミチ統計とお仕事チャン さま
      残念
      視聴権限がありません^^;

    • @熊野コミチ統計とお仕事チャン
      @熊野コミチ統計とお仕事チャン  Год назад +1

      @@高橋亙-m3g スイマセンでした。
      こういう内容が他サイトにありましたのでご参考ください。
      phmuscle.com/2017/07/06/process_capability_interval_estimation/

  • @ryngs9925
    @ryngs9925 3 года назад

    いつも勉強させて頂いてます!
    グラフの説明部分で、「N=20だと最大と最小の差が2くらいあるから、1,5くらいになるN=30の方が良い」と仰られていたと思います。「最大と最小の差(信頼区間比?)」があまりよく分かっていないので、教えていただけないでしょうか?