【解説】95%信頼区間とは?その限界と注意点

Поделиться
HTML-код
  • Опубликовано: 14 мар 2022
  • 医学論文において結果の値と合わせて表記されることが多い”95%信頼区間”。
    その意味や基本的な算出方法,解釈の注意点について平易に解説します。
    なお本動画は「標準誤差」の知識を前提としています。そちらの解説動画も見て頂けたら嬉しいです ( • 【解説】標準誤差とは? 標準偏差との違い・使い分け )
    またサブグループ解析で言及した「多重検定」の問題についてはこちらをご覧ください。
    ▶「多重検定」解説動画: • 【解説】多重検定の問題とは | 仮説生成と仮説検証
    本チャンネル動画 第8作目です。
    ■目次
    00:15 信頼区間と解釈の誤解
    01:12 今回の結論
    01:32 今回の内容
    01:43 前回の復習 | 推測統計
    02:23 前回の復習|標本平均
    02:58 前回の復習|中心極限定理
    03:34 標本平均の分布
    04:15 区間推定とは
    05:25 信頼区間と信頼係数とは
    06:16 95%信頼区間とは
    07:39 前半のまとめ
    08:10 95%信頼区間の注意点
    08:29 ①95%は「真の値を含む確率」ではない
    10:06 ②ランダム抽出でなければ無意味
    11:31 ③サンプルサイズで区間が決まる
    12:14 有意水準との関係
    14:30 後半のまとめ
    14:50 実際の論文の例
    16:39 今回の結論
    ■スキマル
    「スキマでマルっと医療統計」は、できるだけ分かりやすく、短い時間で医療統計の勘所を解説していくチャンネルです。医学生,研修医,臨床医,看護師,薬剤師,リハビリスタッフ,医療系ニュース記者 etc...…医学文献に関わる皆様の学習ハードルを少しでも下げたい、みんなで一緒にリテラシーを高めていきたい、という気持ちで運営しています。
    ■チャンネル登録はこちらから
    / @sukimaru-stats
    ■このチャンネルを作っている人
    市中病院勤務、内科医2人で運営しています。
    ブログやtwitterはこちら。
    ◇blog
    🧠脳内ライブラリアン
    nounai-librarian.com
    🍤エビカツ横丁
    evineko.com/
    ◇twitter
    👴統計おじさん
    / medibook3
    👵エビデンスおばさん
    / evidenceobasan

Комментарии • 19

  • @8083tt
    @8083tt 8 месяцев назад +1

    お疲れ様です。
    動画を拝見しました。構成が非常にわかりやすかったです。
    これからも有益な情報をよろしくお願いします。

  • @user-no1nx2em5e
    @user-no1nx2em5e 8 месяцев назад +1

    こんにちは。
    今年度から本腰を入れて医療研究するために色々な情報を集めており、スキマルさんの動画に行きつきました!
    初学でもわかりやすく丁寧なレクチャーで大変勉強になっております!(´;Д;`)
    私はコメディカルスタッフですが通勤の運転中にyoutubeでヒアリングしつつ耳から学習をしている段階です!
    動画のクオリティも高いので、どんどん統計、研究に関する動画アップをお待ちしております!
    個人的にはテーマ選択からのストーリー作りに関する思考過程なども教えて頂けると大変ありがたいので、是非
    次の動画のテーマ選考に加えて頂けたら幸いです!ヽ(*´∀`)

  • @Mr.G1999
    @Mr.G1999 6 месяцев назад +2

    高校生に数学を教えている者で医療とは無関係なのですが、高校数学Bで履修する確率統計の他の全ての動画よりすんなり理解することができました。
    ありがとうございました。

    • @sukimaru-stats
      @sukimaru-stats  5 месяцев назад +1

      教職の方に見ていただけるとは驚きです。大変有難うございます。医療のみならず統計学は今や幅広い分野に関連していますので交流を深めていけると嬉しいです。またどうぞよろしくお願いいたします。

  • @ParaGate999
    @ParaGate999 2 года назад +2

    区間推定とサンプルサイズ設計を調べていたら、同じ日にスキマルさんとエビカツさんに出会いました。お二人とも超真剣でしかもホンネで話して下さっているのでファンになりました。
    そこでお二人にお願いがあります。現場では母分散未知の場合がほとんどです。その場合、サンプルサイズ設計しろと言われると、未知数2つで方程式1つという無理ゲーじゃね状態になります。永田本では、σの期待値を使う事にしていて、現場の解決策になっていません。これについて、現場では実はこうしている、といったホンネの解説をお願いしたいのですが、チャレンジしてみて頂けないでしょうか?

    • @sukimaru-stats
      @sukimaru-stats  2 года назад +2

      嬉しいコメントありがとうございます!今後も応援いただけますと幸いです。
      症例数設計に関しましては,先行研究(パイロット試験や第1,2相試験)の結果とその標準偏差をもとに期待効果を設定して計算しているケースが多いのではないかと思います。つまりご質問のσについては過去データを参照してある程度手探り的に設定しているのではないでしょうか。多くの臨床研究protocolのsample size calculationではそうした経緯が記載されているように思います。ただ私たち自身は一論文読者に過ぎず実際の臨床試験での運用に詳しいわけではありませんので,SASなどを用いた個別具体的な設計については詳しい教室にお尋ねいただければ幸甚です💦歯切れの悪い回答で申し訳ございません🙇

  • @JohnSmith-dp4kt
    @JohnSmith-dp4kt 2 года назад +2

    9:35 よく見かけるこの100個中95個云々の説明と箱ひげチックな図ですが「100個中95個が当たり(真値を含む)なら,そこから無作為抽出した1個が当たりである確率は0.95である」という謬論に対抗するには弱い気がします.

    • @sukimaru-stats
      @sukimaru-stats  2 года назад +2

      コメントありがとうございます。おっしゃる通りなかなか難しい話題かと思います。ご指摘いただいている「100回行った中で無作為に抽出したものが真の値を含む確率は95%である」というのは、“確率”ではなく抽出を繰り返したときに真の値を含む“割合“なのでむしろ間違っていないのではないかと思います。本動画で誤りとしているのは「1回の抽出で得られた95%信頼区間が真の値を含む確率が95%」という主張で、ある1回で得られた信頼区間の中に高い確率で真の値が含まれているという解釈です。偶然得られた(もしかしたらバイアスもあるかもしれない)1回の信頼区間の数値に過度な信頼を寄せてしまうことを懸念しています。

    • @JohnSmith-dp4kt
      @JohnSmith-dp4kt 2 года назад +1

      @@sukimaru-stats ご多忙のなか早速のご回答恐縮です.
      >むしろ間違っていないのではないかと思います。
      そうなのかも分かりませんが,私には 100 個それぞれの確率(確率密度)は一定ではないので,一様分布のような相対度数(~回中~回)=確率と思わせる表現はまずいように見えます.
      >懸念しています。
      そうですね.95%(0.95)というのは,確率変数が区間 |z-μ|≦1.96*σ/√{n} に属する確率(確率密度関数の積分)であり,信頼区間は,確率変数の実現値がその区間に属するような μ の集合に過ぎないという認識が大切かと思います.荒く言えば,高確率の集合のメンバーだからといって高確率なわけではない.といったところですね.
      私は統計については layman なので,2 つの条件
      ・μ∈母平均の信頼区間
      ・仮説「母平均=μ」は棄却されない
      は同値であるにもかかわらず,「有難がられ方」が随分違う印象を受けます.

    • @sukimaru-stats
      @sukimaru-stats  2 года назад +3

      ご返信ありがとうございます。
      >一様分布のような相対度数(〜回中〜回)=確率と思わせる表現はまずい
      言葉足らずで申し訳ありませんが、内容に関して「間違っていない」とは書いたものの、その場合の“確率“という表現はその通りで、誤りがあるように思います。
      >「有難がられ方」が随分違う
      これもおっしゃる通りです。言葉としてどうしても違った印象を与えてしまうように感じますので、信頼区間に対する認識を十分注意しなければいけないだろうと思います。
      コメントを見させていただく限り我々の方が素人なように思いますが💦、より幅広い方々に少しでも医療統計を身近に感じてもらえるような発信に努めます。今後ともご指導お願いいたします!

  • @slowbeatfoot
    @slowbeatfoot 2 года назад +2

    50の手習ですが勉強させて頂きますm(_ _)m

    • @sukimaru-stats
      @sukimaru-stats  2 года назад +1

      ありがとうございます!お付き合いよろしくお願いいたします!

  • @user-nu7ry1yr4p
    @user-nu7ry1yr4p 7 месяцев назад +1

    上限値,下限値の両方がマイナスになる場合はどのように解釈したらよろしいのでしようか?

    • @sukimaru-stats
      @sukimaru-stats  5 месяцев назад +3

      信頼区間がどちらもマイナスになることはありうると思いますので、そのまま解釈して問題ないのではないでしょうか。質問の意図を十分理解していなかったら申し訳ありません。

  • @user-do4sy6op2s
    @user-do4sy6op2s 24 дня назад

    真の値って何?

  • @35satori
    @35satori Год назад +3

    8:30ここからの説明が、どう誤解してるのかが分からないです。
    真の値を95%の確率で含む区間というのは誤解と説明されてるのに、続く説明では100回のうち母平均が95%含まれているというのがよく分かりません。
    手元の標本は確かに5%の確率で母平均を含んでいないかもしれないけど、95%の確率で母平均を含んでいると言えるのではないか?と思ってしまいます。

    • @_jg9415
      @_jg9415 6 месяцев назад +1

      違ったらすみません。
      感覚的には
      95%大当たりが出るくじを引けるのではなく、大当たりを含んだくじを95%引ける(100個あるくじから95個は大当たり入りくじ)イメージだと思いました。
      言い換えると
      95%母平均を含むのではなく、母平均を含む信頼区間を95%の精度で求めることができるという感じで理解しました。

    • @のいせせ-文理高校生
      @のいせせ-文理高校生 6 месяцев назад +1

      10:03 のところの図で考えると、1個目から100個目まで信頼区間がありますよね。例えば、その中の1つの区間として50.01≦m≦51.23のようなものがある調査によって得られたとします。
      その中に母分散があるかどうかは確率ではないのです。つまり、求められた数値によって示された1つの信頼区間も、母平均も共に確率変数でないため、単純に入っているかいないかだけです。

    • @sukimaru-stats
      @sukimaru-stats  5 месяцев назад +1

      コメント有難うございます。仰っていただいた通りで、母平均などのパラメータを含めた統計モデルを仮定したときに、設定された仮想的な標本から100回のサンプリングを行った場合おおよそ95回は母平均を含むデータが得られる、という話です。母平均などのパラメータは固定したものと設定しているため、95%の確率で信頼区間内に含まれるという表現は誤っていると考えています。