Размер видео: 1280 X 720853 X 480640 X 360
Показать панель управления
Автовоспроизведение
Автоповтор
分かりやすすぎる。。無料でありがとうございます。
わかりやすい動画ありがとうございます。ベイズの公式の価値は大まかに理解できたのですが、ベイズ公式が活きる、そもそもの前提のシチュエーションについてまだ納得がいってないところがございます。例えば例で出してくださった、「サブスク継続者/離脱者に対する新サービス利用割合」を調査する状況ですが、そもそも新サービスの効果を見たいなら「新サービス利用者に対して継続か離脱かを調査」すればいいのではないでしょうか。この後者の調査ができず前者のやり方しかできない状況があまり思い浮かばずでして、自分のビジネスのどのような状況にベイズが活かせるかが具体的にイメージがつけることができていません。研修とパフォーマンスの例についても、パフォーマンスの上昇下降者の中の研修受講有無のデータを集める過程で、研修受講有無におけるパフォーマンス上昇ありなしのデータが集められているような気がして、わざわざベイズが必要にならないのではないかと思ってしまいました。もしかしたら自分のビジネスシーンではそういうケースがないだけで実際はよくあることなのかもしれませんが、例において、どのようにデータを集めたらベイズが必要なシチュエーションになるのかもう少し補足いただけると大変ありがたいです。わかりづらいご質問ですみません。。
もちろん無理に使う必要はなくて、「原因の違いに基づく結果の差」が測定可能であるならば、わざわざ使わなくてもOKです。ベイズの定理が必要になるのは、何か【自動的な手段】でデータが先に集まっている場合ですね。人が集める場合にわざわざ入り組んだアンケートを設計することはないわけで、原因と結果がひっくり返ったデータになるのは専ら「自動的に集まったデータ」や「既に集まっているデータ」の処理の場面においてです。また、ベイズの定理は、検査手法などの精度が予め分かっている状況で、その検査手法を実地で用いた場合の確率推定に使えます。●PCR検査の検出能力が分かっている。先日、街中で検査をして陽性が出た。このとき、本当に自分が感染している確率はどれくらいか。●センサーデバイスによる不良品の検出精度が事前に分かっている。このデバイスを実際に現場で使ったときに、どれくらいの確率で良品を不良と判定してしまうか、また逆に不良を良品と判定してしまう確率は。こういう状況でも使えます。この点については、この回の次の回「ウィルス陽性反応、あなたが本当に感染している確率は?(ベイズの公式)【やさしい統計学11】」で解説していますので、そちらもご覧いただけたら、理解が深まると思います!ruclips.net/video/jJXeWaKutBA/видео.html
@@yasabi-jp 6か月前の動画へのコメントにも関わらず、大変丁寧なご返信ありがとうございます!非常にクリアになりました!この動画きっかけにベイズ勉強始めているのですが、かなり奥深そうなので引き続き学びつつ、実ビジネスにも活用していけるようチャレンジします!他の動画も楽しみにしております!
@@jojotata929 ベイズは現代のAIの仕組みの基本になっているものなので、その原理と、ある程度の応用ができるようになっていて損はないです。実際のところ、ベイズの定理はもっぱら「ベイズ更新」という繰り返しの試行による精度の改善に使われます。ベイズ更新が腹落ちできると、なるほど凄い手法だ、たしかにこれがAIの中核技術だ、と理解できるので、ぜひベイズ更新についても深めてみてください!(↓が私のベイズ更新の解説動画です。)1回の検査では信用できない。では何回検査すればよい?ベイズ更新【やさしい統計学12】ruclips.net/video/6MAu12ask3Q/видео.html
難しい内容なのでもうちょっと解説します。(いさむださんのご質問を受けて、解説をもう少し充実させることにしました。いさむださん、有難うございます。)●日頃から、継続率は0.9なので、今回もそうであろうという前提からスタートする。【ここがポイント】この数字は、仮置きの前提、というのがポイント。新サービス導入後の、実際の継続率とは違うかもしれないのです。というより、実際の数字が求まっていれば、わざわざこんな計算をしなくてよいわけなので、実際の数字を求めていくためのスタート地点の【仮置き】として、従前の0.9という数字を使う。●今期はまだ何人離脱するかは分からないが、さしあたり、現時点で継続しているひとと、離脱した人に対して行った新サービスの利用割合調査からは、以下のことが分かっている。サブスク継続者の新サービス利用割合 0.7 : 0.3 サブスク離脱者の新サービス利用割合 0.5 : 0.5●もし、今期も【従来と同様に0.9の割合で継続する】としたら、このように計算できる。サブスク継続者は全体の0.9と仮置きするならば、サブスク継続者のうちで新サービスを利用した人が、全体に占める割合は 0.7 × 0.9 = 0.63サブスク継続者のうちで新サービスを利用なかった人が、全体に占める割合は 0.3 × 0.9 = 0.27サブスク離脱者を全体の0.1と仮置きするならば、サブスク離脱者で新サービスを利用した人は、全体のうち 0.5 × 0.1 = 0.05サブスク離脱者で新サービスを利用しなかった人は、全体のうち 0.5 × 0.1 = 0.05●かくして、全体に占める割合は以下のように求まる。 新サービス利用者 : 未利用者サブスク継続者 0.63 : 0.27サブスク離脱者 0.05 : 0.05●ベイズの公式とは結局、この全体割合をタテに計算し直すこと意味しています。新サービス利用者のうち、サブスク継続者が0.63人。離脱者が0.05。だとすると、新サービス利用者の継続率は、0.63÷ (0.63+0.05) = 0.926。仮におおよそ従来どおりの継続率だったとするなら、新サービス利用で継続率は確かに改善する。新サービス未利用者のうち、サブスク継続者は0.27。離脱者は0.05。したがって、新サービス未利用者の継続率は、0.27 ÷ (0.27+0.05) = 0.843。仮に従来通りの継続率だったとするなら、新サービス未利用者のうちで継続者の割合は少なくなるわけです。●元の、0.9の継続者と0.1の離脱者を、新サービス利用者と未利用者に配分し直しているわけですね。片方の確率が高まる分、もう片方は減るわけです。その理由はまさしく【従来通りに全体の継続率が0.9であり続けるならば、という前提】にあります。”従来通りの0.9の継続率であるとするならば、新サービス利用者のほうにサブスク継続をする人が多く集まる分、新サービス未利用者のほうはサブスク離脱をする人の割合が相対的に多くなる”わけです。「事前の確率0.9を使う」というのが、結構、強めの前提だということが、ここで分かるでしょう。ですけれども、それ以外に、ここで確率を計算するために使える情報がないわけで、これに依拠するのです。そしてまた、ベイズの公式の強みも、ここにあるのです。過去の情報(物事が起こる前の、事前の確率)を使って、未知なる今のリアル(ものごとが起こった、事後の確率)を推定できる。私達は、新サービス導入がどれだけのサブスク継続効果をもたらすのか、未知だったわけですが、既存の情報から、新サービスを利用した場合は継続率92.6%、未利用の場合は84.3%との値をひとまず得ることができるわけです。そして、時計の針は戻らない。新サービスを世に送り出した私達がいま直面しているのは、この新たな確率です(0.926と0.843)。今度は、これが前提条件となります。ベイズの公式とは、こうして過去の前提条件(事前確率という言い方をします)を使いながら、観察された諸条件を用いて、その前提条件を更新していくことで、今のリアルに接近していく手法です。
@中川先生のやさしいビジネス研究 解りやすい解説ありがとうございます。おかげで理解が深まりました。新規ビジネスで知見がない場合や、「重要なKPIは判ったけど、過去の実績データが無い!」というときにも使えそうですが、その際の事前確率は「とりあえず50%とする」という方法でも機能するのでしょうか?
@@blackmuto3644 はい、統計学者もその方法を採用することが多いです!とりあえず50%でスタートしても、10回20回を経るころには、もうそれっぽい確率が出てくることが知られています!
説明動画ありがとうございます。同じ要領で、新サービス未利用側のサブスク継続率を計算すると0.84になり、従来の継続率0.9より低下しました。未利用側が0.9のままであれば、腹落ちするのですが、今回の計算は単純に0.9を分け合っただけの、見せかけの効果算出のようにも思えます。どのように解釈すれば良いのか悩んでいます。
めちゃくちゃ大切なご質問だと思います。全力解説です。まずは、ばっちり復習的にご自身で計算に取り組んでいただいて、どうも有難うございます!第一には、計算が合っていることをお伝えします。仰る通り、新サービス未利用時の継続率は0.84となります。これを、どう解釈するかがポイントですね。理解するためのカギは、「素直にその数字の通りに解釈すること」です。新サービスを導入する前。サブスク継続率は90%だった。新サービス導入後。利用者のサブスク継続率は92%。未利用者のサブスク継続率は84%。嘘偽りも数字のマジックもなく、素直に、この数字の通りなのです。新サービス導入後は、もう、良くも悪くも、元には戻らない。新サービスを利用してくれるなら継続してくれやすくなるけど、新サービスを利用してもらえないなら、継続してくれなくなる確率が、高まってしまっている。のです。いさむださんが引っかかっているのは、その【因果関係】なのだろうと拝察します。もともとサブスク継続意思が低い人が、新サービスも利用しなかっただけなんじゃないの(逆に、もともと継続意思がある人は、当たり前のように新サービスも利用しているだけなんじゃないの)、という問題意識かな、と推察します。結論は、「その通りかもしれない」です。より正しくは【どういう因果が働いて、こういう継続率になったかまでは、分からない】ですね。残念ながら統計だけでは、そこまではわからない。で、この結果を読み解くポイントは、【とはいえもう、良くも悪くも、新サービス導入前には、戻らない】という点です。もはや以前の「継続率90%」には戻せないのです。私達は新サービスを世に出してしまったし、お客様もその新サービスを見てしまった。なので、ビジネスをめぐる各種確率は【変わってしまった】のです。「新サービス利用なら継続率92%、新サービス未利用なら継続率84%」になってしまったのです。この考え方を「ベイズ更新」と言います。時計はもう戻らない。事前の確率はもはやここで意味をなさないものになっており、事後の確率だけが、私たちの前に存在することになります。前向きに捉えれば、ともかくも新サービスを使う人はサブスク継続率を高めているわけですから、今後も積極展開をしていくべし、ということになります。後ろ向きに捉えれば、新サービスを使わない人の継続率は84%となってしまったのも事実なのです。「新サービスがあるにもかかわらず、新サービスを使わない人は、離脱しやすくなっている」わけです。こちらにも、何らかのテコ入れをしないといけないということになります。****最後に追記です。ここでお見せしたのは、特に何も考えずに中川が勝手につくった架空の数値例ですから、実際のビジネスではここまで極端に数字が下がることは、なかなか無いとは思います!もう少し、現実的な数字になると思いますので、ご安心ください。
「疑問を解決していく」のがこのチャンネルの基本主旨ですから、納得がいくまで、いくらでもご質問ください!また、ここは難しいところだよな…と私も思っていますので、実は来週もう1回「ベイズの公式復習」を、そして再来週にはここで紹介した「ベイズ更新」の説明へと進んでいきます。来週は、同じ問題を「PCR検査が陽性だったとして、本当に感染している確率は何%か」で解説します。すこし待っていただくことにはなりますが、そちらも参照して、理解を深めて頂けたら幸いです。
私は以下のように理解しました。この事例では、新サービスの利用有/無と、サブスクの継続/脱退の割合がキリのいい数値になっていて、これは中川先生が例として設定された数値である。もし実際にこのサブスクを運営していたとすると、このようなキリのいい数値にはならず、それこそ、「新サービス未利用時の継続率」が約0.9となるような割合の数値になる(はず)。つまり、「例として計算しやすい割合を設定すると、一部直観に反する結果が出てきた」。もちろん、現実のビジネスは複雑ですから、今回の例と同じデータが出てくる場合もあるかと思いますが、そのときは中川先生が上に書かれたように解釈するのだと思います。
11:58あたり、頭がこんがらたってきます・・。そもそもPという記号の意味がわからない状態で、PABとかPBとかいうので、そこでこの無機質な記号を頭の中で意味あるものに変換する作業を強いられ、ナレーションに立ち遅れてしまう(ということがわかった)。これは中川先生の問題ではなく、pとかBとか(しかも韻まで同じで紛らわしい)で表現した人の問題。というわけでもう一度じっくり考えようと思います。というわけで、この動画はよくわからなかったです。ベイス統計自体を学んでみようとは思います。
分かりやすすぎる。。無料でありがとうございます。
わかりやすい動画ありがとうございます。
ベイズの公式の価値は大まかに理解できたのですが、ベイズ公式が活きる、そもそもの前提のシチュエーションについてまだ納得がいってないところがございます。
例えば例で出してくださった、「サブスク継続者/離脱者に対する新サービス利用割合」を調査する状況ですが、そもそも新サービスの効果を見たいなら「新サービス利用者に対して継続か離脱かを調査」すればいいのではないでしょうか。この後者の調査ができず前者のやり方しかできない状況があまり思い浮かばずでして、自分のビジネスのどのような状況にベイズが活かせるかが具体的にイメージがつけることができていません。研修とパフォーマンスの例についても、パフォーマンスの上昇下降者の中の研修受講有無のデータを集める過程で、研修受講有無におけるパフォーマンス上昇ありなしのデータが集められているような気がして、わざわざベイズが必要にならないのではないかと思ってしまいました。
もしかしたら自分のビジネスシーンではそういうケースがないだけで実際はよくあることなのかもしれませんが、例において、どのようにデータを集めたらベイズが必要なシチュエーションになるのかもう少し補足いただけると大変ありがたいです。
わかりづらいご質問ですみません。。
もちろん無理に使う必要はなくて、「原因の違いに基づく結果の差」が測定可能であるならば、わざわざ使わなくてもOKです。
ベイズの定理が必要になるのは、何か【自動的な手段】でデータが先に集まっている場合ですね。人が集める場合にわざわざ入り組んだアンケートを設計することはないわけで、原因と結果がひっくり返ったデータになるのは専ら「自動的に集まったデータ」や「既に集まっているデータ」の処理の場面においてです。
また、ベイズの定理は、検査手法などの精度が予め分かっている状況で、その検査手法を実地で用いた場合の確率推定に使えます。
●PCR検査の検出能力が分かっている。先日、街中で検査をして陽性が出た。このとき、本当に自分が感染している確率はどれくらいか。
●センサーデバイスによる不良品の検出精度が事前に分かっている。このデバイスを実際に現場で使ったときに、どれくらいの確率で良品を不良と判定してしまうか、また逆に不良を良品と判定してしまう確率は。
こういう状況でも使えます。この点については、この回の次の回「ウィルス陽性反応、あなたが本当に感染している確率は?(ベイズの公式)【やさしい統計学11】」で解説していますので、そちらもご覧いただけたら、理解が深まると思います!
ruclips.net/video/jJXeWaKutBA/видео.html
@@yasabi-jp 6か月前の動画へのコメントにも関わらず、大変丁寧なご返信ありがとうございます!
非常にクリアになりました!この動画きっかけにベイズ勉強始めているのですが、かなり奥深そうなので引き続き学びつつ、実ビジネスにも活用していけるようチャレンジします!他の動画も楽しみにしております!
@@jojotata929 ベイズは現代のAIの仕組みの基本になっているものなので、その原理と、ある程度の応用ができるようになっていて損はないです。
実際のところ、ベイズの定理はもっぱら「ベイズ更新」という繰り返しの試行による精度の改善に使われます。
ベイズ更新が腹落ちできると、なるほど凄い手法だ、たしかにこれがAIの中核技術だ、と理解できるので、ぜひベイズ更新についても深めてみてください!(↓が私のベイズ更新の解説動画です。)
1回の検査では信用できない。では何回検査すればよい?ベイズ更新【やさしい統計学12】
ruclips.net/video/6MAu12ask3Q/видео.html
難しい内容なのでもうちょっと解説します。(いさむださんのご質問を受けて、解説をもう少し充実させることにしました。いさむださん、有難うございます。)
●日頃から、継続率は0.9なので、今回もそうであろうという前提からスタートする。
【ここがポイント】この数字は、仮置きの前提、というのがポイント。新サービス導入後の、実際の継続率とは違うかもしれないのです。というより、実際の数字が求まっていれば、わざわざこんな計算をしなくてよいわけなので、実際の数字を求めていくためのスタート地点の【仮置き】として、従前の0.9という数字を使う。
●今期はまだ何人離脱するかは分からないが、さしあたり、現時点で継続しているひとと、離脱した人に対して行った新サービスの利用割合調査からは、以下のことが分かっている。
サブスク継続者の新サービス利用割合 0.7 : 0.3
サブスク離脱者の新サービス利用割合 0.5 : 0.5
●もし、今期も【従来と同様に0.9の割合で継続する】としたら、このように計算できる。
サブスク継続者は全体の0.9と仮置きするならば、
サブスク継続者のうちで新サービスを利用した人が、全体に占める割合は 0.7 × 0.9 = 0.63
サブスク継続者のうちで新サービスを利用なかった人が、全体に占める割合は 0.3 × 0.9 = 0.27
サブスク離脱者を全体の0.1と仮置きするならば、
サブスク離脱者で新サービスを利用した人は、全体のうち 0.5 × 0.1 = 0.05
サブスク離脱者で新サービスを利用しなかった人は、全体のうち 0.5 × 0.1 = 0.05
●かくして、全体に占める割合は以下のように求まる。
新サービス利用者 : 未利用者
サブスク継続者 0.63 : 0.27
サブスク離脱者 0.05 : 0.05
●ベイズの公式とは結局、この全体割合をタテに計算し直すこと意味しています。
新サービス利用者のうち、サブスク継続者が0.63人。離脱者が0.05。
だとすると、新サービス利用者の継続率は、0.63÷ (0.63+0.05) = 0.926。
仮におおよそ従来どおりの継続率だったとするなら、新サービス利用で継続率は確かに改善する。
新サービス未利用者のうち、サブスク継続者は0.27。離脱者は0.05。
したがって、新サービス未利用者の継続率は、0.27 ÷ (0.27+0.05) = 0.843。
仮に従来通りの継続率だったとするなら、新サービス未利用者のうちで継続者の割合は少なくなるわけです。
●元の、0.9の継続者と0.1の離脱者を、新サービス利用者と未利用者に配分し直しているわけですね。
片方の確率が高まる分、もう片方は減るわけです。その理由はまさしく【従来通りに全体の継続率が0.9であり続けるならば、という前提】にあります。
”従来通りの0.9の継続率であるとするならば、
新サービス利用者のほうにサブスク継続をする人が多く集まる分、
新サービス未利用者のほうはサブスク離脱をする人の割合が相対的に多くなる”
わけです。「事前の確率0.9を使う」というのが、結構、強めの前提だということが、ここで分かるでしょう。ですけれども、それ以外に、ここで確率を計算するために使える情報がないわけで、これに依拠するのです。
そしてまた、ベイズの公式の強みも、ここにあるのです。過去の情報(物事が起こる前の、事前の確率)を使って、未知なる今のリアル(ものごとが起こった、事後の確率)を推定できる。
私達は、新サービス導入がどれだけのサブスク継続効果をもたらすのか、未知だったわけですが、既存の情報から、新サービスを利用した場合は継続率92.6%、未利用の場合は84.3%との値をひとまず得ることができるわけです。
そして、時計の針は戻らない。新サービスを世に送り出した私達がいま直面しているのは、この新たな確率です(0.926と0.843)。今度は、これが前提条件となります。ベイズの公式とは、こうして過去の前提条件(事前確率という言い方をします)を使いながら、観察された諸条件を用いて、その前提条件を更新していくことで、今のリアルに接近していく手法です。
@中川先生のやさしいビジネス研究
解りやすい解説ありがとうございます。おかげで理解が深まりました。
新規ビジネスで知見がない場合や、「重要なKPIは判ったけど、過去の実績データが無い!」というときにも使えそうですが、
その際の事前確率は「とりあえず50%とする」という方法でも機能するのでしょうか?
@@blackmuto3644 はい、統計学者もその方法を採用することが多いです!とりあえず50%でスタートしても、10回20回を経るころには、もうそれっぽい確率が出てくることが知られています!
説明動画ありがとうございます。
同じ要領で、新サービス未利用側のサブスク継続率を計算すると0.84になり、従来の継続率0.9より低下しました。
未利用側が0.9のままであれば、腹落ちするのですが、今回の計算は単純に0.9を分け合っただけの、見せかけの効果算出のようにも思えます。
どのように解釈すれば良いのか悩んでいます。
めちゃくちゃ大切なご質問だと思います。全力解説です。
まずは、ばっちり復習的にご自身で計算に取り組んでいただいて、どうも有難うございます!第一には、計算が合っていることをお伝えします。仰る通り、新サービス未利用時の継続率は0.84となります。
これを、どう解釈するかがポイントですね。
理解するためのカギは、「素直にその数字の通りに解釈すること」です。
新サービスを導入する前。
サブスク継続率は90%だった。
新サービス導入後。
利用者のサブスク継続率は92%。
未利用者のサブスク継続率は84%。
嘘偽りも数字のマジックもなく、素直に、この数字の通りなのです。新サービス導入後は、もう、良くも悪くも、元には戻らない。新サービスを利用してくれるなら継続してくれやすくなるけど、新サービスを利用してもらえないなら、継続してくれなくなる確率が、高まってしまっている。のです。
いさむださんが引っかかっているのは、その【因果関係】なのだろうと拝察します。もともとサブスク継続意思が低い人が、新サービスも利用しなかっただけなんじゃないの(逆に、もともと継続意思がある人は、当たり前のように新サービスも利用しているだけなんじゃないの)、という問題意識かな、と推察します。
結論は、「その通りかもしれない」です。より正しくは【どういう因果が働いて、こういう継続率になったかまでは、分からない】ですね。残念ながら統計だけでは、そこまではわからない。
で、この結果を読み解くポイントは、【とはいえもう、良くも悪くも、新サービス導入前には、戻らない】という点です。
もはや以前の「継続率90%」には戻せないのです。私達は新サービスを世に出してしまったし、お客様もその新サービスを見てしまった。なので、ビジネスをめぐる各種確率は【変わってしまった】のです。「新サービス利用なら継続率92%、新サービス未利用なら継続率84%」になってしまったのです。
この考え方を「ベイズ更新」と言います。時計はもう戻らない。事前の確率はもはやここで意味をなさないものになっており、事後の確率だけが、私たちの前に存在することになります。
前向きに捉えれば、ともかくも新サービスを使う人はサブスク継続率を高めているわけですから、今後も積極展開をしていくべし、ということになります。
後ろ向きに捉えれば、新サービスを使わない人の継続率は84%となってしまったのも事実なのです。「新サービスがあるにもかかわらず、新サービスを使わない人は、離脱しやすくなっている」わけです。こちらにも、何らかのテコ入れをしないといけないということになります。
****
最後に追記です。ここでお見せしたのは、特に何も考えずに中川が勝手につくった架空の数値例ですから、実際のビジネスではここまで極端に数字が下がることは、なかなか無いとは思います!もう少し、現実的な数字になると思いますので、ご安心ください。
「疑問を解決していく」のがこのチャンネルの基本主旨ですから、納得がいくまで、いくらでもご質問ください!
また、ここは難しいところだよな…と私も思っていますので、実は来週もう1回「ベイズの公式復習」を、そして再来週にはここで紹介した「ベイズ更新」の説明へと進んでいきます。
来週は、同じ問題を「PCR検査が陽性だったとして、本当に感染している確率は何%か」で解説します。すこし待っていただくことにはなりますが、そちらも参照して、理解を深めて頂けたら幸いです。
私は以下のように理解しました。
この事例では、新サービスの利用有/無と、サブスクの継続/脱退の割合がキリのいい数値になっていて、
これは中川先生が例として設定された数値である。
もし実際にこのサブスクを運営していたとすると、このようなキリのいい数値にはならず、
それこそ、「新サービス未利用時の継続率」が約0.9となるような割合の数値になる(はず)。
つまり、「例として計算しやすい割合を設定すると、一部直観に反する結果が出てきた」。
もちろん、現実のビジネスは複雑ですから、今回の例と同じデータが出てくる場合もあるかと思いますが、
そのときは中川先生が上に書かれたように解釈するのだと思います。
11:58あたり、頭がこんがらたってきます・・。そもそもPという記号の意味がわからない状態で、PABとかPBとかいうので、そこでこの無機質な記号を頭の中で意味あるものに変換する作業を強いられ、ナレーションに立ち遅れてしまう(ということがわかった)。これは中川先生の問題ではなく、pとかBとか(しかも韻まで同じで紛らわしい)で表現した人の問題。というわけでもう一度じっくり考えようと思います。というわけで、この動画はよくわからなかったです。ベイス統計自体を学んでみようとは思います。