Hallo Lennart, bei 9:12 sagst du "für Sigma 'diesen Ausdruck' hier". Dieser Ausdruck ist doch genau die Formel für die empirische Varianz bzw. Standardabweichung?
Danke dir! Die meisten Leute bezeichnen mit "log" den Logarithmus zur Basis 10 und mit "ln" den Logarithmus zur Basis der eulerschen Zahl e. Hier in unserem Fall der ML-Schätzung ist es egal, welchen Logarithmus wir nehmen. Beide Logarithmen erfüllen die Rechenregeln, die wir uns hier zu Nutze machen.
Super hilfreich wie detailliert du die verdammten Umformungen zeigst! Frage: Bei 8:08 verstehe ich nicht warum -1/sigma als -n/sigma rausgezogen wird. Wo kommt da das n anstelle der 1 her? Wäre super wenn mir jemand das erklären könnte :)
Coole Frage, die ich dir gern beantworte. Kennst du den Umgang mit dem Summenzeichen? Der Ausdruck Summenzeichen i=1 bis n mit -1/sigma bedeutet, dass du den Term -1/sigma mit sich selbst addierst, bis du n erreichst. n ist hier der Endwert, bis wie lang wir dieses Spiel -1/sigma + (-1/sigma) + (-1/sigma)...spielen. Da die Stichprobengröße n nicht definiert, wir keine Zahl haben, nehmen wir einfach an, n sei unendlich groß (so hab ich es mir gemerkt). Was passiert? Richtig, der Zähler -1 wird bei jedem Additionsvorgang um -1 "erhöht". Also -1, dann -2, dann -3 usw. Der Nenner Sigma verändert sich nicht (Additionsregel für Brüche beachten). Wie lange machen wir das Additionsspiel? Auch richtig, bis wir n (unendlich) erreichen. Das ist aber sehr anstrengend, darum packen wir die unendlich große Zahl n einfach direkt in den Zähler, anstatt bis in alle Ewigkeit zu addieren. Denn das ist ja unser Ziel, wo wir hin wollen. :)
Hi Lennart, danke erstmal für die Aufstellung. Leider hab ich das nicht ganz mit dem Bruch ableiten kapiert. Muss man da nicht die Regel vom Ableiten von Brüchen anwenden? also u´*v - v´*u / v² . Ich versteh nicht ganz wie du von dem Term o^(-2) auf o³ kommst.
Ich Frage mich warum man bei stetigen Maximum Likelihood Funktionen Werte der Dichtefunktion der Verteilung verwendet. Denn Dichtefunktionswerte haben ja keine Aussagekraft bezüglich der Wahrschenlichkeit sondern nur das Integral der Dichtefunktion. Ich habe mir bisher nur den Zusammenhang erklären können, dass eben hohe Dichtefunktionswerte dafür sprechen, dass die unterstellten Parameter der Verteilung also zbs. µ oder λ auf die Verteilung der Stichprobe zutreffen. 1.) Aber was sagt mir der Wert der Dichtefunktion genau? Die nächste Sache ist dass man die Dichtefunktionswerte ja multipliziert. Bei diskreten macht das ja Sinn, da ich somit auf die Wahrscheinlichkeit komme. Die Punktwerte der Dichtefunktion sind dafür doch aber nicht geeignet. Wenn es also nur darum geht den maximalen wert zu finden um zu wissen welcher parameter der Verteilung zbs. µ oder λ nun zutrifft, könnte ich doch auch einfach die Dichtefunktionswerte summieren. 2.) Warum summiere ich die Werte bei einer stetigen Maximumlikelihood funktion nicht einfach?
Ich frage mich jedes Mal, wie kann ein 10 minütiges Video mir mehr beibringen als 2 ganze Vorlesungen + Übung. Warum machen die das alles schwerer als es ist 🙃
Du machst das gut, boss! Hab übermorgen mein Statistik-Examen und denke, dass ich dank deiner Hilfe durchkomme!
Dieses Video ist meine Rettung, vielen Dank!!!!
Perfektes Video! Keine weiteren Fragen aufgekommen ^^
Eeey diggi, richtig stark!
Super Video, schön deutlich und verständlich. Vielen Dank! :D
bei dir macht das Zuhören und Zugucken sogar Spaß😂👍
Du bist the special one bro danke
Hallo Lennart,
bei 9:12 sagst du "für Sigma 'diesen Ausdruck' hier".
Dieser Ausdruck ist doch genau die Formel für die empirische Varianz bzw. Standardabweichung?
Genau. Das zeigt uns doch sehr schön, dass die ML Methode einen sinnvollen Schätzer liefert.
Tolles Video
Hallo Lennart, danke für deine genialen Videos!
Gibt es hier einen Unterschied zwischen "log" und "ln"?
Danke dir! Die meisten Leute bezeichnen mit "log" den Logarithmus zur Basis 10 und mit "ln" den Logarithmus zur Basis der eulerschen Zahl e. Hier in unserem Fall der ML-Schätzung ist es egal, welchen Logarithmus wir nehmen. Beide Logarithmen erfüllen die Rechenregeln, die wir uns hier zu Nutze machen.
Super hilfreich wie detailliert du die verdammten Umformungen zeigst! Frage: Bei 8:08 verstehe ich nicht warum -1/sigma als -n/sigma rausgezogen wird. Wo kommt da das n anstelle der 1 her? Wäre super wenn mir jemand das erklären könnte :)
Coole Frage, die ich dir gern beantworte. Kennst du den Umgang mit dem Summenzeichen?
Der Ausdruck Summenzeichen i=1 bis n mit -1/sigma bedeutet, dass du den Term -1/sigma mit sich selbst addierst, bis du n erreichst. n ist hier der Endwert, bis wie lang wir dieses Spiel -1/sigma + (-1/sigma) + (-1/sigma)...spielen. Da die Stichprobengröße n nicht definiert, wir keine Zahl haben, nehmen wir einfach an, n sei unendlich groß (so hab ich es mir gemerkt). Was passiert? Richtig, der Zähler -1 wird bei jedem Additionsvorgang um -1 "erhöht". Also -1, dann -2, dann -3 usw. Der Nenner Sigma verändert sich nicht (Additionsregel für Brüche beachten). Wie lange machen wir das Additionsspiel? Auch richtig, bis wir n (unendlich) erreichen. Das ist aber sehr anstrengend, darum packen wir die unendlich große Zahl n einfach direkt in den Zähler, anstatt bis in alle Ewigkeit zu addieren. Denn das ist ja unser Ziel, wo wir hin wollen. :)
Ich habe ein Problem den letzten Schritt in der Aufgabe also 9:59 zu verstehen.. Setzt man die 8 ein weil es x8 also maximum Wert oder weshalb?
Weil es insgesamt 8 Werte gibt
danke danke
Top Video, alles sehr verständlich, bis auf, die Rechnung am Ende. Ich habe nicht ganz verstanden, wie man Werte aus einer Summe herausziehen kann...
Danke! An welcher Stelle genau?
nice
Hey,
Mega Video!
Ist hier eine Überprüfung der hinreichenden Bedingung nötig?
Braucht man eig
Super Video! kannst du bitte erklären welche Zahl du für xi am ende im Beispiel eingesetzt hast um auf 3.24 zu kommen?
@@statistik-mit-lennart Ok danke da stand ich auf dem schlauch. Machst du mal ein video zur Berechnung von Quantilen?
Hi Lennart, danke erstmal für die Aufstellung. Leider hab ich das nicht ganz mit dem Bruch ableiten kapiert. Muss man da nicht die Regel vom Ableiten von Brüchen anwenden? also u´*v - v´*u / v² . Ich versteh nicht ganz wie du von dem Term o^(-2) auf o³ kommst.
hab es selber gelöst. da die ableitung von o^(-2) gleich -2o^(-3) ist. der andere Term wird als Konstante gesehn.
Ich Frage mich warum man bei stetigen Maximum Likelihood Funktionen Werte der Dichtefunktion der Verteilung verwendet.
Denn Dichtefunktionswerte haben ja keine Aussagekraft bezüglich der Wahrschenlichkeit sondern nur das Integral der Dichtefunktion. Ich habe mir bisher nur den Zusammenhang erklären können, dass eben hohe Dichtefunktionswerte dafür sprechen, dass die unterstellten Parameter der Verteilung also zbs. µ oder λ auf die Verteilung der Stichprobe zutreffen.
1.)
Aber was sagt mir der Wert der Dichtefunktion genau?
Die nächste Sache ist dass man die Dichtefunktionswerte ja multipliziert.
Bei diskreten macht das ja Sinn, da ich somit auf die Wahrscheinlichkeit komme.
Die Punktwerte der Dichtefunktion sind dafür doch aber nicht geeignet. Wenn es also nur darum geht den maximalen wert zu finden um zu wissen welcher parameter der Verteilung zbs. µ oder λ nun zutrifft, könnte ich doch auch einfach die Dichtefunktionswerte summieren.
2.)
Warum summiere ich die Werte bei einer stetigen Maximumlikelihood funktion nicht einfach?
Ich frage mich jedes Mal, wie kann ein 10 minütiges Video mir mehr beibringen als 2 ganze Vorlesungen + Übung. Warum machen die das alles schwerer als es ist 🙃
bei gott
in 10 Minuten erklärt was eine halbe Vorlesung nicht geschafft hat. Danke