Brutaler Ehrenmann! ohne deine SPSS Videos hätte ich meine Bachelorarbeit wohl nicht geschafft haha Du hast alles wirklich Top erklärt! Alle Schritte wirklich sehr gut nachvollziehbar und perfekt beschrieben. Weiter so!! Mad respect
Hut ab Björn wie viele Fragen du hier kostenlos beantwortest! Für ich bist du der RUclipsr 2020, da du mich mehr in meiner Bachelorthesis begleitet hast als mein eigentlicher Betreuer :) In idesem Sinn Alles Gute und mach weiterhin so klasse Videos, danke !
Hallo und danke für das tolle Video. Ich versuche mich gerade an einer Funktion, die mir die Wahrscheinlichkeit wiedergibt, dass ein Kunde kauft oder nicht (y) - n ≈ 1.000. Dazu nehme ich drei Variablen: Einmal eine für die Zahlungsbereitschaft der Kunden (x1), eine für die Wertigkeit des Produktes (x2) und eine für den Verkaufspreis (x3). Nun ist es so, dass wenn ich jede Variable einzeln per einfacher Regression untersuche, ich für Zahlungsbereitschaft und Wertigkeit sinnvolle Zusammenhänge zur Verkaufswahrscheinlichkeit erkennen kann (y steigt, wenn x1 oder x2 steigt). Nicht hingegen für den Preis x3 - da verläuft die Funktion fast waagerecht. Der Koeffizient b liegt also um die 0, die Konstante a bei 0,5. Das wird durch den vorhandenen Datensatz so dargestellt - gut und schön - dennoch muss die Konstante ≈ 1 sein, denn wenn der Preis 0 ist, wird der Kunde mit an Sicherheit grenzender Wahrscheinlichkeit kaufen. Das lässt sich im einfachen Modell mit einer Variablen auch erzwingen, in dem ich lediglich den Koeffizienten b schätze. Wie kann ich dies denn im Rahmen der logistischen Regression modellieren? Das Problem kommt dann auch auf wenn ich versuche, alle drei Variablen im Rahmen der logistischen Regression einzubinden. Nutze ich nur x1 und x2 für meine logistische Regression, bekomme ich durch die Anwendung der Maximum-Likelihood-Methode ein wunderbares Modell zu Stande, was die Wahrscheinlichkeiten korrekt abbildet. Nehme ich aber den Preis hinzu, erhalte ich (bislang) kein Modell, was die Wahrscheinlichkeiten korrekt wiedergibt. Es muss aber eine Abhängigkeit vom Preis existieren. Hast du einen Tipp, wie ich das Problem lösen kann?
Dankeschön! :-) Es wird in ein paar Wochen sicherlich noch ein weiteres Video zur binär logistischen Regression geben, wo es um ordinale und kategoriale Prädiktoren geht und auch >1 Prädiktor existiert. Viele Grüße, Björn.
Hallo, kann ich die OR wirklich so interpretieren?? Nach Best und Wolf (2010, S. 832; 2012; siehe auch Behnke 2015, S. 73-76) bieten die Effektkoeffizienten bzw. Odds-Ratios nur eine scheinbar einfachere und anschaulichere Interpretation als die Regressionskoeffizienten B (logit-Koeffizienten). Bei Odds-Ratios handelt es sich um Wahrscheinlichkeitsverhältnisse. Zwar werden die Effekte in ihrer Richtung korrekt bewertet, aber die Stärke der Effekte meist überschätzt. Ein Exp(B)-Koeffizient von 1,6 bedeutet nicht, dass Männer eine 1,6-mal höhere Wahrscheinlichkeit aufweisen zu rauchen. Vielmehr ist - abhängig von der Basiswahrscheinlichkeit - jedes relative Risiko möglich. Best und Wolf (2010, S. 832) argumentieren: „Wir raten daher von der Verwendung von eβ-Koeffizienten bzw. Odds-Ratios ab. Eine über die Effekt-Richtung hinausgehende Interpretation ist allein auf der Basis des Koeffizienten nicht möglich.“ Dieser Empfehlung wird an dieser Stelle gefolgt. Bei der Interpretation logistischer Regressionskoeffizienten wird dringend geraten, sich bei den Regressionskoeffizienten B auf die Interpretation der Vorzeichen zu beschränken. Alternativ können auch die Effektkoeffizienten bzw. Odds-Radios verwendet werden. Dabei deuten Werte kleiner als 1 auf eine geringere Chance, Werte größer auf 1 auf eine höhere Chance hin. Die absoluten Beträge der Regressionskoeffizienten bzw. der Effektkoeffizienten sollten allerdings nicht interpretiert werden. Wie siehst du das? MFG
Hey, ich bin Schritt für Schritt alles so durchgegangen und es hat auch alles bei mir gepasst. Leider haben meine Exp(b) alle merkwürdige Werte wie 4,434 oder 2,648 muss ich das Modell dann verwerfen? Ich kann ja schlecht behauptden das einer der unabhängigen Variablen 400% in Zusammenhang mit der abhängigen Variable steht. :-( würde mich über in kurzes feedback sehr freuen. LG, Ricarda
Hallo Ricarda, so hohe Odd's sind nichts ungewöhnliches. Es ist übrigens eine relative Wahrscheinlichkeit, das kommt nicht zu 100% deutlich heraus. Einfacher ist es mit den Odd's direkt zu argumentieren. 4,434 bedeutet eine 4 fach höhere Chance. Hier erkläre ich die Odds auch noch mal, allerdings bei einem kategorialen Prädiktor: ruclips.net/video/3w88xhE5DLk/видео.html Viele Grüße, Björn.
Danke für das Video! Ich habe folgende Frage: Ich möchte schauen, ob verschiedene Variablen einen Einfluss auf das Outcome (Rezidiv ja/ nein) haben. Wenn ich für jede einzelne Variable die binär logistische Regression rechne, kommen komplett andere Werte (andere Signifikanzen, Regressionskoeffizienten, ExpB) raus als wenn ich alle Variablen in einem Modell zusammen rechne. Kann ich den EInfluss der einzelnen Variablen auf das Outcome rechnen und berichten? Oder muss ich ein Modell mit allen Variablen zusammen erstellen? Gruß, Matthias
Hallo Matthias, gerne! Du rechnest immer das vollständige Modell, weil du in der Realität ja auch nicht nur den einzelnen Effekt isoliert betrachten kannst und die verschiedenen UV auch miteinander korrelieren. Faustregel also immer vollständig rechnen, weil es das realitätsnähere Modell ist. Viele Grüße, Björn.
Hi Björn! Vielen Dank für deine Videos nochmal :D was ist denn, wenn mein Exp(B) 3,444 ist? Steigt die Wahrscheinlichkeit für UV=1 dann um 244%, wenn die UV um eins erhöht wird? LG
Hallo Julia, gerne. Die relative Wahrscheinlichkeit steigt um 2,44 bei Erhöhung der UV um 1. Die Betonung liegt hier auf relativer Wahrscheinlichkeit. Viele Grüße, Björn.
Hallo Björn, vielen Dank für deine tollen Videos. Ich habe eine Frage zu dem Fall, wenn die Variable nicht in die Gleichung aufgenommen wird. Welchen Signifikanz-Wert sollte ich mir dann anschauen von dieser Variabel? Also den, der nicht in der Gleichung ist oder den, wo die Variable noch in der Gleichung bleibt ( also in Schritt 1 oder Schritt 0)? Würde mich über eine Antwort freuen!
Wie ist das mit dem Prozentsatz über 50% bei der Klassifizierungstabelle gemeint? Sollte der Gesamtprozentsatz über 50% liegen oder die einzelnen Prozentsätze? :)
Ich habe dieses sehr hilfreiche Video gefühlt schon 100 mal angeschaut (jedes Mal, wenn ich eine log. Regression rechne). Ich frage mich, was es zu beachten gilt, wenn die UV aus Prozentzahlen besteht (also WErte von 0,0 bis 1,0 annehmen kann).
Hallo Björn! Ich muss dir meinen großen Dank liefern! Ohne Dich wäre meine Doktorarbeit echt nicht so geil, vor allem ich selbst habe so vieles gelernt! Eine Frage hätte ich noch: Wenn man nicht sig Omnibus Test und fast signifikanten Hosmer Test hat, ist dann das Model schlecht geeignet? Kann ich trotzdem mit Regressionkoeffizienten (0,002 (Exp(B)=1,002), sehr kleinen) einen Wert interpretieren? 0,2% Anstieg wenn mein UV um einen Punkt steigt? KI beinhalten bei mir "1" dazwischen und Sig ist auch 0,285. Danke und Gruß!
Hallo Adil, danke für dein Lob! Freut mich, wenn dir die Videos geholfen haben! :-) Zu deiner Frage: der Omnibus-Test ist ja das, es der F-Test bei der normalen Regression ist. Sozusagen der Gatekeeper. Wenn der nicht signifikant ist, leistet das Modell, verglichen mit dem Nullmodell, keinen signifikanten Erklärungsbeitrag und man bricht an dieser Stelle ab. Viele Grüße, Björn.
Vielen Dank für das tolle Video! Ich habe eine Frage zur Berechnung der relativen Wahrscheinlichkeit, kann ich bei einer logistischen Regression mit einer binären abhängigen (Erkrankung: ja/nein) und unabhängigen Variablen (Symptom X: ja/nein) auch analog der Berechnung im Video vorgehen? Also bspw. bei einer OR von 6 interpretieren, dass die Erkrankung bei vorhandensein des Symptoms X mit einer relativen Wahrscheinlichkeit von 500% eintritt? Lg und vielen Dank für die Antwort
Hallo Björn, danke für das gute Video! Welches Modell wende ich an, wenn ich als AV eine binäre Variable habe und als UV eine ordinal Skalierung (Likert-Skala). Behandle ich es dann wie eine kategoriale Variable oder eine metrische? VG und Danke für danke für deine tolle Arbeit!
@StatistikamPC_BjoernWalther Ich habe eine abhängige binäre Variable und 2 unabhängige metrische Variablen. Daher scheint die logistische Regression sehr gut zu passen. Allerdings habe ich noch Kontrollvariablen, die ich berücksichtigen will. Mein Problem ist, dass diese metrisch, nominal und ordinal sind. Kann ich diese bei der logistischen Regression überhaupt berücksichtigen, und wenn ja, wie prüfe ich diese auf Korrelation, da sie ja alle unterschiedliche Skalenniveaus haben?
Hallo Felix, die Skalenniveaus der UV sind bei jeglichen Regressionen (auch logistisch) egal. Sprich, du kannst sie alle bedenkenlos aufnehmen. Einzig kategoriale Variablen müssen bei 3 oder mehr Ausprägungen als Dummy codiert werden und eine davon asl Referenzkategorie rausgelassen werden. Die Erstellung von Dummies: ruclips.net/video/znYq9_HrzvU/видео.html und im linearen Kontext die Aufnahme und Interpretation, die analog zum logisitischen Kontext funktioniert: ruclips.net/video/MjvnwcsgxBo/видео.html Viele Grüße, Björn.
Ich habe eine Frage. Ich untersuche gerade das Kaufverhalten von Menschen. Ich möchte hierbei untersuchen was Personen dazu bewegt erneut in einem Laden zu kaufen. Dabei untersuche ich Parameter wie Freundlichkeit des Personals, Zufriedenheit etc. Ich wollte eigentlich Kreuztabellen und eine logistische Regression zu dem Thema rechnen. Allerdings bin ich mir gerade unsicher, ob es sinnvoll ist eine Kreuztabelle (Rückkehrwahrscheinlichkeit X Freundlichkeit des Personals; Rückkehrwahrscheinlichkeit X Zufriedenheit) und eine logistische Regression (Rückkehrwahrscheinlichkeit in Bezug auf Rest) zu rechnen oder ob man in diesem Fall nur eins der beiden Verfahren wählt. Ich freue michauf deine Antwort
Hallo Björn, ist die Berechnung der Regression auch möglich wenn sowohl die abhängige als auch unabhängige Variable ordinal skaliert ist? In den Videos ist immer ein wert zumindest nominal, bei der logistischen Regression kann auch mit metrischen variablen gerechnet werden aber nie wird mit einer ordinalen variable gerechnet. Ist die Regression die falsche Analysemethode für ordinale Daten oder gibt es da einen Lösung für? Danke schon mal im Voraus
Ich habe ein Odds Ratio von 1,051. Das Ergebnis ist signifikant.Wie interpretiere ich dann das Ergebnis ? Kann ich die Nullhypothese ablehnen? (Das Odds Ratio ist ja sehr nahe null)
Ich habe mehrere Prädiktoren, einer davon ist kategorial und 11 sind metrisch. Wenn ich die Prädiktoren einzeln teste, sind einige signifikant. Nehme ich jedoch alle auf einmal ins Modell auf, ist kein Prädiktor mehr signifikant. Woran liegt das?
Hallo Björn. Ich habe da ein Sig.des Steigungskoeffizienten von 0.234 aber dennoch ein exp(B) Konfidenzintervall, dass 0 nicht einschließt. Wie kann man das denn interpretieren? Vielen Dank dir!!
Hallo Björn, vielen lieben Dank für dieses Video!! :) wie gehe ich vor, wenn ich mehrere UV habe? einzeln berechnen oder jeweils in den Blöcken eingeben?
Hallo, gerne. ;-) Ich würde es NICHT einzeln rechnen, da du die Korrelation zwischen den UV zwingend beachten solltest und das nur in einem vollständigen Modell funktioniert. Du kannst aber blockweise dei UV einführen und schauen, wie sich das Modell (hoffentlich) verbessert. Final interpretieren wirst du aber nur das "Endmodell", wo alle UV gleichzeitig drin sind. Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther vielen herzlichen Dank für die Antwort, die hilft mir sehr weiter! Leider habe ich keinen sig. Wert beim Omnibus-Test, weshalb ich die Berechnung wohl verwerfen muss. (Stichprobengröße, Korrelationen passen). Liebe Grüße Isabel
Hallo! Ich habe eine kurze Frage: Darf man bei der binär logistischen Regression auch mehrere unabhänige Variablen gleichzeitig eintragen, um jeweils die univariate Regression errechnen zu lassen oder muss für jede zu untersuchende unabhänige Variable eine neue Regressionsanalyse gestartet werden ? Je nachdem wie viele unabhänige Variablen man eingibt, kommen unterschiedliche Ergebnisse zustande ( bsp. Abhänige Variable: Tod, unabh. Variable: einmal nur Alter vs. einmal Alter und BMI und Größe zusammen). Oder wird, wenn ich mehrere unabh. Variablen zusammen eingebe, direkt eine multivariate Regression berechnet? Vielen Dank für deine tollen Videos!
danke dir für die super Erklärung. Ich habe es genauso wie beschrieben nachgerechnet. allerdings habe ich nachdem ich Exp(b) - 1 gerechnet habe, bei manchen unabhängigen Variablen noch immer einen Wert größer 1 stehen. Kann das richtig sein? Und wenn ja, wie kann ich das interpretieren? Vielen lieben Dank im Voraus!
Hallo und vielen Dank für das aufschlussreiche Video. Eine Frage zur Ergebnisinterpretation: ich habe bei meiner Analyse zu einer UV ein Exp(B) Wert von 8,01 bei einem Regressionskoeffizienten von 2,1 (Sig 0,000). Was wäre das denn für ein Odss Ratio? Das wäre doch abnorm hoch oder?
Hallo Maximilian und danke für dein Lob! Ja, ein solches OR ist schon recht hoch aber jetzt auch nicht ungewöhnlich. Gerade bei ordinal oder kategorial skalierten UVs kann es mitunter schon sehr hoch sein. Evtl. erkennst du in den deskriptiven Statistiken ja schon deutliche Unterschiede. Viele Grüße, Björn.
Hallo Björn, wie verhält es sich mit Odds Ratios von weit über 1, also zB 6,45 oder ähnliches. Wäre das dann dennoch nur eine erhöhte Wahrscheinlichkeit von 45%? Weil du ja sagtest, man zieht immer 1 ab. Danke für die Antwort.
Hallo, lieber mit OR, da die >relativen< Wahrscheinlichkeiten gerne mal zu Verwirrung führen, wenn der Leser nicht aufpasst. Steigerung des Prädiktors um 1 sorgt für eine 6,45 fache höhere Chance für das Ereignis =1. Viele Grüße, Björn.
Lieber Björn, seit ein Paar Wochen schaue ich deine Videos an und konnte bereits ein Abstract auf einem Kongress einreichen. Deshalb erstmal vielen herzlichen Dank! Ich habe allerdings noch eine Frage: Ich habe 11 metrische Prädiktoren. Das heißt, ich sollte zuerst für all meine Prädiktoren separat bzw. einzeln eine sog. univariate binary log. regr. Analyse durchführen. Und um ich eine multivariate binary log. regr. Analyse durchzuführen, sollte ich meine signifikanten Prädiktoren alle zusammen einfügen. Richtig? Ich würde mich auf eine Antwort sehr freuen. Viele Grüße, Ughur
Hallo Ughur, freut mich zu hören, dass dir meine Videos helfen! Ich würde empfehlen alle Prädiktoren gleichzeitig in das Modell aufzunehmen, es sei denn, du kannst begründen, warum du das schritt- bzw. blockweise machst. Denkbar wäre: zuerst Kontrollvariablen im Modell zu haben und zu rechnen und anschließend mit Aufnahme der dich interessierenden Prädiktoren zu schauen, wie viel besser das Modell wird, z.B. anhand -2log-Likelihood oder Pseudo R² oder, für mich immer aufschlussreicher, wie entwickelt sich der Prozentsatz der Richtigen in der Klassifizierungstabelle. Viele Grüße, Björn.
Hallo, vielen Dank für das hilfreiche Video! Ich habe eine binäre logistische Regression mit einer metrischen Variable verwendet. Meine Konfidenzintervalle sind beide über 1, es handelt sich also um einen positiv signifikanten Effekt. Meine Exp(B) ist allerdings bei 4,909. Wie genau habe ich das zu interpretieren? Liebe Grüße!
Hi Björn, Danke dir für deine Videos. Das hilft mir sehr bei meiner Masterarbeit! Ich habe folgende Frage: Ich habe eine nominale abhängige Variable mit 4 Urlaubsarten und mehrere unabhängige Variablen. Ich hatte schon mal 4 dummy variablen für die Urlaubsarten erstellt und wollte mit denen jetzt 4 mal die binäre logistische Regression durchführen. Jetzt hatte ich aber auch beim googeln die multinomiale Regression gefunden. Allerdings finde ich generell darüber weniger Informationen. Leichter wäre für mich also die binäre logistische Regression mehrmals durchzuführen. Aber ergibt das auch inhaltlich Sinn? Sollte ich trotzdem besser die multinomiale Regression wählen? Bin sehr am verzweifeln weil ich 2 Wochen abgabe ist. Danke dir und viele Grüße!
@@StatistikamPC_BjoernWalther Danke für deine schnelle Antwort! Muss ich dabei irgendwas anderes beachten als bei der binären logistischen Regression. Also was die Voraussetzungen angeht?
Hallo Björn! Vielen Dank für die übersichtlichen und sehr gut nachvollziehbaren Videos. Kate Violet hatte es zwar schon einmal ähnlich gefragt, aber ich muss trotzdem nochmal fragen: Ich habe viele viele viele Laborwerte (346 Patienten, jeweils an drei Zeitpunkten gemessen...) und möchte jetzt wissen, ob ein Laborwert (z.B. Laktat) für das Ereignis "Tod" (dichotome Variable; 1=ja; 2=nein) mitverantwortlich ist. Medizinisch wäre es so, dass man eher stirbt, wenn das Laktat steigt. Wenn ich die binäre log. Regression nehme, erhalte ich ein RegressionkoeffizientB von -0,35. Jetzt endlich die Frage: Woher weiß jetzt SPSS, dass mein Ereignis "Tod" bei "1" eintritt und nicht bei "2"? Also wäre es ja in meinem Fall so, dass der Laborwert "Laktat" niedriger wird und damit das Ereignis eher eintritt, oder? (wegen dem negativen Vorzeichen) Die Signifikanz ist übrigens 0,000, der Exp(B) 0,71 und die 1 liegt nicht im Konfidenzintervall. 2. Frage: wenn ich nicht wissen will, ob ein Laborwert zu einem bestimmten Zeitpunkt Einfluss auf das Ereignis "Tod" hat, sondern die Änderung des Werte vom 1. zum 2. Messzeitpunkt - wie mache ich das? Vielen Dank für deine Arbeit!!! Liebe Grüße Bettina
Hallo Bettina und danke für dein Lob! Zu deinen Fragen: 1) SPSS verwendet die niedrigere Ausprägung der dichotomen Variable als Referenzkategorie. Du kannst auch im Klassifikationsdiagramm schauen, was da steht. "Predicted Probability is of Membership for xyz". 2) Da du Paneldaten hast, müsstest du streng genommen auch eine binär logistische Panelregression rechnen. Das geht allerdings in SPSS nicht, jedoch mit dem Paket pglm in R. Du kannst in SPSS nur für bestimmte Wellen in einer Querschnittregression eine Berechnung durchführen oder die UV der vorherigen Perioden auf spätere bzw. folgende Perioden untersuchen. Aber auch da musst du aufpassen, weil dieselbe UV zu unterschiedlichen Zeitpunkten sehr starke Multikollinearität herovrrufen kann und damit deine Ergebnisse stark verzerrt werden. Viele Grüße, Björn
Erstmal vielen Dank für das super hilfreiche Video! Ich hab eine Frage zu meinem Modell: Der Omnibus Test der Modellkoeffizienten mit 0,032 < 0,05 aber der Hosmer Lemeshow Test mit 0,03 nicht > 0,05. Muss ich das Modell verwerfen? Bzw. kann ich dann sagen, dass man an dieser Stelle keine weitere Aussage zum Zusammenhang der abhängigen und unabhängigen Variable treffen kann oder gibt es dann statistisch gesehen keinen Zusammenhang? Liebe Grüße Carina
Hallo Carina, gerne! Der Omnibus-Test ist in Ordnung, der Hosmer-Lemeshow-Test sorgt in deinem Fall für einen nicht hinreichenden Fit. Die Differenzen zwischen beobachteten und erwarteten Werten sind zu hoch, was für eine nicht hinreichende Modellanpassung spricht. Der -2Log-Likelihood-Wert ist vermutlich auch recht groß? Viele Grüße, Björn.
Hallo Statistik am PC, erst einmal vielen Dank für das ausführliche Video! Ich habe noch eine Frage und zwar kannst du noch einmal erklären wie genau das mit den Konfidenzintervallen gemeint ist? Zudem untersuche ich in meiner Masterarbeit auch einen Moderationseffekt. Ich habe eine nominale abhängige Variable (Würden Sie (wieder) in Betracht ziehen etwas über eine branded App zu kaufen? Ja, Nein) und 18 unabhängige Variablen welche die Kaufintention messen. 9 davon messen bereits die Kaufabsicht unter der Voraussetzung von zusätzlicher Personalisierung der App. Muss ich hierfür dann extra noch andere Tests machen zum messen der Unterschiede durch den Moderator oder reicht ein einfacher Vergleich der Regressionskoeffizienten? Zudem ist auffällig, dass nur 8 Variablen ein Signifikanzniveau < 0,05 haben. Könnte hier ein Fehler vorliegen? Vielen Dank vorab und liebe Grüße!
Hallo und danke für dein Lob! Prinzipiell haben bei so einer großen Anzahl an Variablen niemals alle, geschweige denn bisweilen überhaupt die Hälfte einen signifikanten Einfluss. Das ist also alles in Ordnung. Wenn du eine Moderation im Rahmen der logistischen Regression rechnen willst, würde ich dir eher PROCESS empfehlen als die Bordmittel von SPSS, allerdings kannst du damit die im Rahmen einer schrittweisen Regression besser sichtbaren Veränderungen nicht betrachten und musst die Modelle umständlicher jeweils manuell spezifizieren. Viele Grüße, Björn.
Also wir machen das so: Das Model repräsentiert einen signifikanten/nicht signifikanten Anteil der Daten, x^2(df) = ..., p-Wert. Die Prädiktoren erklären ... Prozent (Nagelkerke R^2= ..., Cox & Schnell R^2= ...) der Varianz der abhängigen Variable. "n" von "n-max" (also bsp. 2 von 5) Prädiktoren beeinflussen die "Abhängige Variable" signifikant. Für eine Erhöhung des "Prädiktors XY" um eine Einheit ist die Änderung der Wahrscheinlichkeit für ... (Exp(b) = ..., p-Wert.). Für den Prädiktor "XY" konnte kein signifikanter Einfluss nachgewiesen werden (p-Wert).
Hallo Björn, deine Videos sind wirklich unglaublich hilfreich! Vielen Dank dafür! :) Ich hätte noch eine Frage hinsichtlich der marginalen Effekte. Die Odds Ratio stellen so weit ich es sehe marginale Effekte dar. Gibt es in SPSS auch die Möglichkeit Average Marginal Effects (AME) zu berechnen?
Hallo Björn, im Rahmen meiner logistischen Regression ist die Signifikanz des Omnibustests über 0,05. Was bedeutet dies? Ist die logistische Regression nicht geeignet (laut Skalenniveaus müsste sie geeignet sein)? Liegt keine Korrelation vor? Sollte ich an dieser Stelle abbrechen? Zudem ist in der Klassifizierungstabelle unabhängig vom Signifikanzwert im Omnibustest immer eine Ausprägung komplett falsch vorhergesagt. Was bedeutet dies für mich? LG
Hallo Jessica, wenn der Omnibus-Test nicht signifikant ist, ist das ein Problem. Der Signifikanzwert von weniger als 0,05 zeigt an, dass das aktuelle Modell mit Koeffizienten besser geeignet ist als das Nullmodell. In deinem Falle wäre also das Nullmodell besser. Die binäre logistische Regression würde man an dieser Stelle abbrechen. Mit Korrelation hat das nicht unbedingt was zu tun. Was korreliert? Die UV mit der AV, die UV unter sich? Das kann, muss aber nicht sein. Du willst ja mit der Regression Kausalität untersuchen, zumindest, wenn du es theoretisch fundiert hast, ist so ein Schluss statthaft. Wenn in der Klassifizierungstabelle eine Ausprägung nie vorhergesagt wird, kann das zwei Gründe haben. Der eine ist, dass es schlicht sehr viele Fälle der anderen Ausprägung gibt und das Modell lieber auf die häufiger vorkommende Ausprägung "schätzt", weil es da im Schnitt häufiger richtig liegt als nicht. Der andere Grund ist, dass das Modell, wie du schon gemerkt hast, eher schlecht auf die Daten passt. Das sollte man auch am Hosmer-Lemeshow-Test sehen. Eventuell kannst du deine Stichprobe noch mal unterteilen. Mitunter zeigt sich eine bessere Prognose für nur einen Teil der Stichprobe, z.B. nur für Frauen, statt für beide gemeinsam. Viele Grüße, Björn.
Sehr hilfreich, danke dir! Wollte fragen ob die Interpretation der Ergebnisse im multiplen Fall ausfällt und ob ich die multiple logistische Regression trotzdem machen kann, wenn ich nominale und metrische Prädiktoren habe?
Hallo Luca und danke für dein Lob! Die Interpretation mit mehreren UV ist analog zu der im Video gezeigten. Du kannst die Skalenniveaus der Prädiktoren mischen. Für einen nominalen und dessen Interpretation habe ich noch mal eine separates Video: ruclips.net/video/3w88xhE5DLk/видео.html Viele Grüße, Björn.
Hallo Björn, vielen Dank für das tolle Erklärvideo! Es hat mir bei meiner Masterarbeit schon sehr weitergeholfen. Ich habe allerdings noch drei Fragen und wäre dir sehr dankbar, wenn du mir weiterhelfen könntest. 1.) In meinem ersten Fall ist beim Omnibus-Test die Signifikanz > 0,05. Hier breche ich die weitere Interpretation ja ab und berichte keine weiteren statistischen Werte, richtig? Die Signifikanz > 0,05 bedeutet ja, dass das Nullmodell (Block 0) besser geeignet wäre als das aktuelle Modell (Block 1). Was heißt das genau? 2.) Bei meinem 2. Fall stimmen die Signifikanzen, aber der Gesamtwert in der Klassifikationstabelle liegt gerade mal bei 57,2%, was ja sehr bzw. zu wenig ist. Wie gehe ich damit um und was sagt es genau aus? 3.) In einem der Kommentare wurde gefragte, welche Werte dokumentiert werden sollen. U.a. hast du hier angegeben "Koeffiziententabelle mit unstandardisierten und standardisierten Koeffizienten". Welche zwei Werte sind das im SPSS Output? Vielen Dank schon mal und beste Grüße Lisa
Hallo Lisa, gerne. Zu deine Fragen: 1) Das bedeutet, dass dein Modell unter Hinzunahme weiterer Prädiktoren die AV nicht besser erklären kann als ohne. 2) 57,2% ist zumindest besser als eine zufällige Prognose des Ereignisses. Also du wärest mit einem Münzwurf noch schlechter. Gut ist es nicht, aber besser wird es wohl erst mit anderen UVs, Stichprobenwahl und -größe, "besserer" Operationalisierung latenter Konstrukte usw. 3) Standardisiert meint das Exp(B). Also aus der Tabelle "Variablen in der Gleichung". Viele Grüße, Björn.
Hey, vielen Dank für die tolle Erläuterung :) . Wenn meine Variablen im Einzelnen nicht signifikant sind, mein Modell als Ganzes und im Hosmer-Lemeshow-Test aber schon, lohnt sich dann eine weitere Interpretation der einzelnen Odds?
Danke für das schöne Video! :) Ist es irgendwie möglich auch eine Art "Schwellwert" auf diesen Weg rauszubekommen? Also bspw ab welchem IQ Wert das Bestehen der Prüfung wahrscheinlicher ist?
Das Video ist echt super hilfreich. Ich muss für meine BA eine binär logistische Regression durchführen, aber leider verpasst mein Omnibus-Test mit 0.054 knapp die Signifikanz. Gibt es da eine Möglichkeit trotzdem weiter zu rechnen?
Hallo :) Ich habe eine kurze Frage: Und zwar wird bei mir trotz der Mehrheit auf der Ja-Seite immer Nein als Referenzkategorie angegeben, was mir die Interpretation erschwert. Ich habe auch versucht die Multinominale mit einer Variable zu rechnen, aber das hat mich nur noch mehr verwirrt. Kannst du mir vielleicht einen Rat dazu geben? Das wäre lieb, Danke :)
Hallo Anni, die Referenzkategorie der AV ist immer die niedrigere Ausprägung. Hat Nein die niedrigere Ausprägung? Typischerweise werden Nein mit 0 und Ja mit 1 codiert, was das erklären könnte. Viele Grüße, Björn.
Vielen Dank, deine Videos retten mich echt! Ich hätte noch eine Frage: wenn ich ein Konfidenzintervall von 2.48-141.58 habe, dann weist das auch darauf hin, dass die Ergebnisse nicht signifikant sind oder? Und wenn mein Exp (B) = 18.76 ist, heißt das dann, dass das Modell nicht signifikant ist? Der Wert kommt mir sehr unwahrscheinlich vor... Ich schreibe momentan an meiner Masterarbeit und bin so dankbar für deine Videos, die sind echt super verständlich! :)
Wie muss ich ein Modell interpretieren, wenn das Pseudo-R-Quadrat steigt, sich aber die Häufigkeiten in der Klassifizierungstabelle nicht mehr ändern? Vielen Dank für die Hilfe.
Hallo Florian, welche Methode der Aufnahme der Prädiktoren verwendest du? Gibt es evtl. Prädiktoren, die durch andere Prädiktoren perfekt abgebildet werden können oder eine Linearkombination darstellen? Letzteres trifft meist auf Dummy-Variablen zu, wenn keine Referenzkategorie ausgelassen wird. Viele Grüße, Björn
@@StatistikamPC_BjoernWalther Hi Björn, viel vielen Dank für deine schnelle Antwort. Tatsächlich handelt es sich im Dummy Variablen die sich gegenseitig ausschließen. Wie gebe ich den Einfluss der ausgeschlossenen Variable denn am besten an? Und dann habe ich noch eine zweite Frage und vielleicht kannst du mir helfen: Ich möchte ein Matching durchführen anhand von Scores und dann wiederum schauen, welche Gruppe besser abschneiden. Das Ergebnis ist ebenfalls eine Dummy Variable.
Hallo Florian, du siehst immer nur den Unterschied zwischen dem ausgeschlossenen Dummy und den jeweils im Modell befindlichen Dummys. Du kannst die Dummys beliebig durchtauschen bzgl. Referenzkategorie -das Modell bleibt identisch, du erfährst aber die anderen Unterscheide. Die 2. Frage verstehe ich nicht ganz. Du möchtest deine Stichprobe in 2 Teile splitten und eine Gruppenvariable soll dies abbilden? Viele Grüße, Björn.
Danke Björn für das Video! Ich habe allerdings ein kleines Problem. Ich habe eine binär logistische Regression durchgeführt, wie du es beschrieben hast. Die Outcome-Variable hat die Optionen 0 = "nein" und 2 = "ja". Da ich gelesen habe, dass keine fehlenden Werte existieren sollten in den Variablen (glaube aber das gilt eher nur für den Fall, dass man mehrere Prädiktoren nimmt?) habe ich sicherheitshalber die Stichprobe so gefiltert, dass nur Probanden einbezogen werden in die Analyse, die auf Prädiktor und Outcome einen Wert haben. Jetzt ist es so, dass ich mir diese Beobachtet-Vorhergesagt-Tabelle angucke. Die sieht so aus (ich hoffe, das passt mit der Darstellung): Vorhergessagt nein ja Beobachtet nein 614 0 ja 204 0 Also es wurde offenbar vorhergesagt mit meinem Prädiktor, dass alle Cases in die Kategorie "Nein = Event tritt nicht ein" fallen müssten. Der Prädiktor wird aber mit p = 0,03 signifikant und das Exp(B)-Konfidenzintervall beinhaltet nicht die 1. Hast du eine Idee, ob da etwas schiefgelaufen sein könnte? Oder ist das ein Fall, wo der Prädiktor das Outcome perfekt vorhersagt? Das fänd' ich persönlich sehr komisch. Bei Nutzung derselben metrischen Variablen und eines anderen kategorialen Prädiktors (wieder mit ja/nein) habe ich dasselbe Problem, dass alle Pbn nur einer Kategorie zugehörig vorhergesagt werden... Liebe Grüße und danke schonmal im Voraus!
Hallo, das kann durchaus sein, dass die Vorhersage auch im Block 1 noch zu so einem Ergebnis kommt (Omnibus-Test signifikant?). Das Modell weiß, das in 75% der Fälle "nein" das Outcome ist. Wenn das Modell also immer nein prognostiziert, liegt es ja mit 75% richtig, was per se ein guter Wert ist. Allerdings fallen dir da 200 Fälle runter und so wirklich hat man ja keine (differenzierte) Prognose erzielt. Die Prädiktoren, die du hast, scheinen nicht zuträglich zu sein, also keine weitere hinreichende Differenzierung zu erzielen. Da gibt es also wohl noch etwas Potential bzgl. weiterer Prädiktoren, zumindest anhand des Gelesenen. Viele Grüße, Björn.
Lieber Björn, Vielen Dank für Deine hilfreichen Videos! Ich hätte da noch zwei Fragen: Kann ich eine binäre logistische Regression rechnen, wenn meine Prädiktorvariablen und meine Outcomevariable nominal skaliert sind? Ich möchte schauen, welchen Einfluss Mobbing (nominal, Opfer von Mobbing ja/nein) auf pathologische Internetnutzung (nominal, ja/nein) hat. Meine zweite Frage bezieht sich auf SPSS im Allgemeinen: Ich würde gerne eine Variable erstellen, die zwei bestehende Variablen beinhaltet (Opfer von Mobbing->ja, und Opfer von Cybermobbing-> ja). Ich habe versucht mit der Schaltfläche Transformieren->Neue Variable erstellen die neue Variable zu erstellen mit der Bedingung var_mob = 1 (für ja) & var_cyb = 1 (ja) aber ich habe das Gefühl ich habe einen Fehler gemacht. Wenn ich zum Beispiel dann eine Kreuztabelle mit der neuen Variable rechnen möchte, dann gibt mir SPSS an, dass die neue Variable einen Konstante ist und nicht in der Berechnung berücksichtigt wird. Besten Dank für Deine Hilfe :) Lg Valerio
Hallo Valerio, ja, das funktioniert. Hierzu wird es diesen Freitag auch ein Video geben. Zu deiner zweiten Frage: das hört sich logisch sauber an und sollte klappen - nur 1 &1 Fälle wirst du ja nicht haben. Hast du evtl. keine sonstigen Fälle? Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Danke für Deine schnelle Antwort! Dann bin ich gespannt auf das Video am Freitag :) Ich glaube es hat jetzt geklappt mit der neuen Variable (habe fälschlicherweise anstatt alle Fälle nur die bedingten Fälle ausgewählt). Vielen Dank für deine Hilfe und weiterhin viel Erfolg mit Deinen hilfreichen und qualitativ hochstehenden Tutorials! LG Valerio
Danke für das tolle Video! Was mir allerdings abgeht, sind die zu prüfenden Voraussetzungen bei metrischen Prädiktoren. Muss ich min. erwartete Häufigkeit testen und wenn ja wie? oder gilt das nur für kategoriale Prädiktoren? Danke für deine Hilfe :-)
Hallo Viola und danke für dein Lob! Die logistische Regression hat eigentlich keine Voraussetzungen. Lediglich die dichotome Abgabe Variable und keine Multikollinearität sind zu beachten. Der Rest, wie man ihn aus der linearen Regression kennt, spielt keine Rolle. Viele Grüße, Björn.
Hi! SPSS ist mir noch relativ neu. Möchte eine Binäre Logistische Regression ausprobieren, aerdings wird mir diese Möglichkeit unter Analyse gar nicht angezeigt. Benutze SPSS 26, Tipps? :)
Hallo! Ich danke dir vielmals für deine Videos, ohne wäre ich im Studium schon so häufig verzweifelt. Eine Frage zu den Klassifizierungstabellen: bei mir steht bei der Ausprägung 1 bei den Vorhergesagten immer 0! die beobachteten stimmen, aber woran könnte das liegen? Vielen Dank schonmal, ich freu mich auf ein erklärungsvorschlag
Hallo Pulu, danke für dein Lob! Wie sind denn die Beobachtungen verteilt? Wie viele 1 und 0 hast du als Ausprägungen? Wenn du sehr wenige 1 und sehr viele 0 im Datensatz hast, prognostiziert das Modell fast immer keine 0, weil es damit ohnehin fast immer falsch liegen wird. Viele Grüße, Björn.
Hallo Björn, vielen Dank für deine tollen Videos, die mir schon so oft geholfen haben. Ich habe eine Frage: welches Modell muss ich rechnen, wenn ich sowohl mehrere unabhängige Variablen (unterschiedlich skaliert) als auch mehrere abhängige (alle binär kodiert) habe? Vielen Dank und viele Grüße!
Hallo eileen, danke für dein Lob! Prinzipiell kann man einfach für jede AV ein Modell rechnen: www.ibm.com/support/pages/logistic-regression-multiple-dependent-variables Es kann je nach Kontext aber auch angebracht sein, ein Strukturgleichungsmodell zu rechnen. Mit binären Variablen aber nicht wirklich üblich und bei R zögerlich implementiert: personality-project.org/r/tutorials/summerschool.14/rosseel_sem_cat.pdf Meine Tendenz würde zu ersterem gehen. Viele Grüße, Björn.
Super Video! Ich habe allerdings eine Frage. Ich kriege signifikante Ergebnisse wenn ich nur einzelne Variablen mit der logistischen Regression berechne. Aber wenn ich alle 8 Skalenwerte eines Fragebogens einfüge, sind auf einmal die Signifikanzen dahin. Woran liegt das?
Hallo und danke für dein Lob! Da die unabhängigen Variablen auch untereinander korrelieren, "verschwinden" Signifikanzen aus einfachen Regressionen ab und an. Das ist nichts Ungewöhnliches. Ich würde immer zum "vollständigeren" Modell raten, da du so für den gleichzeitigen Einfluss anderer Variablen kontrollierst. Viele Grüße, Björn.
Hallo Theresa, das hängt natürlich ein bisschen von der Fachrichtung ab, aber generell würde ich für die binär-logisitsche Reression folgendes angeben: die Koeffiziententabelle mit unstandardisiertem und standardisiertem Koeffizienten, dem Odds Ratio, dem 95% KI. Zusätzlich in eine Zeile darunter die Gütemaße (-2LogLikelihood, R²) und evt. noch Hosmer-Lemeshow-Test. Die Ergebnisse aus der Klassifikationstabelle verbalisiert man einfach so mit. Evt. will dein Gutachter aber auch die Tabelle sehen (Anhang?) und den Omnibus-Test für dein Block 1-Modell. Da fragt man am besten nach oder konsultiert die Richtlinien für wissenschaftliches Arbeiten, die dir vorliegen bzw. von deinem Institut/Lehrstuhl zur Verfügung gestellt werden sollten . Viele Grüße, Björn.
Hallo Björn, danke für das tolle Video. Ich hätte eine Frage, ich habe bei meinen Berechnungen für manche Prädikoren für Exp(B) Werte wie "3025" oder auch "1752E-6" rausbekommen. Jetzt weis ich nicht wie komisch das ist. Hab solche Werte noch nie in meinen Recherchen gesehen, was meinst du ://///// danke dir schon mal für deine Antwort 👏🏼
Vielen Dank für die sehr detaillierten Ausführungen. Ich habe eine Frage: Wenn ich das ganze nun mit kategorialen Variablen rechne (z.B. IQ hoch ja/nein) dann gibt mir die OR doch im Endeffekt an, wie viel "wahrscheinlicher" das bestehen des Führerscheins ist, wenn ich einen hohen IQ habe oder?
Hallo, so kann man das vorsichtig interpretieren. Das OR ist das Verhältnis zweier Odds, also die relative Wahrscheinlichkeit. Also bei dichotom, die Odds mit IQ hoch im Verhältnis zu Odds mit IQ niedrig - je nachdem, was die Referenzkategorie ist. Viele Grüße, Björn.
Hat jemand einen Link/Literaturtipp für ein Beispiel wie man die Ergebnisse der binären logistischen Regression darstellt? Die Formulierung der Ergebnisse fällt mir schwer ...
Hallo und vielen Dank für Deine super hilfreichen Videos! Meine Frage: Gibt es ein Einstiegswerk für blutigste(!) Statistik-Neulinge (Geisteswissenschaftler), dass du als eine allgemeine Einführung in die Statistik samt ihrer Theorien und Methodiken empfehlen würdest? lG :)
Hallo Anton und danke für dein Lob! Wenn Englisch kein Problem ist, ist eine recht anwendungsnahe Einführung an SPSS von Andy Field der Klassiker: amzn.to/2VTzk8Q Wenn es ohne Statistikprogramm, etwas ausführlicher, gerade in Bezug auf Forschungsmethodik und auf Deutsch sein soll, ist Döring/Bortz eine gute Wahl: amzn.to/2ItcInF Viele Grüße, Björn.
Hallo, auch lieben Dank von meiner Seite für deine Videos, damit geht das ganze schon viel einfacher :) Ich schaue mir in meiner Arbeit die Unterdrückung von negativen Emotionen auf die Existenz (ja/nein) und das Ausscheiden von Mitarbeitern (ja/nein) in start-ups an - beides in getrennten binären Regressionen. Leider sind die Ergebnisse in der binär logistischen Regression (knapp) nicht signifikant. Ich würde sehr gerne einen Mediator, nämlich Authentizität dazu nehmen, um zu schauen, ob das einen Unterschied macht. Ich hoffe, es gibt über den Mediator ein signifikantes Ergebnis. Ich habe jedoch auf der Uni gelernt, dass die AV bei einer Mediation immer metrisch sein muss, das ist sie ja bei mir aber nicht (Mitarbeiter noch im Unternehmen ja/nein und Start-up existiert noch ja/nein). Könntest du mir vielleicht weiterhelfen, was nun stimmt und wie ich weiter machen kann? Vielen lieben Dank bereits und ganz liebe Grüße, Florentina
Hallo Björn erst mal danke für dein Video und die Mühe dahinter! Ich schreibe zur Zeit an meiner Bachelorarbeit und muss für einer meiner Hypothesen eine Mediationsanalyse durchführen. Nur ist es so, dass mein Mediator dichotom ist. Ich habe im Internet recherchiert und herausgefunden, dass man in diesem Fall auch eine logistische Regression durchführen kann. Jedoch weiß ich nicht, wie das bei SPSS zu handhaben ist. Ich würde mich sehr freuen wenn du mir dabei weiterhelfen könntest. Lg
@@StatistikamPC_BjoernWalther Danke dir! Das bedeutet, ich darf eine binär-codierte UV nicht wie eine metrisch codierte behandeln und kann das Verfahren, wie in diesem Video mit metrischem Prädiktor nicht anwenden?
Hey, erst einmal ein riesen Lob für deine wirklich tollen Videos! Du sagtest ja, dass das Nullmodell eigentlich nicht so besonders wichtig ist. Trotzdem wüsste ich gern einmal, was eigentlich die Zeile „Gesamtstatistik“ in der Tabelle „Variablen nicht in der Gleichung“ bedeutet? Die Zahl erschließt sich mir nicht unbedingt, insbesondere, wenn ich mehrere unabhängige Variablen untersuche. Danke :-)
Hallo und danke! Die Gesamtstatistik im Nullmodell ist ein Chi-Quadrat-Wert, der dir angibt, ob die Variable aufgenommen werden sollte. Nullhypothese: Kein Einfluss der UV. Um die Chi²-Berechnung en detail zu verstehen, kann man nur händisch nachrechnen: Field (2019), Discovering Statistics, S. 880ff. Viele Grüße, Björn.
Gehören die Nullmodelle eigentlich in eine wissenschaftliche Arbeit? Oder kann ich diese auch einfach nur "für mich" interpretieren, ansonsten aber als Tabelle in der Dissertation weg lassen? Viele Grüße
sehr tolles Video, das hilft mir für meine Masterarbeit sehr weiter, danke! Wenn ich mehrere Variablen in die Regression aufnehme, erfolgt die Interpretation nach demselben Prinzip?
Hallo Floriano, danke für dein Lob! Die Gleichung ist ja nichts anderes als die Wahrscheinlichkeit für das Eintreten. Das wäre 1/(1+e^(-(beta_i*x_i))). Viele Grüße, Björn.
Statistik am PC vielen Dank für eine Antwort. Exakt mit dieser Gleichung habe ich die Wahrscheinlichkeiten nachgerechnet und ich komme auf andere Ergebnisse wie sie spss ausgibt? Weißt du woran das liegen könnte ?
@@StatistikamPC_BjoernWalther Hallo Björn! Ja genau, fehlende Werte mit -1 codieren :D man könnte diese herausfiltern, würde ich behaupten. Viele Grüße, Julia
Mein Prof zieht bei der Odds Ratio nicht noch einmal 1 ab. Er interpretiert direkt die Odds Ratio, die angegeben ist. Jetzt bin ich etwas verwirrt. Vielleicht könntest du in Zukunft auch den Graphen etwas besser erklären.
Hallo Julia, es gibt verschiedene Interpretationsmöglichkeiten zum Odd's ratio. Das Abziehen von 1 ist eine Möglichkeit und die, wie ich finde, verständlichere. Du meinst sicher das Klassifikationsdiagramm? Ich denke dazu ist fast alles gesagt, ohne es unnötig in die Länge zu ziehen, da das Video ja ohnehin schon 12,5 Minuten geht. Es wird aber irgendwann noch ein weiteres Video zur binär logistischen Regression geben, wo es um ordinale und kategorial Prädiktoren geht und evt. gibt es da noch ein paar zusätzliche Worte. Oder ich mache da mal ein dediziertes Video zu - ich überlege mir mal was. Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Dafür wäre ich auch unglaublich Dankbar :) (Hut ab an dieser Stelle für deine didaktisch extrem gut aufgebauten Videos!!!!)
@@StatistikamPC_BjoernWalther Eine Erklärung zu einer binär logistischen Regression mit einer ordinalen unabhängigen Variable (Wertung von sehr unwichtig bis sehr wichtig) bräuchte ich leider auch sehr dringend! Hättest du vielleicht einen Tipp, wo ich das stattdessen gut nachlesen kann? Oder kann ich meine ordinale unabhängige Variable einfach umkodieren zu 0=unwichtig und 1= wichtig und die binäre logistische Regression mit kategorialem Prädiktor ausführen? Grüße Raphaela
Hallo Lisa, ah, jetzt sehe ich diesen Kommentar. Soweit ich weiß gibt es keine Möglichkeit in Excel dies zu tun. Evtl. existiert irgendwo ein Plugin, da wäre ich aber vorsichtig. Viele Grüße, Björn.
Gutes Video, aber ein kleines Problem habe ich mit deiner Interpretation der Odds Ratio: die Odds sind keine Wahrscheinlichkeit, dass etwas eintritt, sondern, wenn die OR=1,2 ist, dann steigt die ODDS für das Bestehen des Führerscheins (bei Steigerung des IQ um 1) um 20%. Kleines Beispiel: die WAHRSCHEINLICHKEIT eine 6 zu würfeln liegt bei 1/6, die ODDS für eine 6 liegt aber bei 1/5 (Wahrscheinlichkeit/Gegenwahrscheinlichkeit). Wahrscheinlichkeit und Odds sind nicht dasselbe!
Hallo und danke für dein Feedback! Ich habe wohl nicht gänzlich den Duktus durchgehalten, als ich von relativer Wahrscheinlichkeit sprach. Deswegen habe ich zusätzlich noch versucht mit Folien zu arbeiten, die das unterstützen. Viele Grüße, Björn.
Brutaler Ehrenmann! ohne deine SPSS Videos hätte ich meine Bachelorarbeit wohl nicht geschafft haha
Du hast alles wirklich Top erklärt! Alle Schritte wirklich sehr gut nachvollziehbar und perfekt beschrieben.
Weiter so!! Mad respect
Hallo und danke für die lobenden Worte! Hat mich gefreut! :-)
Viele Grüße und weiterhin viel Erfolg
Björn
Hut ab Björn wie viele Fragen du hier kostenlos beantwortest! Für ich bist du der RUclipsr 2020, da du mich mehr in meiner Bachelorthesis begleitet hast als mein eigentlicher Betreuer :) In idesem Sinn Alles Gute und mach weiterhin so klasse Videos, danke !
wie immer super!!
sehr gute Erklärungen!
Hallo und danke für das tolle Video. Ich versuche mich gerade an einer Funktion, die mir die Wahrscheinlichkeit wiedergibt, dass ein Kunde kauft oder nicht (y) - n ≈ 1.000. Dazu nehme ich drei Variablen: Einmal eine für die Zahlungsbereitschaft der Kunden (x1), eine für die Wertigkeit des Produktes (x2) und eine für den Verkaufspreis (x3). Nun ist es so, dass wenn ich jede Variable einzeln per einfacher Regression untersuche, ich für Zahlungsbereitschaft und Wertigkeit sinnvolle Zusammenhänge zur Verkaufswahrscheinlichkeit erkennen kann (y steigt, wenn x1 oder x2 steigt). Nicht hingegen für den Preis x3 - da verläuft die Funktion fast waagerecht. Der Koeffizient b liegt also um die 0, die Konstante a bei 0,5. Das wird durch den vorhandenen Datensatz so dargestellt - gut und schön - dennoch muss die Konstante ≈ 1 sein, denn wenn der Preis 0 ist, wird der Kunde mit an Sicherheit grenzender Wahrscheinlichkeit kaufen. Das lässt sich im einfachen Modell mit einer Variablen auch erzwingen, in dem ich lediglich den Koeffizienten b schätze. Wie kann ich dies denn im Rahmen der logistischen Regression modellieren?
Das Problem kommt dann auch auf wenn ich versuche, alle drei Variablen im Rahmen der logistischen Regression einzubinden. Nutze ich nur x1 und x2 für meine logistische Regression, bekomme ich durch die Anwendung der Maximum-Likelihood-Methode ein wunderbares Modell zu Stande, was die Wahrscheinlichkeiten korrekt abbildet. Nehme ich aber den Preis hinzu, erhalte ich (bislang) kein Modell, was die Wahrscheinlichkeiten korrekt wiedergibt. Es muss aber eine Abhängigkeit vom Preis existieren.
Hast du einen Tipp, wie ich das Problem lösen kann?
Klasse! Gerne auch für den multivariaten Fall!
Dankeschön! :-)
Es wird in ein paar Wochen sicherlich noch ein weiteres Video zur binär logistischen Regression geben, wo es um ordinale und kategoriale Prädiktoren geht und auch >1 Prädiktor existiert.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Ein Tutorial für mehrere Prädiktoren verschiedener Skalierungen wäre top!
Hallo, kann ich die OR wirklich so interpretieren??
Nach Best und Wolf (2010, S. 832; 2012; siehe auch Behnke 2015, S. 73-76)
bieten die Effektkoeffizienten bzw. Odds-Ratios nur eine scheinbar einfachere
und anschaulichere Interpretation als die Regressionskoeffizienten B (logit-Koeffizienten).
Bei Odds-Ratios handelt es sich um Wahrscheinlichkeitsverhältnisse.
Zwar werden die Effekte in ihrer Richtung korrekt bewertet, aber die Stärke der
Effekte meist überschätzt. Ein Exp(B)-Koeffizient von 1,6 bedeutet nicht, dass
Männer eine 1,6-mal höhere Wahrscheinlichkeit aufweisen zu rauchen. Vielmehr
ist - abhängig von der Basiswahrscheinlichkeit - jedes relative Risiko möglich.
Best und Wolf (2010, S. 832) argumentieren:
„Wir raten daher von der Verwendung von eβ-Koeffizienten bzw. Odds-Ratios ab.
Eine über die Effekt-Richtung hinausgehende Interpretation ist allein auf der Basis
des Koeffizienten nicht möglich.“
Dieser Empfehlung wird an dieser Stelle gefolgt. Bei der Interpretation logistischer
Regressionskoeffizienten wird dringend geraten, sich bei den Regressionskoeffizienten
B auf die Interpretation der Vorzeichen zu beschränken. Alternativ
können auch die Effektkoeffizienten bzw. Odds-Radios verwendet werden. Dabei
deuten Werte kleiner als 1 auf eine geringere Chance, Werte größer auf 1 auf eine
höhere Chance hin. Die absoluten Beträge der Regressionskoeffizienten bzw. der
Effektkoeffizienten sollten allerdings nicht interpretiert werden.
Wie siehst du das? MFG
Super Video!
Hey, ich bin Schritt für Schritt alles so durchgegangen und es hat auch alles bei mir gepasst. Leider haben meine Exp(b) alle merkwürdige Werte wie 4,434 oder 2,648 muss ich das Modell dann verwerfen? Ich kann ja schlecht behauptden das einer der unabhängigen Variablen 400% in Zusammenhang mit der abhängigen Variable steht. :-( würde mich über in kurzes feedback sehr freuen. LG, Ricarda
Hallo Ricarda, so hohe Odd's sind nichts ungewöhnliches. Es ist übrigens eine relative Wahrscheinlichkeit, das kommt nicht zu 100% deutlich heraus. Einfacher ist es mit den Odd's direkt zu argumentieren. 4,434 bedeutet eine 4 fach höhere Chance. Hier erkläre ich die Odds auch noch mal, allerdings bei einem kategorialen Prädiktor: ruclips.net/video/3w88xhE5DLk/видео.html
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Vielen Dank!! :-)
Danke für das Video!
Ich habe folgende Frage: Ich möchte schauen, ob verschiedene Variablen einen Einfluss auf das Outcome (Rezidiv ja/ nein) haben. Wenn ich für jede einzelne Variable die binär logistische Regression rechne, kommen komplett andere Werte (andere Signifikanzen, Regressionskoeffizienten, ExpB) raus als wenn ich alle Variablen in einem Modell zusammen rechne.
Kann ich den EInfluss der einzelnen Variablen auf das Outcome rechnen und berichten? Oder muss ich ein Modell mit allen Variablen zusammen erstellen?
Gruß, Matthias
Hallo Matthias, gerne!
Du rechnest immer das vollständige Modell, weil du in der Realität ja auch nicht nur den einzelnen Effekt isoliert betrachten kannst und die verschiedenen UV auch miteinander korrelieren. Faustregel also immer vollständig rechnen, weil es das realitätsnähere Modell ist.
Viele Grüße, Björn.
Hi Björn! Vielen Dank für deine Videos nochmal :D was ist denn, wenn mein Exp(B) 3,444 ist? Steigt die Wahrscheinlichkeit für UV=1 dann um 244%, wenn die UV um eins erhöht wird?
LG
Hallo Julia, gerne. Die relative Wahrscheinlichkeit steigt um 2,44 bei Erhöhung der UV um 1. Die Betonung liegt hier auf relativer Wahrscheinlichkeit.
Viele Grüße, Björn.
Hallo Björn, vielen Dank für deine tollen Videos. Ich habe eine Frage zu dem Fall, wenn die Variable nicht in die Gleichung aufgenommen wird. Welchen Signifikanz-Wert sollte ich mir dann anschauen von dieser Variabel? Also den, der nicht in der Gleichung ist oder den, wo die Variable noch in der Gleichung bleibt ( also in Schritt 1 oder Schritt 0)? Würde mich über eine Antwort freuen!
Genial! Super. ;))))
Dankeschön! Viel Erfolg weiterhin!
Viele Grüße, Björn.
Wie ist das mit dem Prozentsatz über 50% bei der Klassifizierungstabelle gemeint? Sollte der Gesamtprozentsatz über 50% liegen oder die einzelnen Prozentsätze? :)
Ich habe dieses sehr hilfreiche Video gefühlt schon 100 mal angeschaut (jedes Mal, wenn ich eine log. Regression rechne). Ich frage mich, was es zu beachten gilt, wenn die UV aus Prozentzahlen besteht (also WErte von 0,0 bis 1,0 annehmen kann).
Hallo Björn! Ich muss dir meinen großen Dank liefern! Ohne Dich wäre meine Doktorarbeit echt nicht so geil, vor allem ich selbst habe so vieles gelernt!
Eine Frage hätte ich noch:
Wenn man nicht sig Omnibus Test und fast signifikanten Hosmer Test hat, ist dann das Model schlecht geeignet? Kann ich trotzdem mit Regressionkoeffizienten (0,002 (Exp(B)=1,002), sehr kleinen) einen Wert interpretieren? 0,2% Anstieg wenn mein UV um einen Punkt steigt? KI beinhalten bei mir "1" dazwischen und Sig ist auch 0,285. Danke und Gruß!
Hallo Adil, danke für dein Lob! Freut mich, wenn dir die Videos geholfen haben! :-)
Zu deiner Frage: der Omnibus-Test ist ja das, es der F-Test bei der normalen Regression ist. Sozusagen der Gatekeeper. Wenn der nicht signifikant ist, leistet das Modell, verglichen mit dem Nullmodell, keinen signifikanten Erklärungsbeitrag und man bricht an dieser Stelle ab.
Viele Grüße, Björn.
Vielen Dank für das tolle Video!
Ich habe eine Frage zur Berechnung der relativen Wahrscheinlichkeit, kann ich bei einer logistischen Regression mit einer binären abhängigen (Erkrankung: ja/nein) und unabhängigen Variablen (Symptom X: ja/nein) auch analog der Berechnung im Video vorgehen? Also bspw. bei einer OR von 6 interpretieren, dass die Erkrankung bei vorhandensein des Symptoms X mit einer relativen Wahrscheinlichkeit von 500% eintritt?
Lg und vielen Dank für die Antwort
Hallo Björn, danke für das gute Video! Welches Modell wende ich an, wenn ich als AV eine binäre Variable habe und als UV eine ordinal Skalierung (Likert-Skala). Behandle ich es dann wie eine kategoriale Variable oder eine metrische?
VG und Danke für danke für deine tolle Arbeit!
@StatistikamPC_BjoernWalther
Ich habe eine abhängige binäre Variable und 2 unabhängige metrische Variablen. Daher scheint die logistische Regression sehr gut zu passen. Allerdings habe ich noch Kontrollvariablen, die ich berücksichtigen will. Mein Problem ist, dass diese metrisch, nominal und ordinal sind. Kann ich diese bei der logistischen Regression überhaupt berücksichtigen, und wenn ja, wie prüfe ich diese auf Korrelation, da sie ja alle unterschiedliche Skalenniveaus haben?
Hallo Felix, die Skalenniveaus der UV sind bei jeglichen Regressionen (auch logistisch) egal. Sprich, du kannst sie alle bedenkenlos aufnehmen. Einzig kategoriale Variablen müssen bei 3 oder mehr Ausprägungen als Dummy codiert werden und eine davon asl Referenzkategorie rausgelassen werden. Die Erstellung von Dummies: ruclips.net/video/znYq9_HrzvU/видео.html und im linearen Kontext die Aufnahme und Interpretation, die analog zum logisitischen Kontext funktioniert: ruclips.net/video/MjvnwcsgxBo/видео.html
Viele Grüße, Björn.
Ich habe eine Frage. Ich untersuche gerade das Kaufverhalten von Menschen. Ich möchte hierbei untersuchen was Personen dazu bewegt erneut in einem Laden zu kaufen. Dabei untersuche ich Parameter wie Freundlichkeit des Personals, Zufriedenheit etc. Ich wollte eigentlich Kreuztabellen und eine logistische Regression zu dem Thema rechnen. Allerdings bin ich mir gerade unsicher, ob es sinnvoll ist eine Kreuztabelle (Rückkehrwahrscheinlichkeit X Freundlichkeit des Personals; Rückkehrwahrscheinlichkeit X Zufriedenheit) und eine logistische Regression (Rückkehrwahrscheinlichkeit in Bezug auf Rest) zu rechnen oder ob man in diesem Fall nur eins der beiden Verfahren wählt. Ich freue michauf deine Antwort
Hallo Björn, ist die Berechnung der Regression auch möglich wenn sowohl die abhängige als auch unabhängige Variable ordinal skaliert ist? In den Videos ist immer ein wert zumindest nominal, bei der logistischen Regression kann auch mit metrischen variablen gerechnet werden aber nie wird mit einer ordinalen variable gerechnet. Ist die Regression die falsche Analysemethode für ordinale Daten oder gibt es da einen Lösung für? Danke schon mal im Voraus
Ich habe ein Odds Ratio von 1,051. Das Ergebnis ist signifikant.Wie interpretiere ich dann das Ergebnis ? Kann ich die Nullhypothese ablehnen? (Das Odds Ratio ist ja sehr nahe null)
Ich habe mehrere Prädiktoren, einer davon ist kategorial und 11 sind metrisch.
Wenn ich die Prädiktoren einzeln teste, sind einige signifikant. Nehme ich
jedoch alle auf einmal ins Modell auf, ist kein Prädiktor mehr
signifikant. Woran liegt das?
Hallo Björn. Ich habe da ein Sig.des Steigungskoeffizienten von 0.234 aber dennoch ein exp(B) Konfidenzintervall, dass 0 nicht einschließt. Wie kann man das denn interpretieren? Vielen Dank dir!!
Hallo Björn, vielen lieben Dank für dieses Video!! :) wie gehe ich vor, wenn ich mehrere UV habe? einzeln berechnen oder jeweils in den Blöcken eingeben?
Hallo, gerne. ;-)
Ich würde es NICHT einzeln rechnen, da du die Korrelation zwischen den UV zwingend beachten solltest und das nur in einem vollständigen Modell funktioniert. Du kannst aber blockweise dei UV einführen und schauen, wie sich das Modell (hoffentlich) verbessert. Final interpretieren wirst du aber nur das "Endmodell", wo alle UV gleichzeitig drin sind.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther vielen herzlichen Dank für die Antwort, die hilft mir sehr weiter! Leider habe ich keinen sig. Wert beim Omnibus-Test, weshalb ich die Berechnung wohl verwerfen muss. (Stichprobengröße, Korrelationen passen). Liebe Grüße Isabel
Hallo! Ich habe eine kurze Frage: Darf man bei der binär logistischen Regression auch mehrere unabhänige Variablen gleichzeitig eintragen, um jeweils die univariate Regression errechnen zu lassen oder muss für jede zu untersuchende unabhänige Variable eine neue Regressionsanalyse gestartet werden ? Je nachdem wie viele unabhänige Variablen man eingibt, kommen unterschiedliche Ergebnisse zustande ( bsp. Abhänige Variable: Tod, unabh. Variable: einmal nur Alter vs. einmal Alter und BMI und Größe zusammen). Oder wird, wenn ich mehrere unabh. Variablen zusammen eingebe, direkt eine multivariate Regression berechnet?
Vielen Dank für deine tollen Videos!
danke dir für die super Erklärung. Ich habe es genauso wie beschrieben nachgerechnet. allerdings habe ich nachdem ich Exp(b) - 1 gerechnet habe, bei manchen unabhängigen Variablen noch immer einen Wert größer 1 stehen. Kann das richtig sein? Und wenn ja, wie kann ich das interpretieren? Vielen lieben Dank im Voraus!
Hallo und vielen Dank für das aufschlussreiche Video.
Eine Frage zur Ergebnisinterpretation: ich habe bei meiner Analyse zu einer UV ein Exp(B) Wert von 8,01 bei einem Regressionskoeffizienten von 2,1 (Sig 0,000). Was wäre das denn für ein Odss Ratio? Das wäre doch abnorm hoch oder?
Hallo Maximilian und danke für dein Lob!
Ja, ein solches OR ist schon recht hoch aber jetzt auch nicht ungewöhnlich. Gerade bei ordinal oder kategorial skalierten UVs kann es mitunter schon sehr hoch sein. Evtl. erkennst du in den deskriptiven Statistiken ja schon deutliche Unterschiede.
Viele Grüße, Björn.
Hallo Björn, wie verhält es sich mit Odds Ratios von weit über 1, also zB 6,45 oder ähnliches. Wäre das dann dennoch nur eine erhöhte Wahrscheinlichkeit von 45%? Weil du ja sagtest, man zieht immer 1 ab. Danke für die Antwort.
Hallo, lieber mit OR, da die >relativen< Wahrscheinlichkeiten gerne mal zu Verwirrung führen, wenn der Leser nicht aufpasst. Steigerung des Prädiktors um 1 sorgt für eine 6,45 fache höhere Chance für das Ereignis =1.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Super, vielen vielen Dank!!
Lieber Björn, seit ein Paar Wochen schaue ich deine Videos an und konnte bereits ein Abstract auf einem Kongress einreichen. Deshalb erstmal vielen herzlichen Dank! Ich habe allerdings noch eine Frage: Ich habe 11 metrische Prädiktoren. Das heißt, ich sollte zuerst für all meine Prädiktoren separat bzw. einzeln eine sog. univariate binary log. regr. Analyse durchführen. Und um ich eine multivariate binary log. regr. Analyse durchzuführen, sollte ich meine signifikanten Prädiktoren alle zusammen einfügen. Richtig? Ich würde mich auf eine Antwort sehr freuen.
Viele Grüße, Ughur
Hallo Ughur, freut mich zu hören, dass dir meine Videos helfen!
Ich würde empfehlen alle Prädiktoren gleichzeitig in das Modell aufzunehmen, es sei denn, du kannst begründen, warum du das schritt- bzw. blockweise machst. Denkbar wäre: zuerst Kontrollvariablen im Modell zu haben und zu rechnen und anschließend mit Aufnahme der dich interessierenden Prädiktoren zu schauen, wie viel besser das Modell wird, z.B. anhand -2log-Likelihood oder Pseudo R² oder, für mich immer aufschlussreicher, wie entwickelt sich der Prozentsatz der Richtigen in der Klassifizierungstabelle.
Viele Grüße, Björn.
Hallo, vielen Dank für das hilfreiche Video!
Ich habe eine binäre logistische Regression mit einer metrischen Variable verwendet. Meine Konfidenzintervalle sind beide über 1, es handelt sich also um einen positiv signifikanten Effekt. Meine Exp(B) ist allerdings bei 4,909. Wie genau habe ich das zu interpretieren?
Liebe Grüße!
Hallo Maria, die Chance erhöht sich in deinem Fall um 390% auf einen Outcome von 1, wenn die UV um 1 steigt.
Viele Grüße, Björn.
Hi Björn,
Danke dir für deine Videos. Das hilft mir sehr bei meiner Masterarbeit!
Ich habe folgende Frage:
Ich habe eine nominale abhängige Variable mit 4 Urlaubsarten und mehrere unabhängige Variablen.
Ich hatte schon mal 4 dummy variablen für die Urlaubsarten erstellt und wollte mit denen jetzt 4 mal die binäre logistische Regression durchführen.
Jetzt hatte ich aber auch beim googeln die multinomiale Regression gefunden. Allerdings finde ich generell darüber weniger Informationen. Leichter wäre für mich also die binäre logistische Regression mehrmals durchzuführen. Aber ergibt das auch inhaltlich Sinn? Sollte ich trotzdem besser die multinomiale Regression wählen? Bin sehr am verzweifeln weil ich 2 Wochen abgabe ist.
Danke dir und viele Grüße!
Hallo Kimi, in deinem Fall ist eine multionomiale logistische Regressio durchzuführen, weil deine AV nicht dichotom ist.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Danke für deine schnelle Antwort! Muss ich dabei irgendwas anderes beachten als bei der binären logistischen Regression. Also was die Voraussetzungen angeht?
@@kimi_1036 Nein, da gelten ähnlich kaum Voraussetzungen. Lediglich Multikollinearität sollte beachtet werden.
Viele Grüße, Björn.
Hallo Björn! Vielen Dank für die übersichtlichen und sehr gut nachvollziehbaren Videos.
Kate Violet hatte es zwar schon einmal ähnlich gefragt, aber ich muss trotzdem nochmal fragen: Ich habe viele viele viele Laborwerte (346 Patienten, jeweils an drei Zeitpunkten gemessen...) und möchte jetzt wissen, ob ein Laborwert (z.B. Laktat) für das Ereignis "Tod" (dichotome Variable; 1=ja; 2=nein) mitverantwortlich ist. Medizinisch wäre es so, dass man eher stirbt, wenn das Laktat steigt. Wenn ich die binäre log. Regression nehme, erhalte ich ein RegressionkoeffizientB von -0,35. Jetzt endlich die Frage: Woher weiß jetzt SPSS, dass mein Ereignis "Tod" bei "1" eintritt und nicht bei "2"? Also wäre es ja in meinem Fall so, dass der Laborwert "Laktat" niedriger wird und damit das Ereignis eher eintritt, oder? (wegen dem negativen Vorzeichen) Die Signifikanz ist übrigens 0,000, der Exp(B) 0,71 und die 1 liegt nicht im Konfidenzintervall.
2. Frage: wenn ich nicht wissen will, ob ein Laborwert zu einem bestimmten Zeitpunkt Einfluss auf das Ereignis "Tod" hat, sondern die Änderung des Werte vom 1. zum 2. Messzeitpunkt - wie mache ich das?
Vielen Dank für deine Arbeit!!!
Liebe Grüße
Bettina
Hallo Bettina und danke für dein Lob!
Zu deinen Fragen:
1) SPSS verwendet die niedrigere Ausprägung der dichotomen Variable als Referenzkategorie. Du kannst auch im Klassifikationsdiagramm schauen, was da steht. "Predicted Probability is of Membership for xyz".
2) Da du Paneldaten hast, müsstest du streng genommen auch eine binär logistische Panelregression rechnen. Das geht allerdings in SPSS nicht, jedoch mit dem Paket pglm in R. Du kannst in SPSS nur für bestimmte Wellen in einer Querschnittregression eine Berechnung durchführen oder die UV der vorherigen Perioden auf spätere bzw. folgende Perioden untersuchen. Aber auch da musst du aufpassen, weil dieselbe UV zu unterschiedlichen Zeitpunkten sehr starke Multikollinearität herovrrufen kann und damit deine Ergebnisse stark verzerrt werden.
Viele Grüße, Björn
Werden die Koeffizienten der logistischen Regression bei Paneldaten genauso interpretiert?
Erstmal vielen Dank für das super hilfreiche Video!
Ich hab eine Frage zu meinem Modell: Der Omnibus Test der Modellkoeffizienten mit 0,032 < 0,05 aber der Hosmer Lemeshow Test mit 0,03 nicht > 0,05. Muss ich das Modell verwerfen? Bzw. kann ich dann sagen, dass man an dieser Stelle keine weitere Aussage zum Zusammenhang der abhängigen und unabhängigen Variable treffen kann oder gibt es dann statistisch gesehen keinen Zusammenhang?
Liebe Grüße
Carina
Hallo Carina, gerne!
Der Omnibus-Test ist in Ordnung, der Hosmer-Lemeshow-Test sorgt in deinem Fall für einen nicht hinreichenden Fit. Die Differenzen zwischen beobachteten und erwarteten Werten sind zu hoch, was für eine nicht hinreichende Modellanpassung spricht. Der -2Log-Likelihood-Wert ist vermutlich auch recht groß?
Viele Grüße, Björn.
Hallo Statistik am PC,
erst einmal vielen Dank für das ausführliche Video! Ich habe noch eine Frage und zwar kannst du noch einmal erklären wie genau das mit den Konfidenzintervallen gemeint ist?
Zudem untersuche ich in meiner Masterarbeit auch einen Moderationseffekt. Ich habe eine nominale abhängige Variable (Würden Sie (wieder) in Betracht ziehen etwas über eine branded App zu kaufen? Ja, Nein) und 18 unabhängige Variablen welche die Kaufintention messen. 9 davon messen bereits die Kaufabsicht unter der Voraussetzung von zusätzlicher Personalisierung der App. Muss ich hierfür dann extra noch andere Tests machen zum messen der Unterschiede durch den Moderator oder reicht ein einfacher Vergleich der Regressionskoeffizienten? Zudem ist auffällig, dass nur 8 Variablen ein Signifikanzniveau < 0,05 haben. Könnte hier ein Fehler vorliegen?
Vielen Dank vorab und liebe Grüße!
Hallo und danke für dein Lob!
Prinzipiell haben bei so einer großen Anzahl an Variablen niemals alle, geschweige denn bisweilen überhaupt die Hälfte einen signifikanten Einfluss. Das ist also alles in Ordnung. Wenn du eine Moderation im Rahmen der logistischen Regression rechnen willst, würde ich dir eher PROCESS empfehlen als die Bordmittel von SPSS, allerdings kannst du damit die im Rahmen einer schrittweisen Regression besser sichtbaren Veränderungen nicht betrachten und musst die Modelle umständlicher jeweils manuell spezifizieren.
Viele Grüße, Björn.
Gibt es auch ein Video dazu, wie ich meine Ergebnisse nun präsentieren muss? Wie stelle ich z.B. die Odds Ratio in Arbeiten sinnvoll dar?
Vielen Dank!
Also wir machen das so:
Das Model repräsentiert einen signifikanten/nicht signifikanten Anteil der Daten, x^2(df) = ..., p-Wert. Die Prädiktoren erklären ... Prozent (Nagelkerke R^2= ..., Cox & Schnell R^2= ...) der Varianz der abhängigen Variable.
"n" von "n-max" (also bsp. 2 von 5) Prädiktoren beeinflussen die "Abhängige Variable" signifikant. Für eine Erhöhung des "Prädiktors XY" um eine Einheit ist die Änderung der Wahrscheinlichkeit für ... (Exp(b) = ..., p-Wert.). Für den Prädiktor "XY" konnte kein signifikanter Einfluss nachgewiesen werden (p-Wert).
@@lgemm3528 Vielen Dank! Log-Likelihood reported ihr nicht?
@@P8Dealer Nope, wir nicht. Gern!
Hallo Björn, deine Videos sind wirklich unglaublich hilfreich! Vielen Dank dafür! :)
Ich hätte noch eine Frage hinsichtlich der marginalen Effekte. Die Odds Ratio stellen so weit ich es sehe marginale Effekte dar. Gibt es in SPSS auch die Möglichkeit Average Marginal Effects (AME) zu berechnen?
Hallo Björn,
im Rahmen meiner logistischen Regression ist die Signifikanz des Omnibustests über 0,05. Was bedeutet dies? Ist die logistische Regression nicht geeignet (laut Skalenniveaus müsste sie geeignet sein)? Liegt keine Korrelation vor? Sollte ich an dieser Stelle abbrechen?
Zudem ist in der Klassifizierungstabelle unabhängig vom Signifikanzwert im Omnibustest immer eine Ausprägung komplett falsch vorhergesagt. Was bedeutet dies für mich?
LG
Hallo Jessica, wenn der Omnibus-Test nicht signifikant ist, ist das ein Problem. Der Signifikanzwert von weniger als 0,05 zeigt an, dass das aktuelle Modell mit Koeffizienten besser geeignet ist als das Nullmodell. In deinem Falle wäre also das Nullmodell besser. Die binäre logistische Regression würde man an dieser Stelle abbrechen. Mit Korrelation hat das nicht unbedingt was zu tun. Was korreliert? Die UV mit der AV, die UV unter sich? Das kann, muss aber nicht sein. Du willst ja mit der Regression Kausalität untersuchen, zumindest, wenn du es theoretisch fundiert hast, ist so ein Schluss statthaft.
Wenn in der Klassifizierungstabelle eine Ausprägung nie vorhergesagt wird, kann das zwei Gründe haben. Der eine ist, dass es schlicht sehr viele Fälle der anderen Ausprägung gibt und das Modell lieber auf die häufiger vorkommende Ausprägung "schätzt", weil es da im Schnitt häufiger richtig liegt als nicht. Der andere Grund ist, dass das Modell, wie du schon gemerkt hast, eher schlecht auf die Daten passt. Das sollte man auch am Hosmer-Lemeshow-Test sehen.
Eventuell kannst du deine Stichprobe noch mal unterteilen. Mitunter zeigt sich eine bessere Prognose für nur einen Teil der Stichprobe, z.B. nur für Frauen, statt für beide gemeinsam.
Viele Grüße, Björn.
Sehr hilfreich, danke dir! Wollte fragen ob die Interpretation der Ergebnisse im multiplen Fall ausfällt und ob ich die multiple logistische Regression trotzdem machen kann, wenn ich nominale und metrische Prädiktoren habe?
Hallo Luca und danke für dein Lob!
Die Interpretation mit mehreren UV ist analog zu der im Video gezeigten. Du kannst die Skalenniveaus der Prädiktoren mischen. Für einen nominalen und dessen Interpretation habe ich noch mal eine separates Video: ruclips.net/video/3w88xhE5DLk/видео.html
Viele Grüße, Björn.
Hallo Björn,
vielen Dank für das tolle Erklärvideo! Es hat mir bei meiner Masterarbeit schon sehr weitergeholfen. Ich habe allerdings noch drei Fragen und wäre dir sehr dankbar, wenn du mir weiterhelfen könntest.
1.) In meinem ersten Fall ist beim Omnibus-Test die Signifikanz > 0,05. Hier breche ich die weitere Interpretation ja ab und berichte keine weiteren statistischen Werte, richtig? Die Signifikanz > 0,05 bedeutet ja, dass das Nullmodell (Block 0) besser geeignet wäre als das aktuelle Modell (Block 1). Was heißt das genau?
2.) Bei meinem 2. Fall stimmen die Signifikanzen, aber der Gesamtwert in der Klassifikationstabelle liegt gerade mal bei 57,2%, was ja sehr bzw. zu wenig ist. Wie gehe ich damit um und was sagt es genau aus?
3.) In einem der Kommentare wurde gefragte, welche Werte dokumentiert werden sollen. U.a. hast du hier angegeben "Koeffiziententabelle mit unstandardisierten und standardisierten Koeffizienten". Welche zwei Werte sind das im SPSS Output?
Vielen Dank schon mal und beste Grüße
Lisa
Hallo Lisa, gerne.
Zu deine Fragen:
1) Das bedeutet, dass dein Modell unter Hinzunahme weiterer Prädiktoren die AV nicht besser erklären kann als ohne.
2) 57,2% ist zumindest besser als eine zufällige Prognose des Ereignisses. Also du wärest mit einem Münzwurf noch schlechter. Gut ist es nicht, aber besser wird es wohl erst mit anderen UVs, Stichprobenwahl und -größe, "besserer" Operationalisierung latenter Konstrukte usw.
3) Standardisiert meint das Exp(B). Also aus der Tabelle "Variablen in der Gleichung".
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Vielen Dank! Kurze Rückfrage noch zu 3.): Welchen Wert meinst du dann mit dem "unstandardisierten" Koeffizienten?
Hey, vielen Dank für die tolle Erläuterung :) . Wenn meine Variablen im Einzelnen nicht signifikant sind, mein Modell als Ganzes und im Hosmer-Lemeshow-Test aber schon, lohnt sich dann eine weitere Interpretation der einzelnen Odds?
Hallo, wenn es keine Signifikanz gibt, dann sollte man die odds nicht interpretieren.
Viele Grüße, Björn.
Danke für das schöne Video! :)
Ist es irgendwie möglich auch eine Art "Schwellwert" auf diesen Weg rauszubekommen? Also bspw ab welchem IQ Wert das Bestehen der Prüfung wahrscheinlicher ist?
Würde mich auch interessieren!
Das Video ist echt super hilfreich. Ich muss für meine BA eine binär logistische Regression durchführen, aber leider verpasst mein Omnibus-Test mit 0.054 knapp die Signifikanz. Gibt es da eine Möglichkeit trotzdem weiter zu rechnen?
Hallo :)
Ich habe eine kurze Frage: Und zwar wird bei mir trotz der Mehrheit auf der Ja-Seite immer Nein als Referenzkategorie angegeben, was mir die Interpretation erschwert. Ich habe auch versucht die Multinominale mit einer Variable zu rechnen, aber das hat mich nur noch mehr verwirrt. Kannst du mir vielleicht einen Rat dazu geben? Das wäre lieb, Danke :)
Hallo Anni, die Referenzkategorie der AV ist immer die niedrigere Ausprägung. Hat Nein die niedrigere Ausprägung? Typischerweise werden Nein mit 0 und Ja mit 1 codiert, was das erklären könnte.
Viele Grüße, Björn.
Vielen Dank, deine Videos retten mich echt!
Ich hätte noch eine Frage: wenn ich ein Konfidenzintervall von 2.48-141.58 habe, dann weist das auch darauf hin, dass die Ergebnisse nicht signifikant sind oder?
Und wenn mein Exp (B) = 18.76 ist, heißt das dann, dass das Modell nicht signifikant ist? Der Wert kommt mir sehr unwahrscheinlich vor...
Ich schreibe momentan an meiner Masterarbeit und bin so dankbar für deine Videos, die sind echt super verständlich! :)
Wie muss ich ein Modell interpretieren, wenn das Pseudo-R-Quadrat steigt, sich aber die Häufigkeiten in der Klassifizierungstabelle nicht mehr ändern? Vielen Dank für die Hilfe.
Hallo Christian, das bedeutet wohl, dass das bessere R² nur auf Basis der Aufnahme weiterer UV zustandekommt.
Viele Grüße, Björn.
@Statistik am PC. Bei mir tauchen in der Übersicht nicht mehr alle Variablen auf die ich eingebracht habe. Woran kann das liegen?
Hallo Florian, welche Methode der Aufnahme der Prädiktoren verwendest du? Gibt es evtl. Prädiktoren, die durch andere Prädiktoren perfekt abgebildet werden können oder eine Linearkombination darstellen? Letzteres trifft meist auf Dummy-Variablen zu, wenn keine Referenzkategorie ausgelassen wird.
Viele Grüße, Björn
@@StatistikamPC_BjoernWalther Hi Björn, viel vielen Dank für deine schnelle Antwort. Tatsächlich handelt es sich im Dummy Variablen die sich gegenseitig ausschließen. Wie gebe ich den Einfluss der ausgeschlossenen Variable denn am besten an?
Und dann habe ich noch eine zweite Frage und vielleicht kannst du mir helfen: Ich möchte ein Matching durchführen anhand von Scores und dann wiederum schauen, welche Gruppe besser abschneiden. Das Ergebnis ist ebenfalls eine Dummy Variable.
Hallo Florian, du siehst immer nur den Unterschied zwischen dem ausgeschlossenen Dummy und den jeweils im Modell befindlichen Dummys. Du kannst die Dummys beliebig durchtauschen bzgl. Referenzkategorie -das Modell bleibt identisch, du erfährst aber die anderen Unterscheide.
Die 2. Frage verstehe ich nicht ganz. Du möchtest deine Stichprobe in 2 Teile splitten und eine Gruppenvariable soll dies abbilden?
Viele Grüße, Björn.
Danke Björn für das Video!
Ich habe allerdings ein kleines Problem. Ich habe eine binär logistische Regression durchgeführt, wie du es beschrieben hast. Die Outcome-Variable hat die Optionen 0 = "nein" und 2 = "ja". Da ich gelesen habe, dass keine fehlenden Werte existieren sollten in den Variablen (glaube aber das gilt eher nur für den Fall, dass man mehrere Prädiktoren nimmt?) habe ich sicherheitshalber die Stichprobe so gefiltert, dass nur Probanden einbezogen werden in die Analyse, die auf Prädiktor und Outcome einen Wert haben.
Jetzt ist es so, dass ich mir diese Beobachtet-Vorhergesagt-Tabelle angucke. Die sieht so aus (ich hoffe, das passt mit der Darstellung):
Vorhergessagt
nein ja
Beobachtet nein 614 0
ja 204 0
Also es wurde offenbar vorhergesagt mit meinem Prädiktor, dass alle Cases in die Kategorie "Nein = Event tritt nicht ein" fallen müssten. Der Prädiktor wird aber mit p = 0,03 signifikant und das Exp(B)-Konfidenzintervall beinhaltet nicht die 1.
Hast du eine Idee, ob da etwas schiefgelaufen sein könnte? Oder ist das ein Fall, wo der Prädiktor das Outcome perfekt vorhersagt? Das fänd' ich persönlich sehr komisch. Bei Nutzung derselben metrischen Variablen und eines anderen kategorialen Prädiktors (wieder mit ja/nein) habe ich dasselbe Problem, dass alle Pbn nur einer Kategorie zugehörig vorhergesagt werden...
Liebe Grüße und danke schonmal im Voraus!
Hallo, das kann durchaus sein, dass die Vorhersage auch im Block 1 noch zu so einem Ergebnis kommt (Omnibus-Test signifikant?). Das Modell weiß, das in 75% der Fälle "nein" das Outcome ist. Wenn das Modell also immer nein prognostiziert, liegt es ja mit 75% richtig, was per se ein guter Wert ist. Allerdings fallen dir da 200 Fälle runter und so wirklich hat man ja keine (differenzierte) Prognose erzielt. Die Prädiktoren, die du hast, scheinen nicht zuträglich zu sein, also keine weitere hinreichende Differenzierung zu erzielen. Da gibt es also wohl noch etwas Potential bzgl. weiterer Prädiktoren, zumindest anhand des Gelesenen.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Vielen lieben Dank für die Antwort!!
Lieber Björn,
Vielen Dank für Deine hilfreichen Videos! Ich hätte da noch zwei Fragen: Kann ich eine binäre logistische Regression rechnen, wenn meine Prädiktorvariablen und meine Outcomevariable nominal skaliert sind? Ich möchte schauen, welchen Einfluss Mobbing (nominal, Opfer von Mobbing ja/nein) auf pathologische Internetnutzung (nominal, ja/nein) hat.
Meine zweite Frage bezieht sich auf SPSS im Allgemeinen: Ich würde gerne eine Variable erstellen, die zwei bestehende Variablen beinhaltet (Opfer von Mobbing->ja, und Opfer von Cybermobbing-> ja). Ich habe versucht mit der Schaltfläche Transformieren->Neue Variable erstellen die neue Variable zu erstellen mit der Bedingung var_mob = 1 (für ja) & var_cyb = 1 (ja) aber ich habe das Gefühl ich habe einen Fehler gemacht. Wenn ich zum Beispiel dann eine Kreuztabelle mit der neuen Variable rechnen möchte, dann gibt mir SPSS an, dass die neue Variable einen Konstante ist und nicht in der Berechnung berücksichtigt wird.
Besten Dank für Deine Hilfe :)
Lg Valerio
Hallo Valerio,
ja, das funktioniert. Hierzu wird es diesen Freitag auch ein Video geben.
Zu deiner zweiten Frage: das hört sich logisch sauber an und sollte klappen - nur 1 &1 Fälle wirst du ja nicht haben. Hast du evtl. keine sonstigen Fälle?
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Danke für Deine schnelle Antwort! Dann bin ich gespannt auf das Video am Freitag :) Ich glaube es hat jetzt geklappt mit der neuen Variable (habe fälschlicherweise anstatt alle Fälle nur die bedingten Fälle ausgewählt). Vielen Dank für deine Hilfe und weiterhin viel Erfolg mit Deinen hilfreichen und qualitativ hochstehenden Tutorials!
LG Valerio
Danke für das tolle Video!
Was mir allerdings abgeht, sind die zu prüfenden Voraussetzungen bei metrischen Prädiktoren. Muss ich min. erwartete Häufigkeit testen und wenn ja wie? oder gilt das nur für kategoriale Prädiktoren? Danke für deine Hilfe :-)
Hallo Viola und danke für dein Lob!
Die logistische Regression hat eigentlich keine Voraussetzungen. Lediglich die dichotome Abgabe Variable und keine Multikollinearität sind zu beachten. Der Rest, wie man ihn aus der linearen Regression kennt, spielt keine Rolle.
Viele Grüße, Björn.
Hi! SPSS ist mir noch relativ neu. Möchte eine Binäre Logistische Regression ausprobieren, aerdings wird mir diese Möglichkeit unter Analyse gar nicht angezeigt. Benutze SPSS 26, Tipps? :)
Hallo, hast du die Testversion?
Viele Grüße, Björn.
Was genau ist eigentlicher dieser Wald-Test und wie interpretiere ich den?
Hallo! Ich danke dir vielmals für deine Videos, ohne wäre ich im Studium schon so häufig verzweifelt.
Eine Frage zu den Klassifizierungstabellen: bei mir steht bei der Ausprägung 1 bei den Vorhergesagten immer 0!
die beobachteten stimmen, aber woran könnte das liegen?
Vielen Dank schonmal, ich freu mich auf ein erklärungsvorschlag
Hallo Pulu, danke für dein Lob!
Wie sind denn die Beobachtungen verteilt? Wie viele 1 und 0 hast du als Ausprägungen?
Wenn du sehr wenige 1 und sehr viele 0 im Datensatz hast, prognostiziert das Modell fast immer keine 0, weil es damit ohnehin fast immer falsch liegen wird.
Viele Grüße, Björn.
Hallo Björn, vielen Dank für deine tollen Videos, die mir schon so oft geholfen haben. Ich habe eine Frage: welches Modell muss ich rechnen, wenn ich sowohl mehrere unabhängige Variablen (unterschiedlich skaliert) als auch mehrere abhängige (alle binär kodiert) habe? Vielen Dank und viele Grüße!
Hallo eileen, danke für dein Lob!
Prinzipiell kann man einfach für jede AV ein Modell rechnen: www.ibm.com/support/pages/logistic-regression-multiple-dependent-variables
Es kann je nach Kontext aber auch angebracht sein, ein Strukturgleichungsmodell zu rechnen. Mit binären Variablen aber nicht wirklich üblich und bei R zögerlich implementiert: personality-project.org/r/tutorials/summerschool.14/rosseel_sem_cat.pdf
Meine Tendenz würde zu ersterem gehen.
Viele Grüße, Björn.
Vielen Dank für das tolle Video. Könntest du kurz den Unterschied zur multinomiale logistischen Regression erklären, und was die Ergebnisse aussagen?
Super Video! Ich habe allerdings eine Frage. Ich kriege signifikante Ergebnisse wenn ich nur einzelne Variablen mit der logistischen Regression berechne. Aber wenn ich alle 8 Skalenwerte eines Fragebogens einfüge, sind auf einmal die Signifikanzen dahin. Woran liegt das?
Hallo und danke für dein Lob! Da die unabhängigen Variablen auch untereinander korrelieren, "verschwinden" Signifikanzen aus einfachen Regressionen ab und an. Das ist nichts Ungewöhnliches. Ich würde immer zum "vollständigeren" Modell raten, da du so für den gleichzeitigen Einfluss anderer Variablen kontrollierst.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Danke! Ja, ich hab die hoch untereinander korrelierenden Variablen aufgeteilt und es hat geklappt!
Hallo, welche Werte muss ich denn bei der binär logistischen Regression denn aufschreiben, wenn ich sie publiziere?
Hallo Theresa, das hängt natürlich ein bisschen von der Fachrichtung ab, aber generell würde ich für die binär-logisitsche Reression folgendes angeben: die Koeffiziententabelle mit unstandardisiertem und standardisiertem Koeffizienten, dem Odds Ratio, dem 95% KI. Zusätzlich in eine Zeile darunter die Gütemaße (-2LogLikelihood, R²) und evt. noch Hosmer-Lemeshow-Test. Die Ergebnisse aus der Klassifikationstabelle verbalisiert man einfach so mit. Evt. will dein Gutachter aber auch die Tabelle sehen (Anhang?) und den Omnibus-Test für dein Block 1-Modell. Da fragt man am besten nach oder konsultiert die Richtlinien für wissenschaftliches Arbeiten, die dir vorliegen bzw. von deinem Institut/Lehrstuhl zur Verfügung gestellt werden sollten .
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Vielen Dank für die ausführliche Antwort!
Hallo Björn, danke für das tolle Video. Ich hätte eine Frage, ich habe bei meinen Berechnungen für manche Prädikoren für Exp(B) Werte wie "3025" oder auch "1752E-6" rausbekommen. Jetzt weis ich nicht wie komisch das ist. Hab solche Werte noch nie in meinen Recherchen gesehen, was meinst du ://///// danke dir schon mal für deine Antwort 👏🏼
Vielen Dank für die sehr detaillierten Ausführungen. Ich habe eine Frage: Wenn ich das ganze nun mit kategorialen Variablen rechne (z.B. IQ hoch ja/nein) dann gibt mir die OR doch im Endeffekt an, wie viel "wahrscheinlicher" das bestehen des Führerscheins ist, wenn ich einen hohen IQ habe oder?
Hallo, so kann man das vorsichtig interpretieren. Das OR ist das Verhältnis zweier Odds, also die relative Wahrscheinlichkeit. Also bei dichotom, die Odds mit IQ hoch im Verhältnis zu Odds mit IQ niedrig - je nachdem, was die Referenzkategorie ist.
Viele Grüße, Björn.
Statistik am PC super vielen Dank für die Antwort! Spitzenservice!
Hat jemand einen Link/Literaturtipp für ein Beispiel wie man die Ergebnisse der binären logistischen Regression darstellt? Die Formulierung der Ergebnisse fällt mir schwer ...
Hallo Sophia, Andy Field (2018) Discovering Statistics using SPSS, S. 911.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Danke, habe ich aber leider keinen Zugang zu. Irgendwas öffentlich zugängliches? Viele Grüße, Sophia
Hallo und vielen Dank für Deine super hilfreichen Videos!
Meine Frage: Gibt es ein Einstiegswerk für blutigste(!) Statistik-Neulinge (Geisteswissenschaftler), dass du als eine allgemeine Einführung in die Statistik samt ihrer Theorien und Methodiken empfehlen würdest?
lG :)
Hallo Anton und danke für dein Lob!
Wenn Englisch kein Problem ist, ist eine recht anwendungsnahe Einführung an SPSS von Andy Field der Klassiker: amzn.to/2VTzk8Q
Wenn es ohne Statistikprogramm, etwas ausführlicher, gerade in Bezug auf Forschungsmethodik und auf Deutsch sein soll, ist Döring/Bortz eine gute Wahl: amzn.to/2ItcInF
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Vielen Dank! Werde natürlich trotzdem nicht aufhören deine Videos zu schauen ;D :)
Hallo, auch lieben Dank von meiner Seite für deine Videos, damit geht das ganze schon viel einfacher :)
Ich schaue mir in meiner Arbeit die Unterdrückung von negativen Emotionen auf die Existenz (ja/nein) und das Ausscheiden von Mitarbeitern (ja/nein) in start-ups an - beides in getrennten binären Regressionen. Leider sind die Ergebnisse in der binär logistischen Regression (knapp) nicht signifikant. Ich würde sehr gerne einen Mediator, nämlich Authentizität dazu nehmen, um zu schauen, ob das einen Unterschied macht. Ich hoffe, es gibt über den Mediator ein signifikantes Ergebnis. Ich habe jedoch auf der Uni gelernt, dass die AV bei einer Mediation immer metrisch sein muss, das ist sie ja bei mir aber nicht (Mitarbeiter noch im Unternehmen ja/nein und Start-up existiert noch ja/nein). Könntest du mir vielleicht weiterhelfen, was nun stimmt und wie ich weiter machen kann? Vielen lieben Dank bereits und ganz liebe Grüße, Florentina
Hallo Björn erst mal danke für dein Video und die Mühe dahinter! Ich schreibe zur Zeit an meiner Bachelorarbeit und muss für einer meiner Hypothesen eine Mediationsanalyse durchführen. Nur ist es so, dass mein Mediator dichotom ist. Ich habe im Internet recherchiert und herausgefunden, dass man in diesem Fall auch eine logistische Regression durchführen kann. Jedoch weiß ich nicht, wie das bei SPSS zu handhaben ist. Ich würde mich sehr freuen wenn du mir dabei weiterhelfen könntest. Lg
Hallo, ich habe momentan genau dasselbe Problem. Hast du damals eine Lösung gefunden? Liebe Grüße und danke im Voraus!
Guten Morgen! Gibt es auch die Möglichkeit, eine binär logistische Regression mit einer binären unabhängigen Variable zu rechnen? :-)
Hallo, ja, das funktioniert analog. Hier noch mal ein Video mit kategorialem prädiktor: ruclips.net/video/3w88xhE5DLk/видео.html
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Danke dir! Das bedeutet, ich darf eine binär-codierte UV nicht wie eine metrisch codierte behandeln und kann das Verfahren, wie in diesem Video mit metrischem Prädiktor
nicht anwenden?
@@a.r.142 Schau einfach mal das andere Video an, das sollte deine Fragen beantworten.
Viele Grüße, Björn.
Hey, erst einmal ein riesen Lob für deine wirklich tollen Videos!
Du sagtest ja, dass das Nullmodell eigentlich nicht so besonders wichtig ist. Trotzdem wüsste ich gern einmal, was eigentlich die Zeile „Gesamtstatistik“ in der Tabelle „Variablen nicht in der Gleichung“ bedeutet? Die Zahl erschließt sich mir nicht unbedingt, insbesondere, wenn ich mehrere unabhängige Variablen untersuche. Danke :-)
Hallo und danke!
Die Gesamtstatistik im Nullmodell ist ein Chi-Quadrat-Wert, der dir angibt, ob die Variable aufgenommen werden sollte. Nullhypothese: Kein Einfluss der UV. Um die Chi²-Berechnung en detail zu verstehen, kann man nur händisch nachrechnen: Field (2019), Discovering Statistics, S. 880ff.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Besten Dank!
Gehören die Nullmodelle eigentlich in eine wissenschaftliche Arbeit? Oder kann ich diese auch einfach nur "für mich" interpretieren, ansonsten aber als Tabelle in der Dissertation weg lassen? Viele Grüße
sehr tolles Video, das hilft mir für meine Masterarbeit sehr weiter, danke!
Wenn ich mehrere Variablen in die Regression aufnehme, erfolgt die Interpretation nach demselben Prinzip?
Hallo Julia, danke für dein Lob! :-)
Genau, die Interpretation erfolgt analog.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther kann mich dem Lob nur anschließen. selbst bei ca 25 unabhängige Variablen kann ich das so interpretieren? Grüße
Was wenn ich Ja mit 1 und Nein mit 2 kodiert habe? Muss ich Nein dann zu 0 und Ja zu 1 umkodieren?
Hallo Kate, das macht keinen Unterschied.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Danke! :)
Wo kann ich mir denn die Regressionsgleichung anzeigen lassen? Ich bin gerade verzweifelt auf der Suche! Ansonsten super Video. Vielen Dank!
Hallo Floriano, danke für dein Lob! Die Gleichung ist ja nichts anderes als die Wahrscheinlichkeit für das Eintreten. Das wäre 1/(1+e^(-(beta_i*x_i))).
Viele Grüße, Björn.
Statistik am PC vielen Dank für eine Antwort. Exakt mit dieser Gleichung habe ich die Wahrscheinlichkeiten nachgerechnet und ich komme auf andere Ergebnisse wie sie spss ausgibt? Weißt du woran das liegen könnte ?
super Video!!! wie ist es, wenn ich keine Werte habe und diesen mit -1 codiere?
Hallo Julia, danke! Meinst du fehlende Werte mit -1 codieren?
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Hallo Björn! Ja genau, fehlende Werte mit -1 codieren :D
man könnte diese herausfiltern, würde ich behaupten. Viele Grüße, Julia
Mein Prof zieht bei der Odds Ratio nicht noch einmal 1 ab. Er interpretiert direkt die Odds Ratio, die angegeben ist. Jetzt bin ich etwas verwirrt. Vielleicht könntest du in Zukunft auch den Graphen etwas besser erklären.
Hallo Julia, es gibt verschiedene Interpretationsmöglichkeiten zum Odd's ratio. Das Abziehen von 1 ist eine Möglichkeit und die, wie ich finde, verständlichere.
Du meinst sicher das Klassifikationsdiagramm? Ich denke dazu ist fast alles gesagt, ohne es unnötig in die Länge zu ziehen, da das Video ja ohnehin schon 12,5 Minuten geht. Es wird aber irgendwann noch ein weiteres Video zur binär logistischen Regression geben, wo es um ordinale und kategorial Prädiktoren geht und evt. gibt es da noch ein paar zusätzliche Worte. Oder ich mache da mal ein dediziertes Video zu - ich überlege mir mal was.
Viele Grüße, Björn.
hi, Sehr hilfreich.
Machst Du noch ein Video zu ordinale und multinomiale regression?
Hallo Giuseppe, danke!
Das wird leider noch etwas dauern.
Viele Grüße, Björn.
@@StatistikamPC_BjoernWalther Dafür wäre ich auch unglaublich Dankbar :) (Hut ab an dieser Stelle für deine didaktisch extrem gut aufgebauten Videos!!!!)
@@StatistikamPC_BjoernWalther Eine Erklärung zu einer binär logistischen Regression mit einer ordinalen unabhängigen Variable (Wertung von sehr unwichtig bis sehr wichtig) bräuchte ich leider auch sehr dringend! Hättest du vielleicht einen Tipp, wo ich das stattdessen gut nachlesen kann? Oder kann ich meine ordinale unabhängige Variable einfach umkodieren zu 0=unwichtig und 1= wichtig und die binäre logistische Regression mit kategorialem Prädiktor ausführen? Grüße Raphaela
Bei Fragen und Anregungen zur binär logistischen Regression in SPSS - metrischer Prädiktor - nutzt bitte die Kommentarfunktion.
Danke für die tollen Videos. Gibt es hierzu auch eins für Excel oder eine Beschreibung zum Vorgehen? Danke :)
Hallo Lisa, ah, jetzt sehe ich diesen Kommentar. Soweit ich weiß gibt es keine Möglichkeit in Excel dies zu tun. Evtl. existiert irgendwo ein Plugin, da wäre ich aber vorsichtig.
Viele Grüße, Björn.
Gutes Video, aber ein kleines Problem habe ich mit deiner Interpretation der Odds Ratio: die Odds sind keine Wahrscheinlichkeit, dass etwas eintritt, sondern, wenn die OR=1,2 ist, dann steigt die ODDS für das Bestehen des Führerscheins (bei Steigerung des IQ um 1) um 20%.
Kleines Beispiel: die WAHRSCHEINLICHKEIT eine 6 zu würfeln liegt bei 1/6, die ODDS für eine 6 liegt aber bei 1/5 (Wahrscheinlichkeit/Gegenwahrscheinlichkeit).
Wahrscheinlichkeit und Odds sind nicht dasselbe!
Hallo und danke für dein Feedback! Ich habe wohl nicht gänzlich den Duktus durchgehalten, als ich von relativer Wahrscheinlichkeit sprach. Deswegen habe ich zusätzlich noch versucht mit Folien zu arbeiten, die das unterstützen.
Viele Grüße, Björn.
"Dann steigen die ODDS um 20,1 prozen", nicht die Wahrscheinlichkeit