Binär-logistische Regression in R rechnen - Daten analysieren in R (76)

Поделиться
HTML-код
  • Опубликовано: 24 янв 2025

Комментарии • 35

  • @StatistikamPC_BjoernWalther
    @StatistikamPC_BjoernWalther  8 месяцев назад

    📘Mein Buch "Statistik mit R - Schnelleinstieg": amzn.to/3OzeLJI [Affiliatelink]

  • @beersfromtheglobe2886
    @beersfromtheglobe2886 3 года назад +7

    Danke übrigens für die 1,0 in meiner Hausarbeit in Datenanalyse.

  • @David-hq9qb
    @David-hq9qb 2 года назад +1

    Top Video!

  • @fe21h
    @fe21h 2 года назад +2

    tolles Video! Rettest mir wieder mal den A**** 🙂

  • @lorenzaugsten7474
    @lorenzaugsten7474 3 года назад +1

    Ich verstehe das bei 9:40 nicht. War das Vorzeichen da nicht negativ? Also müsste es dann nicht heißen, dass die Chance für eine Frau 0,243 geringer ist? Sonst ist die Chance ja in beiden Fällen (männlich und weiblich) positiv.

    • @BartwurstGaming
      @BartwurstGaming 3 года назад

      Die Chance ist für Frauen nicht um 0,243 höher, sondern 0,243 mal so hoch. Im Ergebnis erkranken Frauen also 1 * 0,243 = 0,243 so häufig wie Männer. Oder anders betrachtet erkranken Männer 1 / 0,243 = 4,11 mal so häufig wie Frauen :)

    • @lorenzaugsten7474
      @lorenzaugsten7474 3 года назад +1

      @@BartwurstGaming Ah 0,243 bei den Frauen und 4,11 bei den Männern sagen also genau das geiche aus, nur andersherum formuliert. Vielen Dank :)

  • @basketbear18
    @basketbear18 3 года назад +2

    Vielen Dank für deine Videos, die helfen echt sehr! Könntest du in einem Video erklären wie man diese binär-logistische Regression graphisch darstellen kann?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад +1

      Hallo Lukas, das ist eher unüblich. Evtl. hilft dir das aber: stats.idre.ucla.edu/spss/code/graphing-results-in-logistic-regression/
      Viele Grüße, Björn.

  • @Lenabena7491
    @Lenabena7491 2 года назад

    Vielen Dank für das Video. Leider ist es mir noch nicht klar, wieso wir das Nullmodell berechnen, wenn danach nicht mehr damit gerechnet wird?

  • @yasiko
    @yasiko 3 года назад +2

    Ich interpretiere die metrischen Koeffizienten meiner logistischen Regression in Prozent (Anstieg der unabhängigen Variable um 1 steigert/senkt die Wahrscheinlichkeit, dass Krankheit als abhängige Variable eintritt um x Prozent), indem ich sie wie folgt transformiere: (exp(model$coefficients)-1)
    Das sollte auch in Ordnung sein, oder?
    P.s.: gilt der linktest auch als F-Test des logistischen Modells zur Beurteilung der Modellsignifikanz an sich?

  • @lakagranger3012
    @lakagranger3012 10 месяцев назад

    Hi eine Frage, wenn ich einen Standartfehler habe der bei 0,7 liegt, was bedeutet das bei einem binominalen GLM. Kann ich den Prädiktor dann überhaupt sinvoll als signifikant einstufen, selbst wenn der p-Wert signifikant ist?

  • @leoniepfeifer4091
    @leoniepfeifer4091 Год назад

    Hallo! vielen Dank für dein tolles Video!! wie sieht das ganze aus wenn ich noch fixe Effekte (year und Sektor) mit einbaue! sitze schon seit tagen daran und bekomme es leider einfach nicht hin

  • @alinao1195
    @alinao1195 2 года назад +1

    Hallo:) vielen Dank erstmal für das tolle Erklärvideo :) ich hätte eine Frage: wenn ich die binär logistische Regression mit nur einer unabhängigen Variable berechne kommen komplett unterschiedliche Werte (egal ob Exp(B) oder Sign.) raus, als wenn ich mehrere unabhängige Variablen mit reinnehme. Woran liegt das bzw. was ist dann "richtig"? und wenn der Omnibus-Test nicht signifikant ist, macht das meine gesamte Berechnung dann "irrelevant" ? Dankeschön!!

  • @Sarah-om6xs
    @Sarah-om6xs 2 года назад

    Super Video, danke dir! :) Hättest du zufällig auch einen Ratschlag, wie sich der Output und die Modellgüte bei einem Datenvektor testen lassen, also bei svyglm() ?
    Daran hapert es aktuell in unserer Gruppe...

  • @Lascho94
    @Lascho94 3 года назад +2

    Sehr gutes Video, danke dir. Hast du zufällig eine Literaturempfehlung, woraus ich das Verfahren zum Omnibustest zitieren könnte?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад +1

      Hallo, bei Field (2012) Discovering Statistics Using R im 8. Kapitel zur logistischen Regression (ab S. 312) - die genaue Stelle habe ich aber nicht parat.
      Viele Grüße, Björn.

    • @Lascho94
      @Lascho94 3 года назад

      @@StatistikamPC_BjoernWalther Vielen Dank, das hilft mir :)
      Echt super Videos, du hast mir schon bei meiner letzten Hausarbeit durch deine Videos gut helfen können. Finde es auch krass, wie viel Content du raushaust, meine Abobox kommt mir manchmal, wie ein Semesterplan für ein Seminar vor :P

  • @afiapriscilla8276
    @afiapriscilla8276 Год назад

    Danke für das Video! :) Muss für die binäre logistische Regression nach Homoskedastizität geprüft werden?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  Год назад

      Hallo, nein, die einzige Voraussetzung, die noch zu prüfen ist, ist Multikollinearität.
      Viele Grüße, Björn.

  • @jerry190454
    @jerry190454 3 года назад +2

    Kommt auch noch ein Video zur multinomialen logistischen Regression? LG😉

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад +2

      Ist in Planung. ;-)

    • @kaph123
      @kaph123 3 года назад +1

      @@StatistikamPC_BjoernWalther Das Thema würde mich auch total interessieren :)

  • @evas.8248
    @evas.8248 5 месяцев назад

    Hallo, könntest du mir vielleicht erklären, wie man bei einer binär-logistischen Regression die Stichprobengröße berechnet mit G*Power oder durch andere Möglichkeiten?
    Ich muss dies in meiner Bachelorarbeit anwenden und vorher noch einen Chi-Quadrat Test durchführen.
    Liebe Grüße 😊

  • @Shinon64
    @Shinon64 2 года назад

    Supder Video, kannst du vielleicht erklären warum wir bei der logistischen Regression immer Heteroskedastizität vorliegen haben?

  • @jonasuckelmann5303
    @jonasuckelmann5303 2 года назад

    Vielen Dank für die super Erklärung. Ich schreibe in den kommenden Monaten meine Masterarbeit und werde genau dieses Verfahren verwenden. Ich wollte zusätzlich noch den Interaktionseffekt der UVs (kategorial) untersuchen. Ist das mit diesem Verfahren möglich? Gibt es dazu hilfreiche Literatur?

  • @bulicouchyt5725
    @bulicouchyt5725 3 года назад

    Kurze und vielleicht dumme Rückfrage, aber hätte ich nur ein Signifikanzniveau von 0.1 bei manchen unabhängigen Variablen und bei den restlichen sogar ein noch höheres würde ich das Modell dann komplett verwerfen?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад

      Was sagt dir denn der Omnibustest für dein Testmodell? Ich denke, der wird dich bereits zum Verwerfen des Modells führen. Ist der jedoch signifikant, erklärt dass Modell per se erstmal etwas und die Koeffizienten musst du dir anschauen. Da wärst du allerdings recht schnell fertig, da alle über .1 sind.
      Viele Grüße, Björn.

  • @paulinadrk
    @paulinadrk 3 года назад

    Vielen lieben Dank für deine Videos! Ich sitze gerade an einer ähnlichen Aufgabe, weiß aber nicht wie ich mein Odds Ratio interpretieren soll. In meinem Dataframe ist das Geschlecht als character und nicht als 0 und 1 definiert. Nach der summary gibt mir r direkt eine Zeile mit sexmale aus und einem signifikanten p-Wert. Wenn ich mir dann die Odds Ratio rausziehe, bekomme ich den Wert 0.79 für Sexmale. Könnte man dann sagen, die Wahrscheinlichkeit als Mann an einem Experiment teilzunehmen (die Aufgabe) ist um 21% geringer, als als Frau? Hoffe du verstehst :-) Vielen Dank schonmal!

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  2 года назад

      Hallo, ich würde das Geschlecht eher als Faktor hinterlegen, damit ich weiß, was männlich und was weiblich ist und wie dann die Referenzkateogrie ist und was das OR dann letztlich bedeutet.
      Viele Grüße, Björn.

  • @patite3103
    @patite3103 13 дней назад

    Können Sie den Link zu den Daten geben? Vielen Dank

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  12 дней назад

      Hallo, der Datensatz ist auf meiner Homepage im Artikel verlinkt: bjoernwalther.com/binaer-logistische-regression-in-r-rechnen-und-interpretieren/
      Viele Grüße, Björn.

  • @punchline9131
    @punchline9131 3 года назад

    Steigt der BMI um zwei ist dann die Chance die Krankheit zu kriegen um 3,2 höher?

  • @HUTZKIKLON
    @HUTZKIKLON 3 года назад

    Hey, ich bin gerade erst auf den Kanal gestoßen und wir machen gerade genau dieses Thema (zwar in spss aber r ist nie verkehrt zu wissen), also schonmal danke, die videos sind top :D
    Ich hätte im folgenden mal eine Frage, ein Rätsel für dich(oder die community). Wir haben das in Statistik zu gemischten Modellen gemacht und mein prof gibt als preis für die antwort der Frage ein Lehrbuch und Eis aus, wäre also echt super wenn mir wer helfen könnte :D
    Folgendes Problem:
    Datensatz mit einer intervallskalierten abhängigen Variable. Es gibt:
    die festen faktoren/Kovariaten: "quality" mit "easy" und "difficult" als auswahlmöglichkeiten
    "size" mit größe 3 oder 5
    Es wird ein gemischtes lineares Modell berechnet in dem wir auch den Interaktionseffekt Quality*size anschauen.
    Wenn wir das nun mit "size" als kovariate und quality als festen faktor(kategorial) ausrechnen kommt kein interaktionseffekt raus und beide Haupteffekte sind signifikant.
    NUN ZUM PROBLEM:
    Man könnte auf die Idee kommen, size als festen faktor auszuwählen, da er eh nur 2 Ausprägungen hat.
    An den Ergebnissen ändert sich nichts, AUßER, dass der Haupteffekt von "quality" verschwindet (p geht von 0.001 zu 0.967, F ist gegen 0).
    Tipp vom prof: "Hinweis: Es hat mit korrelierten Prädiktoren zu tun und so ein bisschen ist es auch ein Simpson-Paradox."
    [es wird zudem clusterrandomisiert, das sollte hier aber eigentlich keinen einfluss haben glaube ich]