Regression mit Bootstrapping in R

Поделиться
HTML-код
  • Опубликовано: 6 янв 2025

Комментарии • 32

  • @sylv2359
    @sylv2359 Месяц назад +1

    Hallo,ich bin so froh, dass ich Ihre Videos entdeckt habe!! Mir wird in den berechneten Daten ein Intervall ohne Null angezeigt (zwischen 0,28 und 3,4), aber in der grafischen Darstellungen gibt es Balken außerhalb des Konfidenzintervalls, die auf und unter Null liegen. Ist das für meine Korrelation relevant?

    • @RegorzStatistik
      @RegorzStatistik  Месяц назад +1

      Entscheidend ist, ob die Null im Konfidenzintervall liegt oder nicht. Es ist in Ihrem Fall durchaus möglich (und bei der relativ kleinen Untergrenze des KI auch wahrscheinlich), dass es auch vereinzelte Ergebnisse unter Null gibt - entscheidend ist nur, dass dies weniger als 2,5% der Ergebnisse sind, dass die Ergebnisse also außerhalb des Konfidenzintervalls liegen. (2,5 statt 5,0, weil es ja an beiden Seiten des Konfidenzintervalls einen Bereich außerhalb gibt).

    • @sylv2359
      @sylv2359 Месяц назад

      @@RegorzStatistik Vielen Dank! :)

  • @user-qg7md4mp8v
    @user-qg7md4mp8v Месяц назад +1

    Hallo, vielen Dank für die vielen hilfreichen Infos. Ich bin jetzt soweit gekommen, aber wie kann ich bei (vermutlich) nicht normal verteilten Werten noch eine Moderation prüfen? Wäre super, wenn Sie mir weiterhelfen könnten.

    • @RegorzStatistik
      @RegorzStatistik  Месяц назад +1

      Auch eine Moderationsanalyse ist eine multiple Regression - wenn das Konfidenzintervall für die Interaktion die Null nicht mit einschließt, dann liegt eine Moderation vor.
      Wobei ich für eine Moderationsanalyse Model 1 von Hayes PROCESS Macro für R nutzen und dort als Zusatzparameter Bootstrapping anfordern würde. Dann bekommt man am Ende des Outputs für die Regressionsergebnisse auch noch Bootstrap-Resultate und kann so prüfen, ob das Bootstrap-KI die Null einschließt oder nicht.

  • @karolaplue8708
    @karolaplue8708 2 года назад +1

    Danke für die sehr verständliche Erklärung und Demonstration in R!
    Bei der Berechnung der Konfidenzintervalle mit confint() steht in der Ausgabe "Bootstrap bca confidence intervals". Bedeutet dies, dass in der default-version des Befehls die bias-corrected, accelerated Konfidenzintervalle ausgegeben werden?

    • @RegorzStatistik
      @RegorzStatistik  2 года назад +1

      Ich glaube bei R sind die bca "bias-corrected and adjusted" bezeichnet, so zumindest in der Dokumentation für das boot-Package. Ob das exakt dem entspricht, was sonst als "bias corrected and accelerated" bezeichnet wird, weiß ich nicht.

  • @len9787
    @len9787 Год назад +1

    Danke für das super Video! Wie kann ich nun noch R^2 erhalten? Der Bootstrapping-Befehle spuckt mir das ja leider nicht aus und auch kein p-Wert dazu. Kann ich einfach das R^2 und den p-Wert des nicht gebootstrappten Modells interpretieren? Schonmal danke im Voraus!

    • @RegorzStatistik
      @RegorzStatistik  Год назад

      Es gibt wohl Wege dafür, R^2 zu bootstrappen, aber die scheinen mir eher kompliziert:
      stats.stackexchange.com/questions/454337/multiple-r-squared-from-bootstrap-in-r
      Das R^2 des nicht gebootstrappten Modells kann man m.E. interpretieren, den dazu gehörigen p-Wert besser nicht (weil der natürlich von der NV-Annahme ausgeht). Wobei es nach meiner Erfahrung ja recht selten ist, dass man zum R^2 eine eigentliche Hypothese hat, so dass dessen Signifikanz m.E. nicht so entscheidend ist.

  • @user-kg2eg5iv4l
    @user-kg2eg5iv4l Год назад

    Vielen Dank für das hilfreiche Video! Kann man den Fit von gebootstrappten Modellen vergleichen (wie bei der hierarchischen Regression mit Anova)?

  • @vh99_
    @vh99_ 11 месяцев назад

    Guten Abend,
    wie kritisch ist die same size/Stichprobengrößen für das Bootstrapping-Verfahren? Ich schreibe gerade meine Bachelorarbeit und habe bisher n=39 Versuchspersonen erhoben. Ich muss zwingend die lineare Regression rechnen, da ich einen Fall von Moderation bei Messwiederholung (2 Messungen) habe. Da die UV2 metrisch ist und ich von einer Interaktion der Faktoren ausgehe, kommt die ANCOVA zur Prüfung nicht infrage. Die Normalverteilung ist bei Sichtung der bisherigen Daten aber sehr kritisch, da es leider starke Deckeneffekte gibt. Hinzu kommt, dass ich schon in knapp 3 Wochen Verteidigen muss und bis dahin wahrscheinlich nicht auf die angepeilten 60 Versuchspersonen kommen werde. 😅
    Vielen Dank im Voraus, Valentin

    • @RegorzStatistik
      @RegorzStatistik  11 месяцев назад

      Ich kenne aus der Literatur nur die Angabe von mind. 50 VPn. Man kann sich das aber nicht so vorstellen, dass es bis 49 VPn völlig falsche Ergebnisse gibt und ab 50 VPn dann plötzlich korrekte - das ist ein gradueller Prozess.
      Eine mögliche Alternative zu Bootstrapping wäre eine Datentransformation (wobei ich selbst damit keine Erfahrung habe und daher nichts genaueres dazu sagen kann).

    • @vh99_
      @vh99_ 11 месяцев назад

      @@RegorzStatistik Vielen Dank für die schnelle Antwort! Die 50 sind für mich wahrscheinlich machbar, außerdem könnte ich in der Verteidigung darauf hinweisen dass ich noch 8 Wochen bis zu Abgabe habe und bis dahin sicherlich die 50 VPn erreichen werde.

  • @tillgrosse-holz6914
    @tillgrosse-holz6914 2 года назад

    Danke für die Erklärung! Wie geht man mit Missings innerhalb der Variablen um? Bei mir kommt folgende Fehlermeldung: Error in Boot.lm(lreg.emoe, R = 5000, data = na.omit(dataframe)) : The Boot function in the 'car' package does not allow
    missing values for lm or glm models. Refit your model with rows
    with missing values removed. If you have a data frame called 'd',
    then the argument data=na.omit(d) is likely to work.

    • @RegorzStatistik
      @RegorzStatistik  2 года назад +1

      Auf Basis der Fehlermeldung: Indem man die Zeilen mit fehlenden Werten löscht, siehe am Ende der Fehlermeldung.

    • @Teard3mon
      @Teard3mon 9 месяцев назад

      @@RegorzStatistikIch hatte das gleiche Problem und deswegen im Vorfel alle Datensätze mit fehlenden Werten entfernt über data_clean

    • @RegorzStatistik
      @RegorzStatistik  9 месяцев назад

      @@Teard3mon Es müsste m.E. na.omit(data) sein, wenn data der unbereinigte Datensatz ist. Sonst fällt mir nichts weiter ein.

  • @Jane-bo1gj
    @Jane-bo1gj 9 месяцев назад

    Vielen Dank für das Video! Mich würde noch interessieren, wie ich den R-Code anpassen muss, um das Bootstrapping Verfahren bei einer Mehrebenen-Regression zu verwenden. :)

    • @RegorzStatistik
      @RegorzStatistik  9 месяцев назад +1

      Das geht mit dem Code glaube ich nicht. Aber ich glaube in dem lme4 Package gibt es eine gesonderte Funktion zum Bootstrapping von Mehrebenenmodellen, wenn sie mit lme4 geschätzt worden sind.

    • @Jane-bo1gj
      @Jane-bo1gj 9 месяцев назад

      @@RegorzStatistikSchade, leider bin ich totaler R-Neuling und komme dabei alleine nicht weit. Trotzdem vielen Dank!😊

  • @MissSchokochrossy
    @MissSchokochrossy 8 месяцев назад

    Vielen Dank für die anschauliche und tolle Erklärung. Ich versuche gerade meine Ergebnisse schriftlich festzuhalten - dies fällt mir jedoch nicht leicht, weil ich (zumindest in meinem Lehrgebiet) keine Vergleichsarbeiten finde. Könnten Sie für die im Video aufgeführten Daten eine beispielhafte schriftliche Formulierung der Ergebnisse geben? Das würde mir wirklich sehr helfen.
    Liebe Grüße aus Baden-Württemberg

    • @RegorzStatistik
      @RegorzStatistik  8 месяцев назад

      Das werde ich leider zeitlich nicht schaffen. Aber auf meiner Internetseite sind meine Bachelorarbeit und meine Masterarbeit abrufbar, die beide Regression mit Bootstrapping genutzt hatten:
      www.regorz-statistik.de/inhalte/aboutme.html

    • @MissSchokochrossy
      @MissSchokochrossy 8 месяцев назад

      @@RegorzStatistik Vielen Dank für die schnelle Antwort und den Hinweis auf Ihre Arbeiten. Da werde ich gleich nachsehen. Ich wünsche Ihnen noch einen schönen Tag.

  • @murielegold5239
    @murielegold5239 Год назад

    Danke für das Video :) Mich würde noch interessieren ob ich für das Bootstrapping Modell auch eine F-Statistik erhalten kann, um zu sehen ob das Modell überhaupt signifikant ist und somit einen Erklärungsbeitrag leistet und zu wissen wie viel Varianz durch das Modell erklärt wird. Gibt es dafür einen zusätzlichen Befehl? Vielen Dank :)

    • @RegorzStatistik
      @RegorzStatistik  Год назад

      Da ist mir kein einfacher Weg bekannt. Prinzipiell könnte man vermutlich irgendwie die R²-Statistik bootstrappen.
      Wobei ich es auch konzeptionell schwierig fände, da R² ja nicht kleiner als 0 werden kann, und auch ein Wert von exakt 0.000000 dürfte selten sein. Insofern würde da systembedingt ein Bootstrap-KI fast nie die 0 einschließen und hätte daher weniger Aussagekraft.

    • @murielegold5239
      @murielegold5239 Год назад

      @@RegorzStatistik Alles klar, vielen Dank für die Antwort. :) Mein Problem besteht darin, dass mein normales multiples Regressions Modell (welches die Normalverteilung der Resiuden nicht erfüllte) nicht signifikant war, daher weiß ich jetzt nicht in wie fern ich das gebootstrappte Modell jetzt überhaupt interpretieren kann.

    • @RegorzStatistik
      @RegorzStatistik  Год назад

      @@murielegold5239 Wenn ein Prädiktor per Bootstrapping signifikant ist, dann ist er m.E. signifikant, da würde ich tatsächlich nicht mehr auf das Gesamtmodell gucken.

    • @murielegold5239
      @murielegold5239 Год назад

      @@RegorzStatistik Alles klar, vielen Dank für die schnellen Antworten! :)

  • @melinaepp1338
    @melinaepp1338 2 года назад

    Vielen lieben Dank für dieses tolle Video! Es hilft mir sehr bei der Datenanalyse im Rahmen meiner Masterarbeit! 🙂 Eine kurze Frage hätte ich diesbezüglich: Darf man die Funktion Boot() wie von dir beschrieben auch für eine moderierte Regression verwenden oder muss man in diesem Fall anders vorgehen? Vielen Dank! :)

    • @RegorzStatistik
      @RegorzStatistik  2 года назад +1

      Auch wenn ich es noch nie ausprobiert habe auf diesem Weg: Eine moderierte Regression ist eine ganz normale multiple Regression, insofern sollte das gehen.
      Allerdings würde ich in R für eine moderierte Regression eher PROCESS nutzen, wo ich auch eine Bootstrap Option habe, aber auch noch weitere Follow-up Analysen durchführen kann:
      ruclips.net/video/3RhD8mgNgo4/видео.html