Regressionsvoraussetzungen mit R testen

Поделиться
HTML-код
  • Опубликовано: 2 ноя 2024

Комментарии • 32

  • @Pflussferd-c7z
    @Pflussferd-c7z 11 месяцев назад +3

    Wirklich Top - vielen Dank.

  • @Teard3mon
    @Teard3mon Год назад +1

    Genial!!!! Und eine unfassbare Erleichterung!!! Ganz herzlichen Dank :)

  • @m.s.silver3410
    @m.s.silver3410 Год назад +2

    Vielen Dank, sehr gut erklärt! Ich nutze R erst seit gestern und das hat mir sehr weitergeholfen!

  • @CH-ce3gl
    @CH-ce3gl Год назад +1

    mega Video, Danke!

  • @marinamalkasten30
    @marinamalkasten30 3 года назад +2

    Vorab schon mal vielen Dank für dieses Video! Kann man diese Syntax auch analog nutzen, wenn man eine moderierte Regression berechnet (man müsste doch theoretisch nur das Model zu Beginn anders spezifizieren, korrekt?)?... LG

    • @RegorzStatistik
      @RegorzStatistik  2 года назад +1

      Diese Syntax kann man prinzipiell für jede multiple Regression nutzen, also auch für eine moderierte Regression.

    • @robink162
      @robink162 9 месяцев назад +1

      Das heißt konkret, wenn ich eine Moderationsanalyse durchführe, mit einem Moderator (metrisch) und einer unabhängige Variable (dichotom): reg

    • @RegorzStatistik
      @RegorzStatistik  9 месяцев назад +2

      @@robink162 wenn man nur ein Plus eingibt, dann müsste man noch die Interaktion zusätzlich mit einfügen. Ich würde den ersten Code bevorzugen.

    • @robink162
      @robink162 9 месяцев назад

      Okay, vielen Dank dir! 🙂
      Noch eine Verständnis Frage: Und zwar, habe ich davor mit der gleichen UN_VAR und der A_VAR einen t-Test mit unabhängigen Stichproben durchgeführt habe und dort schon gesehen, dass es keinen signifikanten Unterschied gibt. Inwieweit beeinflusst, dass den zweiten Test (Moderationsanalyse)? Hätte ich mir diese auch sparen können, da ich keinen signifikanten Effekt habe? Und wenn ja, warum? 🙂
      Danke dir!!
      @@RegorzStatistik

    • @RegorzStatistik
      @RegorzStatistik  9 месяцев назад +1

      @@robink162 Es ist in Ausnahmefällen möglich, dass es keinen signifikanten Zusammenhang zwischen UV und AV gibt, aber dennoch eine signifikante Moderation durch einen Moderator MOD.

  • @domination5272
    @domination5272 Год назад

    Hallo vielen Dank für die Infos! Eine Frage noch. Wenn ich eine hierarchische Regression rechnen möchte zuerst alle KVs und im zweiten Modell die UV dazunehme, muss ich für beide Modelle alle Voraussetzungen prüfen oder ist das doppelt gemoppelt?

    • @RegorzStatistik
      @RegorzStatistik  Год назад +2

      Wenn man auch die Ergebnisse des ersten Schritts interpretiert (oder die Ergebnisse des Unterschieds zwischen beiden Schritten, z.B. das delta-R²), dann müsste man das rein theoretisch machen.
      Mir war das aber am Ende normalerweise zu viel Aufwand, meine Hypothesen waren bisher immer auf Regressionsgewichte des zweiten Schritts bezogen, und da reichte mir persönlich dann der Voraussetzungstest des 2. Modells.

  • @katrinkrause8997
    @katrinkrause8997 Год назад

    Hallo! Vielen Dank für das Video. Ich führe eine lineare Regressionsanalyse mit einer metrischen AV und einer kategorialen UV (Geschlecht) durch. Lässt sich die Linearität mittels des Rainbow-Tests auch bei kategorialen Variablen prüfen? Die graphische Darstellung ist hierbei ja nicht aussagekräftig. Vielen Dank und liebe Grüße

    • @RegorzStatistik
      @RegorzStatistik  Год назад

      Bei einem binären Prädiktor stellt sich das Problem der Linearität nicht - denn durch zwei Punkte kann man immer eine gerade Linie ziehen. Insofern entfällt für den Prädiktor dann die Linearitätsprüfung.

    • @katrinkrause8997
      @katrinkrause8997 Год назад

      @@RegorzStatistik Vielen Dank für die schnelle Antwort! Alle anderen Voraussetzungen müssen für eine lineare Regression mit einem binären Prädiktor aber gegeben sein?

    • @RegorzStatistik
      @RegorzStatistik  Год назад

      @@katrinkrause8997 Ja, die anderen Voraussetzungen sind wie auch sonst.

    • @katrinkrause8997
      @katrinkrause8997 Год назад

      @@RegorzStatistik Vielen Dank Ihnen! Ich habe noch eine Frage zu der Prüfung der Autokorrekation: Meine Stichprobe von N=14 ist homogen (alle mit derselben Störung), die zu einem Messzeitpunkt erhoben wurde. Daher handelt es sich um eine Querschnittsstudie mit Cluster. Wie prüfe ich denn dann die Unabhängigkeit der Residuen? Der Durbin-Watson-Test soll ja nur für Zeitreihenanalysen verwendet werden.

    • @RegorzStatistik
      @RegorzStatistik  Год назад

      @@katrinkrause8997 Jenseits von Zeitreihenanalysen prüfe ich die Voraussetzung der unabhängigkeit der Residuen normalerweise nicht empirisch, sondern argumentiere mit der Art der Stichprobenziehung (wobei bei mehreren Datenclustern die Annahme normalerweise verletzt wäre).
      Ich kann jedoch leider hier in den Kommentaren keine umfassende Statistikberatung leisten.

  • @RoodyMentaire
    @RoodyMentaire 2 года назад +1

    Vielen Dank für das Video!! Es war sehr hilfreich...
    Wie gibt man denn das Ergebnis des rainbow Tests im Text an?? (R (df1, df2) =..., p =...) Ist ja sicher nicht richtig

    • @RegorzStatistik
      @RegorzStatistik  2 года назад

      Nach folgendem Dokument
      math.furman.edu/~dcs/courses/math47/R/library/lmtest/html/raintest.html
      scheint der Rainbow-Test einer F-Verteilung zu folgen.
      Insofern m.E. dann:
      F(df1, df2) = ....., p = .....

  • @YousefSabbagh
    @YousefSabbagh 2 года назад +1

    Danke!

  • @williamqpnguyen4110
    @williamqpnguyen4110 Год назад

    was mache ich denn, wenn ich in meiner arbeit normalvereteilung habe aber heterodescity etc. muss ich dann meiner studienarbeit weiterforschen und ein anderen test nutzen oder reicht, wenn ich sage. ok, meine arbeit zeigt, dass mein regressionsmodel instabil ist... etc.? Oder reicht es wenn ich eine robuste regression anwende?

    • @RegorzStatistik
      @RegorzStatistik  Год назад

      Bei Heteroskedastizität würde ich einen robuste Standardfehler anwenden (HC3 oder HC4).

  • @vh99_
    @vh99_ 9 месяцев назад

    Hallo, ich habe mehrere Fragen zu den Voraussetzungen:
    1. Was sollte ich tun, wenn bei einer multiplen Regression die optische Prüfung der Linearitätsannahme keine auffällige Abweichung von einem linearen Zusammenhang ergibt, der Rainbow Test aber höchstsignifikant ist? Könnte es möglicherweise daran liegen, dass manche Prädiktoren kaum Varianz erklären können und somit kein Zusammenhang zw. diesen Prädiktoren und der AV besteht, woraus für diese Prädiktoren eine entsprechende Punktewolke resultiert?
    2. Könnte eine Verletzung der Homoskedastizität aus Punkt 1. resultieren? Wenn ja, reicht Bootstrapping aus, um trotz Heteroskedastizizät die Ergebnisse interpretieren zu dürfen?
    3. Wie kann ich Cook's Distanz in R als eigene Spalte hinzufügen, um extreme Ausreißer zu identifizieren und von der Analyse ausschließen zu können? Leider sehe ich derzeit nur, dass es entsprechende Ausreißer gibt, aber kann sie im Datensatz nicht ausfindig machen.
    Vielen Dank im Voraus, Valentin

    • @RegorzStatistik
      @RegorzStatistik  9 месяцев назад

      1. Weiterer möglicher Grund: Der Rainbow-Test hängt auch von der Stichprobengröße ab, in sehr großen Stichproben kann er auch bei trivialen Abweichungen von der Linearität signifikant werden.
      2. Ich glaube nicht. Aber mit Bootstrapping sollten sie dahingehend im Wesentlichen auf der sicheren Seite sein.
      3. Das weiß ich nicht.

    • @vh99_
      @vh99_ 9 месяцев назад

      @@RegorzStatistik Vielen Dank für Ihre schnelle Antwort! Die Stichprobe hat (vorläufig, geplant sind 60-64 VPn) eine Größe von n = 54 VPn, somit wird es leider wahrscheinlich nicht daran liegen. Würde Ihrer Meinung nach eine Polynomiale Regression in diesem Fall nötig sein, um sicherzugehen?
      Könnten alternativ evtl. auch die o.g. extremen Ausreißer das Bild so stark verzerren, das dadurch der Rainbow Test signifikant wird?

    • @RegorzStatistik
      @RegorzStatistik  9 месяцев назад

      @@vh99_Halte ich nicht für ausgeschlossen. Könnte also sinnvoll sein, den Rainbowtest ggf. nach Ausschluss extremer Ausreißer zu wiederholen (oder sich nur auf die grafischen Tests zu beschränken, was ich selbst meistens tue).

  • @Teard3mon
    @Teard3mon 11 месяцев назад

    Eine Frage dazu: kann ich genau so vorgehen, wenn ich ein Modell mit einer UV und mehreren Moderatoren habe?

    • @RegorzStatistik
      @RegorzStatistik  11 месяцев назад

      Ja, auch eine moderierte Regression ist eine multiple Regression, und UV, Moderatoren und Interaktionsterme sind dann die Prädiktoren.

  • @zivoradjovanovic1934
    @zivoradjovanovic1934 2 года назад +1

    Bravo