Heteroskedastizität erkennen - analytisch (White Test)- Regression - Daten analysieren in SPSS (27)

Поделиться
HTML-код
  • Опубликовано: 4 ноя 2017
  • // Heteroskedastizität erkennen (analytisch) //
    Heteroskedastizität der Residuen in der (multiplen) linearen Regression ist ein Problem. Es beschreibt die ungleiche Varianz der Residuen der abhängigen Variable. Einfacher formuliert: Es gibt keine lineare Streuung der Residuen/Fehlerterme. Sind sie linear gestreut, spricht man von Homoskedastizität - das ist eine Voraussetzung für die Durchführung einer linearen (multiplen) Regression.
    Bei Heteroskedastizität ergibt sich nämlich ein Effekt auf Standardfehler und damit auch auf t-Werte und p-Werte. Dadurch steigt wiederum die Wahrscheinlichkeit einen Fehler 1. Art und Fehler 2. Art zu begehen (Nullhypothese fälschlich verwerfen bzw. Nullhypothese fälschlich annehmen).
    Typischerweise begnügt man sich häufig mit einem grafischen Test zur Diagnose von Heteroskedastizität (Video hierzu: • Heteroskedastizität gr... ).
    Da es aber durchaus aus mancher Gutachtersicht notwendig ist, dies analytisch mit einem Test zu prüfen, kann man den sog. White-Test durchführen. IBM selbst hatte bis Version 27 den White-Test nicht implementiert, man konnte ihn aber selber mit etwas Geschick durchführen, was ich im Video zeige. Der Link zu IBM: www-01.ibm.com/support/docview...
    HINWEIS:
    Ich persönlich bin seit Erstellung des Videos weit davon abgerückt überhaupt einen analytischen Test zu empfehlen und folge Hayes, Cai: Using heteroskedasticity-consistent standard error estimators in OLS regression (2007), S. 714: "Thus, we echo Long and Ervin’s (2000) recommendation that investigators should employ a heteroskedasticity-consistent estimator such as HC3-if not as a matter of routine, at least as a means of doublechecking one’s inferences to see if they might be iinfluenced by heteroskedasticity. In the event that a few cases exhibit high leverage, HC4 can be used instead."
    Bei Fragen und Anregungen zum Erkennen von Heteroskedastizität bei einer Regression in SPSS nutzt bitte die Kommentarfunktion. Ob ihr das Video hilfreich fandet, entscheidet ihr mit einem Daumen nach oben oder unten.
    #statistikampc
    ⭐Kanalmitglied⭐ werden:
    =======================
    / @statistikampc_bjoernw...
    Kanal unterstützen? 🙌🏼
    ===================
    Paypal-Spende: www.paypal.com/paypalme/Bjoer...
    Amazon Affiliate-Link: amzn.to/2iBFeG9
    Danke für eure Unterstützung! ♥
    Meine Homepage 💡
    =================
    www.bjoernwalther.com

Комментарии • 75

  • @MissYutani
    @MissYutani 2 года назад +3

    Lieber Herr Walther, an dieser Stelle vielen Dank für Ihre Mühen. Was ich weder in der Bachelorstatistik, noch in den Master-Vorlesungen verstanden habe, schaffen Sie mit 3 Videos. "Ich weiß was Homoskedastizität bedeutet"- das sollte ich mir auf ein Tshirt drucken! 😁

  • @user-jb1ge5zw1f
    @user-jb1ge5zw1f Год назад +1

    Eine Millionen Mal Danke!!!! Du rettest meine Masterarbeit :)

  • @siz7705
    @siz7705 4 года назад +1

    Hallo Björn,
    ein dickes Dankeschön für deine Hilfe!! :-) VG

  • @mailina9000
    @mailina9000 5 лет назад +3

    Hallo Björn,
    auch an dieser Stelle noch mal danke für die Videos, wie immer super erklärt! :)
    ich habe aber da aber noch spezifische Fragen:
    1) meine Stichprobengrößen liegen bei 1400 und 2100. Muss ich bei so großen Stichproben auch die Voraussetzungen für die lineare Regression prüfen und wenn ja, wie schlimm ist es, wenn sie nicht gegeben sind?
    2) in einem Mediationsmodell behandle ich die mediierende Variable als auch als UV richtig?
    3) ich rechne zudem auch einen nichtlinearen Zusammenhang mit einer polynominalen Regression, indem ich den zentrierten x-wert und seine quadrierten Werte blockweise in eine multiple Regression einfüge. Das bedeutet, dass ich hierfür auch die Voraussetzungen prüfen muss, richtig? Wenn ja, ist hier das Vorgehen genau wie in dem Video? Also würde ich die zentrierten x-Werte quadrieren, seine quadrierten x Werte noch mal quadrieren und das Produkt beider Werte ausrechnen?
    Sorry für die sich Fragen, ich hoffe es sind nicht zu viele auf ein Mal ;)

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  5 лет назад

      Hallo Mai, danke für dein Lob!
      Zu deinen Fragen.
      1) Prinzipiell müssen die Voraussetzungen erfüllt sein. Normalverteilte Residuen kannst du ignorieren, da du mit deiner Stichprobengrößen über die Grenze von 30 kommst, die den zentralen Grenzwertsatz beschreibt, der dir quasi garantiert, das eine Verletzung dessen mit einem test unerheblich ist. Grafisch sollte sich wohl eine Normalverteilung einstellen. Hetereoskedastizität der Residuen sollte ebenso wenig vorkommen wie Autokorrelation der Residuen. Multikollinearität sollte auch nicht vorkommen und die Regressionskoeffizienten sollten linear sein.
      2) PROCESS macht das automatisch bei der Schätzung des indirekten Effektes: ruclips.net/video/7lSa5kfCyqc/видео.html
      3) Ja, das Vorgehen wäre in dem Falle analog. Allerdings erscheint mir das Paper auch ganz interessant: doi.org/10.1081/STA-120017806 Evt. ist es ein Reinlesen wert.
      Viele Grüße, Björn

  • @asvk3101
    @asvk3101 5 лет назад

    Hallo, vielen Dank für das tolle Video! Das hat mir super weitergeholfen!
    Ich habe eine Frage: und zwar ist mein R^2 = 1. Muss ich da irgendetwas im weiteren Vorgehen beachten? Was kann das für Ursachen haben?
    Vielen Dank im Voraus

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  5 лет назад

      Hallo, danke für dein Lob!
      Wenn deine R² = 1 ist, ist das schon sehr ungewöhnlich. Das würde eine perfekte Erklärung der Varianz bedeuten. Hast du das noch mal nachgerechnet?
      Viele Grüße, Björn.

  • @sophiejacob9139
    @sophiejacob9139 4 года назад

    Erstmal großes Lob und vielen Dank für deine Videos! Noch eine Frage: Ich brauche für die formale Darstellung in den Ergebnissen noch folgende Werte: Chi Quadrat (X^2), klein Omega und das Konfidenzintervall für Klein Omega. Hast du eine Antwort welchen Wert ich wofür einsetze?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 года назад

      Hallo Sophie und danke für die lobenden Worte! Schau mal in dem Video: ruclips.net/video/mxiqCr9qjH4/видео.html Mit den neuen SPSS-Versionen ist der direkte Test mit allen zu berichtenden Größen implementiert.
      Viele Grüße, Björn.

  • @hellosummer7364
    @hellosummer7364 4 года назад +1

    Wirklich super Videos! Großes Kompliment an dieser Stelle! :) Habe ich es in diesem Fall richtig verstanden, dass wenn mein P-Wert bei 0,69 liegt und somit nicht signifikant ist, ich eine Homoskedastizität habe? Danke und LG!

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 года назад +1

      Hallo und danke für dein Lob! :-)
      Ja, das hast du richtig verstanden. Die Nullhypothese ist in dem Fall, das Homoskedastizität vorliegt. Aufgrund des p-Wertes >0,05 kannst du sie nicht verwerfen.
      Viele Grüße, Björn.

  • @tim-kfeige5038
    @tim-kfeige5038 3 года назад +1

    Hallo Björn,
    ich rechne in meiner Masterarbeit eine Regression mit nur einem Prädiktor, kann ich dann analog zum Video vorgehen und einfach den Interaktionsterm der Prädiktoren weglassen?

  • @kassel100-kc9
    @kassel100-kc9 5 лет назад +2

    Hallo lieber Björn,
    danke erstmal für deine wahnsinnig aufschlussreichen Videos. Die retten mir bei meiner Masterarbeit auf jeden Fall den Arsch ;)
    Jetzt mal eine Frage zur Heteroskedastizät (ein wirklich schlimmes Wort):
    Habe den White-Test durchgeführt und Heteroskedastizät vorgefunden. Was nun? Eine weitere Erhebung ist in meinem Fall nicht drin. Welchen Schluss kann ich jetzt daraus ziehen? Würde mich freuen wenn du hierzu eine Anregung hättest :)

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  5 лет назад +2

      Hallo Lucas, danke für dein Lob! Freut mich zu hören, wenn ich Studenten mit den Videos helfen kann. :-)
      Man kann prinzipiell versuchen mit einer Transformation zu arbeiten. Wenn es sich theoretisch begründen lässt, ist auch das Weglassen von Variablen eine Möglichkeit. Wenn das alles nicht anwendbar ist, hilft nur das Schätzen einer heteroskedastizitätskonsistenten Kovarianzmatrix. Hier gibt es ein paar grundlegende Informationen: www.jstor.org/stable/2938229?seq=1#page_scan_tab_contents
      Wenn du R hast, geht das recht einfach über die Funktion "coeftest". In SPSS ist das allerdings meines Wissens nach nicht ohne weiteres möglich. :-/
      Viele Grüße, Björn.

  • @ulrikef78
    @ulrikef78 6 лет назад +1

    Hallo, erst einmal Danke, dass es endlich vernüntig erklärte Videos zu SPSS gibt! DANKE! Du rettest meine Bachelorarbeit! :)
    Ich habe gerade wie von dir geschrieben den White-Test gerechnet, da mein Streu-Punkt-Diagramm schon verdächtig aussah und leider war er auch signifikant. Theoretisch brauche ich ja Homoskedastizität, als Voraussetzung für meine multiple Regression. *Oh no!*
    Ich habe gelesen, dass man dann sowas wie eine Box-Cox Powertransformation machen kann/soll, davon habe ich aber nie was gehört. Kann man die Homoskedastizität auch vernachlässigen? z.B. wie die Normalverteilung über den zentralen Grenzwertsatz?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  6 лет назад

      Hallo Ulrike,
      danke für das Lob! Freut mich, wenn die Videos helfen. :-) Das war das Ziel, Studenten zu helfen, macht mir irgendwann auch weniger Arbeit. :-D
      Nun zu deiner Frage. Wie schlimm sieht denn das Diagramm aus? Mit Transformationen ist das immer so eine Sache. Ich bin da kein großer Fan von, weil das immer andere Probleme nach sich zieht und auch bei der Interpretation besondere Vorsicht geboten ist. Man könnte daher prinzipiell eine Logarithmus-Transformation anwenden, was aber durchweg positive Ausprägungen voraussetzt. Eine andere Möglichkeit wäre die Weighted least squares Regression zu rechnen. Hierzu werde ich aber erst in einiger Zeit ein Video machen können.
      Man muss jedoch nicht zwingend transformieren oder WLS rechnen und kann trotz Heteroskedastizität die Regression durchführen. Multikollinearität wäre da schlimmer. Die Koeffizienten sind von Heteroskedastizität nicht berührt, allerdings deren Standardfehler, Konfidenzintervalle und p-Werte. Für den Model Fit, also das Bestimmtheitsmaß, hat das auch keine Auswirkungen. Wenn du also mit verzerrten Standardfehlern leben kannst, ist ein Rechnen der multiplen Regression in Ordnung. Als ergänzende Literatur hierzu empfehle ich Field, A. (2013), Discovering Statistics using IBM SPSS Statistics, S. 175.
      Hilft dir das weiter?
      Viele Grüße, Björn.

    • @ulrikef78
      @ulrikef78 6 лет назад +1

      Ja, das hilft mir sehr. Vielen Dank für die super ausführliche Antwort! :)

    • @hannath9213
      @hannath9213 5 лет назад

      @@StatistikamPC_BjoernWalther Hallo Björn! :-)
      ich hab leider das selbe Problem wie Ulrike, wie gehe ich denn bei der Logarithmus-Transformation vor? Und worauf muss ich bei der Interpretation danach besonders achten?
      LG Hanna

  • @jeanetteb9648
    @jeanetteb9648 6 лет назад

    Hallo, danke für das super erklärte Video. Eine Frage dazu: Ich habe mehr als 3 unabhängige Variablen und habe diese jeweils miteinander multipliziert. Führe ich am Ende eine Regressionsanalyse mit allen errechneten Werten aus, oder einmal mit Variable 1 und 2, einmal mit Variable 1 und 3 und einmal mit Variable 2 und 3? Vielen Dank schon mal!

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  6 лет назад +1

      Hallo Jeanette, danke für das Lob!
      Wie ich im Video ab 3:33 zeige, sind alle Variablen gleichzeitig einzubeziehen.
      Viele Grüße, Björn.

  • @anastasialebedeva3082
    @anastasialebedeva3082 6 лет назад +1

    Hallo, vielen lieben Dank für das Video! Eine Frage dazu: hier multiplizieren wir die beiden x-Variablen miteinander. Was muss gemacht werden, wenn ich nur eine x-Variable (eine unabhängige Variable) habe? vielen Dank im Voraus!!

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  6 лет назад +2

      Hall Anastasia, der White-Test ist nur für multiple lineare Regression spezifiziert. Im Falle einer UV kannst du auf die grafische Variante zurückgreifen.
      Viele Grüße, Björn.

  • @lucal.1487
    @lucal.1487 5 лет назад

    Super Video, vielen Dank dafür, gerade als Einsteiger auf dem Gebiet sehr hilfreich👍☺️ Wollte dich noch fragen, wie ich in meinem Research paper die Ergebnisse des Tests angeben kann? Normalerweise packe ich die Outputs immer in den Teil „Appendix“ aber hier habe ich die Werte ja dann im Datensatz. Danke im Voraus🙏

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  5 лет назад

      Hallo Luca, danke für dein Lob!
      Die Ergebnisse des White-Tests würde ich W(Freiheitsgrade)=White-Teststatistik, p=p-Wert.
      Viele Grüße, Björn.

    • @Monkeyundercover2
      @Monkeyundercover2 5 лет назад

      @@StatistikamPC_BjoernWalther welcher Wert ist denn der "White-Teststatistik"?

  • @LotusJanZ
    @LotusJanZ 6 лет назад

    Auch von mir ein großes Lob an deine Videos. Zum Themeneinstieg und auch zum tieferen Verständnis sind diese echt Gold wert! Nun habe ich aber eine Verständnisfrage: Wie genau kann ich z.B. aus der Chi²-Verteilung bei einem 40 Quantil den White-Wert interpretieren? Wenn ich mit df=5 und Sig= 0,05 schaue, komme ich bei auf 11,07. Kann ich jetzt einfach sagen, da W(Krit) < W(Emp), kann H0 abgelehnt werden? Zum Signifkanzniveau ist dann natürlich nichts gesagt. Hoffe die Frage ist verständlich und nicht zu inhaltsleer! Danke dir nochmal! LG

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  6 лет назад

      Hallo Jan, danke für dein Lob! Irgendwie ist dein Kommentar durchgerutscht.
      Wenn ich dich richtig verstehe, hast du den White-Test gerechnet, aber keinen p-Wert erhalten? Die Frage nach Teststatistik vs. kritischem Wert stellt sich ja nur in dem Falle. Sonst muss die Teststatistik größer (extremer, wenn negative Werte existieren) als der kritische Wert sein, damit die H0 abgelehnt werden kann.
      Viele Grüße, Björn.

  • @kathar9127
    @kathar9127 6 лет назад

    Hallo,
    vielen Dank für das tolle Video! Anhand der großartigen Erklärungen ist es super am eigenen Datensatz anzuwenden :-)
    Eine Frage hätte ich jedoch: Kann eine meiner unabhängigen Variablen auch dichotom sein? In meinem Fall handelt es sich um das Geschlecht. Ich habe es testweise ausprobiert, aber in der zweiten Regression (die ich mit den Residuen usw. durchführe), wird das quadrierte Geschlecht nicht als Variable eingeschlossen. Es taucht in der Tabelle "aufgenommene/entfernte Variablen" gar nicht erst auf.
    Über eine Antwort würde ich mich sehr freuen!
    LG, Katha

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  6 лет назад

      Hallo Katha, danke für das Lob!
      Warum quadrierst du denn das Geschlecht? Was ist dein Referenzwert - hoffentlich 0 - sonst kannst du den Koeffizient nicht gescheit interpretieren.
      Hilft dir das bereits?
      Viele Grüße, Björn.

    • @dennisreichow4676
      @dennisreichow4676 6 лет назад

      Hallo,
      erst einmal vielen Dank für das tolle Video. Ich klinke mich mal bei der Frage zu den dichotomen Variablen ein. Das man diese nicht quadrieren muss, wenn sie mit 0 und 1 codiert sind, leuchtet ein. Aber wie verfahre ich weiter?
      Ich habe da zwei Fragen:
      1. Brauche ich für die dichotomen Variablen auch jeweils die Produkte?
      2. Füge ich bei der Regression dann ganz einfach die dichotomen Variablen ein?
      Danke und LG!

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  6 лет назад

      Hallo echoes blub, danke für das Lob! In Schritt drei der in der Beschreibung verlinkten Anleitung heißt es "3) Compute squared values of all predictors and products of all pairs of predictors." Solange es wirklich nur dichotome Variablen sind, kannst du genau so fortfahren, wie du es für "normale" Regressionen kennst. Sollte deine Variable mehr als zwei Ausprägungen haben, ist das noch mal eine andere Geschichte - das Fass machen wir aber hier jetzt lieber nicht noch auf. ;-)
      Viele Grüße, Björn.

  • @christianecreutzburg7797
    @christianecreutzburg7797 3 года назад

    Hallo Björn,
    vielen Dank für deine guten Videos!
    Direkt vor deinem White-Test-Video habe ich mir das Video zur grafischen Analyse der Heteroskedastizität angesehen, und dort hattest du Homoskedastizität festgestellt. Aber war das nicht das gleiche Datenbeispiel?
    Da habe ich etwas gestutzt.
    Was mache ich denn, wenn ich mit dem White-Test Heteroskedastizität und grafisch
    eher Homoskedastizität herauslesen würde?
    Ist der White-Test dann aussagefähiger?
    Danke und Liebe Grüsse
    Christiane

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад

      Hallo Christiane, wenn man analytisch prüft kann es schon zu gegensätzlichen Einschätzungen kommen, verglichen mit grafischer Prüfung. Ich empfehle gerade bei großen Stichproben eher grafisch, weil die HC-Tests gerne mal fälschlicherweise signifikant sind. Im Zweifel kann man auch einfach heteroskedastizitätskonsistente Standardfehler schätzen - die sind nämlich bei HC verzerrt.
      Viele Grüße, Björn.

  • @AniGinGin
    @AniGinGin 5 лет назад

    Hallo Björn,
    vielen Dank für das hilfreiche Video. Wenn ich die Ergebnisse vom White Test in meiner Arbeit berichten möchte, reicht es dann den p-Wert anzugeben oder sollte man zusätzlich andere Parameter darstellen?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  5 лет назад

      Hallo Gicana, ich würde den White-Wert, die Freiheitsgrade und den p-Wert angeben. Also: W(/Freiheitsgade/)=/White-Wert/, p=/p-Wert/. Die mit /../ markierten Werte ersetzt du natürlich. ;-) Im Video wäre das W(5)=20,18; p

    • @AniGinGin
      @AniGinGin 5 лет назад +1

      @@StatistikamPC_BjoernWalther Alles klar. Vielen lieben Dank für die schnelle Antwort und allgemein für die tollen Videos :D. Hatte im Studium bisher nur R und durch dich hab ich mich super schnell und einfach in SPSS einarbeiten können :)

  • @Mayplay100
    @Mayplay100 2 года назад

    Vielen Dank für das tolle Video! :) Ich habe noch eine Frage:
    Wie prüfe ich die Homoskedastizität wenn ich in der linearen Regression auch binäre Variablen habe? (Die kann ich ja nicht einfach so wie die anderen Variablen behandeln und auch quadrieren oder?)
    Ich und meine Bachelorarbeit würden uns sehr über eine Antwort freuen.

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  2 года назад

      Hallo Sinha,
      ich würde pauschal die Berechnung von robusten Standardfehlern empfehlen: ruclips.net/video/dOf03X1CHyM/видео.html
      Viele Grüße, Björn.

  • @isi9276
    @isi9276 3 года назад

    Hallo, ich frage mich, ob ich das bei der Prüfung für die ANCOVA analog machen kann?

  • @MissYilmaz
    @MissYilmaz 2 года назад

    Vielen Dank für das aufklärende Video. Allerdings habe ich bei der zweiten Befehlsausübung
    COMPUTE P=SIG CHISQ(White.8).
    Print /P.
    Execute.
    folgende Fehlermeldung
    Falscher Variablenname: entweder ist der Name länger als 64 Zeichen oder er wird nicht durch einen vorherigen Befehl definiert.
    Wie kann ich diesen Fehler beheben?
    Vielen Dank schonmal im Voraus!

  • @henrikea4167
    @henrikea4167 4 года назад

    Hallo Björn,
    auch von mir ein riesen großes Dankeschön für die vielen Videos! Ich wüsste nicht, wie ich die Auswertung für meine Masterarbeit sonst schaffen sollte.
    Ich hätte tatsächlich noch eine Frage. bezüglich dieses Videos. Ich habe alles exakt so durchgeführt wie du es in deinem Video beschrieben hast. Leider erhalte ich eine Fehlermeldung bei dem aller letzten Schritt:
    "Fehler Nr. 4285 in Spalte 8. Text P > ungültiger Variablenname. Dieser Befehl wird nicht ausgeführt."
    Woran könnte das liegen? Ich habe meine "White" Variable zuvor auch über diesen Weg erhalten und es hat bis dahin alles funktioniert.
    Bei dem grafischen Test auf Heteroskedastizität habe ich 5 diagonal verlaufende "Linien" mit sehr dicht aneinander liegenden Punkten erhalten. Leider habe ich keine Interpretation dazu finden können. Muss ich befürchten, dass in meinem Beispiel Heteroskedastizität vorliegt?
    Vielen Dank im Voraus und viele Grüße
    Henrike

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 года назад

      Hallo Henrike, vielen Dank für dein Lob! Freut mich, wenn dich die Videos voranbringen. Zu Heteroskedastizität habe ich noch zwei weitere Videos gemacht. Es gibt inzwischen den White-Test auch in SPSS implementiert, evt. auch in deiner Version: ruclips.net/video/mxiqCr9qjH4/видео.html
      Zusätzlich ist Heteroskedastizität ein leicht zu behebendes Problem, wie ich hier zeige: ruclips.net/video/dOf03X1CHyM/видео.html
      Viele Grüße, Björn.

  • @kathiw.2424
    @kathiw.2424 3 года назад

    Hallo, danke für das sehr hilfreiche Video! Ich habe eine Frage: kann ein R^2 von 0.000 stimmen? Folglich kommt ein p-Wert von 1.000 raus. Mir kommt das ein bisschen komisch vor. Ich habe nur eine einfache Regression (also mit einem Prädiktor). Danke im Voraus!

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад +1

      Hallo Kathi, rein theoretisch ist das möglich - das Modell ist gelinde gesagt für die Daten wertlos. Die zwei Variablen haben offensichtlich nichts miteinander zu tun. Das sollte auch der p-Wert des F-Tests (ANOVA) im Rahmen der Regression zeigen - im einfachen Regressionsmodell ist der identisch zum p-Wert des Koeffizienten. Ist der über 0,05 leistet das Modell keinen (hinreichenden) Erklärungsbeitrag und sollte konzeptionell neu überdacht werden.
      Viele Grüße, Björn.

    • @kathiw.2424
      @kathiw.2424 3 года назад

      @@StatistikamPC_BjoernWalther Vielen Dank für die rasche und hilfreiche Antwort! :)

  • @sabrinameier4757
    @sabrinameier4757 6 лет назад +1

    Hallo, falls ich eine Moderation rechne. Muss ich dann die Moderation wie ein x behandeln um die Heteroskedastizät zu rechnen?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  6 лет назад

      Hallo Sabrina, bei einer Moderation sind auch die Moderatorvariablen als unabhängige Variablen beim Test auf Heteroskedastizität einzubeziehen, da sie ja in dem Modell auch so behandelt werden.
      Viele Grüße, Björn.

    • @grandmasterflash6388
      @grandmasterflash6388 3 года назад

      @@StatistikamPC_BjoernWalther würde das bedeuten das man auch den interaktionsterm(moderator) mit jedem anderen prädiktor multiplizieren muss? Weil teilweise wäre das ja dann doppelt gemoppelt da der moderator ja schon die eine multiplikation der prädiktoren ist

  • @Monkeyundercover2
    @Monkeyundercover2 5 лет назад

    Hallo Björn,
    am Ende sagst du, dass die Nullhypothese besagt, dass HOMOSKEDASTIZITÄT vorliegt. wenn mein p = .590 nicht signifikant ist, heißt das dann, dass bei meine Variablen homoskedastizität vorliegt? Ich bin etwas verwirrt, sorry :D

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  5 лет назад

      Hallo Lisa, Homoskedastizität liegt bei einer Signifikanz >0,05 vor, in deinem Falle ist das also zutreffend.
      Viele Grüße, Björn.

  • @CherryLoverin
    @CherryLoverin 6 лет назад

    Danke für die Erklärung! Gibt es auch eine Möglichkeit die Linearität zu prüfen, wenn die UV kategorial ist? Das ganze dient als Basis für die Berechnung einer moderierten Mediation mit PROCESS. Danke!

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  6 лет назад

      Hallo Marianna, vom Vorgehen her sollte kein Unterschied existieren. Hast du denn Grund zur Annahme, dass eine grafische Diagnose nicht ausreichend ist bzw. hast du den Verdacht von Heteroskedastizität? Eine moderierte Mediation ist schon nicht ohne. Viel Spaß dabei ;-)
      Viele Grrüße, Björn.

    • @CherryLoverin
      @CherryLoverin 6 лет назад

      Statistik am PC
      danke für die schnelle Antwort :)
      ich bin nicht sicher, welche Variablen ich testen soll, ich habe 1 dichotome UV, 1 Dichotomen Moderator und 3 intervallskalierte AVs in meinem Modell. die residuen der einen AV sehen leider nicht sehr normalverteilt aus. Die dichotomen Variablen zu quadrieren, wie im white-test beschrieben, ist ja im dem Fall nicht so ausagekräftig oder ?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  6 лет назад +1

      Hallo Marianna, das Problem einer moderierten Mediation ist ja, dass du Teilmodelle hast und auch rechnest (Das meinst du sicher mit 3 AV, oder?). Zumindest für den direkten und den indirekten Effekt der Mediation ist das der Fall. Demzufolge ist für jedes Modell separat auf Heteroskedastizität zu prüfen, was schon einiges an Rechnerei bedeutet, besonders wenn es um die zu bildenden Produkte geht. Das sollte aber funktionieren, auch bei dichotomen UV.
      Viele Grüße, Björn.

    • @CherryLoverin
      @CherryLoverin 6 лет назад

      ja genau, ich habe ein Modell mit UV=dichotom, 2 Mediatoren = intervallskaliert) die auf 1 AV = intervallskaliert wirken. Das ganze wird dann noch von einem dichotomen Moderator beeinflusst ;)
      Du meinst also, ich sollte also für die beiden Mediatoren + AV getrennt die Modelle anschauen?
      Also z.B. bei Mediator 1 wäre dann x1=dichotome UV, x2=dichotomer Moderator, y=Mediator;
      beim Modell der AV wäre dann x1=Mediator 1, x2=Mediator 2, y=AV
      Oh jeh, jetzt wird es glaube ich unübersichtlich ;) Zusammenfassend: es macht das gleiche Vorgehen wie im Video auch Sinn, wenn die x-Variable in der Regression kategorial ist? ;) Ich dachte das geht evtl. nicht, weil bei der grafischen Variante das leider bei einer dichotomen x-Variable auch nicht klappt (dann hat man einfach 2 getrennte Punktewolken)
      Danke dir, Björn:)

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  6 лет назад

      Hallo Marianna, kannst du mir mal sagen, welches Template von Hayes das wäre - interessehalber. Es wird in der Tat unübersichtlich. ;-)
      Mir Fällt zumindest kein Grund ein, warum das Vorgehen nicht funktionieren sollte. Man verwendet ja letztlich einen chi²-Test, um die Residuen auf Normalverteilung zu testen. Da du aufgrund der Mediation mehrere Modelle zu prüfen hast, würde ich wohl direkt zu heteroskedastizitäts-konsistenter Fehlerschätzung (z.B. HC3) übergehen. In PROCESS gibt es dazu auch direkt eine Option. Das kann man auch noch mal bei Hayes (2013) auf S. 435 nachlesen. Oder etwas ausführlicher in einem Paper von ihm aus 2007: Hayes, A. F., & Cai, L. (2007). Using heteroskedasticity-consistent standard error estimators in OLS regression: An introduction and software implementation. Behavior research methods, 39(4), 709-722.
      Viele Grüße, Björn.

  • @silviakelch5062
    @silviakelch5062 3 года назад +1

    Frohe Weihnachten und vielen Dank Björn für das super nachvollziehbare Video. Im letzten Schritt versagt allerdings meine Berechnung :-(
    COMPUTE White =316*0.011.
    PRINT /White.
    EXECUTE.
    COMPUTE P=SIG.CHISQ(White.4).
    PRINT /P.
    EXECUTE.
    Fehlermeldung: Falscher Variablenname in
    COMPUTE P=SIG.CHISQ(White.4).
    PRINT /P.
    Was habe ich übersehen? Die Daten oben stimmen. Vielleicht weil R² so klein ist?
    Viele Grüße
    Silvia

    • @horiillustration9600
      @horiillustration9600 3 года назад

      Das Problem habe ich gerade leider auch :/

    • @isi9276
      @isi9276 3 года назад +3

      Zwischen dem White und der 4 muss ein Komma > COMPUTE P=SIG.CHISQ(White,4).

    • @silviakelch5062
      @silviakelch5062 3 года назад

      @@isi9276 Dankeschön

    • @silviakelch5062
      @silviakelch5062 3 года назад

      @@isi9276 Dankeschön :-)

  • @MM-vu7lf
    @MM-vu7lf 3 года назад

    Hallo Björn,
    ganz am Anfang sagst du "Heteroskedastizität ist eine Voraussetzung für lineare Regressionen". Das verwirrt etwas. Ansonsten ein schönes Video, vielen Dank! VG

  • @mathiasmengel191
    @mathiasmengel191 2 года назад

    Hallo Björn,
    vielen Dank für Ihre hilfreichen Videos, immer wieder!
    Ich versuche den White-Test händisch so nachzuvollziehen, wie er im Video gezeigt wird. Es handelt sich prinzipiell um einen Übungsdatensatz, das Verständnis steht im Vordergrund. Alles klappt bis zu der Stelle, wenn das Signifikanzniveau bestimmt werden soll. Bei diesem letzten Schritt wirft mir die Regression (insgesamt 5 UVs, vergleichbar zum Video) eine Variable aus dem Modell raus. Woran könnte es liegen und wie ist in diesem Fall weiter zu verfahren? Für einen Hinweis wäre ich sehr dankbar, vielen Dank im Vorfeld.
    Mit freundlichen Grüßen,
    Katrin

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  2 года назад

      Hallo Katrin/Mathias, danke für deine Kanalmitgliedschaft und dein Lob!
      Zu deiner Frage: Ist schwer zu sagen, wenn SPSS aber eine Variable auslässt, liegt es meist daran, dass sie entweder eine Konstante ist, also nur eine Ausprägung existiert oder eine (lineare) Transformation einer anderen Variable darstellt. Könnte das bei dir zutreffen?
      Viele Grüße, Björn.

    • @mathiasmengel191
      @mathiasmengel191 2 года назад

      Hallo Björn,
      vielen Dank für Ihre rasche Reaktion!
      Ja, das passt. Es ist das quasi dichotom kontrastierte Geschlecht. Dann zeigt sich also trotz der Quadrierung keine "Extremisierung" des Werteverhaltens und die Variable ist somit für die Verhaltensanalyse der Residuen nicht mehr von Bedeutung, könnte man das so interpretieren? (1)
      Dann könnte ich die ausgeschlossene Variable ignorieren und beziehe 4df bei der Signifikanztestung ein? (2)
      Wenn dem so wäre, könnte ich verallgemeinernd annehmen, dass dichotome UVs isoliert in die Prüfung der Signifikanz eingehen können und deren Quadrierung entfällt? (3)
      Und wenn dem (3) so wäre, könnte das Ganze auch auf kategoriale bzw. Dummy-kodierte, nicht jedoch auf Effekt-kodierte Variablen (wegen möglicher Gewichtung) auszuweiten sein? (4)
      Ich bedanke mich für eine mühevolle AW bei diesen umfangreichen Fragen!
      Viele Grüße,
      Katrin
      p.s.: Die Kanalmitgliedschaft war überfällig, sehr gern geschehen.

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  2 года назад

      Hallo Katrin, jetzt wären mir die Fragen fast durchgerutscht.
      1) die Quadrierung aller UV ist rein mechanisch, die Skalierung spielt hierbei keine Rolle. Daraus würde ich aber nicht schließen können, dass diese Variable für die Residuenanalyse bedeutungslos ist.
      2) Wenn du sie ausschließt - unabhängig vom inhaltlichen Grund - reduziert sich df auf 4.
      3) siehe 1) - hier hängt es von der Codierung ab. Wenn es 0 und 1 ist, wird das Quadrat daran nichts ändern. Eingehen müssten sie aber dennoch, da sie Prädiktoren sind und bleiben.
      4) Ja, kategoriale Ausgangsvariablen werden dummy-codiert und diese dann wie andere UV behandelt. Bzgl. Effektkodierung bin ich mir allerdings nicht sicher, inwieweit das Vorgehen bleibt.
      Viele Grüße, Björn.

    • @mathiasmengel191
      @mathiasmengel191 2 года назад

      @@StatistikamPC_BjoernWalther Vielen Dank für die Antwort!

  • @flipmo1164
    @flipmo1164 4 года назад

    Hallo Björn,
    Ich habe im Zuge der Durchführung meiner Bachelorarbeit einige Quellen zu Homoskedastizität gesichtet und bisher hieß es immer, dass Homoskedastizität und nicht Heteroskedastizität bedingung für eine Regression ist.

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 года назад

      Hallo Moritz, prinzipiell ja. Der Duktus ist häufig, dass man auf Heteroskedastizität prüft und bei deren Abwesenheit von Homoskedastizität ausgeht und dann fortfahren kann.
      Viele Grüße, Björn.