Schritt für Schritt - Multiple lineare Regression in R rechnen und interpretieren

Поделиться
HTML-код
  • Опубликовано: 11 сен 2024

Комментарии • 150

  • @StatistikamPC_BjoernWalther
    @StatistikamPC_BjoernWalther  3 месяца назад

    📘Mein Buch "Statistik mit R - Schnelleinstieg": amzn.to/3OzeLJI [Affiliatelink]

  • @katharinatrachte512
    @katharinatrachte512 3 года назад +23

    Vielen herzlichen Dank!!! Wünschte an der Uni würde das auch so gut erklärt! Wäre ziemlich aufgeschmissen gewesen ohne deine Videos

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад +1

      Hallo Katharina, danke für dein Lob! Freut mich, wenn dir die Videos helfen. :-)
      Viel Erfolg weiterhin!
      Viele Grüße, Björn.

  • @sidneyno144
    @sidneyno144 4 года назад +16

    Tausend Dank!
    Ich glaube mit dem Video hast du meine Seminararbeit gerettet!
    Sollte ich dich jemals treffen, hast ein Bier bei mir gut :D

  • @dominiktubben7266
    @dominiktubben7266 3 года назад +11

    Ein komplexes Thema für alle Nichtstatistiker einfach erklärt. Vielen Dank 👍🏻

  • @Ri0m0
    @Ri0m0 4 года назад +1

    Ich wollte mich mal fett bedanken :D Ich hab diese Woche meine Klausur in Statistik mit R wegen corona online geschrieben und dank dir konnte ich alles ausfüllen ^^ Dabei hab ich gaaaaarkeine Ahnung gehabt :D Rückblickend hat das sogar eigentlich spaß gemacht. Vielen dank für die hilfe ^^

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 года назад +1

      Freut mich, wenn die Videos dir so sehr helfen konnten! Weitersagen hilft dem Kanal am meisten. :-)
      Viele Grüße, Björn.

  • @fawazalizzy3446
    @fawazalizzy3446 3 года назад +6

    Wir wollen dich als unseren Übungsleiter! Great videos! Viele Grüße von den TU Berlin Studenten.

  • @marshallwaters996
    @marshallwaters996 3 года назад +1

    Mega schon nach den ersten Minuten! Vielen Dank!!

  • @rafaelt.2635
    @rafaelt.2635 4 года назад +2

    Vielen Dank für diese tiefgründige Erklärung. Du hast mir sehr geholfen!

  • @batearedfox1
    @batearedfox1 Год назад +1

    Phantastisch erklärt, dankeschön!

  • @ballndkrump
    @ballndkrump 3 года назад +1

    Danke! Hat mir sehr weitergeholfen! Super erklärt.

  • @ToutClan
    @ToutClan Год назад +2

    TÜV geprüfter Ehrenmann.

  • @user-cj1mx4zj4z
    @user-cj1mx4zj4z 4 года назад

    Kann mich nur anschließen! Mal wieder ein richtig gutes Video und die Erklärungen zur Interpretation sind super verständlich! Seitdem ich ihre Videos nutze, um R zu verstehen, macht mir das Arbeit damit Spaß! Mich würde, wie im anderen Kommentar bereits erwähnt wurde, interessieren, ob man bei unterschiedlichen Skalen mit verschiedenen Skalenniveaus standardisieren sollte, nicht nur für die Berechnung von multiplen Regressionen, sondern auch für andere Verfahren.
    🙂

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 года назад

      Hallo, das muss man generell nicht tun. Die Interpretation von Koeffizienten ist ohne Probleme möglich. Lediglich in wenigen Ausnahmefällen ist es notwendig, z.B. um standardisierte Koeffizienten im Rahmen der Regression zu erhalten oder bei der Moderation eine sinnvollere Interpretation vornehmen zu können.
      Viele Grüße, Björn.

  • @MBison-oc5tc
    @MBison-oc5tc 3 года назад +1

    dankeeeeee!!!!! bitte mehr von sowas!!!!!!!

  • @StatistikamPC_BjoernWalther
    @StatistikamPC_BjoernWalther  4 года назад +1

    Bei Fragen und Anregungen zur multiplen linearen Regression und deren Interpretation in R nutzt bitte die Kommentarfunktion

    • @Kraeuterkeule
      @Kraeuterkeule 4 года назад

      Hello hab mal ne Frage wie ist in dem Fall ein sehr niedriger R-squared wert von um die 7-8 % einzuschätzen ?
      Sieht dann so aus, als wenn mein Datensatz groß genug wäre die βi's genau zu schätzen, aber Ihre Kovariablen schlechte Arbeit beim Erklären und\oder Vorhersagen der Antwortwert leisten = ist dies bedenklich ?
      Auf eine Antwort würde ich mich freuen (;

  • @lanaschludi5466
    @lanaschludi5466 3 года назад +5

    Sollte man die Annahmen einer linearen Regression (z.B. Multikollinearität, Heteroskedaszidität etc.) vor oder nach z-Standardisierung der Variablen prüfen oder spielt das keine Rolle? Vielen Dank für deine Videos!

  • @serotragtmantel3982
    @serotragtmantel3982 Год назад

    Danke Danke Danke ! Ohne deine Videos wäre ich lost.

  • @Satoshi467
    @Satoshi467 3 года назад +1

    Hallo Björn! Vielen Dank für diese super hilfreichen Videos...mir persönlich würde ein Video über die Pfadanalyse in R gerade extrem helfen da ich das bald in meiner Masterarbeit rechnen werde :) Viele Grüße!

  • @Strogames
    @Strogames 3 года назад +1

    Super hilfreich! Besonders die kleinen Zusammenfassungen waren super :-)

  • @leaschuurmans4940
    @leaschuurmans4940 4 года назад +3

    Tolles Video! Ich bin im Masterstudium nun zum ersten Mal mit R konfrontiert und als SPSS User war ich erstmal total überfordert. Aber mittlerweile finde ich total spannend, welche Möglichkeiten man mit R so hat. Toll, dass du dazu nun auch Video machst! Kommt zufällig demnächst was zu Mixed Effect Models in R? Das fände ich sehr spannend.

    • @leaschuurmans4940
      @leaschuurmans4940 4 года назад

      Und SEMs mit Lavaan fände ich auch super interessant!

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 года назад +2

      Hallo Lea, freut mich, wenn du in R vorankommst. Mixed Modelle gehören nicht so wirklich zu meinem Lieblingsgebiet, eine kleine Einführung könnte -irgendwann- tatsächlich mal folgen. SEM finde ich persönlich ganz schrecklich und vermeide ich tunlichst. Ich verwende lieber gleich valide Skalen. ;-)

  • @christiandrengk6214
    @christiandrengk6214 3 года назад +2

    Hey, auch ich möchte mich einmal ganz ganz herzlich für deine Videos bedanken!
    Dann hätte ich die Frage, ob du mal etwas zu Strukturgleichungsmodellen in RStudio machen könntest. Das wäre wirklich klasse.

  • @dg.o.6515
    @dg.o.6515 4 года назад +2

    Super Video. Das hat mir sehr weitergeholfen! Vielen Dank :)

  • @nguewouorachel6142
    @nguewouorachel6142 2 года назад +1

    Danke sehr ,das war mir sehr hilfreich

  • @davila1906
    @davila1906 3 года назад

    Vielen vielen Dank für die super Erklärungen und die Mühe. So deutlich und klar, einfach perfekt erklärt. Bitte mehr davon. Lg

  • @sportpferdecindygieshoidt5503
    @sportpferdecindygieshoidt5503 4 года назад +1

    Sehr gute R videos! vielen Dank dafür!

  • @supermiimi
    @supermiimi 3 года назад +1

    Hallo, eine Frage du hast gar nichts mehr zu dem Intercept gesagt? Ich verstehe das bei einer Aufgabe bei mir nicht, da geht es um Alter in Jahren (X) , Einkommen in Euro(Y) und Unternehmensgröße (Z). Das Intercept ist 907,8. Bedeutet das jetzt, dass man mit "0 Jahren 907,8 Euro verdient?"?

    • @punchline9131
      @punchline9131 3 года назад

      Ja. Am besten das Alter aber mittelwert zentrieren. Dann wird die Interpretation auch sinnvoller.

  • @nils2527
    @nils2527 4 года назад +3

    Super Video! wie immer ;)
    Kommt noch ein Video zur moderierten Regression in "R"? Ich wüsste gerne ob man bei einer moderierten Regression bei der man mit verschiedenen Skalenbereichen arbeitet z-standartisieren soll/muss? Bei einer einfachen linearen regression muss man das ja nicht oder?
    LG

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 года назад +1

      Hallo Nils, danke für dein Lob!
      Nein, z-standardisieren muss man nicht. es wird aber empfohlen (Hayes, 2018) dies noch mal zu tun und zu rechnen, um die Effekte miteinander vergleichen zu können.
      Ein Video zur Moderation in R steht schon afu der Liste, der nächste Aufnahmezyklus ist aber noch ein bisschen hin.
      Viele Grüße, Björn.

  • @GoodLiveBear
    @GoodLiveBear Год назад +1

    ❤ merci

  • @Pebo42
    @Pebo42 8 месяцев назад

    Danke für die tolle Erklärung, ich hätte eine Frage: Ich habe das so Verstanden, dass das Multiple R-squared der Korrelationskoeffizient ist, allerdings bekomme ich, wenn ich cor(x,y) in RStudio eingebe einen anderen Wert raus. Woran liegt das?

  • @makaveli_9457
    @makaveli_9457 Год назад

    Hallo Bjoern, ich habe viele relativ grosse Datensaetze, welche ich versuche mit dem biglm() paket zu handeln. Das Problem ist, wichtige Kennziffern wie R_squared und F Statistiken gibt mir dieses Paket gar nicht aus. Gibt es da eine Moeglichkeit dies zu umgehen?

  • @Klauskunze99
    @Klauskunze99 3 года назад

    Hallo, du sagst, dass man in der ersten Regression den Einfluss nicht vergleichen kann, weil die Wertebereiche anders sind und möchtest sie über eine z-standardisierung vereinheitlichen. Angenommen die unabhängigen Variablen wären auf der selben Skala (bei mir von 1-7), könnte man sie dann vergleichen, oder ist es wichtig, dass die im Mittelwert 0 und die Standardabweichung 1 ist?

  • @Luki_-pq4uy
    @Luki_-pq4uy 2 года назад +1

    dankeeee

  • @senor6909
    @senor6909 Год назад

    11:23 Wie interpretiert man die z-standardisierten Werte? Der niedrigere Wert im Estimate hat einen höheren Einfluss auf die unabhängige Variable?

  • @Heinz-JürgenHättig
    @Heinz-JürgenHättig 11 месяцев назад

    Ich finde die Ausführungen zu Abischni(bbel) sehr aufschlussreich. Intelligenz ist einflussreicher als Motivation: der gute Wille allein nützt nichts.

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  11 месяцев назад

      Dass es sich hier um fiktive Daten und keine empirisch gesicherten Erkenntnisse handelt, muss ich hoffentlich nicht explizit erwähnen.

    • @Heinz-JürgenHättig
      @Heinz-JürgenHättig 11 месяцев назад

      @@StatistikamPC_BjoernWalther Ich nehme aber an, dass den Simulationsdaten echte Populationsparameter zugrunde liegen. Wie kann man in R mehrere Variablen generieren, die miteinander korreliert sind und deren Stichprobenparameter festgelegt werden können? Das würde mich mal interessieren. Danke schon mal.

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  11 месяцев назад

      Nein, der verwendete Datensatz ist ein simulierter Datensatz aus 2017, der von mir mittels Matlab erstellt wurde - die Parameter bzw. der Code zur Simulierung ist - sofern nicht schon gelöscht - auf meinem ehemaligen Uni-Server.
      Ein guter Blogbeitrag zum Thema: fredclavel.org/2019/04/17/simulating-correlated-multivariate-data/

    • @Heinz-JürgenHättig
      @Heinz-JürgenHättig 11 месяцев назад

      @@StatistikamPC_BjoernWalther Danke für den interessanten Blog-Betrag. Er ist zwar kein Lebensretter, aber bewahrt mich vor Selbstzweifel. Deine YTube-Beiträge sind mit die besten und Gott sei Dank nicht so weitschweifig wie zB asia-amerikanische Beiträge. Danke auch dafür.

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  11 месяцев назад

      Danke für das Lob! Freut mich, wenn die Videos den Nerv treffen. Im englischen Bereich ist es wahrlich etwas schwierig, weshalb ich diese Nische auf einem anderen Kanal jetzt auch etwas bediene.

  • @SarahFehrer
    @SarahFehrer 10 месяцев назад

    Hallo Björn, danke für das super Video. Kannst Du mir verraten, ob man bei der multiplen Regression auch das Bootstrap- und Permutationsverfahren anwendet, um auf die Allgemeinheit zu schließen?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  10 месяцев назад

      Hallo, nein, das ist nicht zwingend notwendig. Resampling wird meist bei Voraussetzungsverletzungen angewendet. Auf die Allgemeinheit kann man schließen, wenn die Stichprobe repräsentativ für die Grundgesamtheit/Allgemeinheit ist. Das ist im Vorfeld deskriptiv zu prüfen und meist ausreichend.
      Viele Grüße, Björn.

  • @Joschiiie
    @Joschiiie 3 года назад

    Es gibt ja auch die Standardisierung nach Gelman 2008, bei der man auch binäre Variablen vergleichen kann. Ich habe diese in meiner Datenanalyse verwendet und dabei verändern sich die Vorzeichen der Koeffizienten. Wie kann ich das dann interpretieren. Z.b. der Plot lässt eine negative Korrelation vermuten. Die standardisierten Estimates sind aber positiv ... Hast du eine Idee? :)

  • @kathrindruke3070
    @kathrindruke3070 3 года назад

    Danke für das Video. :-)
    Ich habe eine Frage zu der Interpretation.. bei meinen Daten kommen bei einer Variable einen positiven nicht signifikanten Wert raus, obwohl es sich eigentlich um eine negative Korrelation handelt. Wie interpretiere ich denn sowas? Bsp.: Affektives Commit und Fluktuation korrelieren negativ miteinander, in meiner multiplen Regression ist ß jedoch positiv.
    LG

  • @sophiehansen2023
    @sophiehansen2023 7 месяцев назад +1

    👏

  • @dandudas8543
    @dandudas8543 3 года назад

    Bei der Minute 12:17 vergleichst du standardisierte Outputs von R und Spss. Warum gibt R ein Intecept von -1.5....aus währen in Spss kein Intercept ausgegeben wird? Danke!

  • @JC-lv1yn
    @JC-lv1yn 3 года назад

    Hi Lieber Björn, ich möchte eine multiple Regression mit mehrer Kontrollvariablen aber einer Unabhängigen und einer Abhängigen Variable machen. Würde ich die Gleiche Funktion benutzen oder gibt es in R eine besser geeignete? Müsste ich dann auch z standardisieren?

  • @CeydaErtürk-i8y
    @CeydaErtürk-i8y 9 месяцев назад

    Vielen Dank für das Video! Kurze Frage zur Interpretation: wenn der koeffizient bei der x positiv ist, heißt es steigt x, steigt auch y. Kann man das auch für den Umkehrschluss so interpretieren? Sinkt x, sinkt auch Y ?
    Vielen Dank!

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  9 месяцев назад

      Hallo, exakt. Der Koeffizient gibt immer an, um wie viele EInheiten y steigt, wenn x um genau eine Einheit steigt. Das gute alte Steigungsdreieck ;-)
      Ist der Koeffizient von X1 = 3, steigt y um 3 Einheiten, wenn X1 um eine Einheit steigt. Umgekehrt, sinkt X1 um eine Einheit, fällt Y um 3 Einheiten.
      Viele Grüße, Björn.

  • @frenchie9792
    @frenchie9792 3 года назад

    Vielen Dank für das informative Video. :-) Ich habe gerade ein Modell erstellt und der adjusted R squared ist durch das Hinzufügen einer weiteren x-Variable unverändert geblieben. Sollte ich die Variable trotzdem im Modell behalten? Es gibt eine konzeptionelle Begründung, warum sie die y-Achse erklären könnte, aber kein "Signifikanz-Sternchen" in der entsprechenden Zeile des Summary. Vielen Dank im Voraus und VG :-)

  • @faith9828
    @faith9828 7 месяцев назад

    Was sagt die F-Statistik hier genau aus? Ich habe es so gelernt, dass ein Nullmodell erstellt wird, wo geguckt wird, ob unser erstelltes Modell statistisch signifikant besser zu den Daten passt, als ein Modell (von der F-Statistik) welches nur aus dem Mittelwert der abhängigen Variable besteht. Ist das richtig?

  • @larasauer5032
    @larasauer5032 2 года назад

    Gibt es so etwas wie eine „Maximalanzahl“ an Prädiktoren? Weil ich habe gehört, dass es zu „Overplotting“ kommen kann… Aber sobald ich eine unabhängige Variable entferne, wird das r-Quadrat kleiner… wäre sehr froh über einen kurzen Tipp!

  • @Schmiedemeister17
    @Schmiedemeister17 3 года назад

    Hi! Vielen lieben Dank für das tolle Video. Ich bekomme als Fehlermeldung meiner Panel-Regresseion (plm) allerdings immer wieder:
    Fehler in solve.default(vcov(x)[names(coefs_wo_int), names(coefs_wo_int)], :
    System ist für den Rechner singulär: reziproke Konditionszahl = 8.32582e-22
    Meine abhängige Variable ist nicht binär.
    Kann es damit zusammenhängen, dass ein Teil meiner Variablen binär sind oder die Ausprägungen zu hoch sind?
    Lieben Dank im Voraus!

  • @tsumakana4185
    @tsumakana4185 2 года назад

    Kurze Frage dazu, ich habe in meiner Abschlussarbeit Cluster meiner Datensätze gebildet gebildet, auch mit
    einigen (7) ausgeschlossenen Datensätzen. Wenn ich eine Variable habe,
    welche von allen teilnehmern (also auch die aus der cluster
    augeschlossenen) Datensätze hat, darf ich dann auch damit auch
    Korrelationen mit den Anfangsgebildeten Clustern betrachten oder muss ich
    dafür die ausgeschlossenen Datensätze auch aus der betreefenden Variable ausschließen?

  • @Juju-ju7uj
    @Juju-ju7uj 2 года назад

    Wenn meine x Variablen die selbe Skala haben, kann ich dann anhand der hier gezeigten Werte erkennen, welche Variable einen größeren Einfluss hat?

  • @Bella-tm4dh
    @Bella-tm4dh 3 года назад

    Eignet sich dieses Video auch für eine Mediation?

  • @mabi3212
    @mabi3212 3 года назад

    Wäre das eigentliche eine Difference in differences (DID)??? Wenn nein, hast du dazu noch ein Video?
    Davon abgesehen, vielen Dank für deine Videos =)

  • @dominikbernard9939
    @dominikbernard9939 3 года назад

    Hallo Björn,
    wie kann man die BLUE Annahmen in R überprüfen?
    P.S. deine Videos retten uns in der Abteilung (Customer Insights bei einem großen Konzern) häufig den Allerwertesten ;)

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад

      Hallo Dominik, freut mich, wenn euch die Videos voranbringen. ;-)
      Die BLUE-Annahmen habe ich im wesentlichen in dieser Playlist zusammengefasst: ruclips.net/p/PLJ8d6dduOfrpBSBxM6YPPWYfHAaupaPEw
      Die Linearität könnte man per Streudiagramm (jede UV zu AV) prüfen. Das halte ich aber für unnötig, da mir bei nicht hinreichender Linearität der F-Test ohnehin um die Ohren fliegt.
      Endogenität als Korrelation von UV und Störterm ist theoretisch per Hausman-Test prüfbar, aber auch da sehe ich bei einer sauberen theoretisch-konzeptionellen Modellherleitung keine Notwendigkeit - Ursache für Endogenität ist nämlich fast immer das Weglassen von Variablen (omitted variable bias).
      Viele Grüße, Björn.

  • @apfelschorle5400
    @apfelschorle5400 10 месяцев назад

    vielen dank. das ist auch alles ganz neu für mich. bietet r auch die möglichkeit das ganze nett aufzubereiten, um es in die arbeit einzufügen? alle graphiken, die ich mir angeguckt habe waren für mich unverständlich....

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  9 месяцев назад +1

      Hallo, ja, man kann über RMarkdown arbeiten (etwas umständlich wenn man bei 0 anfängt) oder nutzt das Paket stargazer: ruclips.net/video/SQtQkVDl4xU/видео.html
      Viele Grüße, Björn.

  • @maxwelll1
    @maxwelll1 3 года назад

    Wie sieht es denn aus wenn man mit korrelierten bzw. unkorrelierten Prädiktoren arbeiten muss? Gibt es da auch ein Video?

  • @Sama-ui2re
    @Sama-ui2re 3 года назад

    Sind gemischte lineare Regressionen und multiple lineare Regression das gleiche? Wenn nicht wo liegt dann der Unterschied und wie würde man gemischte lineare Regressionen in R berechnen?

  • @Vanessa-vc7rx
    @Vanessa-vc7rx 3 года назад

    Super Videos, danke :) Trotzdem hätte ich noch eine Frage, wenn ich die multiple Regression so eingebe wie du, erscheint jedes Mal:
    MultiBrazil

  • @akin65
    @akin65 4 года назад

    Hallo Björn, danke für die ganzen Videos, sehr verständlich erklärt. Könntest du vielleicht ein Video hochladen mit den ganze Annahmen und wie man sie in R testet?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад

      Hallo und danke für dein Lob!
      Ein paar sind schon in dieser Playlist zu finden: ruclips.net/p/PLJ8d6dduOfrpBSBxM6YPPWYfHAaupaPEw
      Viele Grüße, Björn.

  • @odoluo7040
    @odoluo7040 3 года назад

    Vielen Dank für das Video !
    Wie werden aber die P Werte für die einzelnen Koeffizienten im hintergrund berechnet ?
    Werden da alle Variablen bis auf eine "entfernt" bis eine einfache lin. Regression bleibt und schaut dann ob diese signifikant ist, oder funktioniert das anders?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад

      Hallo, das komplette Verfahren jetzt in einem Kommentar zu erklären, würde zu weit führen. Die Regression verwendet die kleineste Quadrate Methode und alle Koeffizienten werden gleichzeitig im Modell verwendet. Die Signifikanz ergibt sich zunächst aus den t-Werten und wird dann in den p-Wert umgerechnet.
      Viele Grüße, Björn.

  • @fabianfe8739
    @fabianfe8739 3 года назад

    MEGA! Danke für deine tausenden hilfreichen Videos! Eine Frage: Wie muss ein nicht signifikanter p-Wert oben bei den einzelnen Koeffizienten interpretiert werden? Zwei stück von meinen fünf unabhängigen Variablen haben leider einen nicht signifikanten p-Wert. Model ist aber signifikant.

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад +1

      Hallo Fabian, gerne doch!
      Das ist nicht ungewöhnlich, das im Model Koeffizienten nicht signifikant sind. Die werden einfach nicht als Einflussfaktoren auf die abhängige Variable eingeordnet. Der Koeffizient wird demzufolge auch nicht interpretiert. Gründe gibt es dafür viele. Von es existiert einfach kein Zusammenhang in der Grundgesamtheit, den man in der Stichprobe auch nicht findet, über eine zu geringe Stichprobengröße, einen Stichprobenbias, eine nicht reliable/valide Messung usw. Viel Raum für Diskussion und Ausblick also. ;-)
      Viele Grüße, Björn.

    • @fabianfe8739
      @fabianfe8739 3 года назад

      @@StatistikamPC_BjoernWalther Danke Björn! Wenn ich nun meine fünf UV (die fünf Sinne - sehen, hören, riechen, schmecken, fühlen) einzeln zu meiner AV berechne sind sie jedoch alle signifikant zusammenhängend. Als Gruppe fallen jedoch zwei aus dem Raster. Wie könnte man das interpretieren/ rechtfertigen?
      DANKE!

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад +1

      @@fabianfe8739 Hallo Fabian, schau mal dazu hier: ruclips.net/video/VQKBEFHLw6g/видео.html&lc=UgwxQ2ciD2cqZCR6kVh4AaABAg
      Kurz aber nicht endgültig gesagt: die UV korrelieren auch untereinander, so dass Redundanzen auftreten, die sich dann in Nichtsignifikanzen äußern. Es können natürlich auch noch andere (inhaltliche) Gründe existieren.
      Viele Grüße, Björn.

    • @fabianfe8739
      @fabianfe8739 3 года назад

      @@StatistikamPC_BjoernWalther Ohman - gar nicht gesehen. DANKE, genau wonach ich gesucht habe. Deine Videos und Erklärungen sind mit Abstand die besten, die es hier gibt. Danke dafür!

  • @philippleeb2794
    @philippleeb2794 3 года назад

    Danke für das Video!
    Wenn ich als Aufgabe habe von "s" auf "p" und "d", dann müsste ich also lm(s~d+p, data = dat) verwenden oder andersrum?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад +1

      Hallo Philipp, so wie du es beschreibst, ist s die unabhängige Variable und p und d sind abhängige Variablen. In einer Regression kann es aber nur eine abhängige Variable geben. Deswegen vermute ich, dass du p und d auf s rechnen sollst. Dann wäre es so wie du es beschreibst richtig.
      Viele Grüße, Björn.

  • @juliankuehn2721
    @juliankuehn2721 3 года назад

    Was kann ich über die Erwartungstreue der Schätzer in diesem Modell sagen?

  • @lavarnan272
    @lavarnan272 3 года назад

    Hallo, ich wollte mir den Datensatz herunterladen aber ich habe im diesem Datensatz nicht die Variable Motivation gesehen.😕 ist das vielleicht der Datensatz von der Linearen Regression ?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад +1

      Hallo Lavin, danke für deinen Hinweis. Ich habe den Datensatz erneut hochgeladen, diesmal mit Motivation.
      Viele Grüße, Björn.

  • @JohannMeier-lm2jh
    @JohannMeier-lm2jh Год назад

    Moin, ich habe meinen eigenen Datensatz und mein p-wert ist exakt gleich. Ist das ein krasser Zufall oder gibt es dafür eine Erklärung?

  • @Kraeuterkeule
    @Kraeuterkeule 4 года назад

    Hello hab mal ne Frage wie ist in dem Fall ein sehr niedriger R-squared wert von um die 7-8 % einzuschätzen ?
    Sieht dann so aus, als wenn mein Datensatz groß genug wäre die βi's genau zu schätzen, aber Ihre Kovariablen schlechte Arbeit beim Erklären und\oder Vorhersagen der Antwortwert leisten = ist dies bedenklich ?
    Auf eine Antwort würde ich mich freuen (;

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 года назад

      Hallo Tobias, niedrige R² deuten daraufhin, dass es für die Erklärung der AV noch geeignetere UV gibt/geben könnte. Ist der Datensatz groß genug, werden die Koeffizienten irgendwann automatisch signifikant, das R² gibt dir die mit der Modellgüte eine bessere Möglichkeit der Einschätzung.
      Viele Grüße, Björn.

  • @fishermensfriendzzz9175
    @fishermensfriendzzz9175 4 года назад

    Hallo, ich hätte eine allgemeine Frage: Ich habe eine abhängige Variable (ordinal) und mehrere unabhängige Variablen (sowohl nominal als auch metrisch). Kann ich die multiple Regression anwenden oder muss ich in dem Fall viele einzelne Regressionen machen und je nach Paarung der Skalenniveaus unterschiedliche Korrelationskoeffizienten berechnen?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 года назад

      Hallo Eric, eine ordinale Variable schreit normalerweise nach einer ordinalen Regression. Mitunter kann man argumentieren, dass die ordinale Variable quasimetrisch ist - gerne von Psychologen angewandt. An sich musst du bei mehreren AV auch mehrere Regressionen rechnen. Ob linear oder ordinal ist jedoch in deinem Fall individuell zu prüfen.
      Viele Grüße, Björn.

  • @kytohd5542
    @kytohd5542 2 года назад

    Super video! Darf man die scale Funktion auch bei Variablen verwenden, die als dummy kodiert sind, also bei 0 und 1? Das wäre extrem wichtig zu wissen :)

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  2 года назад +1

      Hallo und danke für dein Lob! Eine z-Standardisierung bei einer kategorialen Variable funktioniert nicht, da diese keinen Mittelwert und keine Standardabweichung haben.
      Viele Grüße, Björn.

    • @kilianjaehne8496
      @kilianjaehne8496 Год назад

      @@StatistikamPC_BjoernWalther Wichtige Info, habe ich fast falsch gemacht.

  • @CundSS
    @CundSS 3 года назад

    Kurze Frage: moderiert IQ somit dann den Notenschnitt? Dürfte man das dann so schreiben?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад +1

      Nein, eine Moderation wurde hier nicht modelliert. Ein Moderator schwächt oder stärkt eine Beziehung zwischen x-Variable und y-Variable. Hier gibt es lediglich mehrere x-Variablen.
      Viele Grüße, Björn.

    • @CundSS
      @CundSS 3 года назад

      @@StatistikamPC_BjoernWalther lueben Dank für die schnelle Antwort. Wie modelliere ich in R denn Moderatoranalysen? Bin leider auf meiner Suche hierzu noch nicht fündig geworden

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад +1

      @@CundSS Interaktionsterme sind einfach das Produkt von x-Variablen. Z.B. IQ*Motivation.
      Demnächst kommt da auch ein Video zu.
      Viele Grüße, Björn.

  • @nicolasneef3732
    @nicolasneef3732 3 года назад

    Moin, kann ich auch statt zwei intervallskalierten Prädiktoren eine dummy-variable (z.B. 0 = männlich und 1 = weiblich) und eine intervallskaleirte Variable (z.B. Bearbeitungsdauer) rechnen? Lg

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад

      Hallo Niclas, klar, das ist überhaupt kein Problem. Du musst du lediglich darauf achten, was deine referenzkategorie ist und den Koeffizienten dementsprechend interpretieren.
      Viele Grüße, Björn.

  • @melixy3545
    @melixy3545 4 года назад

    Danke für das hilfreiche Video! Bei mir funktionieren die Befehle nicht. Welche packages brauche ich dafür?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 года назад

      Hallo, welche Befehle funktionieren denn nicht?
      lm ist standardmäßig in R implementiert und sollte in jedem Fall gehen.
      Viele Grüße, Björn.

  • @montgomeryhartman476
    @montgomeryhartman476 3 года назад

    Vielen Dank für die sehr informativen Videos!
    Aber kann mir vielleicht jemand einen Tipp geben, wie eine LR bei Einzelfallstudien funktioniert?
    Ich bin mir unsicher , ab welcher Anzahl von Probanden eine (M)LR überhaupt zulässig ist.
    Beispiel: 20 Probanden im AB Modell, Baseline: 8 Durchgänge, Intervention 36 Durchgänge.
    Frage: In wie weit hat die Anzahl der Kursteilnehmer einen Einfluss auf den Lernzuwachs (Effektstärke (Tau-U))?
    Geht das überhaupt? z.B. mit HPLM (scan) Wenn ja, wie?

  • @Draxler2Punkt0
    @Draxler2Punkt0 4 года назад

    Guten Tag, danke für das tolle Video!
    Ist es möglich die Y-Variable als Logarithmus zu schreiben, da meine Y-Variable eine Quote ist und ich den prozentuale Veränderung ausgeben haben möchte? Ich bekomme dann leider immer einen Fehler ausgegeben.
    Danke im Voraus!

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 года назад

      Hallo, gern geschehen.
      Wenn du bereits eine Quote hast, kannst du doch die Veränderung in Prozent direkt ablesen. Da braucht man nichts hin und her transformieren. Ist nur unnötige Arbeit und fehleranfällig.
      Viele Grüße, Björn.

  • @hopelesscynic1584
    @hopelesscynic1584 4 года назад

    Hi, super Video! Kann man auch testen, ob sich die Regressionskoeffizienten signifikant voneinder unterscheiden, also überprüfen, ob der größere Effekt auch signifikant größer ist? Und Gäbe es dafür auch eine Möglichkeit, das in SPSS umzusetzen? Bin für Hinweise dankbar. ;)

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  4 года назад

      Hallo, danke!
      Nein, so etwas kann man nicht untersuchen. Mit den standardisierten Koeffizienten kannst du allerdings sehen, welcher Koeffzient relativ betrachtet welche Einflussstärke hat.
      Viele Grüße, Björn.

  • @jennofer
    @jennofer 3 года назад

    Hallo, vielen Dank für das tolle Video! :-) Gibt es eine Möglichkeit, ein Übersteuern durch zu viele Variablen zu prüfen? Woher weiß ich, wann ich "zuviele" Variablen verwendet habe?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад

      Hallo Jennifer, das kann man pauschal nur so beantworten, das es so wenige UV wie möglich und so viele wie nötig sein sollten. Kritisch im statistischen Sinne wird es immer dann, wenn es mehr Variablen als Beobachtungen gibt. Eine grobe Richtlinie zur Stichprobengröße in Abhängigkeit der #UV beschreibe ich hier: ruclips.net/video/4kl9zb1fqQU/видео.html Ansonsten wäre eine Poweranalyse im Vorfeld natürlich auch nicht verkehrt. ;-)
      Generell gilt stets: jede Einflussvariable muss ja konzeptionell irgendwie hergeleitet werden.
      Viele Grüße, Björn.

    • @jennofer
      @jennofer 3 года назад +1

      @@StatistikamPC_BjoernWalther Hallo Björn, vielen lieben dank für die Antwort. Das hilft mir auf jeden Fall weiter, Danke :-)

  • @tomclaus7456
    @tomclaus7456 3 года назад

    Hallo,
    vielen Dank für dein Video. Wie kann ich anhand des Outputs die Effektstärke (f) (cohens`d) ermitteln?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад

      Hallo Tom, d ist nur für Mittelwertvergleiche konzipiert. R-Quadrat wird bei Regressionen verwendet, welches man auch in f umwandeln kann (R-Quadrat/(1-R-Quadrat)).
      Viele Grüße, Björn.

  • @dertellerwascher6348
    @dertellerwascher6348 Год назад

    Wie würde ich es machen, wenn meine Daten nicht stationär sind? Soll ich die einfach vorher Differenzieren?

  • @susanneheinen5269
    @susanneheinen5269 3 года назад

    Huhu, ich hätte auch eine kurze Frage:) wenn ich eine Regressionsgleichung aufstelle, berücksichtige ich nur die ß die signifikante p-werte habe oder werden alle ß berücksichtigt?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад +1

      Hallo Susanne, die Konstante interessiert dich nur bei Prognosen und da ist der p-Wert egal. Bei der Interpretation von Einflüssen ignoriert man die Konstante.
      Viele Grüße, Björn.

    • @susanneheinen5269
      @susanneheinen5269 3 года назад

      Perfekt, ich danke dir! Bei der multiplen Regression nach der LMS Methode kann ich dann nur eine Prognose aufstellen, oder? Mehr Möglichkeiten hat man da nicht?

  • @Strinanana
    @Strinanana 2 года назад

    vielen Dank für das Video! bei mir ist es so, dass die unabhängige Variable im Nettomodell grösser geworden ist. diese müsste doch bei integration der störvariablen kleiner werden. wie kann das sein? danke!

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  2 года назад +1

      Hallo Nadja, der Koeffizient kann sich, ebenso wie der p-Wert vergrößern oder verkleinern. Was sich erhöhen sollte, ist die Varianzaufklärung der AV, was du aber an einem signifikanten Delta F siehst.
      Viele Grüße, Björn.

    • @Strinanana
      @Strinanana 2 года назад

      @@StatistikamPC_BjoernWalther danke dir!! :)

  • @Doeniz1
    @Doeniz1 3 года назад

    Auf der Folie ganz am Anfang von 0:06 bis 0:40 fehlt die glaube ich das Summenzeichen vor beta_n x_n.

  • @dandudas2254
    @dandudas2254 3 года назад

    warum gibt mir der R Output nur 2 Zeilen für die Regressionskoeffizienten, selbst dann, wenn ich z.B. 4 unabhängige Variablen im Modell aufnehme?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад

      Hallo, jede UV sollte eine separate Zeile in der Koeffiziententabelle haben. Sind fehlende Fälle ausgeschlossen oder sind die Variablen keine Linearkombination anderer, Stichwort Dummies?
      Viele Grüße, Björn.

    • @dandudas8543
      @dandudas8543 3 года назад +1

      @@StatistikamPC_BjoernWalther nee sorry, es lag an einer Klammer die ich vergessen hatte. Alles gut, und vielen vielen Dank, dass es dich gibt.

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад

      @@dandudas8543 Top, gerne doch.

  • @JenViva288
    @JenViva288 3 года назад

    Super Video. Schade, dass es keins zur Moderator-/Mediatoranalyse in R von Ihnen gibt :(

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад

      Hallo Jen, das steht auf der Liste und wird in der nächsten Aufnahmesession auch dabei sein.
      Viele Grüße, Björn.

  • @PG-mu7mz
    @PG-mu7mz 3 года назад

    Hallo,
    danke für deine tollen Videos, du hilfst mir aktuell sehr bei meiner Bachelor Arbeit.
    Ich möchte eine multiple lineare Regression machen in der ich aber nicht 2 Variableneinflüsse vergleichen sondern eher 2 Gruppen.
    In meinem Fall also z.B die drei Gruppen: Unternehmenswachstum~ Unternehmen die international stark aktiv sind, Unternehmen die international moderat aktiv sind, Unternehmen die international nicht aktiv sind.
    Dazu habe ich leider noch kein Video gefunden, ich hoffe mein Anliegen ist verständlich.
    Ich freue mich auf eine Rückmeldung

    • @PG-mu7mz
      @PG-mu7mz 3 года назад

      warscheinlich ist es dann einfach Regression mit Dummys oder ?

  • @ds221b
    @ds221b 3 года назад

    Gibt es eine Möglichkeit meinen R Wert zu erhöhen? Genaueres Messen bringt mir leider nichts und sonst brauche ich vielleicht eine andere Regression?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад +2

      Hier muss ich ganz deutlich warnen. Das Ziel ist es nicht, mit irgendwelchen "Taschenspielertricks" einen bestimmten Wert zu erhöhen oder zu senken, sondern objektiv die erhaltenen Ergebnisse zu präsentieren. Die Ergebnisse sind wie sie sind. Wenn begründeter Verdacht besteht, dass die konzeptionelle Herleitung der Hypothesen überarbeitet werden sollte, dann kann dies Grundlage für die erneute Berechnung mit einem angepassten Modell sein, wo sich mitunter ein anderes Bestimmtheitsmaß zeigt.
      Ich gebe zusätzlich zu Bedenken, dass v.a. Stichprobenauswahl ein entscheidender Punkt ist. Wenn sich kein linearer Zusammenhang zeigt, würde das auch indirekt über die ANOVA ersichtlich. Dennoch sollte in der Diskussion ausführlich auf mögliche Gründe der geringen Varianzaufklärung eingegangen werden.
      Viele Grüße, Björn.

    • @ds221b
      @ds221b 3 года назад

      @@StatistikamPC_BjoernWalther Du hast absolut Recht. Der Wert soll nicht verfälscht werden, aber ich suche eine Funktion bzw Zusammenhang der nicht so einfach abzubilden ist. Danke für die Antwort

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад +1

      @@ds221b Dann wäre evtl. eine zusätzliche (begründete) Aufnahme weiterer UV denkbar, ein anderes Sample oder eine nichtlineare Funktion. Allerdings ist letzteres schon alles andere als trivial, v.a. bei der Interpretation und erst recht bei der Begründung, dass es z.B. quadratisch o.ä. ist.
      Viele Grüße, Björn.

    • @ds221b
      @ds221b 3 года назад

      @@StatistikamPC_BjoernWalther Ja, genau. Da muss ich mich dann einlesene und sehen wie ich das analysieren kann.

  • @GoodLiveBear
    @GoodLiveBear Год назад

    So finde ich in r den Stichprobenumfang?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  Год назад

      Hallo Suzy, schau dazu mal hier über GPower: ruclips.net/video/0pE0hRfyx1c/видео.html
      Viele Grüße, Björn.

  • @denisneznanow2571
    @denisneznanow2571 3 года назад

    top

  • @user-vk5so2mc1c
    @user-vk5so2mc1c 2 года назад

    wie rechne ich die e zahlen aus???????

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  2 года назад

      Hallo, das ist die wissenschaftliche Schreibweise für Nachkommastellen. Rechnen muss man da nichts.
      Viele Grüße, Björn.

  • @lavarnan272
    @lavarnan272 3 года назад

    wie kann ich diesen datensatz runterladen?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад

      Hallo Lavin, der ist in der Videobeschreibung verlinkt.
      Viele Grüße, Björn.

    • @lavarnan272
      @lavarnan272 3 года назад

      @@StatistikamPC_BjoernWalther oh ja, aber auf diesem Datensatz sehe ich die Variable Motivation nicht 😕 ich glaube das ist der Datensatz von der Linearen Regression

  • @punchline9131
    @punchline9131 3 года назад

    Je mehr Variablen ich in mein Regressionsmodell übernehme, desto geringer wird das N im Modell, also die Anzahl der Personen, deren Werte für die Berechnung der Regression verwendet werden. Hat jemand hierfür eine Erklärung?

    • @StatistikamPC_BjoernWalther
      @StatistikamPC_BjoernWalther  3 года назад +1

      Hallo, das liegt an listenweise Ausschluss von Fällen bei fehlenden Werten. Du hast salopp gesagt wenige vollständige Beobachtungen.
      Viele Grüße, Björn.

    • @punchline9131
      @punchline9131 3 года назад

      @@StatistikamPC_BjoernWalther Danke👍 mir ist es dann tatsächlich selbst noch eingefallen 😀

  • @itsfrani
    @itsfrani 2 года назад

    Hi lieber Björn! Du hilfst uns gerade echt sehr durch die Hausarbeit 😊 - Wir müssen dort mit Preisen arbeiten und bekommen deshalb einen sehr hohen MSE Wert. - Ist das normal, mit hoch meine ich 3208573682 - Obwohl das Modell mit einem Bestimmtheitsmaß von 0.6417 ausgegeben wird ;) - Pls send help !!!