SPSS 다중공선성 모르면 회귀분석해도 소용없어요! / 공차(Tolerance) / VIF(분산팽창요인) / 상태지수 / Multicollinearity / 논쓰남

Поделиться
HTML-код
  • Опубликовано: 24 дек 2024

Комментарии • 56

  • @윤소라-s1f
    @윤소라-s1f 3 года назад +2

    우와 이런 좋은 채널이 있다는 사실을 왜 이제야 안걸까요?.... 소정의 돈을 드려야 할 것 같은데 ㅜㅜ

  • @hj-hd7yn
    @hj-hd7yn 3 года назад +8

    와 진짜 전달력 미쳤다 ㄷㄷㄷ 감사합니다.

  • @juravictoria294
    @juravictoria294 2 года назад +4

    설명 너무 너무 감사합니다. 누구도 안 가리쳐주는 것을 이렇게 알려 주는 게 :)

  • @younghojung7344
    @younghojung7344 3 года назад +1

    진짜 혼자 책보고 쩔쩔매고있었는데 이거 보고 육성으로 "키야~~~~~~" 이럼

    • @nssn
      @nssn  3 года назад

      크흐~~~

  • @송현주-m2s
    @송현주-m2s Год назад +1

    선생님 최고

  • @Dive-jf6kh
    @Dive-jf6kh 7 месяцев назад +1

    교수님이 추천해주셔서 왔습니다😂😂
    들으면서 희열을 느낍니다❤
    감사합니다!!

    • @nssn
      @nssn  7 месяцев назад

      교수님이 추천을 해주셨다고요?!😱 감사합니다!

  • @sjoo1271
    @sjoo1271 3 года назад +1

    아 진짜 최고네요 인정

  • @seungjalim1991
    @seungjalim1991 4 года назад +1

    설명을 쉽게 해주셔서 넘넘 이해가 잘 되요 감사감사~~ 그동안 묶은 때가 완전 벗겨지듯.... 시원해요 ! 넘 감사합니다.

  • @grandram2313
    @grandram2313 4 года назад +1

    큰 도움 되었습니다. 감사합니다

  • @Kirk_shimmering
    @Kirk_shimmering 4 года назад +1

    최고에요! 구세주를 만난 기분입니다 ㅠ

  • @시리-c4i
    @시리-c4i Год назад +4

    이해가 쏙쏙 쉽게 설명해주셔서 감사합니다 : -)
    상태지수가 15이상일 경우 다중공선성의 문제가 있다고 하셨는데
    다른 곳에서는 30이상일 경우라고 기준이 다르더라구요
    혹시 어떤 차이일까요?

    • @nssn
      @nssn  Год назад +5

      논문에서는 상태지수를 기재하지 않습니다. 어느 기준에서는 100 미만도 있습니다만, 무시하시고 VIF값과 공차 값만 잘 확인하시길 바랍니다.

  • @fellow4077
    @fellow4077 3 года назад

    진짜 잘가르침

  • @minyounghwang5239
    @minyounghwang5239 2 месяца назад

    차이검정에서 유의한 일반적 특성 3개와 상관분석에서 유의한 독립변수 8개(상관계수 절댓값 0.237~0.386)를 회귀분석 돌렸는데.. 이 중 7개가 유의하고 공차는 0.122~0.826, VIF 1.211~8.192 입니다. (상태지수 65.515)
    딱 한값이 상관분석과 회귀분석의 부호가 다른데, 공차와 VIF는 기준안에 있어서 제거할 변수가 없는 거지요? ㅜㅜ 그냥 무시하고 논의에서 써도 되는건지, 주성분분석을 통해 변수를 줄여야 하는 건지 궁금합니다.
    혹시 보신다면 꼭 답변 부탁드리겠습니다. 좋은 하루 되세요.

  • @김도현-p9f
    @김도현-p9f 4 года назад

    1:51 여기 부분에서 t값이 작아지면 왜 유의확률이 커지는지 궁금합니다 ㅠㅠ

  • @김현지-m5q
    @김현지-m5q 4 года назад +2

    강의 너무 잘 들었습니다. 다른 조건은 다 만족하는데 상태지수가 15이상입니다. 다중공선성 발생이라고 봐야 할 것 같은데. 혹시 어떻게 처리할 방법 없는지요? 공차, 분산팽창은 다중공성선이 나타나지 않았습니다.

  • @CafeRoadtrip
    @CafeRoadtrip 3 года назад +1

    감사합니다. 그럼 다중회귀분석 하기전에 다중공선성을 확인해야 하겠네요?

    • @nssn
      @nssn  3 года назад +1

      맞습니다 :)

  • @chaho5801
    @chaho5801 4 года назад +4

    명쾌한 설명 감사합니다 :)

  • @강낭콩-f4y
    @강낭콩-f4y 11 месяцев назад

    이분형 로지스틱도 다중공선성을 주의깊게 봐야하나요?? 요즘 이거때문에 너무 머리가 아파서요ㅜㅜ

    • @nssn
      @nssn  11 месяцев назад

      독립변인이 여러 개가 투입되는 회귀분석이라면, 공선성은 주의깊게 봐야하는 게 맞습니다. 독립변수들 끼리의 상관관계를 보여줌으로써 공선성을 예측해보시기 바랍니다. 로짓 내에서는 공선성 값이 따로 나타나진 않습니다.

  • @박시내-g6q
    @박시내-g6q 7 месяцев назад

    선생님~~질문이 있습니다. 혹시 독립변수의 하위요인 4가지를 변수로 각기 투입해서 위계적회귀분석을 돌렸더니 4가지변인만 상태지수가 15를 넘는데...4가지변수가 원래는 하나의독립변수여서그런걸까요?그런경우 다중공선성으로진단하고다제거해야하는지..ㅠ아니면4개하위요인은각각투입못하고 그냥통으로하나의독립변수로투입해야하는지 궁금합니다

    • @nssn
      @nssn  7 месяцев назад

      상태지수는 고려하지 않으셔도 됩니다. VIF와 TOL만 집중해서 봐주시면 논문 작성에 문제 없을 겁니다.

  • @이세계-o1n
    @이세계-o1n 4 года назад

    종속변수 1개 , 독립변수 4개로 통계를 돌렸는데 독립변수1개가 제거가 되어서 결과가 나왔고
    다중공선성 나머지 항목은 만족시켰으나 마지막 상태지수가 21입니다 ㅠ ㅠ 뭐가 잘못되었나요 ㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠ

  • @곽현주-f5b
    @곽현주-f5b Год назад

    안녕하세요! 독립변수들 간 상관계수가 높게 나오지만 직관적으로 봤을 때 두 독립변수가 관련이 없어 보인다면 다중회귀 분석에 사용해도 되는건지 궁금합니다.

    • @nssn
      @nssn  Год назад

      직관? 이라는 단어가 통계적 관점으로는 매우 모호합니다. r값이 높다면 다중회귀 시 주의하셔야 합니다.

  • @walk_summer
    @walk_summer 2 года назад

    독립변수가 많이 투입된다는 말은, 결국 조절변수나 통제변수가 많이 투입될 때도 동일하다고 보면 될까요?

    • @nssn
      @nssn  2 года назад

      네, 맞습니다

  • @잎새달열하루_밍쫑로
    @잎새달열하루_밍쫑로 4 года назад +1

    VIF값은 10미만을 만족하지만 유의확률이 0.05 이상인 독립변수 또한 제거대상인가요?

    • @nssn
      @nssn  4 года назад

      VIF 값이 10 미만이라면 다중공선성이라고 판단하지 않습니다. 정상적인 회귀분석에서 유의확률이 0.05 이상 나타난 것이므로 독립변수가 종속변수에 영향을 미치지 않는 것으로 보면 될 것 같습니다. 유의확률이 0.05 이상이라고 독립변수 제거 대상이라고 하진 않습니다.

  • @김미수-q2r
    @김미수-q2r 4 года назад

    VIF와 공차값은 모두 만족하는데, 회귀계수 부호가 다르면 다중공선성에 해당되는 것인가요?

  • @joo_yy
    @joo_yy 2 года назад

    r값이 마이너스라면, 0.9미만이니까 다중공선성이 의심되지 않는 것 맞나요?

    • @nssn
      @nssn  2 года назад

      절대값으로 봐야합니다

  • @이운용-l8l
    @이운용-l8l 4 года назад

    VIF지수가 높게 나와서 다중공선성이 의심되더라도 일단 회귀분석이 유의하고 영향력도 선행연구들과 일치하게 도출되었다면
    조치를 취할 필요는 없는거죠???

    • @nssn
      @nssn  4 года назад

      VIF 값이 10이상으로 높게 나타났다면 다중공선성이 발생한겁니다. 조치 취하셔야해요.

  • @sunnyk674
    @sunnyk674 3 года назад

    설명 감사합니다. 질문인데요. 상태지수 제외한 요소들은 다중공선성과 거리가 멀게 잘 나왔을 경우 질문입니다. 예를들어, 단계적 회귀분석을 했는데 모형이 1,2,3 이렇게 나온것중에서 1,2는 상태지수가 15미만으로 나왔는데 3은 상태지수가 30이렇게 나왔다면, 모형2를 선택해서 해석을 해도 될까요?

    • @nssn
      @nssn  3 года назад +2

      상태지수는 크게 신경안쓰셔도 됩니다. tol과 vif부터 보시고 이상 없다면 논문에 기재하셔도 됩니다

  • @솜솜-p4j
    @솜솜-p4j 2 года назад

    논쓰남님 처럼 모형 1에서만 공차 1.000나오는데 괜찮나요??

    • @nssn
      @nssn  2 года назад

  • @daheejung9413
    @daheejung9413 Год назад

    제 독립변수와 종속변수가 다범주형이라서 어떻게 해야 할지 모르겠어요ㅠㅠ 다중공선성을 볼 때도 연속형일때만 설명해주신 것 처럼 할 수 있는건가요?? 범주형일땐 어떻게 확인하나요??

    • @nssn
      @nssn  Год назад +1

      범주형이면 무시하셔도 됩니다.

    • @daheejung9413
      @daheejung9413 Год назад

      @@nssn 엇.. 게시물이 오래 돼서 맨날 고민만 하다가 댓글 달았는데 감사합니다!!!! 선생님 강의 듣고 더듬더듬 논문 통계 돌리고 있는데 도움이 많이 돼요!!

    • @nssn
      @nssn  Год назад +2

      해당 게시물은 오래되었지만, 지속적으로 새 영상을 올리고 있습니다!!

  • @윤태호-f6n
    @윤태호-f6n 4 года назад

    혹시 다중공선성으로 인해 왜 회귀계수의 표준오차가 증가하는 건지 알 수 있을까요? 표준오차가 증가하면 t값이 작아져서 유의확률이 커지므로 그것이 안좋다는건 알겠는데 왜 다중공선성으로 회귀계수의 표준오차가 커지는지는 이해가 안가네요. ㅠㅠ

    • @andyhan472
      @andyhan472 3 года назад

      다중공선성이란 독립변수 간에 완전한 선형상관관계가 존재하거나(예컨대 X2=2X1) 강한 선형의 상관관계를 보이는 것입니다. 그렇게 된다면 최소제곱법으로 회귀계수들을 추정함에 있어 당연히 정확도가 떨어지게 됩니다. 잔차제곱합을 회귀계수 B1로 미분한 식이랑 B2로 미분한 식이 같아지게 되기 때문이죠.. 따라서 추정의 정확도는 현저히 떨어지게 되고, 그것은 곧 표준오차의 증가를 의미합니다.

  • @simjeetv
    @simjeetv 4 года назад

    저도 VIF 값은 10 이하로 나오지만, 상태지수가 15이상이 나오는게 두개가 있네요..매개변인으로 쓸 변수들이라 없앨 수도 없는데...정녕 방법은 없는 걸까요?

    • @nssn
      @nssn  4 года назад

      일단, 공차와 VIF 값 중심으로 보세요.

  • @poiema-d3i
    @poiema-d3i 4 года назад +6

    안녕하세요! 논쓰남님! 저의 스승님이십니다! 교수님은 아무것도 알려주시지 않으세요... 학위논문을 쓰는 중인데, 저흰 실은 배운게 없거든요 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 하....저는 논쓰남님 영상보고 하고 있습니다ㅠㅠ
    그런데. 저희가 독립변수가 3개뿐이고, 상태지수 값이 15이상이 나오더군요.. 실은 3개의 변수 모두 상관관계가 높게 나왔어요...! 0.01 이거든요.. .. 모두가 알만한 연구를 하는 거긴 하지만.. 이럴때는 어떻게 해야할까요?
    상태지수가 높은 것을 빼고 2개로 돌려도 높게 나온다면... 전문가한테 의뢰하는 법 밖에는 없을까요? ㅠㅠ
    최대한 해결해보고 싶은데요ㅠ

    • @poiema-d3i
      @poiema-d3i 4 года назад +1

      답변 감사합니다!! 오픈채팅방에서 해결해주셔서 !! 감사합니다^^

  • @sumyi46
    @sumyi46 4 года назад

    다중공선성을 피하고싶으면 설문지의 점수 범위를 1점 ~ 10점 이렇게 범위를 넓게하는게 좋을까요??

    • @nssn
      @nssn  4 года назад +1

      이수민 아뇨. 전혀 의미가 없습니다.

    • @sumyi46
      @sumyi46 4 года назад

      논문쓰는남자 감사합니다!! 그러면 최대한 독립변수가 상관관계가 없도록 밖에 답이없는거죠?!

    • @nssn
      @nssn  4 года назад +1

      이수민 다중공선성의 원인은 독립변수간의 높은 상관성 때문입니다. 무조건 상관관계가 낮거나 없어야하는게 아니라 너무 높은게 문제가 될 수 있으니 분석시 주의하란 의미입니다

    • @sumyi46
      @sumyi46 4 года назад

      논문쓰는남자 감사합니다!!