통계데이터분석 - 분산분석 - 공분산분석 🔑 ANCOVA | analysis of covariance | 공변량(covariate) | 독립변수와 종속변수 간의 순수한 영향관계

Поделиться
HTML-код
  • Опубликовано: 20 сен 2024
  • [R을 이용한 통계데이터분석]
    공분산분석(analysis of covariance, ANCOVA)은 분산분석에 공변량(covariate)을 추가하여 분산분석모델을 확장합니다. 공변량으로 모델에 투입하여 통제함으로써 독립변수와 종속변수 간의 순수한 영향관계를 분석합니다. 다음과 같은 함수에 대한 설명이 포함되어 있습니다: tapply(), aov(), summary(), effect(), ancova().
    📢 R과 RStudio 설치는 'R 프로그래밍 / R 기초 - 설치' 강좌를 참고하세요( • R 프로그래밍 / R 기초 - 설치 🔑 ... ).
    📚 『곽기영』 채널의 동영상 강의는 다음 도서를 바탕으로 하고 있습니다. 책의 목차를 포함한 책자에 대한 소개는 도서명 옆의 링크를 참고해주세요. 💕
    『R 기초와 활용』 (product.kyobob...)
    『R을 이용한 통계데이터분석』 (product.kyobob...)
    『R을 이용한 머신러닝과 텍스트마이닝』 (product.kyobob...)
    『R을 이용한 웹스크레이핑과 데이터분석』 (product.kyobob...)
    『SPSS를 이용한 통계데이터분석』 (product.kyobob...)
    『소셜네트워크분석』 (product.kyobob...)
    #R프로그래밍 #데이터분석 #통계 #머신러닝 #데이터애널리틱스 #데이터사이언스

Комментарии • 10

  • @이왕건-o9i
    @이왕건-o9i 8 месяцев назад

    이런 질 좋은 강의를 유튜브에 올려주셔서 감사합니다. 큰 도움이 되었어요.

    • @kykwahk
      @kykwahk  8 месяцев назад

      감사합니다 😎

  • @hoipower8775
    @hoipower8775 3 года назад +1

    상세한 설명 감사드립니다. 덕분에 이해가 되었습니다.

  • @sullin3891
    @sullin3891 3 года назад +1

    ancova를 적용할 일이 생겼는데 쉽게 잘 설명해주셔서 이해가 잘 되었습니다. 좋은 강의 감사합니다.

    • @kykwahk
      @kykwahk  3 года назад +1

      도움이 되셨다니 저도 기쁩니다.

  • @dianeonanywhere720
    @dianeonanywhere720 Год назад

    감사합니다!! ㅎㅎ

  • @고해로
    @고해로 Год назад +1

    교수님 늘 도움이 되는 강의 감사드립니다.
    함수에서 cpa , csa 순서를 바꾸면 해석이 어떻게 되는지 궁금합니다.
    aov(ptsd ~ csa + cpa, sexab)
    이 때는 csa를 통제한 cpa의 순수한 효과라고 할 수 있는지요?

    • @kykwahk
      @kykwahk  Год назад +1

      SPSS와 SAS 통계패키지와 달리 R은 분산분석 수행 시 기본적으로 종속변수에 대한 독립변수의 영향을 순차적으로 평가합니다(이를 Type Ⅰ(sequential) 방식이라고도 합니다). aov(ptsd ~ csa + cpa, sexab)와 같이 지정하면요, 우선 아무런 조정 없이 ptsd에 대한 csa의 영향을 평가하고, 이어서 csa를 통제한 상태에서 ptsd에 대한 csa의 영향을 평가합니다. 따라서 공변량과 독립변수의 순서를 바꾸면 각 변수가 종속변수에 미치는 영향의 크기가 달라질 수 있습니다.

  • @박영빈-p9l
    @박영빈-p9l 2 года назад

    강의 감사합니다!
    궁금한 것이 있는데 공분산분석의 사후 검정 방법이 따로 있나요?

    • @kykwahk
      @kykwahk  2 года назад +2

      ANCOVA를 위한 별도의 사후분석(post-hoc analysis) 방법이 있는 것은 아니고요 일반적인 다중비교 방법을 적용할 수 있습니다. TukeyHSD() 함수나 multcomp 패키지의 glht() 함수를 사용할 수 있습니다. 두 방법은 다중비교 방식이나 유의확률(p-value)을 산출하는 방식이 다르기 때문에 결과가 상이할 수 있습니다. glht() 함수를 이용한 사후분석은 TukeyHSD() 함수에 비해 덜 엄격한 가정을 필요로 하고 적용할 수 있는 모델의 범위가 더 넓습니다.
      이 강의에 포함된 ANCOVA의 경우 사후분석이 의미가 없기 때문에 다른 예를 살펴보겠습니다(독립변수 csa가 두 개의 레벨-Abused/NotAbused-만 있기 때문에 사후분석이 필요 없습니다). 다음은 car 패키지에 포함된 Salaries 데이터셋을 이용하여 ANCOVA 분석과 사후분석을 수행한 예입니다. 재직기간(yrs.service)을 통제한 상태에서 직급(rank) 간 연봉의 차이를 검정한 후 glht() 함수를 이용하여 개별 직급 간 차이를 다중비교를 통해 사후분석을 수행했습니다.
      > library(car)
      > str(Salaries)
      'data.frame': 397 obs. of 6 variables:
      $ rank : Factor w/ 3 levels "AsstProf","AssocProf",..: 3 3 1 3 3 2 3 3 3 3 ...
      $ discipline : Factor w/ 2 levels "A","B": 2 2 2 2 2 2 2 2 2 2 ...
      $ yrs.since.phd: int 19 20 4 45 40 6 30 45 21 18 ...
      $ yrs.service : int 18 16 3 39 41 6 23 45 20 18 ...
      $ sex : Factor w/ 2 levels "Female","Male": 2 2 2 2 2 2 2 2 2 1 ...
      $ salary : int 139750 173200 79750 115000 141500 97000 175000 147765 119250 129000 ...
      > Salaries.aov summary(Salaries.aov)
      Df Sum Sq Mean Sq F value Pr(>F)
      yrs.service 1 4.071e+10 4.071e+10 73.05 2.83e-16 ***
      rank 2 1.036e+11 5.179e+10 92.93 < 2e-16 ***
      Residuals 393 2.190e+11 5.573e+08
      ---
      Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
      > library(multcomp)
      > posthoc summary(posthoc)
      Simultaneous Tests for General Linear Hypotheses
      Multiple Comparisons of Means: Tukey Contrasts
      Fit: aov(formula = salary ~ yrs.service + rank, data = Salaries)
      Linear Hypotheses:
      Estimate Std. Error t value Pr(>|t|)
      AssocProf - AsstProf == 0 14615 4271 3.422 0.002 **
      Prof - AsstProf == 0 49229 3992 12.332