통계데이터분석 - 분산분석 - 공분산분석 🔑 ANCOVA | analysis of covariance | 공변량(covariate) | 독립변수와 종속변수 간의 순수한 영향관계

곽기영

Просмотров 7 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 20 сен 2024
[R을 이용한 통계데이터분석]
공분산분석(analysis of covariance, ANCOVA)은 분산분석에 공변량(covariate)을 추가하여 분산분석모델을 확장합니다. 공변량으로 모델에 투입하여 통제함으로써 독립변수와 종속변수 간의 순수한 영향관계를 분석합니다. 다음과 같은 함수에 대한 설명이 포함되어 있습니다: tapply(), aov(), summary(), effect(), ancova().
📢 R과 RStudio 설치는 'R 프로그래밍 / R 기초 - 설치' 강좌를 참고하세요( • R 프로그래밍 / R 기초 - 설치 🔑 ... ).
📚 『곽기영』 채널의 동영상 강의는 다음 도서를 바탕으로 하고 있습니다. 책의 목차를 포함한 책자에 대한 소개는 도서명 옆의 링크를 참고해주세요. 💕
『R 기초와 활용』 (product.kyobob...)
『R을 이용한 통계데이터분석』 (product.kyobob...)
『R을 이용한 머신러닝과 텍스트마이닝』 (product.kyobob...)
『R을 이용한 웹스크레이핑과 데이터분석』 (product.kyobob...)
『SPSS를 이용한 통계데이터분석』 (product.kyobob...)
『소셜네트워크분석』 (product.kyobob...)
#R프로그래밍 #데이터분석 #통계 #머신러닝 #데이터애널리틱스 #데이터사이언스

Комментарии • 10

@이왕건-o9i 8 месяцев назад
이런 질 좋은 강의를 유튜브에 올려주셔서 감사합니다. 큰 도움이 되었어요.
@kykwahk 8 месяцев назад
감사합니다 😎
@hoipower8775 3 года назад ⁺¹
상세한 설명 감사드립니다. 덕분에 이해가 되었습니다.
@sullin3891 3 года назад ⁺¹
ancova를 적용할 일이 생겼는데 쉽게 잘 설명해주셔서 이해가 잘 되었습니다. 좋은 강의 감사합니다.
@kykwahk 3 года назад ⁺¹
도움이 되셨다니 저도 기쁩니다.
@dianeonanywhere720 Год назад
감사합니다!! ㅎㅎ
@고해로 Год назад ⁺¹
교수님 늘 도움이 되는 강의 감사드립니다.
함수에서 cpa , csa 순서를 바꾸면 해석이 어떻게 되는지 궁금합니다.
aov(ptsd ~ csa + cpa, sexab)
이 때는 csa를 통제한 cpa의 순수한 효과라고 할 수 있는지요?
@kykwahk Год назад ⁺¹
SPSS와 SAS 통계패키지와 달리 R은 분산분석 수행 시 기본적으로 종속변수에 대한 독립변수의 영향을 순차적으로 평가합니다(이를 Type Ⅰ(sequential) 방식이라고도 합니다). aov(ptsd ~ csa + cpa, sexab)와 같이 지정하면요, 우선 아무런 조정 없이 ptsd에 대한 csa의 영향을 평가하고, 이어서 csa를 통제한 상태에서 ptsd에 대한 csa의 영향을 평가합니다. 따라서 공변량과 독립변수의 순서를 바꾸면 각 변수가 종속변수에 미치는 영향의 크기가 달라질 수 있습니다.
@박영빈-p9l 2 года назад
강의 감사합니다!
궁금한 것이 있는데 공분산분석의 사후 검정 방법이 따로 있나요?
@kykwahk 2 года назад ⁺²
ANCOVA를 위한 별도의 사후분석(post-hoc analysis) 방법이 있는 것은 아니고요 일반적인 다중비교 방법을 적용할 수 있습니다. TukeyHSD() 함수나 multcomp 패키지의 glht() 함수를 사용할 수 있습니다. 두 방법은 다중비교 방식이나 유의확률(p-value)을 산출하는 방식이 다르기 때문에 결과가 상이할 수 있습니다. glht() 함수를 이용한 사후분석은 TukeyHSD() 함수에 비해 덜 엄격한 가정을 필요로 하고 적용할 수 있는 모델의 범위가 더 넓습니다.
이 강의에 포함된 ANCOVA의 경우 사후분석이 의미가 없기 때문에 다른 예를 살펴보겠습니다(독립변수 csa가 두 개의 레벨-Abused/NotAbused-만 있기 때문에 사후분석이 필요 없습니다). 다음은 car 패키지에 포함된 Salaries 데이터셋을 이용하여 ANCOVA 분석과 사후분석을 수행한 예입니다. 재직기간(yrs.service)을 통제한 상태에서 직급(rank) 간 연봉의 차이를 검정한 후 glht() 함수를 이용하여 개별 직급 간 차이를 다중비교를 통해 사후분석을 수행했습니다.
> library(car)
> str(Salaries)
'data.frame': 397 obs. of 6 variables:
$ rank : Factor w/ 3 levels "AsstProf","AssocProf",..: 3 3 1 3 3 2 3 3 3 3 ...
$ discipline : Factor w/ 2 levels "A","B": 2 2 2 2 2 2 2 2 2 2 ...
$ yrs.since.phd: int 19 20 4 45 40 6 30 45 21 18 ...
$ yrs.service : int 18 16 3 39 41 6 23 45 20 18 ...
$ sex : Factor w/ 2 levels "Female","Male": 2 2 2 2 2 2 2 2 2 1 ...
$ salary : int 139750 173200 79750 115000 141500 97000 175000 147765 119250 129000 ...
> Salaries.aov summary(Salaries.aov)
Df Sum Sq Mean Sq F value Pr(>F)
yrs.service 1 4.071e+10 4.071e+10 73.05 2.83e-16 ***
rank 2 1.036e+11 5.179e+10 92.93 < 2e-16 ***
Residuals 393 2.190e+11 5.573e+08
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> library(multcomp)
> posthoc summary(posthoc)
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Tukey Contrasts
Fit: aov(formula = salary ~ yrs.service + rank, data = Salaries)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
AssocProf - AsstProf == 0 14615 4271 3.422 0.002 **
Prof - AsstProf == 0 49229 3992 12.332

Следующие

Автовоспроизведение

통계데이터분석 - 분산분석 - 반복측정 분산분석 🔑 repeated measures ANOVA | 하나의 실험 대상에 대해 두 번 이상 반복측정한 관측값 간의 차이 검정