통계데이터분석 - 일반선형모델 - 로지스틱회귀모델 유의성검정 🔑 logistic regression | significance | residual deviance | 이탈도
HTML-код
- Опубликовано: 5 фев 2025
- [R을 이용한 통계데이터분석]
로지스틱회귀모델의 유의성은 널모델(null model)의 데이터 적합도인 널이탈도(null deviance)와 제안모델(proposed model)의 데이터 적합도인 잔차이탈도(residual deviance)의 차이를 바탕으로 검정합니다(이 차이를 -2로그우도(-2LL, -2 Log-Likelihood)라고도 합니다). 이탈도(deviance)는 그 값이 작으면 모델이 데이터를 잘 설명한다는 것을 뜻합니다. 널이탈도와 잔차이탈도의 차이가 0인지 검정하여 두 이탈도의 차이가 0이 아니라면 이는 제안모델과 널모델 간 적합도에 있어서 차이가 존재한다는 것을 의미하므로 예측변수가 추가된 현재의 로지스틱회귀모델이 데이터를 잘 적합시키며 통계적으로 유의한 모델이라고 결론 내릴 수 있습니다. 다음과 같은 함수에 대한 설명이 포함되어 있습니다: glm(), summary(), pchisq().
📢 R과 RStudio 설치는 'R 프로그래밍 / R 기초 - 설치' 강좌를 참고하세요( • R 프로그래밍 / R 기초 - 설치 🔑 ... ).
📚 『곽기영』 채널의 동영상 강의는 다음 도서를 바탕으로 하고 있습니다. 책의 목차를 포함한 책자에 대한 소개는 도서명 옆의 링크를 참고해주세요. 💕
『R 기초와 활용』 (product.kyobob...)
『R을 이용한 통계데이터분석』 (product.kyobob...)
『R을 이용한 머신러닝과 텍스트마이닝』 (product.kyobob...)
『R을 이용한 웹스크레이핑과 데이터분석』 (product.kyobob...)
『SPSS를 이용한 통계데이터분석』 (product.kyobob...)
『소셜네트워크분석』 (product.kyobob...)
#R프로그래밍 #데이터분석 #통계 #머신러닝 #데이터애널리틱스 #데이터사이언스
좋은 강의 감사드립니다. 교수님 파란 재킷도 잘 어울리셔요^^
감사합니다~^^
안녕하세요
간단한 질문이나
[] 벡터 위치표시에서 , 안하면 열로 인식하는건가요.
churn
데이터프레임은 행렬과 리스트의 특성을 모두 갖고 있기 때문에 행렬 인덱싱과 리스트 인덱싱을 모두 사용할 수 있습니다. 열을 선택할 때 대괄호 [ ] 안에 쉼표(,)를 사용하면 행렬 인덱싱을 이용한 겁니다. 반면에 열을 선택할 때 대괄호 [ ] 안에 열 번호만 제공하면 리스트 인덱싱을 수행한 겁니다. 두 방법 모두 데이터프레임의 열을 선택할 수 있습니다.
하지만 행렬 인덱싱을 사용할 때는 주의가 필요합니다. 만약 특정 열들을 제거하고 한 개의 열만 남는다면 행렬 인덱싱에서는 결과를 다음과 같이 벡터로 반환합니다. 이것이 원하는 바가 아니라면 행렬 인덱싱 후 이어지는 후속 작업에서 곤란을 겪을 수 있습니다.
> df df
x y z
1 1 a A
2 2 b B
3 3 c C
4 4 d D
5 5 e E
> df[,-c(1, 3)]
[1] "a" "b" "c" "d" "e"
따라서 결과가 항상 데이터프레임으로 반환되도록 하려면 지금처럼 리스트 인덱싱을 사용하는 것이 좋습니다.
> df[-c(1,3)]
y
1 a
2 b
3 c
4 d
5 e
다음 강의를 참고하세요.
‘R 프로그래밍 / R 기초 - 데이터프레임 인덱싱1’(ruclips.net/video/oxFxwjrI_G4/видео.html)