질문에 나타난 상황은 고유한 문자열 값(예: "T123X")을 가지는 독립 변수에 대해 빈도를 분석하고 싶은 경우로 보입니다. 이런 경우, 문자열 값이 직접적인 수치 데이터가 아니기 때문에 전통적인 회귀분석을 직접 적용하기 어려워 보입니다. 이를 해결하기 위한 접근 방법을 소개하겠습니다: 1. 더미 변수 변환 (One-Hot Encoding) 문자열 값을 대표하는 범주형 변수로 간주하고, 이를 더미 변수로 변환하는 방법입니다. 각 고유 문자열 값마다 하나의 더미 변수를 생성하고, 해당 문자열이 존재하면 1, 아니면 0의 값을 가지게 됩니다. 이렇게 변환된 더미 변수들을 회귀분석의 입력으로 사용할 수 있습니다. 예시: 독립변수 "T123X", "T124X", "T125X" 가 있다고 할 때, 각각을 독립 변수로 변환하여 회귀 모델에 포함시킵니다. 2. 빈도 분석 문자열 값의 빈도 자체를 분석의 대상으로 삼을 수 있습니다. 즉, 각 고유 문자열이 데이터 세트에서 나타나는 빈도수를 계산하고, 이 빈도수를 종속 변수 또는 다른 독립 변수와의 관계를 분석하는 데 사용할 수 있습니다. 예시: "T123X"가 100번, "T124X"가 150번, "T125X"가 200번 등장한다면, 이 빈도수를 기반으로 다른 변수와의 관계를 분석합니다.
안녕하세요 캐나다에서 business analytics 숙제하다 시청하게 되었어요.많은 도움됩니다 😊 퇴사율과 변수들의 관계를 살펴보고 있는데 나이나 근무부서, 집과의 거리 대 부분 관계가 미미합니다. 이럴 경우 그래도 그대로 보고서를 작성해도 될까요 아니면 관계가 높은걸 찾아내야할까요?
회귀의 한자어는 "回歸"입니다. "회"는 되돌아가다 또는 돌아오다를 의미하고, "귀"는 기다릴을 나타냅니다. 종합하면 "돌아가서 기다리다" 라고 해석할 수 있습니다. 이 용어는 초기에는 자녀의 특성이 부모의 특성으로 돌아간다는 관찰에서 파생되었는데, 현재는 통계학에서 두 변수 간의 관계를 나타내는 분석 방법을 지칭하는 용어로 널리 사용되고 있습니다.
회귀분석의 p-값은 다음과 같은 역할을 합니다: 가설 검정(Hypothesis Testing): 회귀분석에서 p-값은 주로 가설 검정에 사용됩니다. 일반적으로 두 가지 가설이 설정됩니다: 귀무 가설(Null Hypothesis, H0): 모델의 회귀 계수(모수)들은 0이며, 독립 변수들과 종속 변수 간에 아무런 관계가 없다. 대립 가설(Alternative Hypothesis, H1): 모델의 회귀 계수들은 0이 아니며, 독립 변수들과 종속 변수 간에 유의미한 관계가 있다. 회귀 계수의 유의성 평가: p-값은 각 독립 변수의 회귀 계수가 유의미한지 여부를 판단하는 데 사용됩니다. 일반적으로 p-값이 작을수록 (예를 들어, 0.05보다 작으면) 해당 독립 변수의 회귀 계수가 유의미하다고 판단됩니다. 모델 유의성 평가: 회귀 모델 전체의 유의성을 판단하기 위해 F-통계량(F-statistic)과 함께 사용됩니다. F-통계량은 모든 독립 변수의 회귀 계수가 동시에 0인지 여부를 검정합니다. 모델 선택: p-값은 변수 선택(variable selection)에도 사용됩니다. 작은 p-값을 가진 변수들은 종속 변수에 더 큰 영향을 미치는 것으로 간주되어 모델에 포함될 가능성이 높습니다. 반대로, 높은 p-값을 가진 변수들은 모델에서 제외될 수 있습니다. 오류 제어: p-값을 사용하여 모델의 예측 성능을 향상시키고 오류를 제어하는 데 도움이 됩니다. 유의수준(alpha)을 설정하여 p-값과 비교함으로써 통계적 유의성을 제어할 수 있습니다. 요약하면, p-값은 회귀분석에서 가설 검정, 변수 선택, 모델 평가, 오류 제어 등 다양한 측면에서 중요한 역할을 합니다. 작은 p-값은 해당 변수 또는 모델이 유의미하다는 것을 나타내며, 이를 통해 통계적으로 의미 있는 결과를 얻을 수 있습니다.
@@edu.purchasing 제가 잘 이해를 못했는데.. p값이 y절편도 있고 x변수에 입력한 값도 있는데 둘 다 0.05보다 작아야 통계적 유의미성을 갖나요 아니면 y절편의 p값이 0.05를 넘더라도 x변수 입력 값의 p값이 0.05보다 작으면 통계적 유의미성을 갖나요?
안녕하세요, 저는 병원에서 근무하는 임상병리사입니다. 정도관리에 회귀분석 그래프 작성하기 힘들어 들어왔는데. 책보다 명확한 설명감사합니다.완전히 이해가 되었습니다.
도움이 되셨다니 정말 다행입니다~ 병원에서 특히 정말 중요한 역할을 하시는 분이라고 생각합니다. 의사의 판단에 영향을 많이 주시는 분이시죠. 분석을 많이 하시느라 이러한 도구가 필요할 것이라고 보여지네요
제가 본 회귀분석 영상중 no.1입니다..
과찬의 말씀 감사합니다 ~!
혹시..여러 독립변수들간에도 상관관계가 있다면 회귀분석으로 만들긴 어렵나요?
@@열레기 독립변수가 여러개인 경우도 화귀분석을 할 수가 있습니다. 다중회귀분석이라고 유투브에 검색하시면 예제를 찾을 수 있습니다
복받으실 것입니다!
@@LibertyMarketTruth 감사합니다!~^^
안녕하세요 회귀분석 때문에 찾다가 여기까지 왔어요 !! ~
예 도움이 되시길 바랍니다 ~
안녕하세요! 너무 유용한 영상 잘 봤습니다! 설명 듣고 따라해봤는데 선에서의 R제곱값과 회귀분석출력에서의 결정계수값이 달라서요ㅠㅠ… 같아야 하는 것 아닌가요?
@@Omg-np7jt 안녕하세요 네 맞습니다..R 제곱과 결정계수는 같은 개념이고 둘은 동일한 값입니다. 결정계수라는 용어는 일반적인 용어구요. R 제곱은 그 값을 나타내는 수학적 기호입니다
@ 다시 해봤더니 같게 나왔어용. 쉽게 잘 알려주셔서 감사합니다!!!!!!
@@Omg-np7jt 예 잘되었네요~
X 독립변수값들이 고유한 문자열인데(ex : T123X) 빈도에 대해 회귀분석하기위한 경우에는 어떻게 하면 될까요?
질문에 나타난 상황은 고유한 문자열 값(예: "T123X")을 가지는 독립 변수에 대해 빈도를 분석하고 싶은 경우로 보입니다. 이런 경우, 문자열 값이 직접적인 수치 데이터가 아니기 때문에 전통적인 회귀분석을 직접 적용하기 어려워 보입니다. 이를 해결하기 위한 접근 방법을 소개하겠습니다:
1. 더미 변수 변환 (One-Hot Encoding)
문자열 값을 대표하는 범주형 변수로 간주하고, 이를 더미 변수로 변환하는 방법입니다. 각 고유 문자열 값마다 하나의 더미 변수를 생성하고, 해당 문자열이 존재하면 1, 아니면 0의 값을 가지게 됩니다. 이렇게 변환된 더미 변수들을 회귀분석의 입력으로 사용할 수 있습니다.
예시: 독립변수 "T123X", "T124X", "T125X" 가 있다고 할 때, 각각을 독립 변수로 변환하여 회귀 모델에 포함시킵니다.
2. 빈도 분석
문자열 값의 빈도 자체를 분석의 대상으로 삼을 수 있습니다. 즉, 각 고유 문자열이 데이터 세트에서 나타나는 빈도수를 계산하고, 이 빈도수를 종속 변수 또는 다른 독립 변수와의 관계를 분석하는 데 사용할 수 있습니다.
예시: "T123X"가 100번, "T124X"가 150번, "T125X"가 200번 등장한다면, 이 빈도수를 기반으로 다른 변수와의 관계를 분석합니다.
많은 도움이 되었습니다! 감사해요!
도움이 되셨다니 기쁩니다~!
안녕하세요 캐나다에서 business analytics 숙제하다 시청하게 되었어요.많은 도움됩니다 😊
퇴사율과 변수들의 관계를 살펴보고 있는데 나이나 근무부서, 집과의 거리 대 부분 관계가 미미합니다. 이럴 경우 그래도 그대로 보고서를 작성해도 될까요 아니면 관계가 높은걸 찾아내야할까요?
안녕하세요.. 제일 이상적인 분석은 상관 분석을 했을때 그 영향이 현저히 낮은 경우, 해당 독립변수를 1,2개 제거하고 다시 상관분석을 합니다. 아니면 독립변수를 다시 찾아내야 하는데 그것이 연구자가 해야할 일이긴 합니다 .
@@edu.purchasing 그렇군요 그것이 연구자의 일이다. 멋진 말입니다. 좀더 찾아보겠습니다. 감사합니다 ^^
@@earlymorning9 완벽한 답변은 아니었지만 다시 문의하실 일이 있으면 언제든 환영합니다 ^^
궁금한게 있는데요 회귀분석의 회귀는 무슨 의미일까요?
회귀의 한자어는 "回歸"입니다. "회"는 되돌아가다 또는 돌아오다를 의미하고, "귀"는 기다릴을 나타냅니다. 종합하면 "돌아가서 기다리다" 라고 해석할 수 있습니다. 이 용어는 초기에는 자녀의 특성이 부모의 특성으로 돌아간다는 관찰에서 파생되었는데, 현재는 통계학에서 두 변수 간의 관계를 나타내는 분석 방법을 지칭하는 용어로 널리 사용되고 있습니다.
안녕하세요 동영상잘보았습니다 궁금한것이있는데요 요약출력이 나왔는데 저장후 다시들어가면 데이터분석 회귀분석이 안뜨고 다른게떠서 다시 회귀분석누르고 셀다시 지정 해서 다시해야하나요?
예 시청감사드립니다. 요약출력이 나오고 저장을 하셨는데 데이터분석 회귀분석이 안뜨는 경우가 가끔 있는데 일반적인 현상은 아닙니다. 오류가 있는 것 같은데요. 컴퓨터 재부팅 후 사용하시면 어떨까요
종속변수 구매금액(개)는 환율에 따라 구매 개수를 뜻하는 건가요??
귀하가 문의하신 내용인 종속변수는 환율에 따라 한 개당 구매금액이 어떻게 변화하는지 예측하는 방법을 다루어 보았습니다. 구매 개수는 아니었습니다.
@@edu.purchasing 구매 금액이 200이라는 것은 200만 원이라는 건가요?? 무엇을 구매한다는 뜻인가요..?
@@hinataa7980 네 구매금액이 200 이라는 것은 200원 또는 200만원이 될 수도 있구요 구매 대상은 영상에 보시면 볼트라고 영어로 되어 있습니다.
구독하고 갑니다
감사합니다 ~^^
종속변수는 하나인가요
일반적으로 종속변수는 한 개이며, 독립변수는 여러개 입니다
데이터? 설치하는 영상은 어떤건가요?..
예, 설치하는 방법은 간단한데요. 번거로우시겠지만 저의 영상 중 '이동평균법'이라고 검색하시면 영상 초반에 설치방법을 녹화했습니다
p값이 둘중 하나만 0.05보다 크면 어떻게 결론을 내야 하나요?
그런 상황이라면 독립변수가 적합하지 않아서 발생할 수 있습니다. 다른 독립변수를 찾거나 또는 제거하여 다시 분석을 하는 것을 권장드립니다
P값을 볼때 독립변수만 보면 되나요?
회귀분석의 p-값은 다음과 같은 역할을 합니다:
가설 검정(Hypothesis Testing): 회귀분석에서 p-값은 주로 가설 검정에 사용됩니다. 일반적으로 두 가지 가설이 설정됩니다:
귀무 가설(Null Hypothesis, H0): 모델의 회귀 계수(모수)들은 0이며, 독립 변수들과 종속 변수 간에 아무런 관계가 없다.
대립 가설(Alternative Hypothesis, H1): 모델의 회귀 계수들은 0이 아니며, 독립 변수들과 종속 변수 간에 유의미한 관계가 있다.
회귀 계수의 유의성 평가: p-값은 각 독립 변수의 회귀 계수가 유의미한지 여부를 판단하는 데 사용됩니다. 일반적으로 p-값이 작을수록 (예를 들어, 0.05보다 작으면) 해당 독립 변수의 회귀 계수가 유의미하다고 판단됩니다.
모델 유의성 평가: 회귀 모델 전체의 유의성을 판단하기 위해 F-통계량(F-statistic)과 함께 사용됩니다. F-통계량은 모든 독립 변수의 회귀 계수가 동시에 0인지 여부를 검정합니다.
모델 선택: p-값은 변수 선택(variable selection)에도 사용됩니다. 작은 p-값을 가진 변수들은 종속 변수에 더 큰 영향을 미치는 것으로 간주되어 모델에 포함될 가능성이 높습니다. 반대로, 높은 p-값을 가진 변수들은 모델에서 제외될 수 있습니다.
오류 제어: p-값을 사용하여 모델의 예측 성능을 향상시키고 오류를 제어하는 데 도움이 됩니다. 유의수준(alpha)을 설정하여 p-값과 비교함으로써 통계적 유의성을 제어할 수 있습니다.
요약하면, p-값은 회귀분석에서 가설 검정, 변수 선택, 모델 평가, 오류 제어 등 다양한 측면에서 중요한 역할을 합니다. 작은 p-값은 해당 변수 또는 모델이 유의미하다는 것을 나타내며, 이를 통해 통계적으로 의미 있는 결과를 얻을 수 있습니다.
@@edu.purchasing 제가 잘 이해를 못했는데.. p값이 y절편도 있고 x변수에 입력한 값도 있는데 둘 다 0.05보다 작아야 통계적 유의미성을 갖나요 아니면 y절편의 p값이 0.05를 넘더라도 x변수 입력 값의 p값이 0.05보다 작으면 통계적 유의미성을 갖나요?
@@nischoi4197 제가 문의하신 내용에 대해 이해한 바로는 x값이 y값에 영향을 끼치므로 x값이 0.05보다 작아야 유의하다고 볼 수 있습니다
데이터 분석은 어디에 있나요...?
컴퓨터에 안나오면 설치해야 합니다. 설치하는 방법은 간단한데요. 저의 영상 중 '이동평균법'이라고 검색하시면 영상 초반에 설치방법을 녹화했습니다