안녕하세요. 실기시험 기출풀이 과정을 오픈했어요. 40% 할인 혜택을 들여요. 10월 12일 까지 쿠폰이 유효해요. 지금 바로 클릭하세요. * www.udemy.com/course/bigdatakisa/?couponCode=1EB1A7915DE9B11874A0 * 최근 8회차 시험 기출풀이가 완료되는 데로, UDemy 강의에 업데이트할 생각이니 놓치지 마시길 ~ ^^
안녕하세요 선생님 궁금한 사항이 있어서 문의 드립니다. 문제 13번 df1 = df.copy() x = df1['mpg'] min = df1['mpg'].min() max = df1['mpg'].max() mm_scaling = ((x - min) / (max - min)) result = sum(mm_scaling > 0.8) print(result) 이렇게 작성을 해보았습니다. 선생님께서는 별도의 변수를 선정하여 데이터 프레임에 저장하여 프로그램을 작성하셨는데 혹시 상기 처럼 작성하면 문제가 있을 요지(len 함수 vs sum함수 등) 가 있을까요?
상관관계에 대해서 아래와 같이 답변 다시 드립니다. 상관관계가 높다 낮다는 절대값 기준으로 표현 합니다. 상관계수가 0.7 이상인 경우, 한 변수가 변화할 때 다른 변수도 거의 함께 변화하는 경향이 강합니다. 0.3 미만인 경우, 두 변수 간의 관계가 약하다는 표현을 합니다. 1: 완전한 양의 상관관계 (한 변수가 증가하면 다른 변수도 완전히 증가) 0.8: 강한 양의 상관관계 (한 변수가 증가하면 다른 변수도 강하게 증가) 0.5: 중간 정도의 양의 상관관계 (한 변수가 증가하면 다른 변수도 중간 정도로 증가) 0.2: 약한 양의 상관관계 (한 변수가 증가해도 다른 변수는 약하게 증가) 0: 상관관계 없음 (두 변수 간에 전혀 관계가 없음) -0.2: 약한 음의 상관관계 (한 변수가 증가하면 다른 변수는 약하게 감소) -0.5: 중간 정도의 음의 상관관계 (한 변수가 증가하면 다른 변수는 중간 정도로 감소) -0.8: 강한 음의 상관관계 (한 변수가 증가하면 다른 변수는 강하게 감소) -1: 완전한 음의 상관관계 (한 변수가 증가하면 다른 변수는 완전히 감소) 잘 공부하시고 시험에 합격하시면 좋겠네요. 응원해요~
안녕하세요. 실기시험 기출풀이 과정을 오픈했어요. 40% 할인 혜택을 들여요. 10월 12일 까지 쿠폰이 유효해요. 지금 바로 클릭하세요.
* www.udemy.com/course/bigdatakisa/?couponCode=1EB1A7915DE9B11874A0
* 최근 8회차 시험 기출풀이가 완료되는 데로, UDemy 강의에 업데이트할 생각이니 놓치지 마시길 ~ ^^
차분한 목소리로 잘 설명해주셔서 귀에 쏙쏙 들어오네요. 그런데 제가 별도로 사서 공부하던 빅데이터분석기사 실기 한권완성 책의 저자셨네요!! 좋은 강의와 Udemy 쿠폰까지...정말 다시 한번 감사드립니다.
네~ 저도 감사드립니다.
24:55 결측치
36:30 이상치-> 스케일(정규화, min_max)
57:10 mpg 데이터 분석
1:33:33 날짜처리
시간을 남겨주셨네요. 감사드려요!~
재미있게 잘듣고 있습니다. 문제 14번 박스문제를
a = df1['weight'].quantile(0,0.25)
b = df1['weight'].quantile(0.75,1)
len(a|b)
이런 식으로 풀어봤는데 괜찮나요?
정답이 맞으면 어떤 방식으로 풀더라도 괜찮아요. 다만, 코드가 너무 복잡하면 여러 명이 함께 분석하는 경우에 의사소통이 어려운 문제가 있긴 해요.
그런 부분만 감안하셔서 풀어보시면 되세요. 감사합니다. :)
안녕하세요 선생님
궁금한 사항이 있어서 문의 드립니다.
문제 13번
df1 = df.copy()
x = df1['mpg']
min = df1['mpg'].min()
max = df1['mpg'].max()
mm_scaling = ((x - min) / (max - min))
result = sum(mm_scaling > 0.8)
print(result)
이렇게 작성을 해보았습니다.
선생님께서는 별도의 변수를 선정하여 데이터 프레임에 저장하여 프로그램을 작성하셨는데
혹시 상기 처럼 작성하면 문제가 있을 요지(len 함수 vs sum함수 등) 가 있을까요?
코드 작성하신 후 정답에 문제 없었으면 어떤 방식으로 풀어도 괜찮아요.
sum과 len은 좀 다른데요. sum은 값을 더하고 len은 길이라서요. 코드 실행하면서 데이터를 좀 확인해 보시면 좋을 거 같네요. ^^
영상 잘보고있습니다. 문제22번에서 가장 큰 상관계수 구할때 음의 상관계수가 큰건 상관관계가높은게 아닐까요? - 0.8 이 0.5 보다 상관관계가 높은게 아닌지 궁금합니다.😮
상관관계에 대해서 아래와 같이 답변 다시 드립니다.
상관관계가 높다 낮다는 절대값 기준으로 표현 합니다.
상관계수가 0.7 이상인 경우, 한 변수가 변화할 때 다른 변수도 거의 함께 변화하는 경향이 강합니다. 0.3 미만인 경우, 두 변수 간의 관계가 약하다는 표현을 합니다.
1: 완전한 양의 상관관계 (한 변수가 증가하면 다른 변수도 완전히 증가)
0.8: 강한 양의 상관관계 (한 변수가 증가하면 다른 변수도 강하게 증가)
0.5: 중간 정도의 양의 상관관계 (한 변수가 증가하면 다른 변수도 중간 정도로 증가)
0.2: 약한 양의 상관관계 (한 변수가 증가해도 다른 변수는 약하게 증가)
0: 상관관계 없음 (두 변수 간에 전혀 관계가 없음)
-0.2: 약한 음의 상관관계 (한 변수가 증가하면 다른 변수는 약하게 감소)
-0.5: 중간 정도의 음의 상관관계 (한 변수가 증가하면 다른 변수는 중간 정도로 감소)
-0.8: 강한 음의 상관관계 (한 변수가 증가하면 다른 변수는 강하게 감소)
-1: 완전한 음의 상관관계 (한 변수가 증가하면 다른 변수는 완전히 감소)
잘 공부하시고 시험에 합격하시면 좋겠네요. 응원해요~
@@데이터코드랩 답변 감사합니다 😊 이해하기 쉬운 강의 감사드립니다
보통 상관관계는 0일때 낮다고 표현하고, 절대값이 1에 가까울수록 높은 상관관계를 가진다고 표현하기때문에
댓글쓰신분 말씀처럼 -0.8이 0.5보다 높다고 얘기해야될것같습니다.
네, 감사합니다.
궁금한 것이 있는데 정답이 Age라면 마지막에 print(‘Age’) 이런식으로 답을 제출해도 되는건가요??
정답만 제출하라고 되어 있어서요. 그렇게 하셔도 될 거예요.
하지만 실수 할 수 도 있으니, 가급적이면 코드를 작성하면서 하시는 게 좋을거 같아요