[데이터분석준전문가 ADsP][3과목-20] 집중화 경향, 데이터의 퍼짐 정도, 분산의 중요성, 변동 계수

Поделиться
HTML-код
  • Опубликовано: 9 ноя 2024

Комментарии • 17

  • @엔제르-l2e
    @엔제르-l2e 3 года назад +3

    감사합니다~
    집중화 경향 측정
    - 평균, 중앙값, 최빈값
    Negative-Skewed : 평균평균
    (중앙값은 항상 가운데!)
    데이터의 퍼짐 정도 측정
    산포도 : 변량(변수)들의 흩어져 있는 정도. 크면 멀리 흩어져있음. 변동성큼 (범위, 사분위수 범위, 분산, 표준편차, 절대편차, 변동계수 등)
    편차 : 변량-평균, 편차의 총합은 항상 0, 절대값이 클수록 멀리 떨어짐
    분산(s^2) : S(편차^2)/n-1
    표준편차(s) : 분산의 양의 제곱근
    변동계수(CV) : 표준편차/표본평균
    단위가 다른 두 그룹 또는 단위가 같지만 평균차이가 클 떄의 산포 비교에 사용(변동계수가 작을수록 변동이 없음)

    • @EduAtoZPython
      @EduAtoZPython  3 года назад

      감사합니다 *^^* 학습하시면서 정리도 해주시다니! 유용하게 사용하겠습니다

  • @EduAtoZPython
    @EduAtoZPython  3 года назад +4

    깨봉수학으로 좀 더 쉽게 이해할수 있습니다 ruclips.net/video/bjiCuyxNQ4I/видео.html 시리즈로 여러가지 개념이 쉽게 설명되어 있어요 ~^^~

  • @김장수-c5t
    @김장수-c5t 3 года назад +1

    항상 고마워요

  • @어니-y2p
    @어니-y2p 3 года назад +2

    개인적인 학습경로 상 R이 제일 어려웠던 것 같습니다..(파이썬 코딩 조금 배웠는데도 짜증나네요) 좀 원래 알던 내용들 나오니까 숨통이 좀 트이네요! 그래도 복습한다고 생각하고 잘 따라가겠습니다~!

    • @EduAtoZPython
      @EduAtoZPython  3 года назад

      ~^^ 이제 2주정도 남았네요 화이팅!입니당 아자~~~!!!

  • @수블링-w9q
    @수블링-w9q 3 года назад +2

    2:50에서 negative-skewed랑 positive-skewed랑 둘다 mode가 제일크고 mean이 제일 작은 거 아닌가요?

    • @EduAtoZPython
      @EduAtoZPython  3 года назад +1

      X축의 크기를 이야기하는 것입니당 ~~^^

  • @MuMu-v2o
    @MuMu-v2o 2 года назад +1

    표의 평균값이랑 분산값이 저렇게 되는지 이해가 가지않습니다.
    뒤에나오는 문제도 공식은 알겠는데 대입이 되질않습니다.
    평균값은 구할 수 있겠는데 표본 분산과 표본 편차를 어떻게 구하는지 모르겠습니다.
    공식은 편차 제곱의 합을 n-1로 나눈것
    편차는 변량-평균인데
    여기서 변량이 멀의미하는지도 모르겠습니다.

    • @EduAtoZPython
      @EduAtoZPython  2 года назад

      우선 구하는 예제는 만들어서 드릴께요. 그리고 변량은 관찰값 또는 데이터 등으로 샘플이 가지고 있는 실제 값들을 이야기 하는 것입니다

  • @봉캉
    @봉캉 2 года назад +1

    선생님 ㅠ 2회독 째에 이해가 잘 되지 않는 내용이 있어 질문드립니다.
    분산이 클수록 '집단의 평균값의 차이'가 무의미해진다.
    집단 내 분산이 작아질수록 평균의 차이가 분명해진다.
    이 두 개 문장인데요, 분산이 크면 그에 따라 표준 편차가 커지기 때문에 집단의 평균 값의 차이가 오히려 유의미해지는 것 아닌가요?
    예를 들어, 표본 평균이 1.5, 표본 표준 편차가 1.27 / 0.5 일 때를 각각 비교하면
    전자의 경우 0.23~2.77
    후자의 경우 1.0~2.0 가 되니까요.. 이 부분이 직관적으로 잘 이해가 가지 않습니다. ㅠ

    • @EduAtoZPython
      @EduAtoZPython  2 года назад

      서로 다른 집단의 평균 차이를 의미하는 것이 아닙니다. 평균과 값들이 가까이 있어야 의미가 있다는 것을 말하는 것입니다. 분산이 크다면 평균이 지지를 받지 못하고, 작아야 평균값이 지지를 받는 다는 의미입니다. 교재 317 페이지에 평균이 같지만 분산이 다른 두 확률 분포의 그림을 보시면 빨간색이 분산(및 표준편차)이 작은 경우인데 평균에 많이 모여있고, 파랑색이 분산이 큰 경우인데 평균과 동떨어진 곳에 많이 분포하는 것을 보고 있습니다.
      예를 들어서 우리나라 남성의 평균키가 175이다라고 했을 때 분산, 표준편차가 작은 경우는 대부분의 사람이 평균과 비슷한 값을 갖는 다는 의미이고, 분산, 표준편차가 크다는 것은 175와 차이 나는 사람들이 많다는 의미가 됩니다. 따라서 분산이 크다는 것은 평균으로써 지지를 많이 받지 못한다는 것을 설명한 것입니다. 차이가 분명해진다고 적어서 오해하게 해드린 것 같습니당. 평균의 차이가 분명해진다는 것은 평균값이 의미를 갖게 된다고 이해하시면 됩니다.

    • @봉캉
      @봉캉 2 года назад +1

      @@EduAtoZPython 헉 선생님! 늦은 시간인데 답변 감사합니다. 저도 그런 의미로 이해를 했는데 확실히 알고 싶어 여쭤봤습니다! 감사합니다!

  • @유성현-l7f
    @유성현-l7f 2 года назад +1

    쌤 편차의 합이 0이되는 이유가 궁금합니다

    • @EduAtoZPython
      @EduAtoZPython  2 года назад

      안녕하세요! 예를 들어 설명드릴께요~ [1,2,3,4,5] 라는 5개의 변량이 있을 때, 평균이 3이 됩니다. 그리고 편차(bais) = 변량 - 평균이므로 편차를 구하면 [-2, -1, 0, 1, 2]가 되며, 이것의 합을 구하면 0이 되는 것입니다.

    • @유성현-l7f
      @유성현-l7f 2 года назад +1

      감사합니다 이해하는데 도움이 됩니다

    • @EduAtoZPython
      @EduAtoZPython  2 года назад +1

      @@유성현-l7f 댓글로 질문 주시면 다음 개정 작업시 많은 도움이 됩니다~^^ 감사합니다