키워드 분석 Keyword Analysis

Поделиться
HTML-код
  • Опубликовано: 20 сен 2024
  • 자연어 처리 Natural Language Processing
    키워드 분석 Keyword Analysis
    한국어 처리, Konlpy, 형태소 분석기, MeCab, 네이버 영화 리뷰 데이터, 불용어 사전, Keyword Count, 단어 빈도, Word Cloud, 워드클라우드, Tree Map, 트리맵
    Colab: colab.research...
    이수안 컴퓨터 연구소 (SuanLab)
    www.suanlab.com

Комментарии • 21

  • @dhhan68
    @dhhan68 3 года назад +3

    감사합니다. 공부 잘했습니다. 한글 처리가 만만치 않음을 다시금 느끼게 되는데 구체적 시각화를 하니 NLP 공부하는 맛이 납니다.^^

    • @dhhan68
      @dhhan68 3 года назад +1

      워드 클라우드를 코랩이 아닌 linux vscode에서 실행해보려고 다시 들어왔는데 목소리도 좋으시고 다정다감하게 설명하시는 게 역시나 푸근하고 좋네요. 중간중간 개념을 정리해주시는 것이 너무 좋습니다. 약간의 코드 설명이 부족하다고 느끼는 것은 ipython 실행시켜서 한줄한줄 코드를 쳐보니 잘 이해가 됩니다. 감사합니다.

    • @suanlab
      @suanlab  3 года назад

      네 너무 감사합니다 ^^

    • @계정통합-k7s
      @계정통합-k7s 2 года назад

      미친님 블루님 혹시 중고 거래 사업 투잡 생각 있으시면 문의 한번 주세용 ^^ 파트너 모집중이라서요
      ruclips.net/video/YCqJgPx0HoM/видео.html

  • @고명범-q7s
    @고명범-q7s 2 года назад +2

    좋은 강의 감사합니다.
    9:44
    raw = [x.decode() for x in raw[1:]] 현재 이 코드는 작동하지 않습니다.
    파이썬 3.7 버전에서 작동하는 듯 하네요

    • @suanlab
      @suanlab  2 года назад

      아! 감사합니다. ^^

    • @seha33
      @seha33 2 года назад

      @@suanlab 이 부분은 어떻게 해결해야 하나요??

    • @user-sg4ee5mw3r
      @user-sg4ee5mw3r 2 года назад

      @@seha33 혹시 해결하셨나요ㅠ

    • @user-up5gg9fo2x
      @user-up5gg9fo2x Год назад

      @@user-sg4ee5mw3r x.decode()를 x로 바꿔서 실행하면 됩니다... 만?! 맨 첫 리뷰는 안 나오네요..ㅠㅠ

    • @박희준-s7l
      @박희준-s7l Год назад

      @@user-up5gg9fo2x 전체가 나오게는 어떻게 하는걸까요,,ㅠ

  • @user-ez5dl5ud5m
    @user-ez5dl5ud5m 9 месяцев назад

    대학원에 진학하면 인공지능 관련 전공으로 진학하려고 준비중인 컴퓨터공학과 2학년 학생입니다.
    강의 보면서 잘 배우고 있습니다.
    학교에서는 개발위주로 가르치고있는데, 대학원 세부전공이 물론 나뉘겠지만, 만약 인공지능 자연어 처리 분야로 가게된다면 해당 강의가 분명 큰 도움이 되겠지요? 제대로된 선택을해서 공부하고 있는건지 모르겠습니다.

  • @kyoun0206
    @kyoun0206 2 года назад +2

    제가 가진 텍스트 파일.csv를 키워드 분석하려고 합니다. 불용어 데이터 csv 파일로 만들어 놨는데 불용어 처리를 하려면 어떻게 해야할까요?

    • @suanlab
      @suanlab  2 года назад

      불용어 csv를 읽어와서 텍스트파일의 단어중 불용어에 해당되는걸 제거해주시면 됩니다. ^^

  • @junebooky5753
    @junebooky5753 3 года назад +2

    코드랩에서 설명붙이신 파일은 따로 공유하시나요? 있다면 알려주시면 감사하겠습니다.~ 보면서 연습하려고 합니다 :)

    • @suanlab
      @suanlab  3 года назад

      설명에 추가했습니다. ^^

  • @jun_924
    @jun_924 2 года назад +1

    강의 정말 잘 봤습니다. 학습 도중 공유하고 싶은 내용이 있어 공유 드립니다.
    "불용어 처리" 과정 중에 직접 각 단어의 빈도를 확인하고 불용어에 추가하는것을 결정 할 수 있도록, 단어를 카운트 하는 코드를 공유 드립니다.
    # 명사중에서도 존재하는 불용어를 한번 더 제거해줍니다.
    # 또한 빈도가 너무 큰 단어도 제거해줍니다.
    # 빈도 체크
    count_dict= {}
    for noun in nouns:
    if noun in count_dict.keys():
    pre_value = count_dict[noun]
    value = pre_value + 1
    count_dict[noun] = value
    else:
    count_dict[noun] = 1

    # 빈도를 기준으로 정렬합니다.
    count_dict = sorted(count_dict.items(), key = lambda item: item[1], reverse=True)
    count_dict = dict(count_dict)

    • @jun_924
      @jun_924 2 года назад +1

      Counter랑 같은 결과를 반환하네여,, 죄송합니다~

    • @suanlab
      @suanlab  2 года назад

      감사합니다. ^^

  • @user-sg4ee5mw3r
    @user-sg4ee5mw3r 2 года назад

    raw = [x.decode() for x in raw [1:]]
    이 부분 어떻게 해결해야하나요 ..
    제발 도와주세요 ㅜ

    • @아연-q4q
      @아연-q4q 7 месяцев назад

      .decode('utf-8') 로 하시면 되는 것 같네요