토큰&임베딩 30분 정리!

Поделиться
HTML-код
  • Опубликовано: 20 сен 2024
  • * 참고한 글 : www.syncly.kr/...
    ---------------------------------------------------------------------------------------------------------------------------
    📝 Summary
    이 영상은 토큰과 임베딩에 대한 간단한 설명을 제공합니다.
    임베딩은 단어를 컴퓨터가 이해할 수 있는 숫자로 변환하는 과정이며, 텍스트를 벡터 형태로 표현하는 것입니다.
    토큰은 문장을 단어 단위로 분리하는 개념이며, 원핫 인코딩 방식으로 임베딩을 하면 모델이 이해하기 힘들어지는 문제가 있습니다.
    최근에는 뉴럴 네트워크를 활용한 learned embedding 방식이 주로 사용되며, 이를 통해 모델이 문맥상 의미적으로 유사한 단어들을 구별하는 데 도움이 됩니다.
    ---------------------------------------------------------------------------------------------------------------------------
    ⏰ Time stamp
    00:00 Intro
    00:24 Embedding이란?
    01:42 Embedding이 왜 필요한가?
    05:47 token이란?
    07:31 Word(token) Embedding vs. Sentence/Document Embedding
    15:42 Embedding을 어떻게 생성하나?
    16:53 One-hot Encoding
    27:34 최근에는 Learned Embedding이라는 방식을 사용
    29:02 전체 내용 요약
    ---------------------------------------------------------------------------------------------------------------------------
    ✅ Tag
    #nlp #llm #token #embedding

Комментарии • 2

  • @joonlab98
    @joonlab98  5 месяцев назад

    강연, 과외 문의 등의 연락은 다음 링크로 부탁드립니다!
    카카오톡 오픈 채팅방 : open.kakao.com/o/sUXWYvlf
    숨고 링크 : soomgo.com/profile/users/7524519

    • @joonlab98
      @joonlab98  5 месяцев назад

      과외 학생분의 프라이버시 상 음원이 중간 중간 비는 점 양해 부탁드립니다!🙏