電腦看懂人類語言的第一步:詞向量。 機器學習youtube教學系列課程 | 機器學習 | 語意向量空間|ChatGPT|AI |人工智慧

Поделиться
HTML-код
  • Опубликовано: 21 авг 2024
  • 在求職過程中,確定一份履歷是否與特定的工作描述相匹配是非常重要的。自動化這一過程可以節省大量時間和人力資源。本文將介紹如何使用 Gensim 庫的 Word2Vec 模型來計算履歷和工作描述之間的相似度。相似度越高,表示履歷與工作描述的相關性越高。
    詳細步驟
    文本數據的預處理:
    首先,我們需要對文本數據進行預處理。這包括將文本轉換為小寫,移除標點符號,並將其分割成單詞列表。Gensim 提供了一個方便的 函數來完成這一步。
    標籤化文本:
    為了使用Word2Vec 模型,我們需要將文本標籤化。每個履歷和工作描述都會被轉換成 TaggedDocument ,其中包含單詞列表和標籤。
    訓練 Word2Vec模型:
    使用預處理後的文本數據來訓練 Word2Vec模型。Word2Vec 是一種將文本轉換為固定長度向量的模型,使我們可以對文本進行比較。訓練模型時,我們需要指定向量的維度、最小詞頻和訓練的迭代次數。
    轉換文本為向量:
    訓練完成後,我們可以使用模型將每個履歷和工作描述轉換為向量。這些向量是高維空間中的點,可以用來計算它們之間的距離。
    計算相似度:
    我們使用餘弦相似度來計算履歷和工作描述之間的相似度。餘弦相似度是一種衡量兩個向量之間相似度的度量,範圍在0到1之間,1表示完全相似,0表示完全不相似。
    關於影片中【resume程式】的下載網址:github.com/deepmind-python/nltk
    請手動複製 github.com/deepmind-python/nltk 至瀏覽器的網址列上,然後在鍵盤上按 Enter鍵。
    音樂來源:RUclips音效庫 "Wrong"

Комментарии • 17

  • @user-uu9mk4rm1y
    @user-uu9mk4rm1y 2 месяца назад +1

    好方法,謝謝堤供教學。

  • @ablezhen
    @ablezhen 2 месяца назад +1

    好課程

  • @mindhappy912
    @mindhappy912 2 месяца назад +1

    good

  • @manninggrow
    @manninggrow 2 месяца назад +1

    詞向量 good

  • @botpython8785
    @botpython8785 2 месяца назад +1

    使用模型將每個履歷和工作描述轉換為向量👍

  • @pythonpeng7018
    @pythonpeng7018 2 месяца назад

    真棒

  • @user-by1ee1mo1d
    @user-by1ee1mo1d 2 месяца назад +1

    使用餘弦相似度來計算履歷和工作描述之間的相似度。

  • @tester-md9in
    @tester-md9in 2 месяца назад +1

    只要將履歷表中的所有文字複製到程式中。

  • @baby-ww7ee
    @baby-ww7ee 2 месяца назад +1

    履歷是否與特定的工作描述相匹配,可用Word2Vec 模型。

  • @simplastx4821
    @simplastx4821 2 месяца назад +1

    背景音乐没必要啊,声音也太大了

    • @grammarAI
      @grammarAI  2 месяца назад

      謝謝您的提醒。因為天氣太熱,開電風扇開太大,我必需大聲說話,壓過電風扇的聲音來拍視頻。

    • @simplastx4821
      @simplastx4821 2 месяца назад +1

      @@grammarAI 是说前奏的背景音,可以小一点,你讲话声音没问题哈

    • @simplastx4821
      @simplastx4821 2 месяца назад +1

      前奏有点长,我还以为一直都会有这个背景音,留言后发现正文没问题

    • @grammarAI
      @grammarAI  2 месяца назад

      @@simplastx4821 原來是這樣,我正在做新視頻,看來我要回去割掉一些前奏。對了,我的訂閱人數太少了,可否訂閱一下。謝謝。

    • @simplastx4821
      @simplastx4821 2 месяца назад +1

      @@grammarAI 嗯嗯,内容不错,已订阅。(你开始讲话了就可以减弱或去掉背景音)

  • @data-tw5xm
    @data-tw5xm 2 месяца назад

    good