文字探勘、文本共現及網路分析 蔡芸琤 教授

Поделиться
HTML-код
  • Опубликовано: 16 июн 2024
  • 文字探勘、文本共現及網路分析 蔡芸琤 教授
    資料科學中的「共現性(Co-occurrence)」,指字詞間共同出現在所擷取之文本或語料單元的現象,當共現頻率出現越高,表示兩字詞之間的關係越緊密。以影片推薦系統來思考,若觀看A影片的人有極高比例均會觀看B影片,則可想像A影片與B影片在一定程度有緊密關聯,因此當你觀看A影片時,平台很可能就會出現「你可能也會喜歡B影片」的推薦。如果要更直觀的用圖像理解共現性,我們可以製作文本共現網路圖,節點面積愈大表示該字詞出現次數愈多、節點間連線粗細則代表兩字詞共現的次數多寡,倘若該字詞若與多個字詞相關,則會使其位置偏向共現網路圖的核心。共現網路分析不僅可運用在推薦系統,在法律科技層面更可透過自定義關鍵詞,來評估不同犯罪之間的關聯性、不同量刑因子的關聯性等諸多運用。

Комментарии •