Анализ тональности комментариев в YouTube с помощью машинного обучения (TF-IDF, LogisticRegression)

Поделиться
HTML-код
  • Опубликовано: 9 ноя 2024

Комментарии • 23

  • @thatombele5522
    @thatombele5522 2 года назад +5

    пришёл с Хабра, шикарная статья, теперь и видосик посмотрим :3

  • @senex9336
    @senex9336 Год назад +2

    Пример взятый для разбора забавный, конечно, получился) Добавляет интереса, так скажем)

  • @ИлонаИнч
    @ИлонаИнч Год назад +1

    Никита, Привет!
    Спасибо тебе большое за видео, у меня вопрос по коду...почему в облаке слов Ш. ты в дикте передаешь П.? и наоборот.
    **wordcloud_shulman** = WordCloud(background_color="black",
    colormap = 'Blues',
    max_words=200,
    mask=None,
    width=1600,
    height=1600)\
    .generate_from_frequencies(
    dict(**putin_frequence**.values))

  • @TheNevfy
    @TheNevfy 2 года назад +2

    ничего не поняла, но завораживает....неужели этому можно научиться?

    • @ivanovnikitok
      @ivanovnikitok  2 года назад

      Конечно, можно и даже нужно, особенно если это интересно! Могу порекомендовать бесплатный курс stepik.org/course/4852/, там нужны только база в статистике (stepik.org/course/76) и база питона (stepik.org/course/67)

    • @TheNevfy
      @TheNevfy 2 года назад

      @@ivanovnikitok спасибо, добрый человек.... Ваше "только" вызвало улыбку, а сами "только" смех сквозь слезы....жизни не хватит....Но посмотрю все. Спасибо и удачи Вам.

  • @johnswet3569
    @johnswet3569 2 года назад +1

    Отлично! Спасибо за проделанную работу. А есть ссылка на колаб проект, не получается в колабе настроить хромдрайвер?

    • @ivanovnikitok
      @ivanovnikitok  2 года назад

      Ссылка на весь архив с файлами в гугл диске, если кликнуть на sentiment_analysis_colab.ipynb он должен открыться в colab : drive.google.com/drive/folders/1hqTJPT0G2SwU47Ul7l8j0wfhO2oiyg9B?usp=sharing

    • @ivanovnikitok
      @ivanovnikitok  2 года назад

      Есть пара туториалов как работать с хромдрайвером через облако колаба, можно попробовать немного доработать код и наверное должно запустится) stackoverflow.com/questions/51046454/how-can-we-use-selenium-webdriver-in-colab-research-google-com

    • @johnswet3569
      @johnswet3569 2 года назад

      @@ivanovnikitok да, тоже нашел эти примеры, пока не получилось

    • @derafum
      @derafum 2 года назад

      @@ivanovnikitok ,Как я могу сохранить нейросеть, чтобы использовать каждый раз без обучения

    • @georgemichael6884
      @georgemichael6884 11 месяцев назад

      @@johnswet3569 все получилось.работает.чат джипити пишет!)

  • @timuryunusov7307
    @timuryunusov7307 7 месяцев назад

    Итого: потрачено 45 минут видео и 3-4 часа работы на то, чтобы доказать очевидное))

  • @psyhhhh
    @psyhhhh Год назад

    эм файла positive нету можно ли ссылку на него?

  • @MrPushcart
    @MrPushcart 2 года назад

    А где код на гитхабе? Не могу увидеть) Только результаты работы

    • @ivanovnikitok
      @ivanovnikitok  2 года назад +1

      Здравствуйте, код: github.com/NikitiusIvanov/russian_youtube_coments_sentimen_analysis/blob/main/sentiment_analysis.ipynb

  • @johnswet3569
    @johnswet3569 2 года назад

    При большом количестве данных в моменте преобразования в массив появляется ошибка памяти:
    count = counter.fit_transform(comments_putin_df['text_clear'])
    count
    count.toarray().sum(axis = 0).shape
    MemoryError: Unable to allocate 1.01 TiB for an array with shape (622644, 222393) and data type int64
    как это можно обойти?

    • @ivanovnikitok
      @ivanovnikitok  2 года назад +1

      Да, есть такое, но на самом деле лучше сразу считать сумму по каждому компоненту в разряженной матрице и уже после этого преобразовывать в массив numpy типа: np.array(sparce_mtx.sum(axis = 0))

    • @johnswet3569
      @johnswet3569 2 года назад +1

      @@ivanovnikitok спасибо, получилось

  • @derafum
    @derafum 2 года назад

    Спасибо за видео.
    Как я могу сохранить нейросеть, чтобы использовать каждый раз без обучения ?

    • @ivanovnikitok
      @ivanovnikitok  2 года назад

      Привет! Можно например использовать joblib или pickle которые просто сохраняют объект python в бинарник, так же в фреймворках (i.e. keras of pytorch) есть встроенная сериализация моделей, что-то типа после обучения вызываешь метод .save() и сохраняешь в файл, а потом с помощью load() восстанавливаешь из файла, легко гуглится serialization keras, serialization pytorch и т.д.