CatBoost на больших данных | Вебинар Александра Савченко | karpov.courses

Поделиться
HTML-код
  • Опубликовано: 26 дек 2024

Комментарии • 12

  • @artem-314
    @artem-314 3 месяца назад

    Спасибо! Отличный, практичный ролик! 🎉

  • @sashab.5472
    @sashab.5472 3 года назад +1

    Спасибо за Ваш труд 🌏🕊

  • @newglory6789
    @newglory6789 3 месяца назад

    Благодарю вас за познавательное видео? Подскажите, пожалуйста, повышает ли применение pyspark точность на большом количестве классов в комбинации catboost?

  • @mwave3388
    @mwave3388 2 года назад +2

    3:13

  • @alekseyloverberg1742
    @alekseyloverberg1742 3 года назад

    Учитывает ли приведенный в уроке pipeline категориальные фичи или нужно добавлять стейдж?

    • @alexkbit
      @alexkbit 3 года назад

      Да, Нужно добавить будет стейдж с добавлением метаинформации, но вы можете реализовать обернутую векторизацию которая это будет делать, на базе VectorAssembler.

  • @alekseyloverberg1742
    @alekseyloverberg1742 3 года назад

    Как добавить стейдж с withColumn?

    • @alexkbit
      @alexkbit 3 года назад

      Вам нужно просто реализовать свой класс-трансформера с вашей логикой по созданию новой колонки.
      Для этого просто опишите класс унаследованный от Transformer.

    • @alekseyloverberg1742
      @alekseyloverberg1742 3 года назад

      спасибо

  • @DmitryB876
    @DmitryB876 3 года назад +1

    Почему ничего не изменилось в точности предсказания, после того, как мы задали категориальные фичи?

    • @alexkbit
      @alexkbit 3 года назад

      Да, простите, во время вебинара у меня опечатка была допущена, и я создавал метаинформацию по исходным колонкам, а нужно было по тем которые были получены после StringIndex'ов. В CoLab сейчас это исправлено.

    • @DmitryB876
      @DmitryB876 3 года назад

      @@alexkbit ок, спасибо!