Благодарю вас за познавательное видео? Подскажите, пожалуйста, повышает ли применение pyspark точность на большом количестве классов в комбинации catboost?
Да, Нужно добавить будет стейдж с добавлением метаинформации, но вы можете реализовать обернутую векторизацию которая это будет делать, на базе VectorAssembler.
Вам нужно просто реализовать свой класс-трансформера с вашей логикой по созданию новой колонки. Для этого просто опишите класс унаследованный от Transformer.
Да, простите, во время вебинара у меня опечатка была допущена, и я создавал метаинформацию по исходным колонкам, а нужно было по тем которые были получены после StringIndex'ов. В CoLab сейчас это исправлено.
Спасибо! Отличный, практичный ролик! 🎉
Спасибо за Ваш труд 🌏🕊
Благодарю вас за познавательное видео? Подскажите, пожалуйста, повышает ли применение pyspark точность на большом количестве классов в комбинации catboost?
3:13
Учитывает ли приведенный в уроке pipeline категориальные фичи или нужно добавлять стейдж?
Да, Нужно добавить будет стейдж с добавлением метаинформации, но вы можете реализовать обернутую векторизацию которая это будет делать, на базе VectorAssembler.
Как добавить стейдж с withColumn?
Вам нужно просто реализовать свой класс-трансформера с вашей логикой по созданию новой колонки.
Для этого просто опишите класс унаследованный от Transformer.
спасибо
Почему ничего не изменилось в точности предсказания, после того, как мы задали категориальные фичи?
Да, простите, во время вебинара у меня опечатка была допущена, и я создавал метаинформацию по исходным колонкам, а нужно было по тем которые были получены после StringIndex'ов. В CoLab сейчас это исправлено.
@@alexkbit ок, спасибо!