Алексей Зиновьев - Тонкости машобуча вместе со Spark ML
HTML-код
- Опубликовано: 16 сен 2018
- Ближайшая конференция - Joker 2024, 9 октября (Online), 15-16 октября (Санкт-Петербург + трансляция).
Подробности и билеты: jrg.su/Ypf1HW
- -
. . . . Что нужно уметь и понимать джависту на типичном BigData + ML проекте:
- как выбирать фичи;
- как перекодировать фичи;
- как скалировать;
- как очищать и заполнять пропуски;
- как оценивать качество кластеризации;
- что делать, если одного дерева мало;
- уметь делать кросс-валидацию.
И всё это на Scala + Spark!
Всё это на примере одного из самых популярных датасетов с Kaggle - от А до Я. Наука