Козлов Алексей | Машинное обучение в промышленном процессе растворения никеля
HTML-код
- Опубликовано: 2 окт 2024
- Козлов Алексей, Data Scientist at АО «Кольская ГМК»
"Машинное обучение в промышленном процессе растворения никеля: проклятие данных, машинное колдовство и темное предсказание"
Тезисы:
1. Описание технологии: растворение никеля является важным процессом в промышленности, который требует высокой точности и эффективности.
2. Обозначение целей: использование машинного обучения для улучшения качества процесса растворения никеля и повышения его эффективности.
3. Способы достижения: анализ данных, разработка моделей машинного обучения, оптимизация процесса на основе полученных результатов.
4. Чем управляем? Мы управляем процессом растворения никеля и его параметрами, такими как температура, давление и концентрация химических веществ.
5. Как собирались данные? Данные были собраны из различных источников, включая датчики и логи процесса, а также результаты анализа химических образцов.
6. Построение модели: мы использовали алгоритмы машинного обучения, для построения модели, которая может предсказывать оптимальные параметры процесса.
7. Адова автоматика: мы разработали систему автоматического управления, которая использует модель машинного обучения для оптимизации процесса растворения никеля.
8. Магия управления: благодаря использованию машинного обучения, мы смогли достичь более точного и эффективного процесса растворения никеля, что привело к улучшению качества продукции и экономической выгоде для компании.
привет
бустинги сложно, но можно интерпретировать (ну как минимум первое дерево 😃шутка, но не совсем). Даже если в деревья не закапываться, но по шапам+корреляциям с таргетом зачастую видно, это компенсирующие фичи или бустящие в узком месте. Опять же значимые улучшения, некорректные собранные фичи с подглядываниями и тп, а также некорректные инпуты увидеть можно практически сразу, в остальных кейсах скор ведь важнее, чем интерпретация, или у вас с этим строго?
конечно если поднимать катбуст с grow_policy=symmetricTree, можно про интерпретацию практически забыть
у линейных моделей с валидацией на таймсериес датасетах бывают проблемы, но вы в курсе наверно. Линейные модели предполагают, что данные независимы, у вас редко такое бывает, если только не разбивать валидацию на какие-то другие минимальные атомарные единицы (мы в спорте били по играм). Также линейные модели предполагают, что дисперсия стационарна (гомоскедастичность), ну аналогично
также поскольку у вас проблем с экстраполяцией нет, можно бленд с RF как минимум проверить, у него с интерпретируемостью лучше чем у бустов (мб не прав, если есть киллер фичи, которые в любом дереве обязательно должны быть для последующих хороших разбиений, то мб не зайдёт)
Отличный доклад!
Почему это не коммерческая тайна?
А какие данные считаете коммерческой тайной?
@@antonabrarov3412 ну мб саму идею, что ОВП можно предсказывать как временной ряд, а не химию, и за счёт этого превентивно регулировать
Bylo 30% a seichas stremitsya k 100%. Ushel ot otveta :)