Козлов Алексей | Машинное обучение в промышленном процессе растворения никеля

Поделиться
HTML-код
  • Опубликовано: 2 окт 2024
  • Козлов Алексей, Data Scientist at АО «Кольская ГМК»
    "Машинное обучение в промышленном процессе растворения никеля: проклятие данных, машинное колдовство и темное предсказание"
    Тезисы:
    1. Описание технологии: растворение никеля является важным процессом в промышленности, который требует высокой точности и эффективности.
    2. Обозначение целей: использование машинного обучения для улучшения качества процесса растворения никеля и повышения его эффективности.
    3. Способы достижения: анализ данных, разработка моделей машинного обучения, оптимизация процесса на основе полученных результатов.
    4. Чем управляем? Мы управляем процессом растворения никеля и его параметрами, такими как температура, давление и концентрация химических веществ.
    5. Как собирались данные? Данные были собраны из различных источников, включая датчики и логи процесса, а также результаты анализа химических образцов.
    6. Построение модели: мы использовали алгоритмы машинного обучения, для построения модели, которая может предсказывать оптимальные параметры процесса.
    7. Адова автоматика: мы разработали систему автоматического управления, которая использует модель машинного обучения для оптимизации процесса растворения никеля.
    8. Магия управления: благодаря использованию машинного обучения, мы смогли достичь более точного и эффективного процесса растворения никеля, что привело к улучшению качества продукции и экономической выгоде для компании.

Комментарии • 6

  • @ivanrubnenkov919
    @ivanrubnenkov919 Месяц назад

    привет
    бустинги сложно, но можно интерпретировать (ну как минимум первое дерево 😃шутка, но не совсем). Даже если в деревья не закапываться, но по шапам+корреляциям с таргетом зачастую видно, это компенсирующие фичи или бустящие в узком месте. Опять же значимые улучшения, некорректные собранные фичи с подглядываниями и тп, а также некорректные инпуты увидеть можно практически сразу, в остальных кейсах скор ведь важнее, чем интерпретация, или у вас с этим строго?
    конечно если поднимать катбуст с grow_policy=symmetricTree, можно про интерпретацию практически забыть
    у линейных моделей с валидацией на таймсериес датасетах бывают проблемы, но вы в курсе наверно. Линейные модели предполагают, что данные независимы, у вас редко такое бывает, если только не разбивать валидацию на какие-то другие минимальные атомарные единицы (мы в спорте били по играм). Также линейные модели предполагают, что дисперсия стационарна (гомоскедастичность), ну аналогично
    также поскольку у вас проблем с экстраполяцией нет, можно бленд с RF как минимум проверить, у него с интерпретируемостью лучше чем у бустов (мб не прав, если есть киллер фичи, которые в любом дереве обязательно должны быть для последующих хороших разбиений, то мб не зайдёт)

  • @AlexeyMatushevsky
    @AlexeyMatushevsky 8 месяцев назад

    Отличный доклад!

  • @fur1ous112
    @fur1ous112 8 месяцев назад

    Почему это не коммерческая тайна?

    • @antonabrarov3412
      @antonabrarov3412 8 месяцев назад

      А какие данные считаете коммерческой тайной?

    • @fur1ous112
      @fur1ous112 8 месяцев назад

      @@antonabrarov3412 ну мб саму идею, что ОВП можно предсказывать как временной ряд, а не химию, и за счёт этого превентивно регулировать

  • @somebody5186
    @somebody5186 8 месяцев назад

    Bylo 30% a seichas stremitsya k 100%. Ushel ot otveta :)