Техномагия для гиганта: как IT двигает ЕВРАЗ, а ЕВРАЗ качает IT
Видите на фото раскалённые потоки металла? Пока это полупродукт, а полноценной сталью его делают дорогостоящие добавки, максимальное и минимальное количество которых определяет ГОСТ. Отмеряет и добавляет их технолог на производстве, а мы разрабатываем и поддерживаем подсказчик, который помогает избежать перерасхода.
Сначала служба БСЕ ЕВРАЗа (специалисты, которые направленно смотрят, что и где можно улучшить, и помогают реализовать улучшение) вместе с технологами от производства подбирали проекты с наибольшим экономическим эффектом и увидели, что можно оптимизировать расход добавок. Затем они подключили меня в роли специалиста Data Science. Мне понадобилось вникнуть в технологию выплавки стали и дать несколько презентаций про ML-модели, чтобы технологи понимали возможности инструментов, которыми обладает Data Scientist.
Первый пул данных выгружал Data Engineer от производства (так как внешнему специалисту искать нужную информацию в производственной базе очень долго). Это был просто Excel. Затем мы уточняли шаг за шагом, какие ещё данные мы можем получить для улучшения качества ML-моделей, выгружали новые данные, анализировали — и потом по новой. Часть данных оказалась низкого качества — например, на истории видно, что человек отдавал много материала, а параметры стали не менялись. Из-за этого пришлось разными способами создавать расчётные коэффициенты и чистить сырые данные.
Пробовали множество моделей: начиная от линейной регрессии и заканчивая градиентными бустингами. Остановились на LightGBM ввиду особенностей технологического процесса, а также скорости работы модели. Подходы к машинному обучению тоже разнились: сначала тренировали модели на данных «как есть», но в процессе поняли, что качество моделей посредственное, а модели не технологичны. Изменили подход к формированию целевого значения (сделали относительные целевые переменные, а не абсолютные) — и всё получилось.
До подсказчика сталевар перестраховывался, чтобы точно попасть в ГОСТ, и засыпа́л чуть больше материалов. Наша модель прогнозирует, что получит человек с той или иной отдачей материала, и учит людей экономить дорогостоящие добавки. Теперь сталевары наблюдают всю необходимую информацию на рабочих местах, получают рекомендации по отдаче материала и более детально анализируют свои действия, прислушиваясь к подсказчику. В целом процесс стал менее человекозависимым, и продукт выходит более качественным вне зависимости от опыта сотрудника.