Первый металлургический ML-хакатон от ОМК ИТ. Погодите, что???
Привет! На связи Объединенная металлургическая компания.
У нас важная новость для всех ML-специалистов и тех, кто неравнодушен к теме ИИ.
Мы не сильно удивим вас, сказав, что ОМК ИТ уже давно использует искусственный интеллект в своей работе. Но вот хакатона по LLM у нас еще не было. Пришло время его объявить!
Какую задачу решаем
В металлургии есть такое понятие как сортамент. Если по-простому — это список характеристик металлического изделия. Допустим: «широкополосный прокат (базовое исполнение), марка стали 09Г2С, толщина проката 25, класс прочности 325, категория 12 по ГОСТ 19281–2014».
Зная, с каким изделием мы имеем дело, можно принять ряд решений по дальнейшей работе с ним. Например, определить перечень необходимых испытаний для соответствия изделия ГОСТу. Или обозначить и определить приемочные границы этих испытаний.
Все характеристики и действия строго зарегламентированы Нормативно-Технической Документацией (НТД), особой вариативности тут нет.
Наша задача на первый взгляд очень простая. Нам нужна LLM, на вход которой мы подаем характеристики сортамента. А на выходе получаем список необходимых испытаний, свойств и допустимых границ.
Эта задача имеет максимальное практическое применение. Используя подобную LLM получится автоматизировать процесс поиска по НТД. И, наверняка, это поможет избежать ошибок, связанных с человеческим фактором.
А как сейчас?
Сейчас эту задачу решают технологи и сотрудники ОТК, знающие ГОСТы если не наизусть, то близко к этому. Они собирают по всем текстам и табличкам нужные сведения и вносят в информационные системы. Когда что-то забывается, они берут на столе распечатку ГОСТа и сверяются с ней.
Зачем тут LLM
На первый взгляд может показаться, что ИИ в данной работе избыточен. Ведь задача линейная. По сути, нам нужен поисковик по справочнику, логически выглядящий как ряд входных условий. По этим условиям и находится нужная информация.
Проблем тут две.
Во-первых, у нас может быть огромное число вариантов того, что придет нам на вход. Прописать эту вариативность вручную часто нереально, нужна какая-то автоматизированная система, способная обучаться самостоятельно.
Во-вторых, НТД (т.е. набор ГОСТов) оцифрована очень неоднородно. Она точно есть в виде бумажных справочников, а вот в электронном виде как повезет. Может оказаться не текстом, а, скажем, PDF-файлом или вообще PNG-картинкой.
Таким образом нам нужно распознать характеристики сортамента и запрос, найти необходимые ГОСТы, достать из них нужную информацию и дать на выход. Уже тянет на искусственный интеллект, да?
Пример связности характеристик сортамента и их механических свойств
Только в реальности и характеристик больше, и колонок справа. А еще Заказчики могут эпистолярно в комментариях к заказу что-нибудь еще заковыристое написать.
Примеры промптов и ответы на них
Чуть-чуть примеров того, что мы хотим получить.
Что может поступить на вход в составе промта
Марка стали;
Толщина проката;
Класс прочности (не для всех НТД требуется);
Категория металлопроката (не для всех НТД требуется);
НТД (нормативно-техническая документация на продукцию);
Дополнительная информация о типе проката и исполнении (в наших примерах прокат широкополосный).
Мы готовы получить и принять определённые условия от участников. Скажем, если ваша модель сможет работать только со стандартизированным промтом, в котором важна последовательность параметров — ОК, давайте обсуждать. Мы всю жизнь работаем с ГОСТами, для нас формы и правила не пустой звук. Мы готовы формулировать промты правильно.
Примеры промптов и правильных ответов LLM
Запрос № 1
Перечислите перечень испытаний для широкополосного проката (базовое исполнение), марка стали 09Г2С, толщина проката 25, класс прочности 325, категория 12 для ГОСТ 19281–2014.
Ответ
Временное сопротивление, предел текучести, относительное удлинение, ударная вязкость -40 (KCU), ударная вязкость (KCU) мех. старение при комнатной температуре.
Следующие запросы ориентированы на определение границ механического свойства. Свойство может ограничиваться только минимальным/максимальным или максимальным/минимальным значениями.
Запрос № 2
Какие границы для испытания на временное сопротивление для широкополосного проката (базовое исполнение), марка стали 09Г2С, толщина проката 25, класс прочности 325, категория 12 для ГОСТ 19281–2014?
Ответ
Минимальная граница 450 Мпа.
Запрос № 3
Какие границы для испытания на временное сопротивление для широкополосного проката, марка стали Ст3сп, толщина проката 20, категория 5 для ГОСТ 14637–89?
Ответ
Минимальная граница 370 Мпа. Максимальная граница 480 МПа.
Что даём взамен
Пока нам не удается решить задачу своими силами. Поэтому мы и хотим обратиться к помощи специалистов, которые, возможно, смогут найти какое-то свежее и рабочее решение. Мы не ожидаем, что вы сможете дать полностью готовую модель со стопроцентным попаданием в промт. Скорее, хакатон будет первым шагом в большой работе. Но, кто знает? Вдруг найдется тот, кто решит задачу сразу?
В любом случае, мы выберем трех победителей, которые получат каждый свой приз.
Первое место. Сертификат на покупки в Озоне на 75 тыс рублей.
Второе место. Сертификат на покупки в Озоне на 50 тыс рублей.
Третье место. Сертификат на покупки в Озоне на 25 тыс рублей.
С людьми или компаниями, добившимися наибольшего успеха в решении задачи, ОМК ИТ будет готов продолжить сотрудничество на коммерческих условиях.
Напоминаем, это крайне практическая задача. Подобные проблемы стоят не только перед ОМК ИТ, а перед всеми, кто связан с тяжелой металлургией. И получившийся продукт, в случае его удачи, будет иметь огромные перспективы.
Отдельно отметим, что мы не ожидаем от участников глубоких знаний в сфере тяжелой металлургии. И уж совсем мы не ждем знания ГОСТов. Задача исключительно на правильный поиск информации и связку «стандартизированный промт» — «выжимка из нужных ГОСТов».
«Нужные» ГОСТы приводим ниже:
https://docs.cntd.ru/document/1200113779
https://docs.cntd.ru/document/1200000119
Как принять участие
Что нужно для участия в новом хакатоне? Вам нужно сделать следующее:
В комментариях к этой статье написать «участвую».
Также в комментах вы можете задавать уточняющие вопросы. Однако, всем заинтересованным предлагаем сразу перейти вот в эту ТГ-группу. В ней есть наши эксперты, они помогут с более специфичными вопросами, не стесняйтесь задавать им вопросы!
Свои решения необходимо загрузить через форму (с использованием гитхаб).
Сроки приема ответов до 3 ноября.
Итоги подведем отдельным постом после 11 ноября.
Дерзайте и удачи)
Habrahabr.ru прочитано 26206 раз