США зарегистрировали патент на разработанный в России метод ИИ03.05.2023 16:17

Ученые российской компании Smart Engines получили патент США на фирменную разработку. Изобретение позволяет существенно оптимизировать работу нейросетевых архитектур, которые используются для распознавания изображений. Авторами изобретения являются старший научный сотрудник-программист Smart Engines Александр Шешкус, генеральный директор Smart Engines к.т.н. Владимир Арлазаров, технический директор Smart Engines к.ф.-м.н. Дмитрий Николаев, профессор, член-корреспондент РАН и директор по науке Smart Engines д.т.н. Владимир Львович Арлазаров.

Патент № US 11636608 B2 датирован 25 апреля 2023 года.

Авторы изобретения предложили новую нейросетевую архитектуру, объединяющую блоки, используемые в современных нейросетях, с классическим инструментом анализа изображений реального мира — преобразованием Хафа. Изобретатели рассчитывают, что предложенная архитектура откроет новую страницу в истории успеха нейросетевых технологий в компьютерном зрении. Первые исследования Хафовских нейросетей, уже опубликованные в научной периодике, полностью подтверждают эту идею. Запатентованное решение уже используется в программных продуктах компании Smart Engines для автономного распознавания паспортов, ID-карт и других документов.

«Нейросети замечательно извлекают информацию из примеров, но их практически невозможно научить непреложным законам физики или математики. Показательны недавние упражнения сети ChatGPT в арифметике. При умножении больших чисел сеть правильно указывает первые и последнии цифры результата, и даже угадывает его длину, а вот центральные цифры ставит «от балды». Довольно забавный результат, ведь для правильного решения требуется в миллиарды раз меньше ресурсов, чем те, что есть в распоряжении у нейросети. Встает вопрос:, а можно ли вообще изучать математику на примерах? Иммануил Кант считал, что человек в своем познании опирается в том числе на априорные формы, не зависящие от опыта. Мы считаем, что нам удалось встроить в нейросеть дополнительное априорное геометрическое представление, лежащее в основе законов перспективы. Это позволяет ей строить решения задач компьютерного зрения, таких как определение ориентации объектов в пространстве или определение собственного положения», — рассказал директор по науке Smart Engines д.т.н. Владимир Львович Арлазаров.

«Самое частое использование преобразования Хафа — это поиск и выделение прямых. Они в области обработки и анализа изображений играют важнейшую роль: это и дороги, и дома, и границы документа, и строки, и рентгеновские лучи, формирующие томограмму, и многое другое. Но эти отрезки почти всегда не совсем прямые, часто зашумлены или видны только частично, имеют разную длину. Поэтому проведение классического Хаф-анализа изображения представляет собой довольно сложную задачу, — отметил старший научный сотрудник-программист Smart Engines Александр Шешкус. –Между тем, как раз с теми проблемами, которые затрудняют Хаф-анализ изображения, прекрасно справляются нейросети и, более того, существуют систематические методы решения подобных проблем».

«Сейчас подавляющее большинство задач технического зрения решается с использованием нейросетей, в развитии которых много лет не ставился вопрос экономии. При этом именно для задач зрения характерны большие объемы входных данных даже в тривиальных приложениях. В результате проблема сокращения вычислительных затрат стоит крайне остро. Предложенная нами архитектура с использованием преобразования Хафа обеспечивает конкурентное качество при значительно меньшем количестве обучаемых параметров и при требовании меньшего количества вычислительных мощностей», — подчеркнул технический директор Smart Engines к.ф.-м.н. Дмитрий Николаев.

«Научные исследования для нашей компании играют роль стратегических инвестиций. Мы серьезно инвестируем в науку и развиваем научное направление в нашей фирме для того, чтобы не только выпускать продукты на злобу сегодняшнего дня, но чтобы и решать проблемы, которые еще не возникли. И быть готовыми к тем вызовам, которые нам несет завтра», — прокомментировал генеральный директор Smart Engines к.т.н. Владимир Арлазаров.

Это уже третий патент, зарегистрированный Smart Engines в США. В феврале 2023 года ученые Smart Engines запатентовали в Штатах систему эффективной локализации и идентификации документов на изображениях. В общей сложности Smart Engines зарегистрировала три патента в США, восемь — в России, а также создала 26 полезных моделей.