Искусственный интеллект в России и мире: эволюция, тенденции, будущее

Сегодня искусственный интеллект активно задействуют в промышленности, строительстве, ТЭК и других сферах. Усиливают потенциал данной технологии новые суперкомпьютеры, которые помогают обучать ИИ для выполнения соответствующих задач. 

Проекты ИИ получают поддержку со стороны государства. В 2021 году стартовал Федеральный проект «Искусственный интеллект», в рамках которого в ИИ будет вложено 24,6 млрд ₽ в течении 5 лет. Уже было профинансировано создание 6 новых научно-исследовательских центров в ведущих университетах и НИИ.

Возникает необходимость не только в оценке эффективности технологий, но и в обосновании их экономической выгоды. В этой статье я рассмотрю тенденции развития ИИ в России, также его возможное будущее и расскажу, как мы применяем искусственный интеллект в работе с данными.

863a40f02ecbc3e009643a8d0716d7f6.png

Эволюция

Авторы Альманаха Искусственного интеллекта в числе основных событий года назвали новую парадигму в области машинного обучения. О ней объявили исследователи из Стэнфорда: вместо множества стартапов с собственными разработками будут 5–10 гигантских моделей ИИ, разрабатываемых крупными корпорациями. Другие же компании будут их дообучать и использовать. 

GPT-3 — одна из моделей, существовавших на тот момент. Она содержит 175 млрд параметров. Процесс обучения происходил на суперкомпьютере Microsoft Azure AI — его построили специально для OpenAI. По разным подсчётам на обучение могло уйти от 4,6 до более 5 млн долларов. 

Развитие этой тенденции явно видно в 2023 году. Только недавно вышла ChatGPT-4. Количество слов, которые способна обработать нейросеть, увеличилось с 8 000

до 64 000. Более того, теперь она может обрабатывать изображения: например, проанализировать макет сайта или описать иллюстрацию. Сегодня он помогает PR, SMM специалистам и журналистам, программистам и разработчикам сайтов, даёт вдохновение дизайнерам, помогает создавать баннеры, видеоролики, клипы и другой контент. 

Иллюстрация от Kandinsky по запросу: ChatGPT-3 и ChatGPT-4 на ринге как милые котики дерутся.

Иллюстрация от Kandinsky по запросу: ChatGPT-3 и ChatGPT-4 на ринге как милые котики дерутся.

Среди главных событий 2021 году упомянуто создание ассистента программиста Copilot — ещё один проект, связанный с Microsoft и OpenAI. По запросу на естественном языке он пишет программный код. Специалисту при работе с ними необходимо написать архитектуру, после чего ИИ будет решать типовые задачи. На международной ИТ-конференции «Ключевые тренды развития искусственного интеллекта: наука и технологии» Пётр Чернавин (гендиректор ГК «ГОСТ») назвал такие инструменты настоящим прорывом. 

Ещё одно яркое событие тоже связано с OpenAI: развитие тренда мультимодальности. Этот тренд в Machine Learning задала модель DALL-E, работающая с языком и изображениями. Мультимодальный искусственный интеллект объединяет множество форматов данных — тексты, фото, видео и аудио. Модель способна генерировать уникальные изображения по текстовому запросу пользователя. 

В России самыми яркими событиями называют обучение Сбером самой большой мультимодальной модели Kandinsky 2.1, а также победу команды DeepPavlov из МФТИ в технологическом конкурсе НТИ Up Great ПРО//Чтение — разработанная ими модель проверяла эссе на английском языке с эффективностью 107% по сравнению с результатами проверки реальными учителями. 

ИИ-модели различаются объёмом данных, на котором были обучены, а также количеством параметров данных, с которыми работают. Модель Kandinsky 2.0 содержала 2 млрд параметров, Kandinsky 2.1 — уже 3,3 млрд. Для обучения во втором случае использовали 170 млн связок «текст-изображение», а затем её дообучили на другом датасете — он содержал 2 млн пар изображений. Увеличение количества параметров позволяет получить более качественные и реалистичные изображения по запросу пользователя. 

Но это правило действует не всегда. Например, DALL-E содержал 12 млрд параметров, а в DALL-E 2.0 их количество составило 3,5 млрд основных и 1,5 млрд дополнительных. При этом вторая версия генерирует изображения, разрешение которых в 4 раза выше, чем в первой версии. 

Применение ИИ-разработок

Нейротехнологии и искусственный интеллект входят в список сквозных технологий, который содержится в нацпроекте «Цифровая экономика». Они считаются наиболее перспективными и способными радикально изменить существующие рынки, стать основой для создания новых. Приведём несколько примеров применения разработок на основе искусственного интеллекта. 

Мода

Инструменты на базе машинного зрения, анализа данных, машинного обучения помогают производителям одежды определять, нет ли плагиата в их новой линейке, искать новые идеи и предугадывать модные тенденции. 

Одни приложения помогают пользователям найти по фотографии модель понравившейся одежды, а другие — заранее предложат тёплую одежду, если вы планируете отпуск в холодной стране, или купальник, чтобы подготовиться к лету. 

Транспорт

Системы на основе искусственного интеллекта позволяют управлять транспортными потоками. В России в разных городах устанавливают умные светофоры. В Москве нейросети позволяют находить нарушителей на средствах индивидуальной мобильности — самокатах и моноколёсах. 

Почти во всех поездах московского метро установлена система «Антисон», которая следит за состоянием водителя; аналог такой системы тестируют в карьерных 220-тонных самосвалах БелАЗ. 

Расписание поездов на железной дороге с помощью ИИ можно составить за несколько секунд. 

И, конечно, стоит сказать о беспилотных автомобилях. В следующем году по трассе М-11 «Нева» начнут перемещаться беспилотные грузовики.

Металлургия и промышленность

ИИ помогает оценить качество дорог в карьере по кадрам с беспилотника, быстро обрабатывать данные с множества сенсоров для поддержания безопасности процессов, найти царапины на металлопрокате.

Система поддержки принятия решений для сталеваров даёт советы о том, какое количество ферросплавов необходимо добавить в выплавку. 

Обработка нейросетью больших объёмов данных позволяет экономить энергию и оптимизировать процессы, а компьютерное зрение в том числе отвечает за безопасность — речь о нахождении сотрудников в зонах, где людям быть не положено. 

Работа с данными

Искусственный интеллект используется для решения двух основных задач. Во-первых, для обработки и анализа больших данных. Так называемая предиктивная аналитика, позволяющая моделировать возможные сценарии. Во-вторых, с целью нормализации данных — приведения данных из разных источников к единому стандарту, принятому во внутренней информационной системе. Существует ряд коммерческих разработок в этой области.

Платформа для анализа программного обеспечения Dynatrace используют для мониторинга и оптимизации производительности приложений, а также разработки ПО и методов обеспечения безопасности. ИИ помогает преодолеть проблему разрозненности систем — когда данные поставляются из двух и более источников. 

HPE в 2017 году  приобрела продукт InfoSight, платформу предиктивного анализа состояния ИТ для использования в дата-центрах. Искусственный интеллект обнаруживает проблемы до того, как они окажут влияние на бизнес-процессы. 

Платформа управления ИТ-инфраструктурой «ИТМен» собирает данные из разных источников (AD, FreeIPA, VMWare, Clouds, Hyper-V, Samba, VMM) в одном месте, нормализует их с помощью ИИ и поставляет в CMDB.

Мировой тренд на ИИ

Исследовательская и консалтинговая компания Gartner Research в октябре 2022 года в числе главных стратегических технологических трендов на 2023 год назвала «Адаптивный искусственный интеллект» (Adaptive AI). 

Ценность операционного искусственного интеллекта заключается в том, что модели ИИ можно быстро разрабатывать, развертывать, адаптировать и поддерживать в различных средах предприятия. С одной стороны, проектировать подобные системы сложно. С другой — их нужно быстро выводить на рынок. 

Поэтому необходимы целые конвейеры для разработки ИИ или создание таких моделей, которые могут самостоятельно адаптироваться. Gartner приводит несколько примеров. 

Производитель химикатов и материалов Dow. Американская компания использует адаптивные системы ИИ, которые за счёт обратной связи улучшает корпоративную аналитику. Ценность аналитической платформы благодаря этому подходу выросла на 320%.

Учебное ПО Cerego в армии США с помощью ИИ адаптирует уроки к процессу обучения каждого конкретного человека. 

Датское управление технологий безопасности (DSTA) следит за безопасностью продуктов, продаваемых в стране. ИИ помогает найти продукты и производителей, ускоряя обнаружение проблем. Спин-офф этого решения используется в 19 других европейских странах.

4a3c4bbfa8bec36cf116c54f29722fd7.png

Перспективы ИИ в России

В России реализуется федеральный проект «Искусственный интеллект», разработанный в соответствии со Стратегией ИИ до 2030 года. Сергей Наквасин, директор Национального центра искусственного интеллекта при Правительстве РФ, поделился своими мыслями на ИТ-конференции «Ключевые тренды развития искусственного интеллекта: наука и технологии»:

  • Ожидания людей от искусственного интеллекта перегреты. 

  • Снизились инвестиции в это направление. 

  • На первый план выходят вопросы этики и безопасности. 

  • Искусственный интеллект сольётся с другими технологиями. 

  • Необходимо развивать квантовый искусственный интеллект. 

Экономический кризис эксперт назвал главным двигателем внедрения ИИ. Поскольку бюджеты компаний снижаются на фоне международных экономических сложностей, ключевым мотивом становится оптимизация затрат и повышение эффективности. 

Сергей Наквасин отмечает, что сегодня важно решить решить проблему получения конкретных экономических эффектов. В Китае ожидают вклад ИИ в ВВП в 26,1% к 2030 году, в ОАЭ — 13,5%. В России понимают все трудности и противоречия, связанные с этой технологией, и говорят о 2–5%. Этот эффект необходимо показать, чтобы продолжить развитие технологического направления с поддержкой государства. 

Инвестиции в ИИ замедляются, так как необходимая глобальная инфраструктура уже создана. Открыт доступ к мощностям, есть дата-сеты, большое количество low-code решений, которые позволяют любому начинающему специалисту создавать приложения. Стоимость создания дата-сетов также снизилась, так как появилась возможность формировать синтетические дата-сеты, отметил Наквасин. 

О синтезе данных для задач AI рассказал Борис Рабинович, старший управляющий директор департамента управления данными Сбера. Синтез помогает увеличить доступность данных, которые не отличимы от реальных, для исследований. Этот процесс он относится к тренду кибербезопасности: организация при обучении нейросети не рискует номерами карт, телефонами и другой информацией от клиента. От реальной информации в синтезированных данных ничего не остаётся, их нельзя расшифровать. 

Сбер относится к числу крупных компаний, использующих ИИ. Борис Рабинович отметил, что финансовый эффект по применению искусственного интеллекта в Сбере в 2022 году составил 235 млн. 

Кроме крупных компаний, прорывы в области ИИ могут обеспечить научные организации, в том числе Центры компетенций НТИ, которые связывают бизнес-заказчиков и учёных, а также команды, среди которых — вышеупомянутый DeepPavlov из МФТИ с технологией обработки естественного языка, BaseTrack и Starline, разработчики технологий беспилотных автомобилей. Компании могут участвовать в технологических конкурсах за крупные денежные призы, имеют возможность получить гранты от государства или начать самостоятельно зарабатывать на своей технологии. 

Заключение

Искусственный интеллект сегодня стал одним из самых перспективных инструментов. Почему же Илон Маск, Стив Возняк, Эван Шарп подписали письмо, в котором эксперты настаивают на перерыве в исследованиях до появления общих протоколов безопасности? В будущих статьях мы разберем вопрос этики в области искусственного интеллекта.

© Habrahabr.ru