Когда ждать российский ChatGPT?
Появление революционной нейросети ChatGPT стало самым громким событием в сфере ИИ в 2023 г. ИТ-специалисты всего мира спорят о том, почему искусственный интеллект внезапно начал выдавать такие результаты, каких от него никто не ожидал, и в какой момент произошел скачок от количества к качеству. Что представляет собой технология и зачем нужно срочно создавать российскую альтернативу, обсудили представители бизнеса и научного сообщества на конференции Data Fusion 2023, организованой CNews и ВТБ на площадке «Сколтеха» в Москве.
Парадокс Чжуан-Цзы
Возникновение технологии ChatGPT от компании OpenAI произвело эффект разорвавшейся бомбы — причем как в экспертном сообществе, так и в массовом сознании. С удачной метафоры начал дискуссию Денис Суржко, начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования банка ВТБ. Она отсылает ко сну китайского философа Чжуан-Цзы, который заявил, что не понимает, то ли ему снится, что он бабочка, то ли он — бабочка, которой снится, что она — философ.
«Когда мы тестировали ChatGPT, то размышляли, когда же появится такая нейронная сеть, которой будет казаться, что она личность. Или же это будет личность, которой кажется, что она нейросеть? — продолжил он. — Очевидно то, что революция произошла благодаря эффекту синергии архитектуры трансформеров, которая известна достаточно давно, с human-guided learning, она сыграла существенную роль в развитии технологии NLP в рамках этой сети. Мы видим фьюжн-эффект революции, помноженный на большие данные огромной выборки».
Участники дискуссии, впрочем, разделились на два лагеря. Одни называли технологию революционной, так как она начала демонстрировать способности, которые изначально в нее не закладывались. Другие — что текущий уровень достигнут эволюционным путем, и магией нейросеть кажется лишь обывателям.
«Несмотря на все проблески интеллекта, это все еще имитация интеллекта… Люди же, которые говорят, что это нечеловеческий разум, поддались эмоциям и когнитивным искажениям — это пройдет, — уверен профессор РАН, заведующий лабораторией Института перспективных исследований проблем искусственного интеллекта и интеллектуальных систем МГУ имени М.В. Ломоносова Константин Воронцов. По его мнению, способность GPT рассуждать — она кажущаяся, случайная». Но, тем не менее, «переход от количества в качество произошел», полагает он.
Более скептичен Михаил Степнов, директор по AdTech Big Data в МТС, заявивший, что хайп и вау-эффект ChatGPT вызвал лишь у людей, которые профессионально не занимаются нейросетями.
«Нужно также понимать разницу между GPT-3,5, GPT-5 и СhatGPT. Первые две — это модели, а ChatGPT — продукт. Разница заключается в пользовательском интерфейсе, он стал понятным для всех. История как с Midjourney, после которой все поняли, как пользоваться нейросетью, — отметил он. — В любом случае, мы видим эволюционное развитие — из того, что я собрал из статей и отзывов, следует, что фундаментально новая модель ничем не отличается от предыдущих кроме большего количества данных и интерфейса. Последний впечатлил людей, создал вещь, неотличимую от магии».
Андрей Червонный, CTO компании Variant Soft, отметил, что технология не стала бы хайповой, если бы не позволяла уже сейчас решать прикладные и бизнес-задачи —, а не просто «играться». »Можно написать живой код, создавать проекты, решать творческие задачи, раньше это было невозможно», — заявил он.
Директор центра Технологий искусственного интеллекта Сколтеха Иван Оселедец признался, что преподаватели Сколтеха уже советуют студентам использовать ChatGPT при написании дипломов, так как англоязычный текст она точно выдаст качественнее. Но ответственность за содержание работы несут все равно сами студенты.
Как сделан ChatGPT
Интересно то, что эксперты в области ИИ до сих пор не понимают точно, «из чего» сделан ChatGPT и что нужно предпринять, чтобы создать аналог.
«Мы не знаем достоверно, как создана технология — говорит Александр Панченко, ведущий научный сотрудник группы «Вычислительная семантика» AIRI. — Мы знаем основные ингредиенты, имеем представление об архитектуре, слоях. О том, что в процедуру были внесены изменения — обучение на инструкциях, интеграция фидбека человека. Но все же есть соус, о котором мы не знаем».
Андрей Червонный посоветовал коллегам спросить о том, как создан ChatGPT, у него самого — он с удовольствием рассказывает о своих слоях гораздо больше, чем есть в документах. Другое дело, что технология может не договаривать и попросту привирать.
«Нужно также понять, что такого нового произошло в теории ИИ, чтобы позволило ChatGPT выйти на такой уровень — или же это просто этап развития «железа» и оптимизации под него софта, просто появились более мощные суперкомпьютеры?» — задался вопросом Андрей Червонный.
Иван Оселедец отметил, что в обучающую выборку было добавлено от 10 до 100 тыс. диалогов, однако секрет заключается в правильном сборе данных и правильной их подаче.
«Мы признаем: инженеры обучили модель, и мы не можем объяснить, почему она так работает. Потому что она делает много интересных вещей, которые математически не объясняются никак. Мы наблюдаем серьезное изменение принципов обучения ИИ — может даже, идея простая, но она все же пришла кому-то в голову, и качество нейронной сети выросло колоссально», — отметил Иван Оселедец.
Он отметил, что за нейросетью вполне может быть будущее поисковых систем. По Ивана Оселедца, если подключить нейросеть к современной базе данных, она будет иметь доступ к актуальной информации, брать документы и интегрировать их. А пользователи будут получать ответы на свои вопросы в максимально удовлетворяющей их формулировке. Так что Google стоило бы присмотреться к средствам ИИ с целью совершенствования поискового механизма.
7 критериев «суверенного ChatGPT»
Константин Воронцов выразил опасение: текущая модель нейронной сети, не может гарантировать, что не выдает ничего, кроме правды.
Тимур Аляутдинов, холдинг «Т1»: Бэк-офис холдинга «Т1» составляет 5,3% от общей численности сотрудников
Бизнес«Мы видим, что GPT может вводить людей в заблуждение, ненамеренно наводнять инфополе лженаукой и профанацией, что технологию может взять на вооружение пропаганда», — заявил он. Поэтому, уверен ученый, необходимо срочно создавать «суверенный» GPT — который, по всей видимости, должен быть кристально честным со своими пользователями и не опускаться до манипуляций общественным сознанием.
Воронцов даже привел семь критериев, которым должна отвечать импортозамещенная и этичная версия нейронной сети.
Участники дискуссии сразу обозначили как главные препятствия к развитию такой технологии, так и потенциальные возможности.
Андрей Червонный сказал, что для обучения нейронной сети всем языкам народов России потребуется огромное количество времени, а Иван Оселедец — что для этого, как минимум, нужно будет организовывать масштабные лингвистические экспедиции. Он добавил, что для создания «православной» версии ChatGPT со своими фильтрами информации потребуется работа не дата-инженеров и математиков, а филологов и философов.
Foresight Day»2023: импортозамещение продолжается
Импортонезависимость«Тут мы с цифр переходим на высокие концепты. Вот где золотая жила для гуманитариев», — заявил он. И, если возвращаться к технической стороне вопроса, у ChatGPT можно скопировать большое количество диалогов, которые выдает закрытая версия, и начать обучать на них свою модель, сделать это «достаточно просто», на его взгляд.
Александр Панченко согласился с тем, что ChatGPT не должна оставаться проприетарной технологией, доступной лишь небольшому кругу компаний — и уже есть попытки в академической среде воспроизвести их результаты, обучив дата-сеты на неких открытых моделях. По его мнению, эти два стрима — большие проприетарные системы и открытые альтернативные реализации технологии — будут развиваться независимо друг от друга.
Впрочем, некоторые российские аналоги модели GPT третьего поколения уже есть: как отметил Михаил Степнов, работать с ними даже удобнее, так как они построены на технологии open sourcе, в отличие от закрытого ChatGPT. Это, к примеру, mGPT от Сбербанка и YaLM от «Яндекса». Они более универсальны, и их можно донастроить под конкретные бизнес-процессы компании.
Участники дискуссии пришли к выводу, что в целом в ближайшие несколько лет (встречались на конференции, впрочем, и более оптимистичные оценки — «полгода-год») создание российского аналога ChatGPT вполне возможно. Однако на пути его создания имеются существенные сложности: пока у российских компаний есть проблемы с мощностями, которые параллельный импорт, увы, не закрывает, и катастрофическая нехватка профильных специалистов.
Анжела Патракова
Полный текст статьи читайте на CNews