Почему Google Gemini не пользуется популярностью среди разработчиков?18.09.2024 16:00

Когда Google представила свою революционную ИИ-модель Gemini, разработчики замерли в ожидании прорыва. Но вместо обещанной простоты они столкнулись с неожиданными трудностями. Один из основателей стартапа провёл 4 часа, пытаясь настроить API соединение, в то время как конкуренты справляются за считанные минуты.

Почему, несмотря на все сложности, крупные компании еще выбирают Gemini, и сможет ли Google обойти своих конкурентов в этой гонке за искусственный интеллект?

Битва Gemini c OpenAI

Начало…

Согласно зарубежным источникам, Google вложила огромные средства в разработку больших языковых моделей, но Gemini по-прежнему сталкивается с двумя серьезными вызовами: сложностью использования и предпочтениями разработчиков в пользу продуктов конкурентов. Эти проблемы могут замедлить рост облачных и ИИ-услуг компании. Несмотря на определенный прогресс после выпуска Gemini, по сравнению с конкурентами, такими как OpenAI, платформа уступает в надежности и доле рынка.

Некоторые разработчики и сотрудники Google жалуются, что разговорный ИИ Gemini слишком сложен в использовании по сравнению с аналогичными технологиями конкурентов. Среди тех, кто критиковал Gemini, был основатель стартапа Topology Эйдан Маклафлин. Его компания занимается разработкой программного обеспечения, которое улучшает возможности рассуждения существующих моделей ИИ.

Маклафлин рассказал, что на использование API Openal у него ушло всего 30 секунд, тогда как на настройку Gemini понадобилось 4 часа, так как Google потребовала создать облачный аккаунт и произвести множество настроек. Кроме того, уязвимости в системе Google иногда вынуждали его откатываться назад. Он отметил: «Если бы модель Google была значительно мощнее OpenAI и Anthropic, я бы готов был пройти через все эти трудности. Самое важное в мире — это качество модели. Но, за редким исключением, модель Google занимает лишь третье место».

Сложности, с которыми сталкиваются разработчики при использовании Gemini, могут повлиять на облачный бизнес Google, так как компания планирует с помощью этой технологии привлечь больше клиентов для использования своих серверов. Некоторые сотрудники Google также отмечают, что это может затормозить развитие их собственных ИИ-решений. OpenAI, привлекая миллионы платных пользователей для покупки своих моделей ИИ или использования ChatGPT, получает множество явных и неявных отзывов, что помогает улучшать модели. Если Gemini не получит подобного уровня использования, Google, вероятно, придется работать с более расплывчатым планом по его улучшению.

Gemini также играет важную роль в развитии потребительских и рекламных продуктов Google, таких как поисковики с разговорными ответами и голосовые помощники. «Привлечение разработчиков для использования Gemini для решения реальных сложных задач даст важную обратную связь для следующего поколения этой модели», — говорит Бинду Редди, генеральный директор Abacus AI, компания которого помогает разработчикам создавать ИИ-приложения. «Чем больше отзывов вы получаете, тем лучше», — добавляет она.

Gemini?

Хотя Gemini значительно улучшился в этом году, его надёжность в бизнес-приложениях с использованием ИИ остаётся ниже, чем у конкурентов. Представитель Google заявил, что обратная связь от разработчиков важна для улучшения модели, но это не единственный источник данных. Некоторые исследователи ИИ также отметили, что значительные улучшения могут быть достигнуты, обучая модели с участием человеческих экспертов из разных областей.

Малые разработчики и крупные компании используют такие большие языковые модели, как GPT-4 от OpenAI, для разработки приложений, автоматизирующих всё — от обслуживания клиентов и анализа данных до выявления мошенничества и генерации кода. OpenAI и Microsoft ежемесячно получают около 100 миллионов долларов дохода, предоставляя услуги по доступу к большим языковым моделям для разработчиков. Среди таких клиентов — компании, занимающиеся количественной торговлей, такие как Jane Street, банки, включая Morgan Stanley, и финтех-компании, такие как Stripe.

Google также перечисляет несколько клиентов Gemini, таких как Mercedes-Benz, Goldman Sachs и Uber. Эти компании заявляют, что используют ИИ для всего, начиная с обслуживания клиентов и заканчивая помощью в написании кода, хотя неизвестно, в каком объеме. Ранее Google установила цель в этом году получить 1 миллиард долларов дохода от ИИ-услуг в Северной Америке, однако это включает не только услуги больших языковых моделей.

Генеральный директор Alphabet Сундар Пичаи на конференции по итогам второго квартала в июле сообщил, что с начала этого года более 2 миллионов разработчиков воспользовались Gemini, но неясно, включает ли это тех, кто воспользовался моделью лишь один или два раза.

По сравнению с моделями OpenAI, низкая популярность Gemini среди разработчиков кажется общеизвестным секретом в отрасли. Тем не менее, Gemini продолжает развиваться, и компания активно предпринимает шаги для повышения его производительности и надежности, чтобы остаться конкурентоспособной на рынке ИИ.

Конкурентные преимущество

Например, исследование, проведённое стартапом Retool в июне среди более 750 работников технологического сектора, показало, что лишь 2,6% респондентов регулярно использовали Gemini для создания ИИ-приложений, тогда как 76% использовали OpenAI. Gemini с небольшим преимуществом обошёл модель Anthropic Claude, которая набрала 2,3%. Однако следует отметить, что использование Claude с ноября 2023 года выросло более чем в четыре раза. Доступ к Gemini для разработчиков стал возможен только в декабре прошлого года.

Согласно данным Similarweb, с июня по август страница Opera для разработчиков получила 82,8 миллиона посещений, тогда как у Google за тот же период было лишь 8,4 миллиона просмотров. Меньшие исследования предоставляют схожие результаты. В конце прошлого месяца основатель Finetune Джулиан Сакс опросил 50 разработчиков И стартапов в своём коворкинге в Сан-Франциско о том, какую модель они чаще всего используют для разговорного ИИ. Почти все из них указали на модели Anthropic или Openair, и никто не назвал Gemini. Сакс не был удивлён этим результатом. Он сказал: «Мне кажется, в области кодирования Gemini не выделяется на фоне других моделей».

Google потратила почти год и провела серьёзную реорганизацию, прежде чем выпустить модель, способную конкурировать с GPT-4, выпущенной OpenAI в начале 2023 года. Google начала предоставлять разработчикам доступ к модели Gemini в декабре 2023 года, и её производительность была сравнима с моделями OpenAI в популярных тестах.

Тем не менее, по словам некоторых сотрудников Google, Open AI, выпустив свой продукт раньше, завоевала признание среди разработчиков. В этом году молодая компания Anthropics также набирает популярность, так как разработчики всё чаще выбирают её модель Claude в качестве альтернативы OpenAI, особенно для помощи в кодировании.

Трудности разработчиков

Gemini, похоже, не вызывает большого интереса. Опрошенные разработчики отметили, что модели Gemini полезны при анализе больших текстов или баз кода, так как они могут обрабатывать больше информации за раз, чем другие модели. Однако они также указали, что опции, предлагаемые Google, сбивают с толку, а процесс использования моделей усложнён по сравнению с конкурентами.

Иногда различные опции использования Gemini даже конкурируют друг с другом в результатах поиска Google. Весной этого года сервис Vertex AI Studio, продвигаемый Google для крупных компаний, желающих использовать Gemini, стал рекламироваться наряду с Google AI Studio, более простым инструментом, который также позволяет разработчикам работать с Gemini.

«Люди путаются, пытаясь понять, что выбрать», — говорит Алекс Атталла, бывший технический директор OpenSea, который также столкнулся с трудностями при попытке использовать Gemini для своей новой компании OpenRouter, разрабатывающей ПО для разработчиков, работающих с большими языковыми моделями.

Хотя в декабре прошлого года Google выпустила AI Studio, чтобы упростить использование Gemini для разработчиков, им всё равно необходимо использовать иной формат запросов, отличный от GPT и Claude, которые используют схожий подход. Маклафлин отметил, что это различие снижает привлекательность перехода на Gemini для разработчиков.

Gemini часто подвергается критике на социальных платформах, особенно на X (бывший Twitter). Исследователь ИИ из компании Xbow Брэндан Долан-Гавитт недавно опубликовал пост на X, описывая, как много шагов ему пришлось пройти, чтобы начать работать с Gemini через Vertex, другой инструмент Google для разработки ИИ-приложений. Пост получил широкую огласку, и другие разработчики также начали высказывать своё недовольство по поводу Gemini.

Стабилизация рыночной доли

Google пытается изменить этот имидж, в том числе отвечая на критику в X. Компания также проводит мероприятия для разработчиков и активно продвигает Gemini. Кроме того, Google предлагает другие стимулы, такие как конкурсы для разработчиков на создание лучших приложений на основе Gemini. Победитель получит настраиваемый электромобиль DeLorean с номерным знаком «G3M1N1». Планируется, что победители будут объявлены в конце этого года.

Логан Килпатрик, сотрудник Google, рассказал, что компания также рассматривает возможность объединить функции некоторых продуктов для создания приложений, чтобы уменьшить путаницу среди разработчиков. «OpenAI дольше предоставляет полезные инструменты для разработчиков в сфере больших языковых моделей, чем Google», — говорит Килпатрик, который присоединился к Google в апреле и стал руководителем AI Studio, а ранее работал в OpenAI. «Мы сталкиваемся с их сильной долей рынка среди разработчиков».

На этой неделе OpenAI запустила модель o1-preview, которая превосходит большие языковые модели в определённых технических или сложных задачах. Это может оказать давление на Google, вынуждая её выпустить аналогичную технологию, иначе компания рискует потерять больше позиций на рынке среди разработчиков.

Подход Gemini

Google активно работает над разработкой Gemini 2.0 в надежде на то, что в долгосрочной перспективе удастся не только догнать OpenAI, но и превзойти её технологические решения. Несмотря на это, Gemini завоевал популярность среди некоторых сторонников, особенно благодаря способности обрабатывать большие объёмы информации. Джеклин Сиу, основатель компании Starcycle, сказала, что её компания использует Gemini 1.5 Pro, самую продвинутую модель, предложенную Google для разработчиков, в основном для извлечения данных из документов. Компания Thomson Reuters также использует Gemini для помощи в юридических задачах, таких как сравнение длинных юридических документов и поиск несоответствий.

Для крупных компаний сложность использования ИИ Google не является серьёзным препятствием. Фиона Тан, технический директор Wayfair, рассказала, что компания выиграла от персонализированного обслуживания, предоставленного сотрудниками Google. Они помогли использовать Gemini для преобразования традиционных баз данных в более удобные для пользователей форматы. Под «персонализированным обслуживанием» понимается максимально внимательное обслуживание с проработкой всех деталей.

Однако некоторые разработчики не стремятся попробовать Gemini, поскольку уже имеют достаточные решения. Мартин Страйдом, разработчик приложения Dots, сказал, что его компания предпочитает использовать Claude для помощи в написании кода и более старые модели GPT от OpenAI для обслуживания клиентов, поскольку у них нет времени на постоянное тестирование разных языковых моделей.

Он сказал: «Сейчас почти все используют OpenAI, Claude или Cursor. Если лучшие инженеры мира используют эти инструменты, зачем нам пробовать что-то другое?» Cursor — это помощник по написанию кода, основанный на моделях OpenAI и Anthropic.

Если вам понравилась статья, то приглашаю Вас в свой telegram-канал «охота за технологиями», там я пишу о технологиях, которые завоевывают признание миллионов лююдей. Я называю свой канал — пространство для стратегов и новаторов, для тех, кто меняет правила игры и готов пойти на риск ради будущего, разрушив старые стереотипы. Буду ждать Вас там!