[Перевод] От MCP до мультиагентов: 10 opensource проектов ИИ на GitHub и почему это важно

Группа экспертов GitHub провела анализ AI проектов, созданных за последние 99 дней, учитывая факторы, такие как количество звезд в день, форки, всплески трафика и активность контрибьюторов. Ниже мы расскажем вам об этих проектах и обсудим почему, по нашему мнению, они важны для AI разработки.

Содержание:

  • Для чего нужен протокол MCP?

  • Проект Open WebUI MCP: упрощение итеграции AI инструментов

  • Проект Unbody: «Supabase для AI»

  • Проект OWL: мультиагентное взаимодействие в действии

  • Проект F/mcptools: CLI для MCP разработчиков

  • Проект Nutlope/self.so: Создайте свой сайт с AI за считанные секунды

  • Проект VoiceStar: точное управление для приложений преобразования текста в речь

  • Проект Second-Me: создайте своего цифрового двойника

  • Проект SesameAILabs/csm: переосмысление синтеза речи

  • Проект Letta: универсальный стандарт для переносимых агентов ИИ

  • Проект Blender-MCP: соединение 3D-творчества и искусственного интеллекта

  • Выводы. Что эти проекты говорят нам об эволюции ИИ в открытом коде?

Для чего нужен протокол MCP?

MCP — это открытый протокол, который стандартизирует способы предоставления приложениями контекста для LLM. Представьте MCP как порт USB-C для приложений ИИ. Так же как USB-C обеспечивает стандартизированный способ подключения устройств к различным периферийным устройствам и аксессуарам, MCP обеспечивает стандартизированный способ подключения моделей ИИ к различным источникам данных и инструментам.

Источник: https://docs.anthropic.com/en/docs/agents-and-tools/mcp

Подробнее про MCP протокол

https://www.anthropic.com/news/model-context-protocol

https://docs.anthropic.com/en/docs/agents-and-tools/mcp

https://modelcontextprotocol.io/introduction

https://github.com/modelcontextprotocol

https://habr.com/ru/articles/879970/

https://habr.com/ru/articles/862312/

1. Проект Open WebUI MCP: упрощение итеграции AI инструментов

Ссылки

Сайт: https://docs.openwebui.com/

Репозиторий: https://github.com/open-webui/mcpo

ЯП: Python

Лицензия: MIT license

Это прокси-сервер, который превращает инструменты MCP в OpenAPI-совместимые HTTP-серверы. Разработчики, создающие приложения на базе искусственного интеллекта, используют этот сервер для простого соединения инструментов на базе MCP со всем, что использует стандартные RESTful OpenAPI-интерфейсы.

Почему это важно:

«Этот новый проект OpenWebUI (выпускник 2024 GitHub Accelerator) — отличный пример растущей тенденции в области ИИ, связанной с интеграцией, особенно с использованием MCP», — объясняет Эбигейл. «Это подчеркивает, что людям в ИИ нужно больше интеграции, и больше стандартов, таких как MCP, помогут в этом».

2. Проект Unbody: «Supabase для AI»

Ссылки

Сайт: https://unbody.io/

Репозиторий: https://github.com/unbody-io/unbody

ЯП: TypeScript

Лицензия: Apache 2.0 license

Подумайте о Supabase, но для искусственного интеллекта — это Unbody. Это модульный бэкенд, позволяющий создавать программное обеспечение, ориентированное на ИИ, которое действительно понимает и осмысливает знания, а не просто перемешивает данные.
Проект разбивает всё на четыре уровня, которые можно смешивать и сочетать:

  • Восприятие: Получает, анализирует, улучшает и векторизует исходные данные.

  • Память: Хранит структурированные знания в векторных базах данных и постоянных хранилищах.

  • Рассуждение: Генерирует содержание, вызывает функции и планирует действия.

  • Действие: Предоставляет знания через API, SDK и триггеры.

Почему это важно:

«Это интересный вопрос: Как программирование агентов может стать более абстрагированным от бэкенда?» — спрашивает Кевин. «С Unbody вы можете писать на любом фреймворке и получить бэкэнд, который будет автоматически управляться. Если вы посмотрите на такие компании, как E2E, то увидите, что ведется работа по созданию гораздо более продвинутых агентов, которые показывают, как абстрагируется стек бэкенда».

3. Проект OWL: мультиагентное взаимодействие в действии

Ссылки

Репозиторий: https://github.com/camel-ai/owl

ЯП: Python

Лицензия: Apache 2.0 license

OWL
OWL

Когда одного агента ИИ становится недостаточно, в дело вступает OWL. Построенный на базе фреймворка CAMEL-AI, который наиболее известен тем, что популяризировал ролевой подход для мультиагентных систем и выпустил множество синтетических пакетов «задача + данные», OWL позволяет нескольким специализированным агентам взаимодействовать через браузеры, терминалы, вызовы функций и инструменты MCP. Она даже возглавляет список лидеров с открытым исходным кодом в бенчмарке GAIA (58.18).

Почему это важно

«Это не просто агенты, это еще и мультимодельные и мультиагентные архитектуры, такие как OWL», — отмечает Эбигейл. «Год назад речь шла о людях, создающих модели, а теперь речь идет об агентах и о том, что они могут делать. OWL занимается мультиагентной работой, которая быстро развивается».

4. Проект F/mcptools: CLI для MCP разработчиков

Ссылки

Репозиторий: https://github.com/f/mcptools

ЯП: Go

Лицензия: MIT license

2214a8cbd256c3221a573d69268b39e9.png

Поклонники CLI: перед вами интерфейс командной строки для работы с серверами MCP. Созданный звездой GitHub Фатихом Кадиром Акином (который также создал функцию подсказок GitHub Copilot), он позволяет вам находить и вызывать инструменты, получать доступ к ресурсам и управлять подсказками с любого MCP-совместимого сервера.

MCP Tools поддерживает ввод/вывод данных через stdin/stdout или HTTP и выдает результаты в виде JSON или таблиц. Он даже позволяет создавать макеты серверов для тестирования или передавать MCP-запросы сценариям оболочки.

Почему это важно

Это превращает MCP в нечто, что можно «git clone && mcp call». Он предлагает привычный рабочий процесс CLI плюс встроенный режим охраны, позволяющий быстро создавать прототипы инструментов и блокировать их для продакшена.

5. Проект Nutlope/self.so: Создайте свой сайт с AI за считанные секунды

Ссылки

Сайт: https://www.self.so/EB

Репозиторий: https://github.com/Nutlope/self.so

ЯП: TypeScript

Лицензия: MIT license

426b7c497f2a15c74719bb57eae30ccc.png

Если создание личного сайта — не самое приятное занятие, Nutlope/self.so поможет вам. Загрузите свое резюме или профиль LinkedIn, и инструмент создаст для вас простой сайт, используя искусственный интеллект для верстки, без головной боли с CSS.

Технологический стек включает Together.ai для языкового моделирования, Vercel’s AI SDK, Clerk для аутентификации, Next.js для фреймворка, Helicone для наблюдаемости, S3 для хранения, Upstash Redis для базы данных и Vercel для хостинга.

Почему это важно:

Проект представляет собой сборный «ИИ-конструктор Lego». Это потому, что он объединяет Vercel AI SDK, Clerk auth, Upstash Redis, S3 и Tailwind, причем каждый сервис выполняет одну задачу, что иллюстрирует, как современные приложения для ИИ часто собираются из небольших специализированных сервисов, а не монолитов.

6. Проект VoiceStar: точное управление для приложений преобразования текста в речь

Ссылки

Репозиторий: https://github.com/jasonppy/VoiceStar

ЯП: Python

Лицензия: MIT code license, CC-BY-4.0 model license

Если в вашем проекте требуется речь, которая должна укладываться в определенный временной промежуток, вам поможет синтез VoiceStar с регулировкой длительности. Он позволяет разработчикам устанавливать целевую длительность, чтобы голосовой вывод соответствовал чувствительным ко времени сценариям использования — например, подсказкам фиксированной длины или повествованию — без дополнительного редактирования звука.

Проект включает в себя интерфейсы CLI и Gradio для вывода, а также предварительно обученные модели, которые можно использовать сразу же. Поскольку голосовые интерфейсы становятся все более важными в приложениях, наличие моделей с открытым исходным кодом и таким уровнем контроля — полезный шаг вперед.

Почему это важно:

Это открытая модель TTS, позволяющая привязать речь к точной длительности, что полезно для дубляжа, рекламы и наложений, где важна каждая миллисекунда. Это ИИ, поддерживающий вещательный уровень синхронизации, от сообщества с открытым исходным кодом.

7. Проект Second-Me: создайте своего цифрового двойника

Ссылки

Сайт: https://www.secondme.io/

Репозиторий: https://github.com/mindverse/Second-Me

ЯП: Python

Лицензия: Apache 2.0 license

Хотите поэкспериментировать с искусственным интеллектом? Second-Me позволяет вам попробовать создать базового «цифрового двойника» — агента, который будет отражать некоторые ваши знания, стиль общения и предпочтения.

Возможности могут быть самыми разными: от персональных помощников, которые действительно понимают, как вы думаете, до инновационных способов поделиться своим опытом с другими. Один из примеров применения Second-Me в действии: ваш цифровой двойник управляет вашим аккаунтом на LinkedIn или Airbnb, играя роль профессионала или хозяина.

Почему это важно:

Это яркий пример того, что мы наблюдаем переход от моделей к агентам. «Если посмотреть на ситуацию год назад, то все сводилось к созданию моделей. Как сделать X или Y? Вы создавали новую модель», — объясняет Джефф. «Этот проект и другие демонстрируют сдвиг в сторону агентных движений и того, как люди используют ИИ для выполнения задач».

8. Проект SesameAILabs/csm: переосмысление синтеза речи

Ссылки

Репозиторий: https://github.com/SesameAILabs/csm

ЯП: Python

Лицензия: Apache 2.0 code license (model has restrictions on Abuse)

Conversational Speech Model (CSM) предлагает новый подход к генерации речи. Она преобразует текстовые и аудиоданные в аудиокоды с остаточной векторной квантизацией (RVQ), используя архитектуру на основе Llama. Его специальный аудиодекодер производит аудиокоды Mimi, в результате чего получается удивительно естественно звучащая речь.

Интересно то, как CSM объединяет архитектуру языковой модели и специализированный аудиодекодер, предоставляя вам открытую альтернативу проприетарным вариантам преобразования текста в речь, которые доминируют на рынке.

Почему это важно:

CSM объединяет текстовую основу на базе Llama с легким аудиодекодером, который выводит коды Mimi RVQ — это доказывает, что мультимодальные мэшапы могут работать локально на одном GPU. Это говорит о том, что мультимодальность на уровне моделей начинает приобретать API-цепочки, а разрешительное лицензирование Apache-2.0 ускоряет исследования и разработки сообщества по созданию речевых систем с миллиардом параметров.

9. Проект Letta: универсальный стандарт для переносимых агентов ИИ

Ссылки

Репозиторий: https://github.com/letta-ai/agent-file

ЯП: Python

Лицензия: Apache 2.0 license

Letta представляет открытый формат файлов (.af) для упаковки агентов ИИ с сохранением их памяти и поведения. Считайте, что это переносимый контейнер для агентов. Вы можете обмениваться ими, ставить контрольные точки и контролировать версии в разных фреймворках.

Для разработчиков, жонглирующих несколькими фреймворками агентов, это может стать экономией времени. Хотите перенести агента с одной системы на другую, не перестраивая его с нуля? Именно эту проблему решает Letta.

Примечательно, что проект Letta является ответвлением от проекта cpacker/memgpt — он выделил слой сериализации, который MemGPT первоначально использовал для привязки своих «виртуально-контекстных» агентов. Команда вырезала этот код в чистую, не зависящую от фреймворка спецификацию (agent-file), так что любой стек — MemGPT/Letta, LangGraph, CrewAI — может импортировать или экспортировать полностью stateful агента с помощью одного архива .af.

Почему это важно:

Подумайте о «Docker-образе для агентов ИИ». В .af-образе хранятся снимки памяти, инструменты и подсказки, позволяющие контролировать версии, обмениваться и производить горячую замену агентов между фреймворками (MemGPT, LangGraph, CrewAI и т. д.), что решает проблему «как мне переместить моего агента?».

10. Проект Blender-MCP: соединение 3D-творчества и искусственного интеллекта

Ссылки

Репозиторий: https://github.com/ahujasid/blender-mcp

ЯП: Python

Лицензия: MIT license

Художники Blender, это для вас: сторонний инструмент, который соединяет популярный пакет для создания 3D с открытым исходным кодом Blender с искусственным интеллектом Claude AI через MCP. С помощью Blender-MCP разработчики могут управлять операциями Blender с помощью естественного языка или добавить помощь искусственного интеллекта в свой рабочий процесс 3D.

Blender-MCP показывает, как MCP может выступать в качестве универсального «порта инструментов» для LLM-агентов: сегодня это Blender, а завтра — Unity, Unreal или любое сложное настольное приложение. Для 3D-художников и прототипировщиков это означает более быстрое блокирование сцен, легкие эксперименты со стилями и совершенно новый способ обучения новичков. Просто опишите, что вы хотите, и смотрите, как программа создает это.

Почему это важно:

Это показывает, как MCP может подключить LLM к тяжелым настольным приложениям — в данном случае, давая Claude ключи к Blender для создания сцен на естественном языке и управления ассетами. Его быстрый рост намекает на то, что следующий скачок UX в 3D (и, возможно, в CAD, Unity, Unreal) может быть в переходе на работу с AI агентами.

Выводы. Что эти проекты говорят нам об эволюции ИИ в открытом коде?

Эти модели не только отражают текущее состояние ИИ в open source, но намекают на проблемы и возможности, которые ждут нас впереди. Вот что говорят эксперты GitHub о быстро развивающемся пространстве:

1. Интеграция в ИИ через MCP — это новый рубеж

Широкое распространение MCP во многих проектах подчеркивает растущую важность стандартизированных паттернов интеграции в разработке ИИ.

«Я увидела одну большую закономерность — это болевая точка вокруг ИИ и интеграции», — отмечает Эбигейл. «Больше стандартов, таких как MCP, помогут в этом».

2. Возникает многоагентное сотрудничество

Такие проекты, как OWL, указывают на будущее, в котором несколько специализированных агентов ИИ будут работать вместе для решения сложных задач.

«Вы должны думать об этом в контексте взаимодействия человека с человеком, агента с агентом, а затем иметь несколько агентов, работающих в тандеме», — объясняет Кевин, подчеркивая сложность и потенциал такого подхода.

3. Генерация речи развивается

Речевые технологии, конечно, не новы, но большие языковые модели настолько сильно меняют преобразование текста в речь (TTS) и речи в текст (STT), что открывается новая волна возможностей.

Более важная история заключается в том, что это означает в дальнейшем, и имеет последствия для СМИ, поддержки клиентов и UX продуктов.

4. Меняющийся ландшафт участия в проекте с открытым исходным кодом

ИИ привлек к открытому исходному коду новую волну сопровождающих и разработчиков, которые привнесли новую энергию и подходы.

Кара Делосс, старший менеджер программы по связям с разработчиками в GitHub, отмечает: «Мы видим новое поколение или новый тип сопровождающих» в сфере ИИ. Кевин добавляет, что «если у вас есть большое сообщество в первый день, это очень ценно», подчеркивая, как развивается экосистема. Это сочетание устоявшихся и новых методов разработки создает захватывающие возможности для сотрудничества в рамках сообщества.

5. Важность лицензий, одобренных OSI

Каждый топовый проект в нашем списке использует лицензии, одобренные OSI (в основном MIT и Apache 2.0), и это не случайно. «В общем, вы не получите много положительных эмоций от сообщества, если будете называть себя открытым исходным кодом, но не будете использовать лицензию, одобренную OSI», — отмечает Джефф. «Эти лицензии важны, потому что они предоставляют четкие гарантии прав на использование, модификацию и перераспределение, что укрепляет доверие в сообществе».

Джефф также отмечает возникающую проблему: «По мере того как сервисы и инструменты на базе ИИ становятся все более мощными, мы наблюдаем тенденцию, когда некоторые проекты накладывают ограничения на использование модели или сервиса, связанные со злоупотреблениями и мошенничеством. Это может не сделать их полностью открытыми по лицензии, одобренной OSI, и проекты и сообщество будут продолжать активно обсуждать эти условия».

Джефф: «Важно понимать и документировать все существующие ограничения, прежде чем использовать модель или сервис». Это своевременное напоминание, поскольку сообщество ИИ с открытым исходным кодом ориентируется в этих меняющихся вопросах лицензирования.

6. Изучайте и вносите свой вклад в создание инструментов ИИ завтрашнего дня!

Проекты, о которых мы рассказали здесь, — это лишь верхушка айсберга. Поскольку ИИ продолжает развиваться, экосистема с открытым исходным кодом — это место, где первыми появляются многие из самых интересных стандартов, инструментов и методов.

Эксперты принявшие участия в данном обзоре
  • Эбигейл Кабунок Майес (Abigail Cabunoc Mayes), она же @abbycabs, которая работает над программами сопровождения открытого кода и занимает должность директора в фонде OpenJS.

  • Кара Соулс, она же @karasowles, которая работает с сопровождающими и сообществом разработчиков открытого кода

  • Кевин Кросби (Kevin Crosby), он же @kevincrosby, руководит программой GitHub по финансированию открытых исходников

  • Джефф Лущ (Jeff Luszcz), он же @jeffrey-luszcz, который помогает управлять программным офисом GitHub по работе с открытым исходным кодом (OSPO).

Если вы нашли ошибку, опечатку или у вас есть замечание по переводу — используйте, пожалуйста, Ctrl+Enter. Спасибо.

© Habrahabr.ru