OpenAI представила новые модели GPT-4.1: как они изменят кодинг

OpenAI изображения
Новые модели пригодятся для кодингаИсточник: OpenAI

OpenAI представила три новые модели: GPT-4.1, GPT-4.1 mini и GPT-4.1 nano. Все они превосходят предыдущие версии по ключевым параметрам, особенно в области программирования.

Флагманская модель GPT-4.1 демонстрирует впечатляющие результаты в кодинге. На бенчмарке SWE-bench Verified она решает 54,6% задач, что на 21,4% больше, чем GPT-4o. Это делает ее лидером среди моделей для программирования.

график сравнения моделей OpenAI
Сравнение GPT-4.1Источник: OpenAI

Главное преимущество новых моделей — способность обрабатывать до миллиона токенов контекста. Для сравнения: это объем, эквивалентный восьми полным копиям кодовой базы React. Такая возможность позволяет анализировать большие проекты целиком.

Как рассказал Hi-Tech Mail Игорь Трунин, сооснователь Telegram-бота Whisper Summary AI, обновление понравится пользователям, которым важны скорость, цена, а также возможность работы с большим объемом данных без потерь.

Во-первых, наконец-то можно всерьез работать с длинным контекстом: окно в миллион токенов, и модель при этом не «плывет» и не теряет детали. Это огромный плюс для задач вроде обработки длинных документов, логов или кода Во-вторых, приятно удивляет цена — OpenAI явно хочет привлечь разработчиков, и делает это грамотно: быстро, дешево, достаточно умно. Важно и то, что 4.1 слушается инструкций почти как o3-mini, при этом быстрее работает (особенно nano и mini). Конечно, придется мириться с некоторой потерей качества, но для многих утилитарных задач — самое то.AQAKbSnWLwEj2gDVPTVH7A1EyoW_WgLV-kCyPa1M
Игорь Трунин
сооснователь Telegram-бота Whisper Summary AI

Компания Windsurf, тестировавшая GPT-4.1, отметила, что модель на 60% эффективнее GPT-4o при решении задач программирования. Код, созданный с помощью новой модели, чаще принимается с первого раза и требует меньше доработок. Кстати, до 21 апреля GPT-4.1 будет доступна бесплатно в Windsurf.

Особенно впечатляет способность GPT-4.1 создавать фронтенд-приложения. В тестах профессиональные оценщики предпочли сайты, созданные GPT-4.1, в 80% случаев по сравнению с работой GPT-4o. Новая модель генерирует более функциональные и эстетичные веб-интерфейсы.

График сравнения возможностей GPT-4.1
Сравнение GPT-4.1Источник: OpenAI

Важное улучшение — точность следования инструкциям. GPT-4.1 лучше понимает сложные запросы и поддерживает последовательность в многоэтапных разговорах. На бенчмарке MultiChallenge от Scale результат улучшился на 10,5% по сравнению с предыдущей версией.

Компания Blue J, специализирующаяся на налоговом праве, сообщила о 53% росте точности при решении сложных налоговых сценариев с помощью GPT-4.1. А Hex отметила двукратное улучшение при работе со сложными SQL-запросами.

Модель GPT-4.1 mini представляет значительный прорыв в производительности малых моделей. Она соответствует GPT-4o по многим показателям, при этом работает почти вдвое быстрее и стоит на 83% дешевле.

сравнение особенностей GPT-4.1 с другими моделями
Сравнение моделей GPT-4.1Источник: OpenAI

GPT-4.1 nano — самая быстрая и доступная модель в линейке. Несмотря на компактный размер, она показывает высокие результаты в тестах и идеально подходит для задач классификации или автодополнения.

Цены на использование новых моделей снижены. GPT-4.1 стоит на 26% меньше, чем GPT-4o для типичных запросов. Для запросов с повторяющимся контекстом скидка на кэширование увеличена до 75%.

Новые модели GPT-4.1 уже доступны через API для всех разработчиков. OpenAI также начнет постепенно отказываться от GPT-4.5 Preview, поскольку GPT-4.1 предлагает аналогичную или лучшую производительность при меньших затратах и задержках.

Забавный факт: недавно ChatGPT запустили на 16-летнем iPhone 3G, рассказали об этом в статье.

Поделиться

HI-TECH@Mail.Ru прочитано 3560 раз