OpenAI представила новые модели GPT-4.1: как они изменят кодинг

OpenAI представила три новые модели: GPT-4.1, GPT-4.1 mini и GPT-4.1 nano. Все они превосходят предыдущие версии по ключевым параметрам, особенно в области программирования.
Флагманская модель GPT-4.1 демонстрирует впечатляющие результаты в кодинге. На бенчмарке SWE-bench Verified она решает 54,6% задач, что на 21,4% больше, чем GPT-4o. Это делает ее лидером среди моделей для программирования.

Главное преимущество новых моделей — способность обрабатывать до миллиона токенов контекста. Для сравнения: это объем, эквивалентный восьми полным копиям кодовой базы React. Такая возможность позволяет анализировать большие проекты целиком.
Как рассказал Hi-Tech Mail Игорь Трунин, сооснователь Telegram-бота Whisper Summary AI, обновление понравится пользователям, которым важны скорость, цена, а также возможность работы с большим объемом данных без потерь.
Во-первых, наконец-то можно всерьез работать с длинным контекстом: окно в миллион токенов, и модель при этом не «плывет» и не теряет детали. Это огромный плюс для задач вроде обработки длинных документов, логов или кода Во-вторых, приятно удивляет цена — OpenAI явно хочет привлечь разработчиков, и делает это грамотно: быстро, дешево, достаточно умно. Важно и то, что 4.1 слушается инструкций почти как o3-mini, при этом быстрее работает (особенно nano и mini). Конечно, придется мириться с некоторой потерей качества, но для многих утилитарных задач — самое то.Игорь Трунинсооснователь Telegram-бота Whisper Summary AI
Компания Windsurf, тестировавшая GPT-4.1, отметила, что модель на 60% эффективнее GPT-4o при решении задач программирования. Код, созданный с помощью новой модели, чаще принимается с первого раза и требует меньше доработок. Кстати, до 21 апреля GPT-4.1 будет доступна бесплатно в Windsurf.
Особенно впечатляет способность GPT-4.1 создавать фронтенд-приложения. В тестах профессиональные оценщики предпочли сайты, созданные GPT-4.1, в 80% случаев по сравнению с работой GPT-4o. Новая модель генерирует более функциональные и эстетичные веб-интерфейсы.

Важное улучшение — точность следования инструкциям. GPT-4.1 лучше понимает сложные запросы и поддерживает последовательность в многоэтапных разговорах. На бенчмарке MultiChallenge от Scale результат улучшился на 10,5% по сравнению с предыдущей версией.
Компания Blue J, специализирующаяся на налоговом праве, сообщила о 53% росте точности при решении сложных налоговых сценариев с помощью GPT-4.1. А Hex отметила двукратное улучшение при работе со сложными SQL-запросами.
Модель GPT-4.1 mini представляет значительный прорыв в производительности малых моделей. Она соответствует GPT-4o по многим показателям, при этом работает почти вдвое быстрее и стоит на 83% дешевле.

GPT-4.1 nano — самая быстрая и доступная модель в линейке. Несмотря на компактный размер, она показывает высокие результаты в тестах и идеально подходит для задач классификации или автодополнения.
Цены на использование новых моделей снижены. GPT-4.1 стоит на 26% меньше, чем GPT-4o для типичных запросов. Для запросов с повторяющимся контекстом скидка на кэширование увеличена до 75%.
Новые модели GPT-4.1 уже доступны через API для всех разработчиков. OpenAI также начнет постепенно отказываться от GPT-4.5 Preview, поскольку GPT-4.1 предлагает аналогичную или лучшую производительность при меньших затратах и задержках.
Забавный факт: недавно ChatGPT запустили на 16-летнем iPhone 3G, рассказали об этом в статье.
HI-TECH@Mail.Ru прочитано 3560 раз