Т-Банк презентовал две мощные открытые ИИ-модели: в чем особенность
Группа компаний T-Технологии представила две новые языковые модели — T-Pro с 32 миллиардами параметров и обновленную T-Lite с 7 миллиардами параметров. Эти модели стали мощным инструментом для обработки информации на русском языке, демонстрируя высочайшие показатели на таких отраслевых тестах, как MERA, ruMMLU, MT-Bench и AlpacaEval.
T-Pro обладает значительным числом параметров и выделяется способностью анализировать сложные контексты, извлекать точные данные и адаптироваться к различным задачам. Эта модель не только запоминает больше информации, но и выполняет более сложные вычисления, что делает ее идеальной для крупных бизнес-проектов. Ее можно использовать двумя способами: настраивать под конкретные бизнес-задачи или применять в режиме диалога для решения повседневных задач.
Обновленная версия T-Lite также получила улучшения. Она теперь лучше понимает сложные запросы, генерирует текст, максимально приближенный к человеческому стилю, и отличается логической последовательностью. Модель подходит для различных отраслей, таких как медицина, образование, финансы и ритейл, где требуется высокая точность ответов и креативный подход к задачам.
T-Банк сделал доступ к моделям бесплатным для всех, разместив их на платформе Hugging Face с лицензией Apache 2.0. Это означает, что любой бизнес, вне зависимости от размера, может использовать их для создания инновационных решений. Например, такие модели могут стать основой для интеллектуальных чат-ботов, способных вести диалог с клиентами без строгих скриптов.
T-Технологии объясняют свой успех особым подходом к обучению. Они используют стратегию continual-pretraining и general alignment, что позволяет улучшать открытые языковые модели, добавляя знания и навыки, необходимые для русскоязычной аудитории. В отличие от полного обучения с нуля, этот подход экономит ресурсы и обеспечивает качественный результат.
Однако даже лучшие языковые модели имеют свои ограничения. Например, обе модели оптимизированы для обработки текстов длиной до 8 тысяч токенов. В будущем компания планирует улучшить их возможности и добавить функции, такие как вызов инструментов. T-Lite станет отличным выбором для базовых задач, а T-Pro подойдет для сложных бизнес-кейсов, которые требуют высокой производительности.
ИИ-модели от Т-Банк — не единственные новинки этого месяца в сфере нейротехнологий. Ранее OpenAI открыла доступ к своей флагманской нейронке для генерации видео Sora.