ИИ-технологии Сбера выложили в открытый доступ

Команда Сбербанка сообщила, что в открытом доступе появились базовая и инструктивная версии самой быстрой модели GigaChat Lite и самая сильная, согласно бенчмарку ruMTEB, модель на русском языке GigaEmbeddings-instruct. 

ИИ-технологии Сбера выложили в открытый доступСгенерировано нейросетью Dall-E

Также большое обновление получило семейство open-source моделей машинного обучения для распознавания речи и эмоций GigaAM (Giga Acoustic Model). Об этом рассказал технический директор GigaChat Федор Минькин на международной конференции AI Journey («Путешествие в мир искусственного интеллекта»).

В новой версии акустических моделей GigaAM улучшены подготовка данных и технология предобучения базовой модели. За счёт этого удалось значительно снизить количество ошибок в словах (Word Error Rate) при распознавании русскоязычных запросов.  Для самой сильной модели семейства GigaAM-RNNT этот показатель улучшен на 25% относительно предыдущей версии и на 56% превосходит OpenAI-Whisper-large-v3.

Обновлённая линейка моделей GigaAM поддерживает дообучение и инференс с Flash Attention, что дает существенное ускорение на современных видеокартах. Для повышения доступности использования моделей команда упростила код, снизила число зависимостей и подготовила конвертацию в формат ONNX (открытая библиотека программного обеспечения). Новые модели публикуются с лицензией MIT, что допускает их коммерческое использование.

©  iXBT