Сбер открыл бесплатный доступ к инструменту подготовки датасетов
Хорошая новость для разработчиков — мы открыли доступ к программной библиотеке PyTorch-LifeStream, которая содержит несколько алгоритмов построения эмбеддингов событийных данных. Инструмент может быть использован для подготовки различных массивов обезличенных датасетов.
Событийные данные могут представлять собой самые разные последовательности: истории посещений сайтов, покупок, событий в онлайн-играх и так далее. При этом сгенерированный на основе алгоритмов библиотеки эмбеддинг не будет содержать каких-либо персональных данных.
В библиотеке PyTorch-LifeStream мы реализовали уникальный алгоритм применения нейросетевого контрастного обучения к событийным данным, созданный и запатентованный в Лаборатории по искусственному интеллекту Сбера. Кроме того, в ней реализованы методы на основе сторонних научных публикаций, но адаптированные Сбером.
Подробнее о PyTorch-LifeStream можно узнать из нашего видео.
Сбер не первый раз делится результатами исследований в области искусственного интеллекта со всеми желающими. Ранее мы вывели в открытый доступ такие библиотеки, как ruGPT-3, LAMA, RePlay, ruDALL-E.