Сбер открыл бесплатный доступ к инструменту подготовки датасетов

Хорошая новость для разработчиков — мы открыли доступ к программной библиотеке PyTorch-LifeStream, которая содержит несколько алгоритмов построения эмбеддингов событийных данных. Инструмент может быть использован для подготовки различных массивов обезличенных датасетов.

Событийные данные могут представлять собой самые разные последовательности: истории посещений сайтов, покупок, событий в онлайн-играх и так далее. При этом сгенерированный на основе алгоритмов библиотеки эмбеддинг не будет содержать каких-либо персональных данных.  

image-loader.svg

В библиотеке PyTorch-LifeStream мы реализовали уникальный алгоритм применения нейросетевого контрастного обучения к событийным данным, созданный и запатентованный в Лаборатории по искусственному интеллекту Сбера. Кроме того, в ней реализованы методы на основе сторонних научных публикаций, но адаптированные Сбером. 

Подробнее о PyTorch-LifeStream можно узнать из нашего видео.  

Сбер не первый раз делится результатами исследований в области искусственного интеллекта со всеми желающими. Ранее мы вывели в открытый доступ такие библиотеки, как ruGPT-3, LAMA, RePlay, ruDALL-E.

© Habrahabr.ru