Сбер открыл бесплатный доступ к инструменту подготовки датасетов

Блог компании Сбер Big Data Машинное обучение Искусственный интеллект
Хорошая новость для разработчиков — мы открыли доступ к программной библиотеке PyTorch-LifeStream , которая содержит несколько алгоритмов построения эмбеддингов событийных данных. Инструмент может быть использован для подготовки различных массивов обезличенных датасетов. Событийные данные могут представлять собой самые разные последовательности: истории посещений сайтов, покупок, событий в онлайн-играх и так далее. При этом сгенерированный на основе алгоритмов библиотеки эмбеддинг не будет содержать каких-либо персональных данных.   В библиотеке PyTorch-LifeStream мы реализовали уникальный алгоритм применения нейросетевого контрастного обучения к событийным данным, созданный и запатентованный в Лаборатории по искусственному интеллекту Сбера. Кроме того, в ней реализованы методы на основе сторонних научных публикаций, но адаптированные Сбером.  Подробнее о PyTorch-LifeStream можно узнать из нашего видео.   Сбер не первый раз делится результатами исследований в области искусственного интеллекта со всеми желающими. Ранее мы вывели в открытый доступ такие библиотеки, как ruGPT-3, LAMA, RePlay, ruDALL-E.)
Теги:
Хабы: