Bloomberg выпустило чат-бота для финансового рынка BloombergGPT

Агентство Bloomberg представило чат-бота BloombergGPT. Это большая языковая модель с 50 млрд параметров, созданная для финансового рынка. Модель обучена работе с широким спектром данных и поддерживает выполнение разнообразных задач обработки естественного языка в финансовой отрасли.

Bloomberg Terminal / RICHARD LEVINE / GETTY IMAGES

Bloomberg Terminal / RICHARD LEVINE / GETTY IMAGES

BloombergGPT поможет агентству с анализом настроений, распознаванием именованных сущностей, классификацией новостей и ответами на вопросы. Кроме того, чат-бот откроет новые возможности для упорядочения огромных объёмов данных, доступных в Bloomberg Terminal (службе подписки с несколькими уровнями надстроек, предназначенных для помощи в инвестировании, управлении активами или финансами), чтобы лучше помогать клиентам агентства.

Исследователи Bloomberg первыми применили смешанный подход, сочетающий финансовые данные с наборами данных общего назначения, для обучения своей модели. Группа по продуктам и исследованиям машинного обучения сотрудничала с командой инженеров искусственного интеллекта, чтобы создать один из крупнейших наборов данных для предметной области. 

Разработчики использовали данные, которые аналитики Bloomberg собирали и хранили в течение 40 лет. Это позволило создать набор из 363 млрд токенов, состоящий из финансовых документов на английском языке. Его дополнили общедоступным набором данных на 345 млрд токенов для создания большого обучающего корпуса с более чем 700 млрд токенов. 

С помощью части этого корпуса команда обучила каузальную языковую модель с 50 млрд параметров, предназначенную только для декодера. Её проверили на существующих финансовых тестах NLP (Natural Language Processing), наборе внутренних тестов Bloomberg и широких категориях задач NLP общего назначения из популярных тестов (например, BIG-bench Hard, оценки знаний, понимания прочитанного и лингвистических задач).

Bloomberg

Bloomberg

Разработчики отмечают, что модель BloombergGPT превосходит существующие открытые модели аналогичного размера в финансовых задачах с большим отрывом, но при этом работает на уровне или лучше в общих тестах NLP.

Подробнее о разработке модели можно прочитать здесь.

Между тем Microsoft представила сервис на базе GPT-4 для киберзащиты IT-инфраструктуры корпоративных клиентов под названием Security Copilot. Чат-бот способен распознавать кибератаки на компанию даже при отсутствии их явных признаков. Security Copilot будет помогать сотрудникам в компаниях, чтобы они смогли оперативно противодействовать хакерам.

© Habrahabr.ru