«Ай-Теко» создала платформу для семантической обработки текстовой информации из соцмедиа

Компания «Ай-Теко» объявила о запуске платформы »2Толк», создаваемой в рамках проекта инновационного центра «Сколково». Комплекс будет использоваться в системах аналитической разведки информационного пространства для исследования событий, проблем, информационных кампаний путем мониторинга интернет-ресурсов.

Целью данной разработки стало предоставление аналитикам средств для быстрого выделения знаний из множества разнородных источников текста. Подобные исследования сейчас ведутся в активно развивающемся проекте Knowledge Discovery and Dissemination (KDD), DARPA. Предтечей нового продукта явились методы и технологии, реализованные «Ай-Теко» в системе «Аналитический курьер», рассказали в компании.

Создаваемые специалистами компании облачные сервисы »2Толк» будут применяться для мониторинга веб-ресурсов, highload-обработки текста на нескольких языках, включающей анализ сущностей, их связей, мнений, тональности высказываний, социального графа авторов и сообществ. Программный компонент для хранения документов и знаний использует Open Source-платформы Big Data.

Среди особенностей проекта в «Ай-Теко» отметили поддержку: управляемых данными гибких сценариев аналитической обработки результатов поиска, когнитивных карт, персональных рубрикаторов, конструкторов инфопанелей и отчетов (сценарий может включать последовательное применение методов Text & Data Mining к коллекциям документов, полученным на предыдущих этапах); персонализации поисковой выдачи с учетом профиля и истории работы пользователей; извлечения и представления знаний в открытых форматах; полного цикла обработки сообщений — от поиска в источниках и доставки до получения полезных результатов; онлайн-процессов семантического агрегирования всех сущностей до доминант синсетов в кластерных, когнитивных картах, частотных распределениях и рефератах (например, в частотном распределении будет выполняться объединение категорий из одного синсета (набора именований объекта) в одну категорию); обеспечения чувствительности всех результатов к изменениям в составе базы знаний в режиме Near real-time.

«Появление огромных объемов контента увеличивает спрос на «осмысление» естественного языка в системах поддержки принятия решений и мониторинга социальных медиа, в когнитивных приложениях. Для удовлетворения непрерывно растущих потребностей рынка нами было принято решение о создании на основе результатов внедрений «Аналитического курьера» нового продукта — программно-технологической платформы »2Толк» для семантической обработки больших объемов текстовой информации из соцсетей в инновационном центре «Сколково», — рассказал Сергей Киселев, директор департамента систем управления знаниями компании «Ай-Теко». — Хочу отметить, что на базе сервисов »2Толк» предполагается разработка приложений для различных областей, а предоставление полученных с помощью комплекса знаний будет соответствовать открытым международным стандартам».

©  CNews