«ИВК Сонет»: обработка неформализованных текстов
Компания ИВК, российский производитель компьютерной техники, системообразующего ПО и средств защиты информации, объявляет о завершении разработки и начале продвижения на российский рынок нового программного продукта — информационно-аналитической системы обработки неформализованных естественных текстов «ИВК Сонет».Эта система позволяет создавать решения промышленного уровня для сбора, систематизации и анализа неструктурированной текстовой информации, полученной из всевозможных источников, включая информационные веб-ресурсы. В итоге, возрастает оперативность, точность и обоснованность решения таких задач, как глубокое изучение рынка, анализ действий конкурентов, идентификация информационных кампаний, выявление тенденций и как результат – принятие требуемых управленческих решений.
Система «ИВК Сонет » базируется на собственных технологиях и разработках ИВК в области лингвистической обработки неструктурированной информации, морфологического и синтаксического анализа текстов на русском языке. Отдельные технологии, вошедшие в «ИВК Сонет», в течение ряда лет прошли всестороннюю проверку в реальных системах обработки информации, относящейся к столь разным предметным областям, как чрезвычайные ситуации, спорт, нефтяной комплекс, судебная система, гуманитарная сфера и др.
Вместе с тем, при создании этого программного продукта данные технологии были оптимизированы по функциональности и производительности, а также интегрированы в единый комплекс инструментов для сбора и консолидации информации из различных источников, решения всевозможных задач по анализу собранного массива текстов, а также настройки системы на новые предметные области. Благодаря интуитивно понятному интерфейсу «ИВК Сонет» для работы с ней требуется минимальное обучение.
Подчеркнем, что вошедший в «ИВК Сонет» набор функций достаточен для поддержки работы аналитика над задачами, критически важными практически для любой организации.
В целом, «ИВК Сонет» включает средства сбора и консолидации информации, инструменты фильтрации и поиска, а также 3 вида аналитической обработки: классификация, кластеризация и контент-анализ.
Встроенные средства и специальные программы-конверторы позволяют автоматически заносить в базу данных системы сообщения в наиболее распространенных форматах, включая .TXT, .HTML, .XML, .RTF, .DOC, E-MAIL и др. При этом система унифицирует формат полученной информации, проводит полнотекстовое индексирование сообщений, а также классификацию входного потока с использованием средств морфологического и синтаксического анализа.
В перспективе ИВК планирует дальнейшее развитие комплекса «ИВК Сонет». В ближайших планах - внедрение функции тонального анализа, позволяющего выявлять сообщения с положительной, нейтральной и негативной эмоциональной окраской. Затем в систему будут включены функции создания семантической сети терминов, окружающих изучаемый объект, а также установления возможных транзитивных связей между объектами.
Кроме того, компания планирует интегрировать систему «ИВК Сонет» в среду «ИВК Юпитер», что расширит возможности анализа территориально-распределенных массивов текстовой информации, разграничения доступа к данным «ИВК Сонет», безопасного обмена информацией между аналитиками и потребителями их услуг.
© CNews