Бизнес не определился с термином «большие данные»

Что являют собой большие данные — новый этап в развитии технологий хранения и обработки информации или же маркетинговый ход, — обсуждается сегодня очень активно. Это подтвердила и прошедшая 4 июня 2014 г. конференция «Big Data — технология будущего», организованная CNews Conferences и CNews Analytics. Вопрос, что считать большими данными, нашел самый большой отклик аудитории, но так и остался открытым.

Для отнесения технологий к стеку больших данных Gartner требует соблюдения трех условий: большого объема, высокой скорости обработки и разнообразия данных — volume, velocity, variety (знаменитые три «V»). Но участников конференции не удовлетворило классическое определение. При обсуждении ряда реализованных российских проектов они так и не пришли к единому мнению, в каких случаях примененные подходы и инструменты можно отнести к технологиям больших данных, а в каких — нельзя. «Мы столкнулись с большими данными и начали с ними работать очень давно, еще в 2002 году, когда и термина такого не было. Наверное, поэтому мы его не очень любим, — поделился Александр Горный, директор по информационным технологиям Mail.Ru Group. — Ни с появлением Hadoop, ни с популяризацией термина «большие данные» в нашей стратегии работы с данными ничего принципиально не поменялось», — отметил он.

Российский рынок больших данных находится на начальной стадии формирования, идут первые пилотные проекты, до массового применения технологий дело еще не дошло. Первые истории успеха весьма любопытны. Уникальный проектный опыт был представлен на конференции, например, Алексеем Бедновым, архитектором Big Data-решений AT Consulting, и Виктором Булгаковым, руководителем департамента управленческой информации компании «Вымпелком». Эксперты осветили вопросы использования технологий больших данных в телеком-операторе для решения различных задач, как например: определение внутреннего оттока абонентов, фильтрация SMS-спама, повышение качества обслуживания клиентов, построение карт перемещения абонентов. Еще один кейс озвучил Дмитрий Буканов, директор по ИТ компании «Коттон Вэй». Он рассказал, как индустриальная прачечная оптимизирует деятельность при помощи анализа данных RFID-меток и отзывов в социальных сетях.

Технологии больших данных изначально зародились в интернет-бизнесе. Возможности антиспама и таргетинга делают большие данные по сути бизнесообразующими для компаний, имеющих «прописку» в глобальной сети. Среди крупных интернет-проектов — Mail.Ru, Avito, «ВебТВ» и Wikimart. Мысль, буквально висевшую в воздухе, транслировал Александр Аникин, руководитель аналитического отдела Wikimart (компания использует Hadoop). «Большие данные придумали вендоры, чтобы продать BI тем, кто еще не купил, а если уже купил, то чтобы продать во второй раз», — заключил спикер. Однако очевидно — и с этим фактом согласились все присутствующие, — что новые технологии дали возможность анализировать данные, которые до недавнего времени было невозможно обрабатывать за приемлемые деньги и в сжатые сроки.

©  CNews