Dremel. Как Google считает в real-time?
Dremel — масштабируемая система обработки запросов в режиме близком к режиму реального времени (near-real-time), предназначенная для анализа неизменяемых данных [4]. Авторы research paper [4] (среди которых, судя по всему, и наши соотечественники — Сергей Мельник и Андрей Губарев), в котором описываются базовые принципы и архитектура Dremel, заявляют, что система в силах: выполнять агрегирующие запросы над боле чем над триллионом строк за секунды; масштабируется на тысячи CPU; предназначена для работы с петабайтами данных; имеет тысячи пользователей внутри Google (дословно «at Google» [4]). Читать дальше →