Как обрабатывать терабайты данных в 1000 потоков на PHP — Hadoop/MapReduce02.04.2014 18:18

Всем привет! Уже слышали про Bigdata? Ну да, веб растет, данных становится больше и их нужно держать под контролем и периодически анализировать. Базы данных — лопаются под нагрузкой, реляционная теория не совсем справляется с задачей, нужно решение. Маркетинг активно давит сверху, а железо острыми углами — снизу и попахивает суицидом. В этом посте постараюсь дать конкретные работающие рецепты и куски кода с краткими теоретическими выводами, как же обрабатывать >=терабайты в >=1000 потоков на PHP. Чтобы можно быть взять и решить задачу, не теряя времени и не забивая голову теорией. Однако, если вдруг стало подташнивать и закружилась голова, можно дальше не читать —, а полюбоваться на прекрасных птичек и забыть о вышенаписанном. Но будьте на чеку, Bigdata может завтра взять и постучатся в дверь ;-)Читать дальше →