Вы понимаете Hadoop неправильно
— Мы получаем больше миллиона твитов в день, и наш сервер просто не успевает их обрабатывать. Поэтому мы хотим установить на кластер Hadoop и распределить обработку. Речь шла о вычислительно тяжёлом сентиментном анализе, поэтому я мог поверить, что у одного сервера действительно не хватает CPU, чтобы справиться с большим потоком твитов. — А что вы собираетесь делать с уже обработанными данными? — Скорее всего, мы будем складывать их в MySQL, как делали это раньше, или даже удалять. — Тогда вам определённо не нужен Hadoop. Мой бывший коллега был далеко не первым, кто говорил про распределённые вычисления на Hadoop. И каждый раз я видел полное непонимание того, зачем была придумана и разработана эта платформа. Читать дальше →