Работа с потоком логов в реальном времени с помощью Heka. Опыт Яндекс.Денег

0778c018e0944f44a18a0cbc876feaf3.png

Комментарии (1)

  • 11 мая 2017 в 12:29

    0

    Уже много лет проводим тесты по вопросу как быстрее парсить логи регэкспом. И много лет побеждает perl. Он создан для регулярок все таки. У нас объем меньше вашего, но и парсим мы только логи nginx.
    Ansible проследит что бы везде был одинаковый формат. Syslog-ng направит поток из файла логов nginx на stdin парсера.
    150 тысяч записей лога в минуту (многострочные данные мы считаем за одну запись) — в сумме со всех серверов дает <10%CPU нагрузки.

© Habrahabr.ru