DevOps

Ведущий специалист систем мониторинга (observability-инженер) Full-time

О компании и команде

Мы создаем единую распределенную систему масштаба страны, которая преобразит опыт совершения покупок, а именно позволит "оцифровать" каждую единицу товара уже к 2025 году.

Это позволит каждому покупателю быть уверенным в качестве и происхождении товара, а производителям и продавцам - не только уменьшить долю неоригинальной продукции на рынке, но и оптимизировать производственно-логистические процессы и сократить издержки за счет возможностей аналитической подсистемы. Уже сейчас система обрабатывает миллиарды транзакций ежедневно и оперирует петабайтами данных на скоростях десятки тысяч запросов в секунду.

О мониторинге:

Сама система мониторинга в настоящее время строится на стеке: Kubernetes, Prometheus + Victoria metrics; Clickhouse; ELK; Graylog; Grafana. Обрабатываем до 1 млн. метрик в секунду. Обрабатываем логов до 180 000 лог сообщений в секунду. Наша задача построить и развивать централизованную систему мониторинга, включающую в себя мониторинг инфраструктуры (ЦОД) и нескольких высоконагруженных информационных систем.

Ожидания от кандидата

Чем предстоит заниматься:

Построение, внедрение и развитие высоконагруженных многокомпонентных систем мониторинга:

  • Постановка на мониторинг инфраструктуры, приложений и бизнес показателей. Для всех стендов, включая разработку и тестирование;
  • Развитие централизованной системы мониторинга;
  • Создание и маршрутизация оповещений, включая предиктивную аналитику;
  • Консультации разработчиков по созданию метрик и сущностей мониторинга(сервис мониторы);
  • Интеграция систем мониторинга с другими системами компании;
  • Автоматизация процессов мониторинга;
  • Создание и построение комплексных экранов систем мониторинга;
  • Внедрение CI/CD для компонентов мониторинга;
  • Разработка системы логирования для приложений;
  • Обеспечение отказоустойчивости и быстродействия создаваемой системы;
  • Разработка приложений для нужд мониторинга в случаях, когда готового решения не существует.

От успешного кандидата мы ожидаем:

  • Опыт работы с Kubernetes (уверенный пользователь, опыт в развертывании и обслуживании будет большим плюсом);
  • Опыт администрирования ОС семейства Linux (Debian-based);
  • Знания устройства и принципов работы docker;
  • Опыт в работе с SQL; умение писать простые запросы; понимание, для чего нужны JOIN;
  • Опыт внедрения и построения многокомпонентных систем мониторинга(Prometheus-like стек, VictoriaMetrics,  Graylog,  Zabbix);
  • Опыт поддержки высоконагруженных систем мониторинга;
  • Опыт настройки и администрирования Grafana, ELK, Prometheus;
  • Знание скриптовых языков, Python, Bash, знание ЯП будет большим плюсом;
  • Умение читать и понимать чужой код (В основном Python, Go. Плюсом будет Java);
  • Опыт работы с системами виртуализации и Linux-контейнерами;
  • Опыт в работе с Helm (написание простых чартов, понимание принципов работы helm-template);
  • Уверенный пользователь систем версионирования кода (Предпочтительно Git);
  • Опыт работы с Gitlab CI;
  • Умение работать с системами управления автоматического развертывания конфигураций (Предпочтительно Ansible).

Условия работы

Что вам точно понравится:

  • Сложные и интересные задачи, работа с современным востребованным стеком;
  • Экспертная, увлеченная и талантливая команда, у которой можно многому научиться, культура открытости и взаимопомощи;
  • Конкурентная ЗП, оформление по ТК РФ;
  • ДМС со стоматологией после испытательного срока, ДМС для семьи с корпоративными скидками;
  • Страхование жизни и здоровья;
  • Предоставляем всю необходимую технику для работы;
  • Возможность работать удаленно/частично удаленно;
  • “Кафетерий” льгот (возмещение расходов на любое самообразование, спорт, ДМС для членов семьи, доступ к ИТ сервисам и т.д).

Overview

  • Job Title: Ведущий специалист систем мониторинга (observability-инженер)
  • Published: 1 month, 4 weeks ago
Apply For This Job