DevOps

Инженер сопровождения инфраструктуры L3 (SRE) Full-time

О компании и команде

Мы делаем ИТ для ритейла реального времени.

Наши ИТ-продукты автоматизируют разные этапы цепочки создания ценности для клиента доставки: закупки, логистику, работу дарксторов, сборку и доставку заказа до двери, управление промокампаниями и остальные этапы большого процесса. Используем интеллектуальные системы прогнозирования, а разные этапы выполнения заказа автоматизируем роботическими системами.

Наши ключевые направления: Быстрая доставка, Маркетплейс, Логистика.

Наша цель — сделать все необходимые ИТ-инструменты и инфраструктуру, чтобы все нужные товары могли попадать домой к людям мгновенно (насколько это возможно в физическом мире).

Мы ищем инженера сопровождения в команду Observability & Reliability. Команда отвечает за стабильность работы наших сервисов. 

Ожидания от кандидата

  • Поддержка, анализ и частично внедрение процессов и инструментов для обеспечения высокой доступности и производительности систем;
  • Работа с алертами. Установление причины возникновения алерта, при возможности устранение алерта. Действовать согласно ранбукам и инструкциям, разработка инструкций по алертам.
  • Реагирование на инциденты, оперативно их решать, опираясь на компетенции и инструкции, по необходимости эскалировать проблему команде эксплуатации или разработчикам;
  • Разработка и поддержка актуальность документации: регламентов, инструкций, FAQ и пр.;
  • Диагностика и помощь в решении проблем возникающий у разработчиков. Привлечение профильных команд эксплуатации, в целях решения проблемы;
  • Работа с логами (уметь работать с маппингом в стеке ELK);
  • Работа с метриками (grafana). Создание и работа с dashboard, alerts, notification policies, silences и др. Создание дашбордов, триггеров, хостгрупп, сайлентсов и пр. (zabbix).
От успешного соискателя мы ожиданием:
  • Базовых знаний или опыта работы с системами логирования и трассировки логов (например: ELK stack, Graylog, Logstash, etc.);
  • Базовых знаний или опыта работы с инструментами мониторинга (например: Prometheus, Grafana, Zabbix, VictoriaMetrics, etc.);
  • Опыта работы с Linux-based операционными системами на уровне системного администратора (чтение и парсинг логов, регулярные выражения, понимание процессов на уровне файловой системы);
  • Знание стека TCP/IP.
Будет плюсом:
  • Опыт работы с инструментами Atlassian, такими как Jira/Confluence;
  • Базовые знания или опыт работы с такими инструментами как Sentry, Tempo, APM, Docker, Kubernetes, Helm, Vault, Kafka, Clickhouse, Ansible, Gitlab/Gitlab CI, etc.;
  • Базовые знания опыт работы с базами данных (например PostgreSQL, MongoDB, MySQL, ClickHouse, Couchbase, etc.);
  • Опыт написания одного из скриптового языка программирования (Bash, Python, Go).

Условия работы

Все классические условия, с запасом

Мы аккредитованная IT-компания с сопутствующими преимуществами. У нас белая зарплата, ДМС и страховка, разнообразное обучение, оплата участия в конференциях, скидки от партнеров и все классические плюшки.

Вайб

  • Делаем продукты – понятные, оставляющие след в реальном мире, помогающие создавать клиентский опыт, которым пользуемся сами. Круассан из Самоката, наушники из Мегамаркета с доставкой по клику – с помощью наших решений.
  • Считаем, что не знать, как правильно и пробовать – это ок. Умеем ошибаться, учиться на ошибках, развиваться.
  • Работаем откуда угодно в России.
  • Ценим простоту общения. Чтобы можно было задать вопрос любому коллеге (от самого главного босса до вообще любого человека из любой команды), получить прямой ответ.
  • По умолчанию на “ты”. Уважаем коллег, стремимся к дружелюбию и доброжелательности. Не приемлем токсичность ни при каких обстоятельствах.
  • Умеем меняться – пересобирать оргструктуру, менять подходы к разработке, обновлять продуктовый и технологический фокус – быть стабильными в росте, не разваливаться, избегать неповоротливости.
  • Мы большие и разные: в технологиях, подходах, людях. Найдёшь у нас коллег, близких по духу и интересам.

Overview

  • Employer: Ecom.tech
  • Job Title: Инженер сопровождения инфраструктуры L3 (SRE)
  • Published: 3 months, 3 weeks ago
Apply For This Job