DevOps

Инженер по обеспечению доступности систем / SRE Full-time

О компании и команде

Cloud.ru — провайдер облачных технологий. Один из лидеров рынка облачных сервисов по моделям IaaS и PaaS для физлиц, стартапов, малого, среднего, крупного бизнеса и корпораций.

Сейчас мы ищем Инженер по обеспечению доступности систем в платформу Evolution

Задачи:

  • Отвечать за доступность IaaS-платформы и развернутых на ней приложений, оперативно устранять инфраструктурные инциденты;
  • Обеспечивать обновление платформы, весь деплой должен быть покрыт тестами с возможностью отката всех внесенных изменений;
  • Организовать качественный мониторинг и алертинг инфраструктуры и приложений;
  • Быть активным участником процессов инцидент и проблем менеджмента (включая участие в устранении аварий, стабилизации систем после дизастера и выполнения действий, запланированных в рамках постмортема), выполненять работы по запросам пользователей;
  • Планировать и выполнять работы по запросам на изменение, а также регламентных работ направленных на предотвращение угроз деградации/прерывания сервисов;
  • Осуществлять контроль доступных мощностей, подготавливать предложения по увеличению мощностей;
  • Участвовать в проектах, внедрять, согласовывать и актуализировать эксплуатационную документацию;
  • Подготавливать технические требования в случаях необходимости модернизации инфраструктуры;
  • Проводить DR тесты согласно DRP, согласовывать изменения Продукта (изменение архитектуры, дизайна, масштабирование), оценивать риски и целесообразность изменений.

Ожидания от кандидата

Вы нам подходите, если вы:

  • Имеете опыт работы в качестве DevOps/SRE не менее 2-х лет;
  • Понимаете устройство ядра Linux, его модулей, а также процессов управления потоками, задачами, памятью;
  • Имеете опыт работы с Docker;
  • Имеете опыт работы с libvirt/qemu;
  • Пишете на Python/Bash на уровне Junior+;
  • Хорошо ориентируетесь в сборе метрик процессов, обработке логов и настройке алертинга, желательный стэк: Prometheus, Grafana, ELK/EFK;
  • Имеете опыт работы с различными opensource-системами;
  • Имеете хорошие знания в области сетевых технологий.

Будет плюсом, если вы:

  • Проектировали высоко-нагруженные, масштабируемые и отказоустойчивые сервисы (монолитные или микросервисные);
  • Обладаете знаниями в архитектуре OpenStack и имеете успешный опыт деплоя и эксплуатации платформы;
  • Знаете и умеете использовать Terraform и Ansible;
  • Имеете опыт работы с K8s;
  • Имеете опыт работы с openvswitch;
  • Имеете желание развивать свои профессиональные умения и накапливать опыт.

Условия работы

Что мы предлагаем:

  • Участие в создании инновационных продуктов;
  • Оформление по ТК РФ и “белая” зарплата;
  • Конкурентный уровень дохода (оклад, который мы обсудим по итогам собеседования + годовой бонус);
  • Офис в центре Москвы, коворкинг в Питере или возможность работать полностью удаленно на территории РФ;
  • Гибкое начало рабочего дня и сокращенный рабочий день в пятницу;
  • Льготную программу ипотечного и потребительского кредитования.
  • ДМС со стоматологией и возможностью льготного подключения к программе своих детей и родственников;
  • Прозрачную систему мотивации, которая позволяет влиять на уровень дохода;
  • Работу в команде профессионалов;
  • Возможность вертикального и горизонтального роста.

Бонусы

  • Бонусные программы от компаний партнёров;
  • Реферальная программа, бонусы за рекомендации кандидатов на открытые вакансии;
  • Материальная помощь при рождении детей и других семейных обстоятельствах;
  • Обучение в корпоративном университете;
  • Возможность участвовать в профильных конференциях в качестве спикера или слушателя;
  • Корпоративная жизнь: спортивные комьюнити, клубы по интересам (например, настолки, интеллектуальные игры, велоклуб и многие другие).

Overview

  • Employer: Cloud.ru
  • Job Title: Инженер по обеспечению доступности систем / SRE
  • Published: 6 months ago
Apply For This Job