DevOps

Старший системный администратор Cloud duty (General Incident Commander) Full-time

О компании и команде

Облако Selectel представляет собой широкий набор микросервисов и подсистем, слаженная работа которых позволяет эффективно управлять виртуальными машинами, кластерами Kubernetes, базами данных и другими объектами.

Дежурная служба отвечает за бесперебойную доступность Облака, обрабатывая сообщения системы мониторинга и помогая коллегам с технически сложными задачами.

Ищем технического лидера в Дежурную службу. В его задачи будет входить организация процессов решения критичных инцидентов, анализ происшествий, сбор дополнительных технических данных, а также организация работы между смежными отделами для того, чтобы предотвратить повторное происшествие в будущем, выстраивание сотруднических отношений и процессов взаимодействия команд и стейкхолдеров, постановка и контроль выполнения рабочих задач, а также повышение технической экспертизы текущих сотрудников дежурной службы.         

Ожидания от кандидата

Желательные требования к кандидату

  • Опыт работы с проектом OpenStack, его экосистемой и инфраструктурой для работы с ним.
  • Опыт работы с виртуализацией на базе libvirt/QEMU/KVM
  • Опыт работы с MySQL Galera Cluster, Redis, RabbitMQ, Memcached
  • Опыт разработки скриптов автоматизации на bash/Python/Go
  • Хорошее владение любой системой сбора и визуализации метрик
  • Знание методологий, таких как ITIL, для эффективного управления задачами
  • Опыт управления командой, включая мотивацию, делегирование и разрешение конфликтов.
  • Владение английским на уровне, достаточном для чтения документации.

Обязанности
  • Изучать и анализировать инциденты, чтобы понять их причины и предложить улучшения.
  • Взаимодействовать с командами разработки и технической поддержки для решения инцидентов.
  • Организовывать и проводить анализ после завершения инцидентов.
  • Предоставлять разработчикам информацию о проблемах и предложениях по улучшению продуктов.
  • Участвовать в планировании и принятии решений по развитию облачной платформы.
  • Подготавливать отчеты о происшествиях, предоставлять информацию о решениях.
  • Обеспечивать эффективную связь с клиентами и внутренними командами.
  • Помогать коллегам из смежных отделов.
  • Диагностировать и устранять проблемы в работе инфраструктуры и сетевой связности.
  • Разрабатывать и администрировать средства автоматизации для ускорения реакции на инциденты и их решения.
  • Повышать техническую экспертизу сотрудников дежурной службы.
  • Улучшать процессы мониторинга и реагирования на события, которые могут повлиять на доступность облака.
  • Создавать и обновлять регламенты и инструкции для работы, актуализировать документацию.
Требования
  • Хорошие навыки работы с Linux системами на уровне администратора
  • Понимание базовых принципов работы сетей: стандартные протоколы и их применение, алгоритмы балансировки, технологии обеспечения High Availability.
  • Опыт работы с High Availability системами или инфраструктурой публичного продукта в сфере телекоммуникаций или хостинга
  • Умение анализировать технические данные и выявлять корневые причины проблем
  • Отличные навыки коммуникации для взаимодействия со смежными отделами и стейкхолдерами, умение аргументировано доносить свою позицию
  • Умение строить сотруднические отношения и эффективно взаимодействовать с разными людьми.
  • Умение планировать и контролировать рабочие задачи.
  • Способность управлять временем и приоритетами.
  • Опыт работы в распределенной команде или в удалённом режиме.
  • Эмпатия и способность вдохновлять команду.

Условия работы

  • Оформление в официально аккредитованную IT-компанию
  • Белая заработная плата
  • Годовая премия по результатам работы до 15% от суммарного оклада за 12 месяцев
  • 30 000 бонусных рублей на услуги компании ежегодно
  • Релокационный бонус при переезде
  • Бесплатные обеды и кофе-брейки
  • Офис в Санкт-Петербурге, 10 минут пешком от м. Московские ворота, своя парковка (и для велосипедов тоже)

Бонусы

  • Ежемесячная надбавка за некурение
  • ДМС + стоматология + офисный врач*
  • Доступ к психологическим консультациям: онлайн, в офисе или кабинете психолога
  • 50% оплата абонемента в фитнес-клуб
  • Спортивные мероприятия (турниры по пейнтболу, картингу, «Гонка героев», киберспорт)
  • Аренда залов для футбола на газоне, пляжного волейбола, йога в офисе
  • Офисный душ
  • От 50% до 100% оплаты обучения английскому, 50% — испанскому, еженедельные бесплатные разговорные клубы с носителями английского языка
  • Внутренние обмены знаниями: lightning & thunder talks
  • Персонализированный план обучения, возможность участия в конференциях по всему миру
  • Онлайн-библиотека Alpina Digital
  • Образовательные мероприятия (мастер-классы, лекции про вселенную или по психологии, квизы и многое другое)
  • PlayStation VR zone, кикер и настольный тенниc

Overview

  • Employer: Selectel
  • Job Title: Старший системный администратор Cloud duty (General Incident Commander)
  • Published: 1 month, 2 weeks ago
Apply For This Job