О компании и команде
RetailCRM — это передовое SaaS-решение для eCommerce и ритейла, которым каждый день пользуются тысячи клиентов.
RetailCRM вырос с нуля до большого высоконагруженного проекта (4 датацентра в Европе и России, 100+ млн запросов к backend в сутки, 70+ тысяч запросов к БД в секунду)
Сейчас над продуктом работает 12 команд разработки и эксплуатации, каждая из которых сосредоточена на своей зоне в продукте.
Наш проект полностью работает на bare-metal (250+ серверов), и мы сформировали хорошую экспертизу в построении SaaS-решении на выделенных серверах. У вас будет возможность получить опыт развития и обслуживания подобной инфраструктуры. В свою очередь от кандидатов мы ожидаем достаточно хорошего опыта администрирования серверов. Это не значит, что вам придется вручную настраивать сервера, но этот опыт важен при анализе узких точек инфраструктуры и правильной настройке production-решений.
О команде:
Команда DevOps:
- Обеспечивает и повышает надежность инфраструктуры;
- Реагирует на инциденты, оперативно решает их;
- Проводит анализ слабых точек, повышает уровень auto-failover;
- Развертывает новые сервисы, разрабатываемых product teams;
- Предоставляет и развивает инструменты мониторинга инфраструктуры и сервисов.
Как мы работаем:
- Управляем инфраструктурой с помощью Ansible 2.9, придерживаемся подхода GitOps (все плейбуки и конфигурация кластеров, в том числе «секреты», в Git, довольно много pipeline-ов в ansible-репозитории);
- Аналогично через GitOps организовано управление доменами в связке Gitlab + OctoDNS + Cloudflare;
- 90+ сервисов в инфраструктуре. Автоматически строим визуальную и текстовую карту сервисов http://ds.retailcrm.tech/s/1625674134.png;
- Для мониторинга и логов используем Zabbix, Pinba, ClickHouse, Redash, Grafana;
- В качестве внутренних систем используем Redmine, Gitlab, Mattermost;
- Довольно компактный стек технологий для разработки сервисов. 99% сервисов на Nginx, PHP, Go, PostgreSQL, Redis;
- В команде выстроена система дежурств. Каждую неделю дежурит определенный DevOps-специалист, который в первую очередь реагирует на инциденты и помогает отделам техподдержки и разработки;
- Выстроена система Postmortem. Фиксируем хронологию инцидентов, причины их возникновения и пути решения.
Ожидания от кандидата
- Хорошее знание Linux на уровне системного администратора;
- Опыт работы c контейнеризацией (Docker);
- Опыт работы с системами управления конфигурациями (ansible будет большим плюсом);
- Опыт работы с системами мониторинга и логгирования;
- Опыт программирования на скриптовых языках (bash, python);
- Знание сетевых технологий TCP/IP;
- Умение перенимать опыт коллег и делиться с ними собственным.
Условия работы
- Обучение продукту компании, наличие опытного и квалифицированного наставника;
- Интересные и амбициозные задачи;
- Реальную возможность карьерного и профессионального роста;
- Хорошую заработную плату с регулярным повышением, оформление по ТК РФ;
- Профессиональное обучение (регулярные митапы, внешнее обучение, стажировки);
- Официальное оформление в аккредитованной IT компании;
- Сильную и дружную команду профессионалов.