О компании и команде
О проекте:
Продукт SIEM-решение для мониторинга и анализа любой сетевой активности, происходящей в организации, включающая корреляцию в режиме реального времени, визуализацию данных и поиск по ним, долгосрочное хранение сырых и нормализованных событий, инцидент менеджмент и отчеты.
Планируется доработка функционала в части:
- Увеличения объёма обработки данных;
- Разработки нового агента обработки, который занимается нормализацией, корреляцией и выполнением удаленных команд;
- Разработки web-интерфейса для нового продукта и поддержка старого;
- Разработки мониторинга web- интерфейса.
Ожидания от кандидата
Задачи:
- Изучить существующие инсталляции, изучить их конфигурации
- На основании изученного предложить план по улучшениям и повышению стабильности
- Заняться подробным документированием инфраструктуры БД
- Провести ревизию схем резервного копирования, задокументировать
- Разработать планы проверки и восстановления из бэкапов на случай критических ситуаций
- Провести ревизию существующего мониторинга, предложить план по улучшениям и повышению стабильности
Мы ждем от вас:
1. Умение самостоятельно развертывать и обслуживать кластера БД на MySQL:
- опыт настройки различных видов репликации, понимание как это работает, чем отличаются друг от друга;
- настройка прав доступа;
- умение экспортировать/импортировать данные из дампов вручную (mysqldump / mysql / xtrabackup);
- опыт организации резервного копирования БД и проверки целостности бэкапов;
- опыт настройки Percona XtraDB Cluster или MariaDB Galera Cluster;
- умение писать и анализировать SQL-запросы для помощи разработчикам, а также для анализа при проблемах с производительностью;
- самостоятельный поиск и устранение узких мест;
- тюнинг серверов баз данных по результатам таких исследований;
- умение пользоваться mysqltuner, анализировать его вывод и применять на практике полученную информацию;
- умение пользоваться соответствующими инструментами для профилирования и анализа запросов (explain, PMM, etc);
- понимание того, как нужно строить отказоустойчивые кластера баз данных;
- опыт восстановления баз данных по binlog'ам;
- опыт восстановления баз данных при сломанной репликации;
- умение проводить базовый тюнинг через sysctl, по рекомендациям из официальной документации;
- понимание, какой параметр и зачем тюнится;
- опыт обновления серверов БД со старых версий на новые;
- умение настраивать и пользоваться системами мониторинга.
2. Умение самостоятельно развертывать и обслуживать кластера ClickHouse.
- умение поднимать кластера ClickHouse с нуля;
- умение планировать новые кластера с учётом требований к отказоустойчивости;
- понимание, как работает ClickHouse и как масштабировать кластера;
- умение диагностировать проблемы в его работе;
- понимание, для чего нужен zookeeper, умение его конфигурировать и использовать.
Также Будет плюсом:
- опыт работы с Apache Kafka
- опыт администрирования кластеров PostgreSQL;
- опыт разработки полезных инструментов для работы с БД.
Условия работы
- Работа в аккредитованной ИТ-компании;
- Оформление официально по ТК РФ;
- Непрерывное развитие и возможности карьерного роста.;
- График 5/2, удаленный формат.