Мы создаем экосистему из данных, которая позволит лидерам команд продаж и продукта принимать более качественные решения.
Мы ищем квалифицированного инженера по обработке данных, который возглавит проектирование и внедрение нашей инфраструктуры хранилища данных.
Наш идеальный кандидат имеет опыт работы в области разработки данных с упором на проектирование архитектуры, моделирование данных, процессы ETL и оптимизацию производительности баз данных.
Фронт работ:
Проектирование и планирование архитектуры. Нужно будет сотрудничать со стейкхолдерами и погружаться в продукт, путь клиента и процесс продаж, чтобы понять потребности чтобы понять потребности в данных и определить архитектуру, структуру и макет нового хранилища данных.
Моделирование данных. Нужно будет разработать концептуальные, логические и физические модели данных, обеспечивающие оптимизацию для конкретных потребностей отчетности и бизнес-аналитики.
Интеграция данных и ETL. У нас разные источники данных и из требуется затягивать в хранилище с использованием Python, Kafka, Airflow и других инструментов.
Производительность базы данных. Нужно оптимизировать хранилище для обеспечения высокой производительности запросов. Это включает в себя индексирование, секционирование и другие методы настройки базы данных.
Качество данных. Нужно внедрить и поддерживать процедуры проверки и очистки данных для поддержания высокого качества и целостности данных.
Документация: ведение тщательной документации по архитектуре хранилища данных, процессам ETL, моделям данных и другим соответствующим процессам.
Мы уважаем время кандидатов, поэтому не затягиваем с ответом.
Обратная связь по итогам собеседования озвучивается всем кандидатам в течение 1-2 дней.