Data Engineering

Data Engineer Full-time

О компании и команде

Коллеги, добрый день! Находимся в поиске дата инженера в команду развития аналитики и Big Data. Работаем по Scrum. На текущий момент перед командой стоят следующие задачи:

Ключевые задачи подразделения:

  • Реализация и поддержка ETL процессов по загрузке данных в Data Lake и формированию витрин (стек: Ni-Fi, Hadoop, Postgres, MS SQL);
  • Интеграция с внешними и внутренними источниками данных, автоматизация регулярных запросов (стек: Python, Airflow);
  • Подготовка ML моделей;

Ближайшие крупные задачи:

  • Feature Store;
  • Оптимизация архитектуры;
  • Резервирование кластера;
  • Миграция ETL процедур из Locko-Analytics;

Чем предстоит заниматься:

  • Совместно с командой разработать концепцию решения и план реализации;
  • Подготавливать ETL процессы по регулярной загрузке нужных данных в требуемом формате;
  • Настраивать автоматизированные процессы по сбору статистики по предикторам;
  • Участвовать в работах по подготовке мониторинга;
  • Разрабатывать Feature store для ML моделей банка;
  • Разрабатывать и поддерживать компоненты Big Data платформы сбора, обработки и анализа данных;
  • Разрабатывать ETL - процессов;
  • Построить аналитические витрины данных;
  • Построение автоматизированных процессов обеспечения и контроля качества данных;
  • Проектировать интеграции данных различных проектов;
  • Участвовать в проектировании и развитии архитектуры Big Data платформы;

Ожидания от кандидата

Основные технологии, с которыми необходимо будет работать:

Apache NiFi; Apache Hadoop; Apache Airflow; Apache Spark; Apache Hive; Jupyter Notebook;Microsoft SQL Server; PostgreSQL; RabbitMQ;

Что мы ждём от кандидата:

  • Опыт работы от 1 года;
  • Опыт разработки на Python;
  • Хорошее знания SQL;
  • Хорошее знание OS Linux / bash;
  • Опыт работы с экосистемой Hadoop и решениями Big Data;
  • Опыт работы с базами данных MS SQL, PostgreSQL;
  • Опыт работы с Apache NiFi \ Spark \ Airflow \ Hive;
  • Большим плюсом будет опыт работы с Feature store;
  • Желателен опыт вывода ML моделей в production;

Условия работы

  • Оформление по ТК РФ;
  • ДМС после испытательного срока;
  • Удалённый формат работы;
  • График работы: 5/2 с 9.30-18.30, в пятницу - до 17:30;
  • Уровень ЗП обсуждается на собеседовании, исходя из навыков и опыта работы кандидата (оклад + полугодовые премии).

Overview

  • Employer: ЛОКО-Банк
  • Job Title: Data Engineer
  • Published: 11 months, 4 weeks ago
Apply For This Job