Команда билайн ищет DevOps инженера для ML-платформы, которая помогает дата-сайентистам самостоятельно управлять всем жизненным циклом ML-моделей — от разработки до постановки в production.
Стек продукта:
— JupyterHub, MLFlow, Argo Workflows, Argo CD, Airflow, Cookiecutter.
— K8s, Docker, Nexus, Gitlab, Keycloak, Ceph.
— Hadoop (pyspark, hive, hdfs).
— Python + ML libs (pandas, scikit-learn, catboost, pytorch)
Посмотреть и почитать про проект:
https://habr.com/ru/companies/beeline_tech/articles/760308/
https://www.youtube.com/watch?v=x5BYjDsqaPU
https://www.youtube.com/watch?v=iE0zA8hDbHY
Что предстоит делать:
— Создавать и развивать единую платформу для аналитики и машинного обучения в K8s;
— Разрабатывать и поддерживать платформу для исследований и экспериментов на базе JupyterHub и K8s;
— Разрабатывать и поддерживать платформу жизненного цикла ML-моделей на базе MLFlow и Argo;
— Внедрять инструменты для Model Serving (например, Seldon Core или Triton Inference Server);
— Внедрять и совершенствовать MLOps-процессы в командах;
— Участвовать в развитии и планировании всей Data Science инфраструктуры;
— Принимать участие в построение Feature Store и других DS&ML сервисов.
— Опыт работы DevOps от 3 лет;
— Знание Linux на уровне администратора;
— Опыт работы с Kubernetes;
— Опыт работы с GitLab, включая GitLab CI;
— Опыт работы с экосистемой Hadoop;
— Навыки программирования на Python, так как у Data Scientists весь код на Python.
Будет плюсом, если вы:
— Имеете опыт внедрения фреймворков для ML (MLFlow, JupyterHub, Argo Workflows, Seldon Core, Triton Inference Server или аналогов);
— Работали с инструментами нашего стека (чем больше, тем лучше).
— Оформление в аккредитованную IT-компанию;
— Можно выбрать формат работы: гибрид или 100% удаленная работа;
— Гибкий график работы;
— Сильная DevOps/MLOps команда, с которой можно расти;
— Свобода в принятии решений, возможность влиять на процесс и результат;
— Развитая Data-платформа с более чем 1000 пользователей;
— Мощный кластер с GPU и десятками Пбайт разнообразных данных - от классических табличных до гео, графов, кликстримов, текстов и картинок;
— Полис ДМС с хорошими клиниками;
— Cлужебная сотовая связь.