О компании и команде
Wildberries – это не только 9 миллионов заказов и 1 миллиард поисковых запросов в день, но и команда, которая стремится быть на переднем крае технологий и инноваций. Мы используем SOTA-решения в production и постоянно развиваем нашу A/B платформу, поисковой движок и другие проекты.
Мы ищем опытного Data Scientist в команду разработки платформы WB Space для проведения ML-соревнований. Это возможность напрямую влиять на продукты и GMV компании, привлекая талантливых специалистов. Дополнительно предстоит работа с ТОП-ВУЗами: ведение практики, подготовка заданий для проектов студентов и техношколы по ML-направлениям.
Наш стек: Python, Go, Mlflow, ClearML, Prometeus, Grafana, Docker, PyTorch, Airflow, Postgres, Clickhouse, K8s, FastAPI, Gitlab, PyTorch, Tensorflow, ONNX
Чем предстоит заниматься:
- Анализировать текущие решения в компании для формирования новых задач;
- Подбирать, разрабатывать новые метрики для ML-соревнований с учетом бизнес-задач;
- Консультировать заказчиков по постановке задачи и формированию метрик для ML-соревнований на платформе;
- Разрабатывать baseline-решения для различных задач в рамках соревнований;
- Визуализировать данные и представлять результаты;
- Формировать задачи для ML-соревнований, где конечным решением будет Docker-образ;
- Вести практику и подготовку заданий для проектов студентов в топовых ВУЗах;
- Готовить и помогать коллегам реализовывать задания для техношколы по разным ML-направлениям.
Ожидания от кандидата
Что мы ожидаем:
- Знание алгоритмов и структур данные
- Уверенные знания Python
- Уверенные знания математики для ML
- Уверенные и глубокие знания классического машинного обучения
- Уверенные и глубокие знания основ Deep Learning
- Обучение и дообучение нейросетей на PyTorch
- Опыт работы с разными типами задач NLP/Time Series/CV/RecSys от 2х лет
- Опыт работы с Docker-образами
- Умение делать inference для моделей, проектировать, разрабатывать и разворачивать собственные сервисы
Будет плюсом:
- Опыт преподавания или ведения практики для студентов в области машинного обучения
- Опыт выкатки моделей в production
- Опыт работы с большими данными, применения распределённых вычислений
- Опыт работы с Gitlab
- Опыт решения задач Classification, Object Detection, Segmentation, Anomaly Detection, OCR
Условия работы
- Гибкое начало рабочего дня и гибридный формат работы: 5 офисов в Москве (с бесплатными завтраками, обедами и ужинами);
- Вариативность оформления: трудовой договор, самозанятость, ИП или ГПХ;
- Корпоративные скидки у партнеров, внешние программы по обучению и внутренние митапы;
- Ежегодная 40%-ая скидка на покупку ноутбука или мобильного телефона.