О компании и команде
Стек:
- Работа с большими данными: HDFS, PySpark, Hue, YARN, Cloudera
- Разработка моделей на Python, автоматизированная продуктивизация
- Гибкая ML-платформа с развитыми MLOps-инструментами
- Хранение и версионирование кода в Gitlab
Какие задачи необходимо решать:
- Cоздание, внедрение и доработка классических и глубоких моделей для скоринга, поведенческого моделирования, а также мультимодальных (смс + поведение)
- Применение NLP-подходов для решения различных задач (например, NER); глубокое моделирование последовательностей
- Ведение R&D-проектов с нуля до стадии рабочего MVP
- Проведение контролируемых экспериментов (AB-тестирование)
- Анализ больших данных, геоаналитика
- Нахождение wow-инсайтов и красивая визуализация. Мы - это голос данных!
Ожидания от кандидата
- Высшее образование, знания в области математики, теории вероятности, мат. статистики, компьютерных наук
- Опыт работы от 2 лет в области машинного обучения и анализа данных (в том числе, NLP)
- Продвинутый Python (+ ML-библиотеки) и SQL, опыт с Pyspark будет плюсом
- Знание теории и опыт проведения AB-тестов
- Навыки работы с Linux/Unix и Git
- Будет плюсом широкий кругозор в области технологий машинного обучения в целом, знание текущих SOTA архитектур, актуальных архитектур нейронных сетей
Условия работы
- Удаленная работа на территории РФ
- Оформление в аккредитованную IT-компанию
Бонусы
- ДМС со стоматологией
- Компенсация мобильной связи и интернета
- Пакет бенефитов на выбор