О компании и команде
Привет!
Мы команда, которая создаёт алгоритм поиска для всех продуктов 2ГИС. Помогаем миллионам наших пользователей быстро и точно находить фирмы, адреса, достопримечательности по всей России и многим странам зарубежья. Наш код работает и на мобильных устройствах
и на серверах. Чтобы поиск находил точнее, мы создаём системы анализа данных. Они помогают проверять и поддерживать качество работы поиска.
Задачи, которыми тебе предстоит заниматься
- Оценка качества работы поиска в рамках различных проектов, типов запросов, типов пользователей и т.п.
2. Исследования пользовательской активности в приложении при использовании функционала поиска:
- поиск и идентификация ботов и парсеров;
- определение популярных паттернов поисковых кейсов: как пользователи ищут те или иные вещи.
3. Поиск аномалий в поисковой выдаче и определение их причин.
4. Оценивать эффективность и полезность выпущенных фич.
Для выполнения данных задач потребуется:
- находить статистически обоснованные взаимосвязи, генерировать и проверять гипотезы в данных;
- организовывать проведение AB тестов и анализировать их результаты;
- придумывать метрики для оценки качества поиска и обосновывать их необходимость;
- контролировать метрики и исследовать причины их роста или падения;
- разрабатывать дашборды в Grafana и Power BI;
- использовать в качестве инструментов разметки данных различные платформы: толока, tagme.
Ожидания от кандидата
- Умение писать сложные и быстрые SQL-запросы.
- Хорошее знание Python, например, вы знаете чем отличается многопоточность от многопроцессорности и как обстоят с этим дела в питоне, знаете как улучшить производительности кода.
- Опыт написания юнит-тестов.
- Опыт работы с библиотеками типа numba будет плюсом.
- Опыт обработки данных в Python (работа с библиотеками pandas, numpy, sklearn, работа с инструментами визуализации данных — matplotlib, seaborn, plotly).
- Знаете основы машинного обучения: какие бывают задачи, метрики, что такое переобучение и как с ним бороться в моделях различного типа и т.п.
- Можете написать код для обучения логистической регрессии на простых табличных данных.
- Умеете работать с разметкой и проводить контроль качества данных (знакомы с методами агрегации ответов в разметке (MACE, Majority Vote и т.п.)).
- Знания теории вероятностей и статистики.
- Умение работать в команде, а также самостоятельно искать и использовать всю необходимую информацию.
Условия работы
Почему у нас хорошо:
- мы аккредитованная IT –компания;
- само собой, полностью белая зарплата, размер которой обсуждаем на собеседовании;
- есть ДМС и все классические IT-плюшки;
- еще у нас можно работать удалённо. Для нас важен специалист, а не его локация. Если хочешь работать в гибридном формате, у нас есть офисы в Москве, Санкт-Петербурге, два классных офиса в Новосибирске;
- для комфортной работы доставим всё, что нужно и организуем встречи с командой онлайн и офлайн.