О компании и команде
DevTeam.Space — это американская компания, специализирующаяся как на разработке внутренних продуктов, так и на работе с клиентами.
Ожидания от кандидата
- Опыт работы не менее 3 лет в области Machine Learning, включая опыт с языковыми моделями и генерацией текста.
- Глубокие знания и практический опыт работы с Llama, GPT или другими крупными языковыми моделями.
- Отличные знания Python — будет большим плюсом.
- Опыт работы с TensorFlow, Keras, PyTorch или другими фреймворками для глубокого обучения.
- Знание и опыт применения методов оптимизации моделей (например, квантование, обрезка моделей, дистилляция моделей, sparse matrices) для ускорения их работы и уменьшения потребления ресурсов.
- Опыт работы с системами генерации кода и автоматизацией программирования, в том числе создания автотестов.
- Навыки использования инструкционных слоев (instruction layer) для управления поведением моделей и их настроек.
- Опыт разработки и внедрения векторных представлений, таких как embeddings, для улучшения качества моделей.
- Понимание трансформеров (Transformers) и архитектур, основанных на них (например, BERT, GPT), для генерации текста и задач NLP.
- Навыки работы с инструментами управления жизненным циклом моделей (MLOps), включая настройку пайплайнов автоматизации обучения, тестирования и деплоя моделей.
- Умение составлять требования для ассессоров по подготовке датасетов для обучения нейронных сетей.
- Опыт интеграции ML-решений в микросервисные архитектуры с применением Docker и Kubernetes.
- Опыт работы с облачными ML-сервисами, такими как AWS SageMaker, Google AI Platform, Microsoft Azure ML.
- Уверенные навыки работы с реляционными (PostgreSQL, MySQL) и NoSQL базами данных (MongoDB, Redis) для хранения и обработки данных.
- Опыт работы с системами контроля версий, такими как Git, для отслеживания версий моделей и кода.
Обязанности:
- Разработка и оптимизация плагина для генерации автотестов в IDE на базе Llama и других языковых моделей, с возможностью дальнейшей адаптации на собственную нейронную сеть.
- Оптимизация работы языковых моделей для генерации кода, включая дообучение и улучшение моделей на основе пользовательских данных.
- Внедрение методов оптимизации моделей для повышения их производительности (квантование, дистилляция моделей, sparse matrices, обрезка) в среде ограниченных вычислительных ресурсов.
- Участие в проектировании и внедрении микросервисной архитектуры для масштабируемости решения и интеграции ML-решений в облачные платформы.
- Настройка и управление пайплайнами MLOps для автоматизации процессов обучения, валидации и деплоя моделей.
- Интеграция ML-решений с реляционными и NoSQL базами данных для обработки и хранения больших объемов данных.
- Участие в создании безопасных и производительных решений для машинного обучения с соблюдением принципов кодирования и безопасности данных.
- Обеспечение качества кода через написание юнит-тестов и интеграционных тестов для моделей и приложений.
- Взаимодействие с командой разработчиков для улучшения и расширения функционала плагина.
Условия работы
- Зарплата обсуждается индивидуально с каждым кандидатом, учитывая их опыт и навыки.
- Возможность удаленной работы с комфортом и гибкостью в рабочей среде.
- Гибкий график работы, который можно адаптировать под личные потребности.
- Возможности для профессионального обучения за счет компании, способствующие росту и развитию сотрудников.
- Условия обсуждаются с каждым кандидатом индивидуально, чтобы удовлетворить их потребности и предпочтения.