Москва, Нижний Новгород, Самара, Новосибирск, Санкт-Петербург, Томск, Удаленная работа

MLOps Engineer

ML команда создает решения, которые помогают различным продуктам Positive Technologies автоматически детектировать, предотвращать угрозы и реагировать на них. Также активно облегчаем рутину наших коллег с помощью решений на основе LLM.

Ищем MLOps-инженера, который усилит ML команду и поможет выводить ML-модели в продакшен быстрее, а также модернизировать инфраструктуру под требования современных LLM и GPU.

Чем предстоит заниматься

  • Строить и оптимизировать ML-пайплайны с Apache Airflow для обработки данных и обучения моделей
  • Разрабатывать CI/CD (GitLab) для автоматизации всего жизненного цикла ML-моделей
  • Развертывать и масштабировать self-hosted LLM (например, Qwen, Mistral)
  • Оптимизировать использование GPU: настраивать MIG-разделение (NVIDIA Multi-Instance GPU), Triton Inference Server, ONNX для ускорения инференса
  • Поддерживать надежность ML-сервисов: мониторинг (Prometheus, Grafana), анализ логов и алертинг (OpenSearch)
  • Интегрировать модели с векторными база данных (Qdrant), аналитическими системами (ClickHouse), NoSQL-базами (MongoDB) и S3

Наши ожидания

  • Опыт MLOps >2 лет, включая работу с LLM и GPU-ускоренными системами
  • Умение писать понятные скрипты на Python, работа с api (пригодится MLflow, Airflow)
  • Опыт работы с Debian based дистрибутивами, Docker, git
  • CI/CD на основе GitLab для построения процессов вокруг ML инфраструктуры
  • Развертывание LLM: опыт с HuggingFace, LlamaIndex, LangChain, Ollama
  • Работа с хранилищами: ClickHouse, MongoDB, PostgreSQL, Qdrant, S3
  • Опыт в мониторинге и логировании: Prometheus, Grafana, OpenSearch

Будет плюсом

  • Опыт работы с потоковыми данными (Apache Kafka, Spark Streaming, Apache Flink) для обработки угроз в реальном времени
  • Опыт работы с Apache Trino, Apache Spark
  • Навыки разделения GPU (MIG), настройка CUDA-оптимизаций, использование Triton для инференса
  • Знание архитектур LLM приложений (RAG, fine-tuning, prompt engineering)
  • Следование принципу Infrastructure as code (IaC): ansible, terraform
  • Опыт работы с ML-экосистемой: Scikit-learn, PyTorch
  • Опыт работы с Kubernetes


 

Мы предлагаем

  • Ежегодный отпуск

    28 календарных дней и 10 дополнительных оплачиваемых выходных

  • Карьерный рост

    Обучение и рост вместе с лучшими экспертами

  • Окружение

    Сильную команду профессионалов, с которыми ты будешь решать сложные интересные задачи и определять будущее кибербезопасности в мире

  • Коммьюнити

    Возможность стать частью комьюнити и проводить время с коллегами вне работы. У нас есть спортивные сборные и клубы по интересам

  • Комфорт

    Гибридный график и гибкое начало рабочего дня

  • Доверие

    Работу в аккредитованной ИТ-компании и возможность использования льгот Министерства цифрового развития

  • Забота о здоровье

    Заботу о здоровье: ДМС (стоматология, вызов врача на дом и экстренная госпитализация — с первого месяца работы), частичная компенсация занятий спортом и английским

Инструменты и стек

  • Python

  • Docker

  • ClickHouse

  • LLM

  • Apache Airflow

  • Apache Spark

Откликнуться на вакансию

Расскажите нам о себе и наш менеджер непременно свяжется с вами.

Почта

Выберите Резюме
в формате DOCX, PDF не более 10 Мб