ML команда создает решения, которые помогают различным продуктам Positive Technologies автоматически детектировать, предотвращать угрозы и реагировать на них. Также активно облегчаем рутину наших коллег с помощью решений на основе LLM.
Ищем MLOps-инженера, который усилит ML команду и поможет выводить ML-модели в продакшен быстрее, а также модернизировать инфраструктуру под требования современных LLM и GPU.
Чем предстоит заниматься
- Строить и оптимизировать ML-пайплайны с Apache Airflow для обработки данных и обучения моделей
- Разрабатывать CI/CD (GitLab) для автоматизации всего жизненного цикла ML-моделей
- Развертывать и масштабировать self-hosted LLM (например, Qwen, Mistral)
- Оптимизировать использование GPU: настраивать MIG-разделение (NVIDIA Multi-Instance GPU), Triton Inference Server, ONNX для ускорения инференса
- Поддерживать надежность ML-сервисов: мониторинг (Prometheus, Grafana), анализ логов и алертинг (OpenSearch)
- Интегрировать модели с векторными база данных (Qdrant), аналитическими системами (ClickHouse), NoSQL-базами (MongoDB) и S3
Наши ожидания
- Опыт MLOps >2 лет, включая работу с LLM и GPU-ускоренными системами
- Умение писать понятные скрипты на Python, работа с api (пригодится MLflow, Airflow)
- Опыт работы с Debian based дистрибутивами, Docker, git
- CI/CD на основе GitLab для построения процессов вокруг ML инфраструктуры
- Развертывание LLM: опыт с HuggingFace, LlamaIndex, LangChain, Ollama
- Работа с хранилищами: ClickHouse, MongoDB, PostgreSQL, Qdrant, S3
- Опыт в мониторинге и логировании: Prometheus, Grafana, OpenSearch
Будет плюсом
- Опыт работы с потоковыми данными (Apache Kafka, Spark Streaming, Apache Flink) для обработки угроз в реальном времени
- Опыт работы с Apache Trino, Apache Spark
- Навыки разделения GPU (MIG), настройка CUDA-оптимизаций, использование Triton для инференса
- Знание архитектур LLM приложений (RAG, fine-tuning, prompt engineering)
- Следование принципу Infrastructure as code (IaC): ansible, terraform
- Опыт работы с ML-экосистемой: Scikit-learn, PyTorch
- Опыт работы с Kubernetes