Сейчас мы в поисках Senior Site Reliability Engineer, который присоединится к команде нового высоконагруженного облачного продукта.
Стек технологий: Kubernetes, Helm, Kafka, Flink, Java и др.
Чем предстоит заниматься
- Делать наши системы еще надежнее: от инструментов до архитектуры
- Проектировать и внедрять отказоустойчивые решения, которые выдержат любые нагрузки
- Следить, чтобы сервисы работали стабильно и без перебоев
- Развивать Observability: настраивать метрики, логи и трассировки так, чтобы любые проблемы были видны сразу
- Автоматизировать рутину и избавлять команду от однообразных задач
- Участвовать в расследовании инцидентов и помогать находить корневые причины
- Работать вместе с коллегами над лучшими инженерными решениями для продукта и бизнеса
Мы ожидаем
- Уверенные навыки работы с Linux на уровне системного администратора
- Уверенное владение одним из языков программирования: Go, C#, Python, Java и другие
- Уверенные навыки работы с системами контейнеризации и оркестрации (OpenShift, Kubernetes)
- Опыт работы с системами управления конфигурациями, деплоя и поддержки окружений (Terraform, Helm)
- Понимание принципов построения CI/CD-пайплайнов и подхода IaC
- Ориентирование в сетях, работе с данными, протоколах интернета, RPC и другом
- Опыт работы с распределенными системами (Kafka, Clickhouse и т.д.)