DevOps Engineer
#удаленка #middle #senior #400k
Компания: Telespace
ЗП: от 3 000 до 4 000$
Мы ищем
Опытного DevOps-инженера, который способен обеспечить бесперебойную работу множественных центров обработки данных, эффективно управлять распределением больших объемов данных, с интеграцией современных технологий, включая Kubernetes
Stack
Env: Bare-metal / Proxmox
Backend: Go, Python +
Temoral.io
Data Transport: Apache Kafka, S3
Data Storage: PostgreSQL, Clickhouse, Cassandra, Redis (KeyDB), Elasticsearch
Ops: k8s, GitLab
Monitoring: Prometheus/Grafana, OpenTelemetry/Opentracing
Ключевые задачи
Проектирование и развитие инфраструктуры в нескольких ДЦ:
- Планирование и реализация сетевой архитектуры
- Эффективное управление распределением данных
- Масштабирование и оптимизация работы кластеров k8s
- Проектирование архитектурных решений и обоснование с точки зрения производительности, безопасности и стабильности
Бесперебойная работа сервисов:
- Обеспечение надежности, высокой доступности и производительности продукта
- On-call дежурства и реакция на инциденты: работа продакшн - твоя зона ответственности
- Управление инцидентами: разбор и постмортемы, исправление проблем
- Масштабирование и capacity planning. Создание DRP, проведение регулярных учения по отказам с последующим анализом результатов
Делать продакшн лучше:
- Автоматизация ручной, повторяющейся работы и рутинных задач
- Release engineering: разработка, внедрение и поддержка процессов CI/CD
- Сотрудничество с командами разработки для обеспечения работы и эффективного взаимодействия всех компонентов системы
- Актуализация метрик/алертов мониторинга и логирования, отслеживание и анализ ошибок
Самое важное для нас:
- Глубокие знания сетевых технологий: опыт работы с multi-DC network, умение проектировать/настраивать их для обеспечения высокой доступности и производительности
- Практический опыт с крупными базами данных: такими как Postgres, Clickhouse, Cassandra или ScyllaDB, а также понимание того, как решать задачу CAP на большом объеме данных
- Глубокий опыт эксплуатации k8s: ты знаешь, как быстро и просто масштабировать продукт, между несколькими дата-центрами на больших объемах данных
- Умеешь в System Design: используешь принципы и best practice при построении высоконагруженных систем
- Слова Observability & Monitoring тебя не пугают: знаешь, что такое персентиль и медиана, отличаешь SLO/SLA/SLI
- Во время сбоя можешь быстро принимать решения, не теряешься и не сдаешься
- Умеешь и любишь общаться с коллегами (да, мы понимаем, что иногда это сложно). Необходимо много общаться со смежниками, договариваться
- Умеешь описывать понятную и подробную документацию, по проделанной работе
Будет плюсом опыт:
- bare-metal / on-prem
- Proxmox/VMware
-
Temporal.io
- Go/Python
https://t.me/devs_it