Ведущий специалист систем мониторинга (observability-инженер)

З/П договорная
Размещено 09 марта


О компании Мы создаем единую распределенную систему масштаба страны, которая преобразит опыт совершения покупок, а именно позволит "оцифровать" каждую единицу товара уже к 2025 году. Это позволит каждому покупателю быть уверенным в качестве и происхождении товара, а производителям и продавцам - не только уменьшить долю неоригинальной продукции на рынке, но и оптимизировать производственно-логистические процессы и сократить издержки за счет возможностей аналитической подсистемы. Уже сейчас система обрабатывает миллиарды транзакций ежедневно и оперирует петабайтами данных на скоростях десятки тысяч запросов в секунду. О мониторинге: Сама система мониторинга в настоящее время строится на стеке: Prometheus + Victoria metrics; Clickhouse; ELK; Graylog; Grafana, K8S. Обрабатываем до 1 млн. метрик в секунду. Обрабатываем логов до 180 000 лог сообщений в секунду. Наша задача построить и развивать централизованную систему мониторинга, включающую в себя мониторинг инфраструктуры (ЦОД) и нескольких высоконагруженных информационных систем. Чем предстоит заниматься: Построение, внедрение и развитие высоконагруженных многокомпонентных систем мониторинга: Постановка на мониторинг инфраструктуры, приложений и бизнес показателей. Для всех стендов, включая разработку и тестирование; Развитие централизованной системы мониторинга; Создание и маршрутизация оповещений, включая предиктивную аналитику; Консультации разработчиков по созданию метрик и сущностей мониторинга(сервис мониторы); Интеграция систем мониторинга с другими системами компании; Автоматизация процессов мониторинга; Создание и построение комплексных экранов систем мониторинга; Внедрение CI/CD для компонентов мониторинга; Разработка системы логирования для приложений; Обеспечение отказоустойчивости и быстродействия создаваемой системы; Разработка приложений для нужд мониторинга в случаях, когда готового решения не существует. От успешного кандидата мы ожидаем: Опыт работы с k8s (уверенный пользователь, опыт в развертывании и обслуживании будет большим плюсом); Опыт администрирования ОС семейства Linux (Debian-based); Знания устройства и принципов работы docker; Опыт в работе с SQL; умение писать простые запросы; понимание, для чего нужны JOIN; Опыт внедрения и построения многокомпонентных систем мониторинга(Prometheus-like стек, VictoriaMetrics, Graylog, Zabbix); Опыт поддержки высоконагруженных систем мониторинга; Опыт настройки и администрирования Grafana, ELK, Prometheus; Знание скриптовых языков, Python, Bash, знание ЯП будет большим плюсом; Умение читать и понимать чужой код (В основном Python, Go. Плюсом будет Java); Опыт работы с системами виртуализации и Linux-контейнерами; Опыт в работе с Helm(написание простых чартов, понимание принципов работы helm-template); Уверенный пользователь систем версионирования кода (Предпочтительно Git); Опыт работы с Gitlab CI; Умение работать с системами управления автоматического развертывания конфигураций (Предпочтительно Ansible); Наличие фундаментальных знаний в ИТ; Нацеленность на результат, обучаемость, умение работать в команде. Что вам точно понравится: Сложные и интересные задачи, работа с современным востребованным стеком; Экспертная, увлеченная и талантливая команда, у которой можно многому научиться, культура открытости и взаимопомощи; Конкурентная ЗП, оформление по ТК РФ; ДМС со стоматологией после испытательного срока, ДМС для семьи с корпоративными скидками; Страхование жизни и здоровья; Предоставляем всю необходимую технику для работы; Возможность работать удаленно/частично удаленно; Кафетерий льгот (возмещение расходов на любое самообразование, спорт, ДМС для членов семьи, доступ к ИТ сервисам и т.д).