Middle Data Analyst [Python]

З/П договорная
Размещено 20 апреля


Привет На связи deeplay продуктовая IT-компания. Мы создаём системы и решения в сфере интеллектуальных игр. Наши продукты разрабатываются на основе 3-х ключевых технологий: Data Processing + Analytics, Artificial Intelligence, Distributed Systems.В нашей команде порядка 500 человек deeplay объединяет разработчиков, аналитиков, архитекторов и инженеров. С нами ты можешь комфортно работать из любого уголка мира, потому что мы: Настроили процессы технического оснащения, чтобы ты мог рассчитывать на нашу помощь в подготовке техники для работы, где бы ты ни находился. Выстроили систему инструментов никаких бесконечных чатов в ТГ. Работаем через онлайн-сервис управления проектами и корпоративный мессенджер с настроенной картой каналов. Организовываем рабочие процессы с учётом часовых поясов, время для регулярных командных встреч подбирается максимально удобно для всех. Помогаем сохранять контекст и знакомиться с коллегами из других отделов регулярно проводим общие информационные и развлекательные онлайн-мероприятия, а также тимбилдинги с выездами в российские города и заграницу. И сейчас нам нужен Middle Data Analyst в одну из наших команд. Основные задачи будущего тиммейта: Смотреть в данные. Мы обычно более-менее знаем, что они обозначают. А вот подробнее уже на тебе, то есть все вопросы типа: - А есть зависимость между X и Y? А если подвинуть X, как поведёт себя Y? А на сколько надо подвинуть? - Мы грузанули 7 источников, они же одинаковые, правда? - У нас тут сервак прилёг на пару часов, а там кажется ETL гонялся. Посмотри, дырок ведь не осталось? - и прочие великолепные идеи - это твоё поле. Объяснять данные. Вот прямо максимум от того, что ты понял на прошлом пункте, перелить в голову продакту. Аккуратно и доступно. Пока рекорд на объяснение с нуля продакту, что такое pairplot -- 17 минут. Будем рады, если сможешь побить. Не допускать джуновых ошибок. Надо уметь отличать корреляцию от казуации, понимать как различать прямую казуацию от обратной, как найти вторичный признак при существовании сильного первичного. Сложнее, надо проверять вещи за джунами и заказчиками и объяснять им как такие ошибки не повторять. Строить матмодели взаимодействия элементов. Например, экономику транзакций на 5 участников. Не очень сложные, узлов на 8 максимум. По моделям находить экстремумы, и даже упрощать их до состояния, когда продакты могут использовать модель для исследования сами. Для смены темпа, иногда будут приходить разрабы. Когда-то ETLщики, которым надо понять, чего делать с новыми данными; когда-то MLщики, которые будут с лупой искать новую идеальную фичу. Хорошие штуки хочется делать с возможностью последующего реюза. Да, вот прям докстринги в тетрадках, и вот прям в гит. Это не так страшно, надо просто привыкнуть. Для реализации этих задач потребуется: Опыт использования Python для анализа данных от 2-ух лет; Уверенные знания SQL (оконные функции, операции над массивами); Опыт взаимодействия с библиотеками Pandas, Matplotlib, Scipy; Умение "вытаскивать" проблематику из заказчика; Будет плюсом опыт работы с Clickhouse. Общие условия: Если хочется офисной жизни - у нас есть хорошие офисы в Омске, Новосибирске, и Санкт-Петербурге; Окладная система оплаты труда; Ежегодно проводим performance review, по итогу которых намечаем планы развития сотрудника; Оформление на работу с первого дня, больничные и отпуска согласно ТК РФ; График работы с гибким началом и окончанием рабочего дня. Поддержка сотрудников: Частичная компенсация расходов на медицинские услуги, бассейн, массаж; Частичная компенсация расходов на спорт; Материальная помощь к важным событиям и в сложных жизненных ситуациях. Обучение и развитие: Частичная компенсация затрат на обучение; Регулярные шаринги знаний, хакатоны, митапы, трансляции, турниры; Изучение английского языка для всех желающих 2 раза в неделю. Корпоративная жизнь: Открыто делимся информацией о развитии компании: регулярно проводим интервью и внутренние