Data Scientist (NLP)

З/П договорная
Размещено 19 апреля


Кластер моделирования и исследования данных Блока Стратегия и развитие Сбера занимается разработкой AI-решений для различных бизнес-доменов подразделения: целеполагание и эффективность деятельности, управление численностью Группы, Data-driven инсайты для стратегии, анализ процессов и клиентских путей банка. Обязанности консультирование / участие в автоматизации источников данных для ML моделей совместно с ML Engineer/Data Engineer; end2end-разработка ML-моделей, доведение моделей из стадии MVP до целевого решения (все этапы ЖЦ моделей по CRISP-DM от Data Understanding до Deployment с использованием тех. стека банка); NLP-задачи: Preprocessing, Classification, Summarization (Ext/Abst), Sentence Compression, Simplification, NER, Semantic Search, Clustering и др.; Domain Adaptation и дообучение (Lora SFT / SFT) большой языковой модели Сбера (GigaChat) с использованием внутренних / синтетических данных; LLM Plugins (multi-hop reasoning, поиск, генерация fuse blocks для вызова внешних API); разработка Python back-end сервисов для обслуживания моделей в ПРОМ-среде. Сопутствующие обязательные стримы: взаимодействие с бизнес-заказчиком для выявления требований к AI-компоненте продукта; участие в разработке архитектуры решения в части AI-компоненты (тех. стек для развертывания моделей в средах исполнения); участие в стримах по валидации моделей и постановке их на автомониторинг Требования опыт в разработке NLP-моделей (обязательно) и рекомендательных систем (желательно); умение переводить бизнес-постановку задачи в ML-постановку, грамотная интерпретация полученных результатов; высокий уровень владения ядром Python и SQL; свободное владение базовыми библиотеками на Python, в том числе: pandas, numpy, matplotlib, seaborn; знание фреймворков, библиотек, алгоритмов машинного обучения: Scikit-learn, Pytorch, XGBoost, CatBoost, TensorFlow, transformers; опыт работы с NLP-библиотеками: pymorphy2, NLTK, Gensim, spaCy, regexp; знание NN-архитектур: LSTM, трансформеры (GPT, BERT, BART, T5); контейнеризация: Docker; виртуализация: OpenShift; брокеры сообщений: Kafka; инструменты DevOps (MLOps): Git, Bitbucket, Nexus, Jenkins; индустриальный опыт разработки, обучения, тестирования, выведения моделей в эксплуатацию и мониторинга качества; технический английский (статьи, документация); преимущество: pet-projects на Github, владение Confluence, Jira, медали на Kaggle, готовность брать на себя коммуникацию с бизнес-заказчиком. Условия ипотека выгоднее для каждого сотрудника и льготные условия кредитования фитнес залы в офисах; бесплатная подписка СберПрайм+; скидки на продукты компаний-партнеров: Okko, Сбер Маркет, Delivery Club, Самокат, Сбер Еаптека и другие; ДМС с первого дня и льготное страхование для близких;корпоративная пенсионная программа; курсы для будущих родителей, материальная поддержка и тематическое сообщество для молодых мам; детский отдых и подарки за счет Компании; обучение за счет Компании: онлайн курсы в Виртуальной школе Сбера и неограниченный доступ к библиотеке, обучение в Корпоративном университете, тренинги, митапы и возможность получить новую квалификацию; реферальная программа для сотрудников: можно пригласить в команду знакомых профессионалов и получить вознаграждение до 100 тыс. рублей

Похожие вакансии

Team Lead Data Scientist (NLP)
Москва
На работу требуется team lead в г. Москва.Ищем к себе в команду (сервис Новостной мониторинг) Tech Lead NLP. Задача сервиса - сбор и обработка информации из новостных источников для мониторинга состояния заемщиков банка. Команда решает end-to-end задачу: занимается как парсингом/скрапингом источников (около 30 тыс штук), так и разработкой моделей
Договорная
Договорная
30 апреля
Data Scientist DL
Москва
Требуется data scientist в г. Москва.Мы ищем специалиста Deep Learning в disrupt направление. Нам нужны специалисты в области NLP и работы с аудио (ASR, TTS). Вам предстоит участвовать в развитии системы форд-мониторинга Сбербанка, которая обеспечивает защиту клиентов банка во всех каналах обслуживания от мобильных приложений и покупок в интернет
Договорная
Договорная
30 апреля
Data Scientist DL
Москва
Требуется data scientist в г. Москва.Мы ищем специалиста Deep Learning в disrupt направление. Нам нужны специалисты в области NLP и работы с аудио (ASR, TTS). Вам предстоит участвовать в развитии системы форд-мониторинга Сбербанка, которая обеспечивает защиту клиентов банка во всех каналах обслуживания от мобильных приложений и покупок в интернет
Договорная
Договорная
30 апреля
Team Lead Data Scientist (NLP)
Москва
На работу требуется team lead в г. Москва.Ищем к себе в команду (сервис Новостной мониторинг) Tech Lead NLP. Задача сервиса - сбор и обработка информации из новостных источников для мониторинга состояния заемщиков банка. Команда решает end-to-end задачу: занимается как парсингом/скрапингом источников (около 30 тыс штук), так и разработкой моделей
Договорная
Договорная
30 апреля
Middle/Senior Data Scientist (команда Лояльности)
Москва
Требуется middle/senior data в г. Москва.Обязанности:Команда Лояльности ПАО "Сбербанк" ищет профессионала на позицию Middle Data Scientist. Команда занимается разработкой и внедрением ML моделей на огромной клиентской базе B2C в целях улучшения клиентского опыта и повышения эффективности программы лояльности Спасибо и сервиса
Договорная
Договорная
29 апреля
Data Scientist DL
Москва
Мы ищем специалиста Deep Learning в disrupt направление. Нам нужны специалисты в области NLP и работы с аудио (ASR, TTS). Вам предстоит участвовать в развитии системы форд-мониторинга Сбербанка, которая обеспечивает защиту клиентов банка во всех каналах обслуживания от мобильных приложений и покупок в интернет до визитов клиентов в офисы. Нам уже
Договорная
Договорная
29 апреля