Data Scientist LLM (Global markets)

З/П договорная
Размещено 19 апреля


На работу требуется data scientist в г. Москва.Кто мы? Команда, отвечающая за AI инициативы бизнеса Департамента Глобальных Рынков Сбера. Что мы делаем? Департамента Глобальных Рынков (ДГР) предоставляет корпоративным и розничным клиентам широкий спектр продуктов и услуг на финансовых рынках. Ключевые направления бизнеса: торговые операции с ценными бумагами, деривативами, ликвидностью, на валютном, товарно-сырьевом рынках, структурные продукты. Мы помогаем внутренним клиентам увеличивать доходность, создаем информационную платформу, проводим анализ финансовых рынков, работаем с разными форматами данных. Наша команда решает очень широкий спектр DS-задач с применением самых передовых ML/DL алгоритмов и инструментов. В нашей компетенции разработка, тестирования и вывод в промышленную среду моделей . Мы ищем талантливого специалиста, который обладает опытом работы с большими языковыми моделями (LLM). В этой роли вы будете играть ключевую роль в исследовании и применении нашей LLM для решения широкого спектра задач, включая генерацию текста, извлечение информации, Q&A системы, логическое мышление и другие.Обязанности Участие в разработке решения на основе обучения/файнтюнинга (SFT LoRA, RLHF) современных генеративных сеток (GigaChat, LLAMA2, Gpt3.5/4); Построение пайплайна обработки данных и обучения LLM (LLM цепочек); Разработка векторизованных баз знаний с использованием LangChain, ChromaDB; Организация процесса мониторинга качества LLM; Тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения; Участие в формировании требований и необходимых данных по улучшению моделей; Оценка как полученное решение достигает поставленных целей; Следить за последними исследованиями и инновациями в области языковых моделей и применять их на практике; Разработка документации и руководства для пользователей и разработчиков; Подготовка и анализ новостей для обучения модели. Требования Основные навыки Знание Python на уровне middle-разработчика; Опыт анализа и обработки данных (numpy/pandas) и их визуализация (matplotlib, seaborn, plotly); Опыт web scraping (в идеале playwright/parsel/httpx, возможно selenium/beautifulsoup/requests); Опыт работы с БД (ORM); Опыт создания dashboards (streamlit/gradio/dash); Опыт асинхронного программирования (asyncio); Linux; Git; Docker. Навыки NLP Уверенное владение базовыми знаниями в Deep Learning и NLP с практическим опытом работы в этом направлении; Знание PyTorch или Tensorflow для возможности fine-tuning LLM под конкретную задачу; Знание LLM-фреймворков и библиотек (в идеале langchain, дополнительно как пример - llama-index, openai) для создания LLM-приложений; Опыт использования LLM (gpt-3.5-turbo/gpt-4/open source), в идеале опыт использования их API для создания LLM-приложений; Знание методов Prompt Engineering. Личностные качества Навыки и желание самостоятельного изучения новых технологий для проведения экспериментов и реализации MVP с участием в дальнейшим развитии проектов. Проекты Наличие публичных проектов, и/или активное участие в разработке open source проектов в области NLP/LLM; Наличие блога по NLP/LLM. Условия Формат работы: офис (ул.Вавилова,19). Возможен гибрид; ДМС с первого дня; Скидки на продукты банка и экосистемы; Развитая IT архитектура; Постоянное развитие: обучающие курсы от лучших университетов и компаний (МФТИ, ВШЭ, NVIDIA и другие), участие в международных конференциях; Развитое DS community, регулярные митапы, дайджесты и конференции.

Похожие вакансии

Data scientist (NLP)
Москва
Ищем data scientist в г. Москва.С 1997 года команда Ренессанс страхование помогает нашим клиентам таким же людям, как и мы сами в сложных ситуациях. Мы прошли путь от классической страховой компании до компании InsurTech, которая цифровизирует процессы на всем пути клиента и создает новые онлайн-сервисы и digital-продукты. Мы первыми на рынке
Договорная
Сегодня в 03:21
Договорная
Сегодня в 03:21
Senior Data Scientist (LLM)
Москва
Работа в Правительстве Москвы это возможность делать наш город современнее и удобнее. Если ты тоже неравнодушен к Москве, хочешь развивать ее и развиваться сам, присоединяйся к нашей команде Обязанности: Проведение и описание экспериментов Создание и описание воспроизводимого кода экспериментов Выбор и визуализация гипотез Обработка больших
Договорная
Договорная
16 мая
Data scientist (NLP)
Москва
Ищем data scientist в г. Москва.С 1997 года команда Ренессанс страхование помогает нашим клиентам таким же людям, как и мы сами в сложных ситуациях. Мы прошли путь от классической страховой компании до компании InsurTech, которая цифровизирует процессы на всем пути клиента и создает новые онлайн-сервисы и digital-продукты. Мы первыми на рынке
Договорная
Договорная
16 мая
Data scientist (NLP)
Москва
С 1997 года команда Ренессанс страхование помогает нашим клиентам таким же людям, как и мы сами в сложных ситуациях. Мы прошли путь от классической страховой компании до компании InsurTech, которая цифровизирует процессы на всем пути клиента и создает новые онлайн-сервисы и digital-продукты. Мы первыми на рынке страхования прошли полноценное IPO
Договорная
Договорная
15 мая
Middle/Senior Data Scientist (команда PFM GigaChat)
Москва
Требуется middle/senior data в г. Москва.Обязанности:В трайбе Персональное финансовое планирование блока Управление благосостоянием открылся поиск Data Scientist, которому предстоит заниматься развитием и имплементацией в бизнес-процессы сервисов анализа финансов за счет подключения LLM моделей, аккумулирующих в себе большой объем данных о
Договорная
Договорная
15 мая
Data Scientist NLP
Москва
Открыта вакансия "data scientist" в г. Москва.Наша команда занимается улучшением процесса заключения как стандартных, так и сложно-структурированных инвестиционно-банковских сделок Департамента инвестиционной деятельности (блок Корпоративно-инвестиционный бизнес), с применением искусственного интеллекта. Нашими потенциальными внешними и
Договорная
Договорная
14 мая