Data Scientist NLP (LLM), Senior, АО Газпромбанк
EMCR EMCR
or

Data Scientist NLP (LLM), Senior, АО Газпромбанк

О ЦТИИ

Центр технологий искусственного интеллекта (ЦТИИ) Газпромбанка — это команда профессионалов, которые используют AI технологии для разработки и внедрения инновационных решений. Мы сосредоточены на создании интеллектуальных систем, которые могут анализировать большие объемы данных и предоставлять ценную информацию о клиентах.
Основные проекты осуществляются по нескольким направлениям: риски, борьба с мошенничеством, персонализация, клиентский сервис и автоматизация.

Чем будешь заниматься?

- Проектировать, разрабатывать и внедрять LLM модели, участвовать в разработке pipeline до промышленной реализации
- NLP-задачи (генеративные модели, чат-бот)
- Проводить исследования, проверять гипотезы проекта с использованием LLM в задачах генерации обучающего контента
- Работать с текстовыми данными - обращениями клиентов, отзывами, чатами. (NLTK, genism, word2vec, Bert, etc)
- Анализировать различные источники данных, генерировать признаки для построения моделей
- Анализировать различные источники данных, генерировать признаки для построения модели
- Проверять гипотезы, проводить A/B тестирования, EDA
- Рисерчить новые подходы и технологии

Requirements

- Практический опыт полного цикла решения NLP задач: предобработка данных, выбор алгоритмов и тюнинг их параметров, оценка качества моделей, визуализация
- Опыт дообучения BERT-Like и GPT-Like моделей
- Опыт работы с LLM, prompt engineering
- Опыт работы в области анализа данных и машинного обучения от 2 лет
- Степень бакалавра или магистра в области компьютерных наук, науки о данных, математики, статистики или смежных областях
- Сильные навыки программирования на Python, R или подобных языках, умение писать чистый код
- Знание SQL на уверенном уровне (вложенные запросы, оконные функции)
- Опыт работы с фреймворками PyTorch / TensorFlow
- Опыт работы с SQL, Linux, bash, системами контроля версий
- Знание и понимание метрик, необходимых для оценки качества генеративных моделей
- Высшее образование в области математического моделирования/ информатики/ машинного обучения

Стек технологий:

- Для разработки используем: Python, PySpark, Pandas, PyTorch, RecBole, Scikit-learn, MLFlow и др.
- Для организации работы: Jira, Confluence, Git

Conditions

- полностью удаленная работа в крупнейшем банке России
- достойная заработная плата (оклад + премии)
- трудоустройство согласно ТК РФ
- возможности для корпоративного обучения (корпоративные платформы, возможности обучения в Skillbox, несколько онлайн-библиотек)
- ДМС, страхование от несчастных случаев и тяжелых заболеваний
- материальная помощь и социальная поддержка, корпоративная пенсионная программа;
- льготные условия кредитования

АО Газпромбанк

Газпромбанк» (Акционерное общество) – один из крупнейших универсальных финансовых институтов России, предоставляющий широкий спектр банковских, финансовых, инвестиционных продуктов и услуг корпоративным и частным клиентам, финансовым институтам, институциональным и частным инвесторам. Банк входит в тройку крупнейших банков России по всем основным показателям и занимает третье место в списке банков Центральной и Восточной Европы по размеру собственного капитала.

Job type    Full-time
Experience level    Middle, Senior
Salary per month    220 000 - 400 000 RUB
Location    Russia (Россия)
Arrangement    Remote

Published: 09/01/2024