Data Scientist NLP, Senior, АО Газпромбанк
EMCR EMCR
or

Data Scientist NLP, Senior, АО Газпромбанк

О ЦТИИ
Центр технологий искусственного интеллекта (ЦТИИ) Газпромбанка — это команда
профессионалов, которые используют AI технологии для разработки и внедрения
инновационных решений. Мы сосредоточены на создании интеллектуальных систем,
которые могут анализировать большие объемы данных и предоставлять ценную
информацию о клиентах.
Основные проекты осуществляются по нескольким направлениям: риски, борьба с
мошенничеством, персонализация, клиентский сервис и автоматизация.
Чем будешь заниматься?
- Проектировать, разрабатывать и внедрять ML модели, участвовать в разработке pipeline до
промышленной реализации
- Работать с текстовыми данными - обращениями клиентов, отзывами, чатами. (NLTK, genism,
word2vec, Bert, etc)

- Применение алгоритмов иерархической классификации к обращениям
- Сентимент анализ, распознавание сущностей (NER) и суммаризация клиентских обращений
- Поиск наилучшего ответа оператора
- Анализировать различные источники данных, генерировать признаки для построения
моделей
- Разведочный анализ данных (EDA)
- Анализировать различные источники данных, генерировать признаки для построения модели
- Проверять гипотезы, проводить A/B тестирования, EDA
- Рисерчить новые подходы и технологии

Requirements

- Практический опыт полного цикла решения NLP задач: предобработка данных, выбор алгоритмов и тюнинг их параметров, оценка качества моделей, визуализация
- Опыт работы в области анализа данных и машинного обучения от 2 лет
- Степень бакалавра или магистра в области компьютерных наук, науки о данных, математики, статистики или смежных областях
- Сильные навыки программирования на Python, R или подобных языках, умение писать чистый код
- Знание SQL на уверенном уровне (вложенные запросы, оконные функции)
- Опыт работы с фреймворками PyTorch / TensorFlow
- Опыт работы с SQL, Linux, bash, системами контроля версий
- Знание и понимание метрик, необходимых для оценки качества генеративных моделей
- Высшее образование в области математического моделирования/ информатики/ машинного
обучения

Стек технологий:
- Для разработки используем: Python, PySpark, Pandas, PyTorch, RecBole, Scikit-learn, MLFlow и др.
- Для организации работы: Jira, Confluence, Git

Будет плюсом:
- Владение фреймворками автоматизации процессов и оркестрации задач (например, AirFlow, Prefect, Luigi и др.)
- Опыт работы с системами поддержки жизненного цикла и версионирования моделей (например, MLFlow, DVC)
- Опыт написания BRD, технической документации

Conditions

- полностью удаленная работа в крупнейшем банке России
- достойная заработная плата (оклад + премии)
- трудоустройство согласно ТК РФ
- возможности для корпоративного обучения (корпоративные платформы, возможности обучения в Skillbox, несколько онлайн-библиотек)
- ДМС, страхование от несчастных случаев и тяжелых заболеваний
- материальная помощь и социальная поддержка, корпоративная пенсионная программа;
- льготные условия кредитования

АО Газпромбанк

Газпромбанк» (Акционерное общество) – один из крупнейших универсальных финансовых институтов России, предоставляющий широкий спектр банковских, финансовых, инвестиционных продуктов и услуг корпоративным и частным клиентам, финансовым институтам, институциональным и частным инвесторам. Банк входит в тройку крупнейших банков России по всем основным показателям и занимает третье место в списке банков Центральной и Восточной Европы по размеру собственного капитала.

Job type    Full-time
Experience level    Middle, Senior
Salary per month    220 000 - 400 000 RUB
Location    Москва, Russia (Россия)
Arrangement    Remote

Published: 09/01/2024