Команда продукта «Интеллектуальная система управления руководителя» создает продукт, который включает Ai-сервисы для повышения эффективности работы руководителя:
- голосовой Виртуальный Ассистент на базе «Салют» (навыки работы с текстом, аудио, поиск информации по корпоративной базе знаний)
- Knowledge Assistant с использованием Llm для поиска и работы с информацией в корпоративной базе знаний
- сервис Speech2Text + Llm для автоматического протоколирования совещаний
- Llm для саммаризации протоколов совещаний, почты, заметок и пр.
- Llm и др. генеративные модели для генерации текстов (писем, заметок), презентаций, документов
- Ocr и Llm для распознавания и работы с документами (саммаризация, комментарии к материалам)
Взаимодействие ведется с командами внутри Блока, подразделениями Блока Технологии (SberDevices), Департаментом Ии (Ai Lab, Sber Ai), Управлением валидации.
Обязанности
-
разработка дизайна Ml системы из множества Ml моделей в рамках единого продукта («Интеллектуальная система управления руководителя»)
-
консультирование / участие в автоматизации источников данных для Ml моделей совместно с Ml Engineer/Data Engineer
-
full-stack разработка Ml моделей, доведение моделей из стадии Mvp до целевого решения (все этапы Жц моделей по Crisp-Dm от Data Understanding до Deployment с использованием тех. стека банка);
-
Работа с аудио сигналом: фильтрация, очистка от шума, алгоритмы сжатия.
-
Speech2Text: разработка, настройка и дообучение моделей распознавания речи (например Wav2Vec, Whisper);
-
Решение задач Speaker Diarization и Speaker Recognition: эмбеддинги спикеров, разделение спикеров (сегментация, кластеризация), идентификации спикеров.
-
Vad: Решение задачи детектирование активности голоса.
-
Audio Source Separation: решение задач по разделению источников звука.
Сопутствующие обязательные стримы:
-
тесное взаимодействие с бизнес-заказчиком для выявления требований к Ai-компоненте продукта и самостоятельная постановка задачи на основании извлечения vision;
-
участие в разработке архитектуры решения в части Ai-компоненты (технологический стек для развертывания моделей в средах исполнения);
-
участие в стримах по валидации разработанных моделей и постановке их на автомониторинг.
Требования
-
образование в техническом Вузе в сфере компьютерных наук, прикладной математики или статистики. Наиболее приоритетны: Вшэ, Мфти, Мгу, Мифи;
-
опыт в разработке Speech to Text моделей и сервисов;
-
опыт в обработке аудиосигналов.
-
опыт в работе с моделями Speaker Diarization и Speaker Recognition;
-
опыт в работе с моделями Vad и Audio Source Separation;
-
понимание жизненного цикла моделей (Crisp-Dm);
-
умение переводить бизнес-постановку задачи в Ml-постановку, грамотная интерпретация полученных результатов;
-
высокий уровень владения ядром Python и Sql;
-
свободное владение базовыми библиотеками на Python, в том числе: pandas, numpy, matplotlib, seaborn;
-
знание фреймворков, библиотек, алгоритмов машинного обучения: Scikit-learn, Pytorch, Xgboost, CatBoost, TensorFlow, transformers;
-
знание библиотек и инструментов для работы с аудио: ffmpeg, torchaudio;
-
Базовые знания Nlp;
-
знание архитектур нейронных сетей 1D Cnn, трансформеры;
-
контейнеризация: Docker, OpenShift;
-
Linux;
-
инструменты DevOps (Mlops): Git, Jira, Bitbucket, Nexus, Jenkins;
-
индустриальный опыт разработки, обучения, тестирования, выведения моделей в эксплуатацию и мониторинга качества (не менее 3-х лет);
-
технический английский статьи, документация);
Преимущество:
pet-projects на Github, владение Confluence, Jira, медали на Kaggle, готовность брать на себя коммуникацию с бизнес-заказчиком, опыт Ds-менторства.
Условия
-
Ипотека выгоднее на 4% для каждого сотрудника и льготные условия кредитования;
-
Бесплатная подписка СберПрайм+;
-
Скидки на продукты компаний-партнеров;
-
Дмс с первого дня и льготное страхование для близких;
-
Корпоративная пенсионная программа;
-
Обучение за счет Компании: онлайн курсы в Виртуальной школе Сбера и неограниченный доступ к библиотеке, обучение в Корпоративном университете, Тренинги, митапы и возможность получить новую квалификацию;
-
Крупнейшее Ds&Ai community - более 600 Ds банка, включая: регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих Вузов и экспертов технологических компаний, дайджест о самых последних разработках в области Ds&Ai и отчеты с крупнейших конференций мира, регулярные внутренние митапы
Требуется data scientst (asr)
Web-разработчик, web-программист, программист python, разработчик, web-developer, программист, developer python, developer