Job 22 van 136

ОТКЛИКНУТСЯ



Data Scientst (Asr)


Команда продукта «Интеллектуальная система управления руководителя» создает продукт, который включает Ai-сервисы для повышения эффективности работы руководителя:
- голосовой Виртуальный Ассистент на базе «Салют» (навыки работы с текстом, аудио, поиск информации по корпоративной базе знаний)
- Knowledge Assistant с использованием Llm для поиска и работы с информацией в корпоративной базе знаний
- сервис Speech2Text + Llm для автоматического протоколирования совещаний
- Llm для саммаризации протоколов совещаний, почты, заметок и пр.
- Llm и др. генеративные модели для генерации текстов (писем, заметок), презентаций, документов
- Ocr и Llm для распознавания и работы с документами (саммаризация, комментарии к материалам)
Взаимодействие ведется с командами внутри Блока, подразделениями Блока Технологии (SberDevices), Департаментом Ии (Ai Lab, Sber Ai), Управлением валидации.
Обязанности

  • разработка дизайна Ml системы из множества Ml моделей в рамках единого продукта («Интеллектуальная система управления руководителя»)
  • консультирование / участие в автоматизации источников данных для Ml моделей совместно с Ml Engineer/Data Engineer
  • full-stack разработка Ml моделей, доведение моделей из стадии Mvp до целевого решения (все этапы Жц моделей по Crisp-Dm от Data Understanding до Deployment с использованием тех. стека банка);
  • Работа с аудио сигналом: фильтрация, очистка от шума, алгоритмы сжатия.
  • Speech2Text: разработка, настройка и дообучение моделей распознавания речи (например Wav2Vec, Whisper);
  • Решение задач Speaker Diarization и Speaker Recognition: эмбеддинги спикеров, разделение спикеров (сегментация, кластеризация), идентификации спикеров.
  • Vad: Решение задачи детектирование активности голоса.
  • Audio Source Separation: решение задач по разделению источников звука.
Сопутствующие обязательные стримы:
  • тесное взаимодействие с бизнес-заказчиком для выявления требований к Ai-компоненте продукта и самостоятельная постановка задачи на основании извлечения vision;
  • участие в разработке архитектуры решения в части Ai-компоненты (технологический стек для развертывания моделей в средах исполнения);
  • участие в стримах по валидации разработанных моделей и постановке их на автомониторинг.
Требования
  • образование в техническом Вузе в сфере компьютерных наук, прикладной математики или статистики. Наиболее приоритетны: Вшэ, Мфти, Мгу, Мифи;
  • опыт в разработке Speech to Text моделей и сервисов;
  • опыт в обработке аудиосигналов.
  • опыт в работе с моделями Speaker Diarization и Speaker Recognition;
  • опыт в работе с моделями Vad и Audio Source Separation;
  • понимание жизненного цикла моделей (Crisp-Dm);
  • умение переводить бизнес-постановку задачи в Ml-постановку, грамотная интерпретация полученных результатов;
  • высокий уровень владения ядром Python и Sql;
  • свободное владение базовыми библиотеками на Python, в том числе: pandas, numpy, matplotlib, seaborn;
  • знание фреймворков, библиотек, алгоритмов машинного обучения: Scikit-learn, Pytorch, Xgboost, CatBoost, TensorFlow, transformers;
  • знание библиотек и инструментов для работы с аудио: ffmpeg, torchaudio;
  • Базовые знания Nlp;
  • знание архитектур нейронных сетей 1D Cnn, трансформеры;
  • контейнеризация: Docker, OpenShift;
  • Linux;
  • инструменты DevOps (Mlops): Git, Jira, Bitbucket, Nexus, Jenkins;
  • индустриальный опыт разработки, обучения, тестирования, выведения моделей в эксплуатацию и мониторинга качества (не менее 3-х лет);
  • технический английский статьи, документация);
Преимущество: pet-projects на Github, владение Confluence, Jira, медали на Kaggle, готовность брать на себя коммуникацию с бизнес-заказчиком, опыт Ds-менторства.
Условия
  • Ипотека выгоднее на 4% для каждого сотрудника и льготные условия кредитования;
  • Бесплатная подписка СберПрайм+;
  • Скидки на продукты компаний-партнеров;
  • Дмс с первого дня и льготное страхование для близких;
  • Корпоративная пенсионная программа;
  • Обучение за счет Компании: онлайн курсы в Виртуальной школе Сбера и неограниченный доступ к библиотеке, обучение в Корпоративном университете, Тренинги, митапы и возможность получить новую квалификацию;
  • Крупнейшее Ds&Ai community - более 600 Ds банка, включая: регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих Вузов и экспертов технологических компаний, дайджест о самых последних разработках в области Ds&Ai и отчеты с крупнейших конференций мира, регулярные внутренние митапы

Требуется data scientst (asr)

Web-разработчик, web-программист, программист python, разработчик, web-developer, программист, developer python, developer

ОТКЛИКНУТСЯ

Другие вакансии по поиску