Мы ищем специалиста Deep Learning в disrupt направление. Нам нужны специалисты в области Nlp и работы с аудио (Asr, Tts).
Вам предстоит участвовать в развитии системы форд-мониторинга Сбербанка, которая обеспечивает защиту клиентов банка во всех каналах обслуживания от мобильных приложений и покупок в интернет до визитов клиентов в офисы.
Нам уже есть чем гордиться, но мы развиваемся и не стоим на месте
17th Annual 2021 Cyber Security Global Excellence Awards winners.
Fraud Prevention Gold Winner – SberBank Anti-Fraud System
Fraud Prevention Editor’s Choice – SberBank
Мы принимаем активное участие в развитии этой системы и сосредоточены на разработке и внедрении Ai-моделей по выявлению мошенничества. У нас ты сможешь поработать с действительно большими объемами данных, широким перечнем передовых технологий и сделать значимый вклад в борьбу с мошенничеством в стране.
Обязанности
· Исследование новых архитектур и подходов, апробирование на реальных данных
· Работа с собственной Llm GigaChat. Имплементация Llm для решения прикладных задач
· Обработка аудио-потока: Speech-to-Text и Text-to-Speech
· Построение высоконагруженных решений, основанных на Dl-моделях
а также
· Мониторинг и регулярный контроль качества работающих в пром. моделей;
· Анализ доступных источников данных и информации в них, оценка качества для решения задач;
· Обсуждение задач и методов их решения совместно с фрод-аналитиками и бизнес-заказчиками, формулирование гипотез и их проверка;
· Построение воспроизводимых и переиспользуемых решений для работы с данными и моделями
Требования
· Хорошие знания Python 3
· Знание PyTorch, опыт полного цикла разработки Dl моделей.
· Знание подходов обработки последовательностей: Rnn, Transformer.
· Опыт использования библиотека анализа данных и построения Ml моделей на Python (pandas/dask, xgboost/lightgbm/catboost, sklearn, …), понимание особенностей и границ применимости;
· Знание мат. статистики и теории вероятностей
· Знание Git
· Знание английского языка (чтение документации и статей)
Условия
· Знание Spark/PySpark, Hive
· Знание библиотек torch-audio, pyaanote, librosa, nemo.
· Опыт обработки последовательностей, знание продвинутых подходов.
· Знакомы подходы tts, stt, diarisation.
· Опыт взаимодействия с Llm, Sft.
· Знание подходов распараллеливания вычислений.
Требуется data scientist dl
Аналитик, data scientist, web-разработчик, web-программист, программист python, разработчик, web-developer, программист, developer python, developer, специалист по анализу данных, специалист по большим данным, специалист по обработке больших данных, специалист по работе с большими данными