Job 510 van 525

ОТКЛИКНУТСЯ



Data Scientist Nlp


Кто мы?
Наша междисциплинарная команда, состоящая из юристов, лингвистов, разработчиков и Data Scientists, занимается разработкой уникальных продуктов в области Legal Tech: решений для юриспруденции на базе систем искусственного интеллекта. Мы создаем наши решения как для внутренних, так и для внешних клиентов, обеспечивая, в частности, автоматизированные правовые заключения для предоставления корпоративным клиентам Сбербанка кредита за семь минут.
Кого мы ищем?
Мы ищем опытного специалиста в области Nlp-алгоритмов, готового погрузиться в проблематику и успешно решать задачи извлечения юридически значимых фактов из корпоративных документов кредитного досье, таких как уставы и внутренние нормативные документы, договоры, протоколы, доверенности и т.п.
Чем предстоит заниматься:
  • Исследовать вместе с аналитиками данных атрибутный состав исследуемых документов, ставить задачу на формирование и разметку обучающей выборки, контролировать качество данных, распределение сущностей
  • Выбирать оптимальные модели для решения задач извлечения сущностей, их взаимосвязей, и их сборки в деревья для принятия решений
  • Собирать пайплайн вызова моделей и следить за актуальностью зависимостей
  • Взаимодействовать с разработчиками и аналитиками.
  • Заниматься наставничеством в команде.
Что мы используем:
  • PyTorch, ruBert, Gpt-3, AllenNlp, AirFlow
  • Neo4j, PostgreSql, MongoDb
  • Docker, Jenkins, OpenShift, Linux, Bash, Git, Dvc
Но мы открыты к твоим предложениям использовать и другие технологии. Более того, мы рассчитываем, что ты будешь готов принести что-то свое в нашу команду!
Эта вакансия тебе подходит, если ты:
  • Не боишься браться за сложные задачи.
Тебе предстоит разобраться в устройстве сложного пайплайна вызова моделей, исследовать возможности по улучшению качества извлечения (предсказания, классификации) десятков взаимосвязанных сущностей.
  • Знаешь и применяешь State-of-the-Art (Sota) технологии.
Мы ожидаем, что ты знаешь, как устроены трансформеры и сможешь самостоятельно адаптировать и дообучить нейронную сеть на архитектуре Bert для решения задач юридического домена.
  • Хорошо знаком с алгоритмами и готов рассказать, как лучше обойти дерево.
Результат нашего извлечения из документа – древовидные группы сущностей, на основе которых создаются онтологии с возможностью поиска по ним. Звучит сложно? Надеемся, что это тебя не испугает, а заинтригует!
  • Командный игрок: готов слушать, предлагать и брать ответственность.
В нашей команде каждый может повлиять на итоговый продукт. Мы ищем тех, кто готов проявлять инициативу и доводить её до конечного результата, не взирая на трудности.
  • Нацелен на результат.
Наша цель – делать ценные для пользователя продукты на основе Ml-алгоритмов. Все технологические усовершенствования, в которые мы инвестируем наше время, должны приносить измеримый и ощутимый для пользователя эффект.
Условия
  • Работа среди сильных специалистов в своей области. В нашей команде работают выпускники Мфти, Мгу, Вшэ, Мгюа
  • Возможности саморазвития: оплата поездок на конференции, прохождение курсов, спортзал
  • Возможности для профессиональной самореализации: работая над сложными практическими и исследовательскими задачами, ты сможешь пользоваться вычислительным мощностям Сбера, в том числе - суперкомпьютера Кристофари
  • Дмс для сотрудника и его родственников.
  • Льготные условия на продукты Сбера +

Требуется data scientist nlp

Аналитик, data scientist, специалист по анализу данных, специалист по большим данным, специалист по обработке больших данных, специалист по работе с большими данными, разработчик, программист, developer

ОТКЛИКНУТСЯ

Другие вакансии по поиску