Кто мы?
Наша междисциплинарная команда, состоящая из юристов, лингвистов, разработчиков и Data Scientists, занимается разработкой уникальных продуктов в области Legal Tech: решений для юриспруденции на базе систем искусственного интеллекта. Мы создаем наши решения как для внутренних, так и для внешних клиентов, обеспечивая, в частности, автоматизированные правовые заключения для предоставления корпоративным клиентам Сбербанка кредита за семь минут.
Кого мы ищем?
Мы ищем опытного специалиста в области Nlp-алгоритмов, готового погрузиться в проблематику и успешно решать задачи извлечения юридически значимых фактов из корпоративных документов кредитного досье, таких как уставы и внутренние нормативные документы, договоры, протоколы, доверенности и т.п.
Чем предстоит заниматься:
-
Исследовать вместе с аналитиками данных атрибутный состав исследуемых документов, ставить задачу на формирование и разметку обучающей выборки, контролировать качество данных, распределение сущностей
-
Выбирать оптимальные модели для решения задач извлечения сущностей, их взаимосвязей, и их сборки в деревья для принятия решений
-
Собирать пайплайн вызова моделей и следить за актуальностью зависимостей
-
Взаимодействовать с разработчиками и аналитиками.
-
Заниматься наставничеством в команде.
Что мы используем:
-
PyTorch, ruBert, Gpt-3, AllenNlp, AirFlow
-
Neo4j, PostgreSql, MongoDb
-
Docker, Jenkins, OpenShift, Linux, Bash, Git, Dvc
Но мы открыты к твоим предложениям использовать и другие технологии. Более того, мы рассчитываем, что ты будешь готов принести что-то свое в нашу команду!
Эта вакансия тебе подходит, если ты:
-
Не боишься браться за сложные задачи.
Тебе предстоит разобраться в устройстве сложного пайплайна вызова моделей, исследовать возможности по улучшению качества извлечения (предсказания, классификации) десятков взаимосвязанных сущностей.
-
Знаешь и применяешь State-of-the-Art (Sota) технологии.
Мы ожидаем, что ты знаешь, как устроены трансформеры и сможешь самостоятельно адаптировать и дообучить нейронную сеть на архитектуре Bert для решения задач юридического домена.
-
Хорошо знаком с алгоритмами и готов рассказать, как лучше обойти дерево.
Результат нашего извлечения из документа – древовидные группы сущностей, на основе которых создаются онтологии с возможностью поиска по ним. Звучит сложно? Надеемся, что это тебя не испугает, а заинтригует!
-
Командный игрок: готов слушать, предлагать и брать ответственность.
В нашей команде каждый может повлиять на итоговый продукт. Мы ищем тех, кто готов проявлять инициативу и доводить её до конечного результата, не взирая на трудности.
Наша цель – делать ценные для пользователя продукты на основе Ml-алгоритмов. Все технологические усовершенствования, в которые мы инвестируем наше время, должны приносить измеримый и ощутимый для пользователя эффект.
Условия
-
Работа среди сильных специалистов в своей области. В нашей команде работают выпускники Мфти, Мгу, Вшэ, Мгюа
-
Возможности саморазвития: оплата поездок на конференции, прохождение курсов, спортзал
-
Возможности для профессиональной самореализации: работая над сложными практическими и исследовательскими задачами, ты сможешь пользоваться вычислительным мощностям Сбера, в том числе - суперкомпьютера Кристофари
-
Дмс для сотрудника и его родственников.
-
Льготные условия на продукты Сбера +
Требуется data scientist nlp
Аналитик, data scientist, специалист по анализу данных, специалист по большим данным, специалист по обработке больших данных, специалист по работе с большими данными, разработчик, программист, developer