Обязанности:
DataOffice - это драйвер DataDriven культуры в Ростелекоме, один из лидеров отрасли управления данными в России. DataOffice объединяет 300 профессионалов в области ИТ-технологий. В компании расширяется команда для разработки сервисов на базе больших языковых моделей: прикладные настольные приложения для повышения эффективности сотрудников и внедрение ИИ в программные продукты РТК (Яга/Ежка, аналоги Jira/Trello/Confluence, Электронный документооборот, ITSM и т.д.). Примеры сервисов: Генерация формального текста или шаблона задачи из свободного описания; Формирование саммари текстов; Умный поиск по документам, базам знаний; Генерация презентаций; Поиск похожих документов; Интеллектуальная нарезка историй и задач на подзадачи или пункты; Различные задачи классификации на основе текстовых данных; Выделение именованных сущностей из описания задачи. Что мы ожидаем от кандидата: Опыт работы в роли Data scientist от 1 года; Работа с одним из фреймворков PyTorch/TensorFlow; Знание основных подходов для предобработки и векторизации текста; Наличие опыта решения задач NLP для текста (Text Classification, NER, Text Summarization); Знакомство и понимание основных принципов современных SOTA моделей NLP; Владение: git, docker, sql и одним из фреймворков для реализации api. Будет плюсом: Участие в соревнованиях по ML/DL; Практический опыт до обучения и работы с open source LLM; Публикации по NLP; Собственные проекты по NLP. Мы предлагаем: Работа в крупнейшем в России интегрированном провайдере цифровых решений; Возможна полная или частичная удаленная работа из России; В Москве - БЦ Академик, победивший в номинации лучший проект «Бизнес-центр класса А. Москва» Возможность работать из офисов в городе Краснодар и Новосибирск. Официальное оформление — согласно ТК РФ (полный соц. пакет: ежегодный оплачиваемый отпуск 28 календарных дней, оплата больничных); Официальная заработная плата (оклад и годовая премия); Кафетерий льгот с 1 рабочего дня: ДМС, компенсация транспорта, интернета, спорта, обучения и др.; Корпоративное обучение: внутренние митапы, участие в конференциях, доступ к корпоративным библиотекам технической и бизнес литературы.