ML-инженер (портал Рамблер)
Rambler&Co занимает первое место среди медиахолдингов России по объему аудитории цифровых ресурсов — свыше 45,2 млн человек ежемесячно (по данным Mediascope, Cross Web, 2023). В него входят «Лента.ру», «Газета.Ru», «Чемпионат», портал «Рамблер», «Афиша» и ряд других медиаактивов. Благодаря различной тематической принадлежности площадок холдинг покрывает почти весь спектр интересов и потребностей различных аудиторий.
Сейчас находимся в ML-разработчика в Отдел по разработке и внедрению AI портала Рамблер.
Задачи:
– Разработка и тестирование алгоритмов RAG и LORA для генерации вопросов и ответов;
– Создание алгоритмов для ведения свободного диалога с пользователем, включая фактчекинг и фильтрацию;
– Анализ и сравнение результатов "Картины дня" после обработки редакцией и версий, созданных моделью;
– Разработка пайплайна для суммаризации полезного контента;
– Настройка навыков виртуального ассистента;
– Создание и индексация векторных поисковых индексов для алгоритмов RAG.
Ожидания от кандидата (опционально):
– Опыт работы в роли Data Scientist от 3 лет, предпочтительно в области обработки естественного языка (NLP);
– Уверенные знания и опыт работы с библиотеками машинного обучения и NLP, такими как TensorFlow, PyTorch, Hugging Face и др.;
– Опыт работы с алгоритмами RAG и LORA.;
– Владение Python;
– Знание SQL и опыт работы с базами данных.;
– Работа с большими языковыми моделями (LLM), понимание архитектуры и принципов работы LLM, опыт использования популярных библиотек для работы с LLM, умение выполнять тонкую настройку (fine-tuning) моделей под конкретные задачи, создание и тестирование промтов (Prompt Engineering), опыт тестирования и оптимизации промтов, оценка производительности моделей (Benchmarking), создание бенчмарков для оценки качества работы моделей, знание метрик для оценки NLP-задач;
– Знание особенностей задач NLP, опыт работы с текстовыми данными: предобработка, токенизация, лемматизация, стемминг, векторизация. Классификация, кластеризация, генерация, NER;
– Навыки работы с поисковыми системами и задачами поиска, понимание принципов работы поисковых систем, знакомство с Elasticsearch, опыт создания и оптимизации поисковых запросов, умение работать с семантическим поиском.
Условия:
– Официальное трудоустройство;
– ДМС со стоматологией, офисный врач, доплата больничного листа, корпоративные скидки;
– Современный офис (Даниловская мануфактура, м. Тульская), бесплатный спорт в собственном спортзале от «Лиги Героев»;
– Бесплатная подписка на сервисы партнеров;
– Полный день в офисе, гибридный график или 100% дистанционный формат работы;
– Льготные условия ипотеки в рамках зарплатного проекта;
– Насыщенная корпоративная жизнь.