Обязанности:
– Проектировать и разрабатывать RAG-пайплайны (Retrieval-Augmented Generation) для задач question-answering, поиска и суммаризации документов
– Интегрировать LLM (локальные модели) с использованием фреймворков (LangChain)
– Работать с векторными базами данных для эффективного хранения и поиска эмбеддингов
– Проводить оценку качества RAG-систем: применять метрики, разрабатывать собственные тестовые сценарии
– Внедрять мониторинг и observability для LLM-приложений с помощью LangFuse (отслеживание промптов, трассировка, анализ стоимости и задержек)
– Обеспечивать безопасность LLM-систем: внедрять практики LLMSecOps (защита от prompt injection, санитизация входных данных, контроль доступа к моделям, аудит логов)
– Разрабатывать и поддерживать классические ML-модели для задач классификации, регрессии, кластеризации — встраивать их в продуктовую архитектуру
– Оптимизировать производительность инференса моделей
Требования:
– Опыт разработки на Python от 3 лет
– Знание асинхронного программирования (asyncio/aiohttp) будет плюсом
– Глубокое понимание принципов работы LLM, трансформеров, эмбеддингов, методов промпт-инжиниринга
– LLM в проде: понимание токенизации/контекста и ограничений, типовых failure-modes; понимание, когда уместна адаптация модели (PEFT/LoRA/QLoRA) и как оценивать влияние на качество/производительность.
– RAG / knowledge Q&A: практический опыт построения решений на базе корпоративных данных: эмбеддинги, retrieval (векторный/гибридный), reranking, grounding/цитирование, контроль качества.
– Инструменты LLM: HuggingFace + LangChain/LlamaIndex (или аналоги); опыт построения agentic/non-agentic пайплайнов с tool/function calling (контракты инструментов, устойчивость вызовов).
– Backend и интеграции: сильный Python; сервисы и API (FastAPI или аналоги), очереди/воркеры/фоновые задачи, интеграции с внутренними системами; тесты и сопровождение.
– Production/observability: логи/метрики/трейсы (Grafana/Prometheus или аналоги), диагностика инцидентов и деградаций качества/производительности.
– Инфраструктура: Linux/CLI; Kubernetes на уровне чтения манифестов/логов и участия в диагностике.
Условия:
– Оформление по ТК, белая заработная плата
– Оплачиваем питание в офисе
– ДМС, страховка жизни и несчастных случаев, страховка от онкозаболеваний
– Ежегодная индексация оклада
– Годовая премия 10% от годового оклада
– Софинансирование фитнеса
– Корпоративные курсы английского языка
– Оплата обучения до 100 000 р в год