Обязанности:
– Разрабатывать и поддерживать LLM/RAG-решения для бизнес-задач:- Интеграция внутренней документации (CRM, техническая база знаний) с LLM через векторные БД;- Оптимизация релевантности ответов за счет тюнинга эмбеддингов и ранжирования;
– Работать с векторными базами данных:- Настройка и администрирование (QDrant, ChromaDB, pgvector);- Оптимизация скорости поиска и качества эмбеддингов (выбор моделей, размер chunk’ов, метрик сходства).
– Интегрировать сервисы в существующую ИТ-инфраструктуру (API, брокеры сообщений, хранилища данных).
– Создавать API-интеграции для LLM:- Построение микросервисов на FastAPI для обработки запросов к LLM;- Интеграция с внешними системами (CRM, чат-боты, аналитические платформы);- Обеспечение безопасности и аудита запросов (rate limiting, фильтрация данных).
– Оптимизировать производительность и масштабируемость разрабатываемых сервисов для высоконагруженных систем.
– Настраивать мониторинг технических и качественных метрик моделей.
– Взаимодействовать с инженерами, аналитиками и продуктовыми командами.
– Экспериментировать с генеративным ИИ:- RnD/Fine-tuning моделей (open-source Ollama / Cloud LLMs) под нишевые задачи;- Тестирование новых архитектур (агента на основе AutoGen, multi-agent системы);- Внедрение cost-эффективных решений (quantization, кэширование ответов).
Требования:
– Опыт работы с RAG-архитектурами (от проектирования до оптимизации в production).
– Python — продвинутый уровень (от 3 лет), умение писать чистый и поддерживаемый production код (OOP, SOLID), знание фреймворков FastAPI, ORM (sqlalchemy).
– Понимание эмбеддингов: как генерировать, сравнивать, оптимизировать под задачи бизнеса.
– Практический опыт с векторными БД:- Уверенное использование минимум одной: QDrant, ChromaDB;- Навыки настройки индексов, гиперпараметров поиска, обработки больших датасетов.
– Знание LLM-стека:- Работа с LangChain, LlamaIndex;- Понимание принципов prompt engineering, retrieval strategies, reranking;- Опыт деплоя моделей через vLLM, Text Generation Inference или аналоги.
– Навыки API-интеграций:- Создание REST api-сервисов для LLM;- Работа с асинхронными запросами, очередями и фоновыми задачами (Celery, RabbitMQ, Redis).
– Опыт подготовки моделей к продакшену:- Docker, CI/CD.
– Хорошее знание Linux.
– Опыт работы с GitLab.
– Понимание принципов MLOps и мониторинга (включая Grafana).
– Опыт работы с SQL и NoSQL базами данных.
– Способность самостоятельно разбираться в предметной области и видеть связь технической постановки с бизнес-потребностями.
Условия:
– Работа на курорте "Роза Хутор";
– Оформление по ТК РФ;
– График работы 5/2 (с 9:00 до 18:00) или гибрид (3/2);
– ДМС со стоматологией после испытательного срока;
– Корпоративный транспорт (из Сочи, Адлера, Хосты, Кудепсты, Веселого, Чайсовхоза, Молдовки, Красной Поляны);
– Мотивационный пакет (доступ к уникальным возможностям курорта, включая пользование канатными дорогами и различными услугами);
– Полугодовой бонус по результатам работы курорта;
– Позиция не подразумевает предоставление жилья.