............................................................................. ............................................................................. ............................................................................. ............................................................................. ............................................................................. ............................................................................. ............................................................................. ............................................................................. ............................................................................. ............................................................................. ............................................................................. ............................................................................. .............................................................................

Центр поддержки печати 

Ремонт оргтехники
5
1 оценка
ООО Центр поддержки печати
AI-engineer
Обязанности: – Проектировать и разрабатывать RAG-пайплайны (Retrieval-Augmented Generation) для задач question-answering, поиска и суммаризации документов – Интегрировать LLM (локальные модели) с использованием фреймворков (LangChain) – Работать с векторными базами данных для эффективного хранения и поиска эмбеддингов – Проводить оценку качества RAG-систем: применять метрики, разрабатывать собственные тестовые сценарии – Внедрять мониторинг и observability для LLM-приложений с помощью LangFuse (отслеживание промптов, трассировка, анализ стоимости и задержек) – Обеспечивать безопасность LLM-систем: внедрять практики LLMSecOps (защита от prompt injection, санитизация входных данных, контроль доступа к моделям, аудит логов) – Разрабатывать и поддерживать классические ML-модели для задач классификации, регрессии, кластеризации — встраивать их в продуктовую архитектуру – Оптимизировать производительность инференса моделей Требования: – Опыт разработки на Python от 3 лет – Знание асинхронного программирования (asyncio/aiohttp) будет плюсом – Глубокое понимание принципов работы LLM, трансформеров, эмбеддингов, методов промпт-инжиниринга – LLM в проде: понимание токенизации/контекста и ограничений, типовых failure-modes; понимание, когда уместна адаптация модели (PEFT/LoRA/QLoRA) и как оценивать влияние на качество/производительность. – RAG / knowledge Q&A: практический опыт построения решений на базе корпоративных данных: эмбеддинги, retrieval (векторный/гибридный), reranking, grounding/цитирование, контроль качества. – Инструменты LLM: HuggingFace + LangChain/LlamaIndex (или аналоги); опыт построения agentic/non-agentic пайплайнов с tool/function calling (контракты инструментов, устойчивость вызовов). – Backend и интеграции: сильный Python; сервисы и API (FastAPI или аналоги), очереди/воркеры/фоновые задачи, интеграции с внутренними системами; тесты и сопровождение. – Production/observability: логи/метрики/трейсы (Grafana/Prometheus или аналоги), диагностика инцидентов и деградаций качества/производительности. – Инфраструктура: Linux/CLI; Kubernetes на уровне чтения манифестов/логов и участия в диагностике. Условия: – Оформление по ТК, белая заработная плата – Оплачиваем питание в офисе – ДМС, страховка жизни и несчастных случаев, страховка от онкозаболеваний – Ежегодная индексация оклада – Годовая премия 10% от годового оклада – Софинансирование фитнеса – Корпоративные курсы английского языка – Оплата обучения до 100 000 р в год
Зарплата не указана
Вакансии на карте
Ищите работу на карте рядом с домом
Информация о вакансиях предоставлена hh.ru
🍪
Мы используем cookies подробнее