Мы создаём финтех-продукты для рынков, где формируется будущее финансовых технологий. Работаем на международных проектах, совмещая скорость стартапов с надёжностью enterprise-разработки.
У нас прозрачные процессы, честные грейды и инженерная культура без бюрократии. У нас можно создавать международный финтех, влиять на продукт и расти в предсказуемой, честной и зрелой инженерной среде.
Прямо сейчас мы в поиске AI/ML-инженера.
Стек технологий: Python 3.12+, asyncio, FastAPI, Uvicorn, Pydantic v2, LiteLLM, vLLM, TGI, Ollama, LangChain, LlamaIndex, Qdrant, Chroma, Pinecone, Sentence-Transformers, OpenAI Embeddings, Unstructured, Chonkie, LangChain Text Splitters, FlashRank, Cohere, Presidio, NeMo Guardrails, Detoxify, OpenLLMetry, LangFuse, LangSmith, Prometheus, Docker, Kubernetes, CUDA, GPU, A10, A100, MinIO.
Чем предстоит заниматься?
– Разрабатывать LLM routing и gateway слой;
– Реализовывать и оптимизировать RAG-пайплайны;
– Встраивать guardrails и AI safety механизмы;
– Интегрировать LLM observability и трейсинг;
– Оптимизировать inference по latency, throughput и стоимости;
– Реализовывать evaluation-пайплайны качества ответов;
– Работать с GPU-инфраструктурой и масштабированием.
Мы ожидаем от Вас:
– Опыт работы от 5 лет;
– Реальный опыт вывода ML-моделей в production и понимание жизненного цикла модели;
– Глубокое понимание RAG-архитектур: практические навыки работы с векторными БД (Qdrant, Milvus, Weaviate, PGVector) и фреймворками (LangChain, LlamaIndex или кастомные решения);
– Глубокое знание Python и async-стека;
– Умение проектировать и оценивать эксперименты, работать с метриками ;
– Продуктовый опыт работы с LLM;
– Понимание рисков и безопасности LLM-систем.
Будет плюсом:
– Agentic RAG и multi-agent системы;
– Fine-tuning моделей (LoRA, QLoRA);
– Multi-modal модели (vision, audio);
– ASR, TTS, OCR, NER;
– Опыт evaluation-фреймворков (RAGAS, deepeval);
– Оптимизация inference (batching, KV-cache, quantization).
Почему мы?
– График 5/2 по календарю РФ, гибкое начало рабочего дня до 10:00 по Московскому времени;
–
Уютный офис в центре Казани, возможность удаленной работы из других город;
– Официальное трудоустройство в аккредитованной IT-компании со всеми плюшками;
– Корпоративные уроки английского, фитнес прямо в офисе, футбольная команда, библиотека и партнёрские бенефиты;
– Подарки к праздникам и здоровую атмосферу, где твой вклад ценят;
– Поддержка профессионального развития — участие в конференциях, обучение, обмен опытом;
– Открытая культура и высокий уровень доверия.