СофтТелематика – российский разработчик интеллектуальных телематических систем и транспортно-логистических платформ.
Кого мы ищем:
Мы ищем Middle ML Developer / LLM Developer, который присоединится к нашей команде разработки интеллектуальных ассистентов и поисковых систем нового поколения. Основная задача – проектирование и внедрение production-решений на базе LLM и Retrieval-Augmented Generation (RAG), обеспечивающих точный поиск, обработку и генерацию знаний для корпоративных и отраслевых сценариев.
Нам нужен специалист, способный не только интегрировать существующие решения, но и разрабатывать собственные подходы для повышения качества поиска и ответов, включая настройку моделей, разработку пайплайнов и оптимизацию производительности. Вы будете работать на стыке современных языковых моделей, систем поиска и инженерии данных.
Основные задачи:
– Разработка и улучшение пайплайнов для RAG-сценариев (retrievers, embeddings, chunking, индексация)
– Настройка и оптимизация работы с LLM API / open-source LLM (например, Qwen, LLaMA, Mistral, GPT-OSS)
– Построение и обучение моделей для обработки текста (NER, классификация, ранжирование документов)
– Работа с векторными базами данных (Qdrant, FAISS).
– Исследование и внедрение новых методов, включая retrieval-fusion, hybrid search, tool-use
От будущего коллеги мы ждем:
– Опыт коммерческой разработки в ML от 3-х лет (опыт работы с LLM от 1-го года)
– Понимание основ современных языковых моделей и их ограничений для решения реальных задач
– Уверенное владение Python (NumPy, PyTorch/TensorFlow, HuggingFace, LangChain/LlamaIndex)
– Опыт построения production-пайплайнов (обработка данных, деплой моделей, мониторинг)
– Практический опыт с RAG или поисковыми системами (BM25, vector search, hybrid)
– Опыт работы с Docker, понимание CI/CD
Будет плюсом:
– Опыт тонкой донастройки LLM (LoRA, PEFT)
– Понимание требований к аппаратным ресурсам и производительности при обучении и инференсе LLM: умение оценить нагрузку на GPU/CPU/память, подобрать конфигурацию кластера, учитывать latency и throughput в продакшне
– Опыт оптимизации моделей для инференса (quantization, pruning, mixed precision)
– Опыт успешного вывода на рынок продукта на базе LLM
– Опыт работы с VLM моделями
Мы предлагаем:
– Конкурентную заработную плату (плюс бонус) – уровень дохода обсуждаем в зависимости от компетенций;
– Работу в аккредитованной ИТ-компании;
– Участие в инновационных сложных проектах, которыми можно гордиться;
– Расширенный пакет ДМС со стоматологией, нужную технику для работы, систему скидок для сотрудников;
– Насыщенную корпоративную жизнь: корпоративы, тимбилдинг, детские праздники, тематические дни, комьюнити, спортивные мероприятия;
– Комфортный офис с панорамными видами, местами для отдыха, развитой инфраструктурой: оборудованные кухни (кофе, фрукты, овощи, снеки в свободном доступе), вендинговые автоматы со здоровой едой, рядом с офисом кафе и рестораны в шаговой доступности;
– График работы: 5/2 с 9:00 до 18:00 (гибкое начало рабочего дня).