Центр исследования и разработки беспилотного транспорта - команда профессионалов работающих над внедрением инновационных решений, а также повышением эффективности и безопасности городского транспорта в Москве.
ОБЯЗАННОСТИ
Управление данными и автоматизация (Core MLOps)
– Построение end-to-end процессов работы с видеоданными: от сбора с edge-устройствдо подготовки финальных датасетов для обучения моделей
– Интеграция инструментов разметки (CVAT) с S3-хранилищем и ClearML, автоматизация обмена данными и статусов задач разметки
– Автоматизация процессов Active Learning: выборка данных для доразметки, формирование заданий, обновление датасетов
– Анализ и улучшение производительности пайплайнов работы с данными (скорость обработки, стоимость хранения, стабильность)
Генеративный AI и Синтетические данные
– Развертывание и сопровождение генеративных моделей на GPU-серверах (например, диффузионные модели для генерации изображений)
– Построение пайплайна генерации синтетических изображений для дообучения нейронных сетей (Data Augmentation / Synthetic Data Generation)
– Организация хранения и учёта сгенерированных данных (метаданные, версии, параметры генерации)
Оптимизация моделей под целевую платформу:
– Квантизация, pruning, сжатие
Разработка и обучение новых моделей детектора:
– Подбор и внедрение современных архитектур
– Настройка пайплайна обучения, валидации, тестирования
ТРЕБОВАНИЯ
– Опыт работы с современными генеративными моделями (диффузионные модели, GAN)
– Опыт в MLOps / Data Engineering: уверенное владение Python, опыт написания скриптов автоматизации
– Работа с ML-инфраструктурой: уверенный опыт использования ClearML
– Опыт построения пайплайнов обработки данных (желательно — видеоданных): скачивание, конвертация, нарезка, аугментации, контроль качества
– Уверенная работа в Linux-среде
– Уверенный Python, опыт с PyTorch/TensorFlow
– Практический опыт обучения, тюнинга и квантизации моделей
БУДЕТ ПЛЮСОМ
– Опыт развёртывания и оптимизации генеративных моделей
– Опыт работы с Active Learning, semi-supervised/self-supervised подходами в контексте данных компьютерного зрения
– Понимание типичных задач CV (детекция, трекинг, сегментация) и требований к датасетам для них
УСЛОВИЯ
– Трудоустройство и работа в соответствии с ТК РФ
– Бесплатный проезд в столичном метро
– Бесплатный проезд по железным дорогам в пригородном сообщении от места жительства до места работы и обратно в пределах Московской области
– Льготы на отдых в оздоровительном комплексе метрополитена
– Детский оздоровительный лагерь и детский клуб
– Финансовые условия обсуждаем индивидуально в зависимости от опыта кандидата