DS аналитик
VizorLabs – один из ведущих российских поставщиков систем видеоаналитики для промышленного применения.
Мы ищем специалиста, который будет заниматься исследованием, прототипированием и валидацией ML-моделей для решения бизнес-задач клиентов. Работа напрямую с клиентами и командой Data Engineering для подготовки данных и создания готового рабочего прототипа модели, который затем передается MLE-команде для индустриализации.
Ключевые Обязанности:
– Клиентская работа и анализ требований
– Проведение глубоких интервью с клиентами для выявления и формализации их бизнес-проблем.
– Перевод бизнес-задач на язык конкретных ML-постановок (классификация, регрессия, детекция аномалий и т.д.).
– Формирование гипотез и предложений по их решению с помощью данных и ML.
– Подготовка и презентация результатов анализа и прототипов моделей для технических и нетехнических аудиторий.
Исследовательская работа и прототипирование:
– Проведение полного цикла исследовательского анализа данных (EDA).
– Разработка, обучение и валидация прототипов машинного обучения и глубокого обучения (в основном в средах типа Jupyter Notebook +Docker).
– Подбор и тонкая настройка алгоритмов и их гипер параметров для достижения максимального качества на валидационных выборках.
– Анализ ошибок модели, интерпретация ее решений.
Работа с данными и разметка:
– Тесное взаимодействие с Data Engineering по формированию и доставке сырых данных.
– Составление ТЗ и управление процессом разметки данных (работа с менеджерами по разметке, аутсорсом или краудсорсинговыми платформами).
– Контроль качества размеченных данных, их очистка.
Документирование и передача:
– Создание исчерпывающей технической документации на прототип: использованные данные, фичи, алгоритмы, метрики качества, ограничения модели.
– Передача обученных моделей, кода и документации команде MLE для последующего внедрения.
– Консультация MLE-команды по вопросам, связанным с логикой работы модели.
Ожидаем от кандидатов:
– Опыт работы на позиции Data Scientist от 2-х лет.
– Знание Python и основных библиотек для анализа и ML: Pandas, NumPy, Scikit-learn, Matplotlib/Seaborn.
– Понимание принципов оценки качества моделей (кросс-валидация, выбор метрик: AUC-ROC, F1, Precision, Recall, MAPE и т.д.).
– Опыт работы с Jupyter Notebook/Lab
– Опыт работы с Docker на уровне запуска контейнеров.
– Опыт работы с глубоким обучением (CNN, RNN, Transformers) и фреймворками: TensorFlow или PyTorch (именно на уровне создания и обучения прототипов, а не продакшн-развертывания).
– Опыт работы с компьютерным зрением (CV)
– Мониторинг качества работы системы и обученной модели.
– Участие в создании документации компонентов системы и процессов видеоаналитики.
Будет преимуществом:
– Опыт работы с инструментами для управления экспериментов (MLflow, Weights & Biases, ClearML).
– Опыт fine-tuning MLLM (multimodal large language models) и разработка решений на основе Retrieval-Augmented Generation (RAG).
– Умение разрабатывать структурированные и ёмкие презентации для наглядной коммуникации сложных идей.
– умение работать с командной строкой (Linux)Предлагаем:
Предлагаем:
– Работа в аккредитованной ИТ компании, входящей в топ-100 ИТ-компаний России;
– Программы обучения сотрудников, возможности для повышения квалификации и сертификации;
– ДМС;
– Корпоративная мобильная связь;
– Офис ст. метро Бауманская/Электрозаводская