AI DevOps инженер / Инженер по машинному обучению / MLOps
Мы – R&D подразделение в лидирующем рекламном холдинге Okkam. Мы строим технологические и AI продукты для рекламного рынка России и Казахстана. Мы работаем с большими данными, интегрируемся с рекламными платформами и развиваем внутренние и внешние сервисы Okkam. Мы держим высокий темп разработки, опираемся на Agile и Lean практики и активно используем AI инструменты.
Нам нужен опытный DevOps админ с сильным opensource бэкграундом. Тебе предстоит разворачивать и поддерживать инфраструктуру для R&D продуктов в облаке и on premise, помогать командам быстро запускать сервисы и держать стабильность при росте нагрузки. Мы разрабатываем AI решения корпоративного уровня, поэтому мы ждём от тебя уверенный опыт с LLM, RAG, GPU стеком, Docker, Kubernetes и вспомогательными системами.В Okkam есть команда IT инфраструктуры, но её задача держать в рабочем состоянии основные сервисы холдинга вроде почты, корпоративных мессенджеров, файловых ресурсов, SQL и 1С, поэтому им трудно покрыть потребности R&D. Нам нужен человек, который сможет работать сразу с несколькими командами разработки, брать на себя развёртывание, настройку, оптимизацию и поддержку нужных инфраструктурных компонентов. Тебе придётся выстраивать рабочие отношения с IT инфраструктурой, хостингами и внешними партнёрами, чтобы наши продукты получали надёжную и предсказуемую среду.
Твои задачи:
– Администрирование инфраструктурф разработки и хостинга продуктов: настройка, обновления, мониторинг.Стек: Linux, Docker, Kubernetes, Ansible, RabbitMQ, nginx, S3, mail-сервер, Apache Airflow, GitLab, RAG.
– Помощь в настройке и поддержке CI/CD (GitLab Runner, Docker, Magallanes v5).
– Разворачивание и администрирование отдельных приложений для работы команды разработки и проверки гипотез.
– Развёртывание и поддержка инструментов для команд: GitLab, YouTrack, Superset, BookStack, Vaultwarden, Matomo, Node Red и другие.
– Участтие в обсуждении архитектуры продуктов и выборе технологий.
– Поддержка стабильной работы R&D продуктов и участие в быстрых восстановительных работах при сбоях
Нам по пути, если ты:
– Имеешь опыт работы на позиции DevOps и/или системного администратора от 3 лет.
– Отлично умеешь администрировать Linux и умеешь решать сложные кейсы.
– Уверенно работаешь с Docker и оркестраторами контейнеров (Kubernetes и др).
– Работал с облачными инфраструктурами, в том числе с Яндекс Облаком.
– Ты умеешь настраивать системы мониторинга (Prometheus, Elasticsearch, Grafana, Sentry и Kibana).
– Ты умеешь поднимать и поддерживать CI/CD в GitLab или готов быстро закрыть пробелы.
– Ты развертывал opensource решения для LLM и RAG в облаке и on premise.
– Ты готов разворачивать и администрировать нужные командам сервисы: mail серверы, nginx, S3, RabbitMQ, Airflow, системы ведения документации и другие.
– Объясняешь свои решения ясно и можешь аргументировать свою позицию.
– Работаешь на общий результат и не боишься брать на себя ответственность.
Будет плюсом:
– Опыт поддержки боевой AI инфраструктуры под чат-ботов или AI агентов.
– Опыт работы с инфраструктурой как кодом (Ansible).
– Опыт работы с очередями сообщений (RabbitMQ).
– Навыки администрирования ClickHouse, PostgreSQL или MSSQL
От нас:
– Обучение, тренинги и прозрачный карьерный рост, корпоративный коуч
– Классный офис класса А в башне Империя Москвы-сити
– Комфортная неформальная атмосфера, клубы по интересам, мероприятия
– Оформление по ТК, ДМС после испытательного срока, страхование от несчастных случаев, онкочекапы и мат.помощь
– Бесплатные консультации от психологов, налоговых консультантов и др.
– Корпоративная программа скидок платформы Best Benefits
– Волонтерские программы, платформа для идей и их реализации, благотворительность