............................................................................. ............................................................................. ............................................................................. ............................................................................. ............................................................................. ............................................................................. ............................................................................. ............................................................................. ............................................................................. ............................................................................. ............................................................................. ............................................................................. .............................................................................

Яндекс 

Г. Москва
1.5
985 оценок
Аналитик данных в Авто.ру
Команда Яндекс Вертикалей ищет аналитика-разработчика. Мы помогаем развивать бизнес Авто.ру во всех регионах России. Если вам интересно улучшать маркетинговую аналитику, придумывать идеи для экспериментов и критически анализировать задачи — эта работа для вас. Какие задачи вас ждут Анализ трендов рынкаВы будете выявлять сезонные колебания спроса, анализировать ценовую динамику и новые модели, чтобы понимать, куда движется рынок авто. Анализ поведения пользователейВы будете изучать, как клиенты ищут и выбирают автомобили, где проводят больше всего времени и что мешает им совершить сделку. Анализ клиентской базыВы будете сегментировать аудиторию, выявлять ключевых игроков и понимать, что мотивирует разных пользователей. Мониторинг сервисовВы будете следить за метриками платформы, тестировать новые фичи и измерять полезность инструментов для пользователей. Создание дашбордовВы будете визуализировать ключевые показатели для руководства и автоматизировать отчёты, чтобы решения принимались на основе данных. Больше об аналитике в Яндексе — в канале Yandex for Analytics Мы ждем, что вы – Уверенно владеете SQL – Отлично знаете Excel, в том числе Power Query – Хорошо понимаете бизнес-потребности – Хотите работать без явного формализма и тотального контроля – Умеете чётко и ясно выражать свои мысли устно и письменно
Зарплата не указана
Аналитик данных в Авто.ру
Команда Яндекс Вертикалей ищет аналитика-разработчика. Мы помогаем развивать бизнес Авто.ру во всех регионах России. Если вам интересно улучшать маркетинговую аналитику, придумывать идеи для экспериментов и критически анализировать задачи — эта работа для вас. Какие задачи вас ждут Анализ трендов рынкаВы будете выявлять сезонные колебания спроса, анализировать ценовую динамику и новые модели, чтобы понимать, куда движется рынок авто. Анализ поведения пользователейВы будете изучать, как клиенты ищут и выбирают автомобили, где проводят больше всего времени и что мешает им совершить сделку. Анализ клиентской базыВы будете сегментировать аудиторию, выявлять ключевых игроков и понимать, что мотивирует разных пользователей. Мониторинг сервисовВы будете следить за метриками платформы, тестировать новые фичи и измерять полезность инструментов для пользователей. Создание дашбордовВы будете визуализировать ключевые показатели для руководства и автоматизировать отчёты, чтобы решения принимались на основе данных. Больше об аналитике в Яндексе — в канале Yandex for Analytics Мы ждем, что вы – Уверенно владеете SQL – Отлично знаете Excel, в том числе Power Query – Хорошо понимаете бизнес-потребности – Хотите работать без явного формализма и тотального контроля – Умеете чётко и ясно выражать свои мысли устно и письменно
Зарплата не указана
Арт-директор сайта и коммуникаций в Yandex Cloud
Yandex Cloud — облачная платформа для создания цифровых продуктов. В её составе есть решения для инфраструктуры, организации данных и вычислений, машинного обучения — всё, что помогает бизнесу развиваться. Ищем арт-директора, который возьмёт на себя ключевую творческую роль в развитии сайта Yandex Cloud и смежных продуктов. Наши основные проекты: – Сайт Yandex Cloud , который состоит из продуктовых и промостраниц, документации, калькуляторов, блога, мероприятий и кейсов – Опенсорс-система компонентов Gravity UI и конструктор сайтов Page Constructor Обязанности: – Развитие и поддержка веб-коммуникацийПредстоит поддерживать и развивать все веб-коммуникации: сайт Yandex Cloud и сайты других наших продуктов на базе конструктора, лендинги мероприятий, спецпроектов и промокампаний. – Управление командой и взаимодействие со смежниками Вы будете руководить небольшой дизайн-командой: помогать ей расти, выстраивать процессы, обучать и поддерживать младших коллег, распределять задачи и обеспечивать высокий уровень исполнения на проектах. Будете тесно взаимодействовать со смежными командами фронтенд-разработки и контент-маркетинга. – Развитие и поддержка дизайн-системы конструктора сайтовНужно будет поддерживать и развивать конструктор сайтов Page Constructor, часть нашей собственной опенсорс-системы компонентов Gravity UI. Требования: – Более пяти лет создавали дизайн в цифровой среде: лендинги, сайты, интерактивные и digital-продукты – Имеете опыт в построении и развитии дизайн-систем – Управляли командой более года – Работаете со смыслами и докапываетесь до сути задач: какую цель преследуем? Какую задачу решаем? Какой результат хотим получить? – Держите файлы в Figma в порядке, работаете с компонентами, используете autolayout, умеете прототипировать и анимировать интерфейсы – Используете системный подход, логику и здравый смысл при разработке решений – Понимаете возможности веб-вёрстки – Можете курировать создание 2D- и 3D-графики для своих задач – Инициативны, внимательны к деталям и неравнодушны к тому, что делаете – Способны чётко формулировать свои мысли и договариваться с коллегами – Умеете предлагать как быстрые, так и нестандартные решения Будет плюсом, если вы: – Знаете HTML и CSS – Владеете знаниями и навыками в области графического дизайна
Зарплата не указана
Продуктовый дизайнер в Яндекс Игры
Яндекс Игры — онлайн-платформа браузерных игр с потенциалом для экосистемного развития. Мы помогаем людям находить увлекательные занятия, позволяем отвлечься от повседневных забот — будь то дома за компьютером или в любом месте с помощью смартфона. Какие задачи вас ждут – Исследование и улучшение пользовательского опыта Вы будете проводить базовые количественные UX-исследования, анализировать поведение пользователей и собирать user flow, находить узкие места в сценариях и предлагать улучшения. – Работа над интерфейсами Вам предстоит проектировать пользовательские интерфейсы и визуальный дизайн для веб-версии и мобильного приложения — от базовых форм до полноценных разделов. В числе ближайших задач: разработка модуля социализации платформы, в том числе взаимодействие пользователей, фидбэк, совместные игры и ачивки, редизайн главной страницы, проектирование платёжных сценариев. – Развитие дизайн-системы Вместе с командой вы будете развивать дизайн-систему: формировать и поддерживать визуальный язык продукта, систематизировать компоненты, создавать новые паттерны и гайдлайны. Мы ждем, что вы – Понимаете особенности геймерской аудитории и игровые механики – Готовы работать с разными ЦА, в том числе с иностранными пользователями – Знаете, как строить дизайн экосистемных продуктов – Привыкли приносить больше, чем от вас ожидают – Аргументируете свои решения на языке цифр – Умеете превращать целевую картину в проект Будет плюсом, если вы – Умеете создавать микроанимацию в интерфейсах
Зарплата не указана
Руководитель отдела мероприятий
eLama — самостоятельный SaaS-сервис в составе Яндекса, один из крупнейших в России в сфере интернет-маркетинга. Мы создали платформу, которая уже 15 лет упрощает работу с интернет-рекламой. В личный кабинет интегрированы различные рекламные системы, такие как Яндекс Директ, VK Реклама, Telegram Ads и другие. Пользователи могут запустить свою рекламу на всех этих площадках, а также воспользоваться инструментами для автоматизации рекламных кампаний. С нами работают более 40 тысяч клиентов. Среди них — Redmond, Ozon, «Додо Пицца», «Гарант», Nikon, Grow Food и другие. Мы обрабатываем огромные массивы данных клиентов, чтобы создавать уникальный сервис, который помогает эффективно выстраивать рекламные кампании в интернете, увеличивать посещаемость сайтов, а также экономить время и деньги при работе с рекламой.Команда мероприятий занимается организацией участия спикеров eLama в различных внешних выставках и конференциях, где мы рассказываем о наших продуктах и решениях, о том, как можем помогать разным организациям рассказывать об их деятельности и привлекать клиентов. Мы также организовываем и проводим обучающие вебинары, где делимся кейсами, рассказываем о секретах эффективности в работе с разными рекламными системами. Вам предстоит: – Трансформировать глобальные бизнес-цели и маркетинговую стратегию в конкретный, реализуемый план мероприятий в онлайне и офлайне на год – Вести переговоры с организаторами топовых мероприятий в области digital-рекламы о встраивании наших спикеров в программу и другие мероприятия на самые выгодные позиции. Продумывать формат и программу собственных офлайн-мероприятий, чтобы привлекать больше участников – Формирование бюджета всех мероприятий, его защита и контроль исполнения – Придумывать и реализовывать нестандартные форматы онлайн-мероприятий – Управлять командой ивент-менеджеров: распределять задачи, расставлять приоритеты и контролировать исполнение. Мы ожидаем, что вы – Работали с ивентами более пяти лет – Имеете практический опыт полного цикла подготовки и реализации ивент-проектов разного масштаба – Занимались бюджетным планированием и контролем реализации бюджета мероприятия – Владеете опытом работы с организаторами внешних ивентов и навыками переговоров с ними – Управляли командой от трёх человек – Обладаете широкой насмотренностью в ивент-индустрии и погружены в digital-тренды
Зарплата не указана
Account Manager (FSI) в Yandex Cloud
Направление работы с ключевыми клиентами (сегмент enterprise) Yandex Cloud отвечает за привлечение и развитие клиентов из разных индустрий — финансов, ритейла, разработки программного обеспечения и сервисов. Наша команда помогает этим клиентам быстрее реагировать на изменения рынка и делать бизнес надёжнее. Мы растём и ищем коллегу для усиления команды. Хотим видеть в своих рядах вдумчивого человека с хорошими навыками переговоров, который знаком с облачными технологиями и понимает специфику их использования в банковской индустрии. Обязанности: – Работать с ключевыми клиентами, расширяя возможности использования новых облачных сервисов для клиента – Искать и привлекать новых клиентов – Выстраивать крепкое технологическое партнёрство и развивать отношения на всех уровнях организации – Взаимодействовать со смежными подразделениями (архитекторами, маркетингом, аналитикой) и координировать их, чтобы находить оптимальные для клиентов решения – Планировать и прогнозировать развитие бизнеса Требования: – Занимались активными прямыми продажами сложных технологических продуктов (вы будете отвечать за формирование конечного предложения и подписание договоров с клиентами) – Придерживаетесь принципов тотальной прозрачности по отношению к клиенту и в рамках ведения бизнеса – Продавали сложные решения на уровне CxO – Хорошо понимаете специфику банковской индустрии, знаете сценарии применения облачных сервисов в этом бизнесе – Готовы искать новые контакты и создавать возможности для роста бизнеса – Быстро осваиваете новые технологии Будет плюсом, если вы: – Разбираетесь в российском и международном облачном рынке, знаете ключевых поставщиков, особенности продуктов и конкурентные отличия
Зарплата не указана
Account manager (oil, gas, energy) в Yandex Cloud
Направление работы с ключевыми клиентами (сегмент enterprise) Yandex Cloud отвечает за привлечение и развитие клиентов из разных индустрий. Наша команда помогает клиентам быстрее реагировать на изменения рынка и делать бизнес надёжнее. Мы растём и ищем коллегу для усиления команды. Хотим видеть в своих рядах вдумчивого человека с хорошими навыками переговоров, который знаком с облачными технологиями и понимает специфику их использования в нефтегазовой отрасли и энергетике. Обязанности: – расширять возможности использования новых облачных сервисов ключевыми клиентами; – выстраивать крепкое технологическое партнёрство и развивать отношения на всех уровнях организации; – взаимодействовать со смежными подразделениями (архитекторы, маркетинг, аналитика) и координировать их, чтобы находить оптимальные для клиентов решения; – планировать и прогнозировать развитие бизнеса. Требования: – успешно занимались активными прямыми продажами сложных технологических продуктов (вас ждут и прямые продажи, и продажи через партнёрский канал; вы будете формировать конечное предложение и подписывать договоры с клиентами); – разбираетесь в том, как устроена нефтегазовая или энергетическая отрасль; – придерживаетесь принципов тотальной прозрачности по отношению к клиенту и в рамках ведения бизнеса; – продавали сложные решения на уровне CxO; – готовы искать новые контакты и создавать возможности для роста бизнеса; – быстро осваиваете новые технологии; – знаете английский на уровне не ниже Intermediate. Будет плюсом, если вы: – знаете представителей ключевых клиентов индустрии, поддерживаете с ними контакты; – разбираетесь в облачных технологиях, российском и международном облачном рынке, знаете особенности продуктов и конкурентные отличия.
Зарплата не указана
Account Manager (Retail) в Yandex Cloud
Направление работы с ключевыми клиентами корпоративного сегмента Yandex Cloud отвечает за привлечение и развитие клиентов из индустрии финансов, ритейла, разработки программного обеспечения и сервисов. Наша команда помогает этим клиентам быстрее реагировать на изменения рынка и укреплять бизнес.Мы растём и ищем коллегу для усиления команды. Хотим видеть в своих рядах вдумчивого человека с хорошими навыками переговоров, который знаком с облачными технологиями и понимает специфику их использования в ритейл-индустрии. Обязанности: – Работа с клиентамиВам предстоит работать с ключевыми клиентами, искать и привлекать новых, расширять возможности использования новых облачных сервисов для клиента, выстраивать крепкое технологическое партнёрство и развивать отношения на всех уровнях организации – Взаимодействие со смежными подразделениями Вы будете взаимодействовать с архитекторами, маркетологами, аналитиками, координировать их, чтобы находить оптимальные для клиентов решения Требования: – Занимались активными прямыми продажами сложных технологических продуктов (вас ждут и прямые продажи, и продажи через партнёрский канал, вы будете формировать конечное предложение и подписывать договоры с клиентами) – Придерживаетесь принципов тотальной прозрачности по отношению к клиенту и в рамках ведения бизнеса – Продавали сложные решения на уровне CxO – Хорошо понимаете специфику ритейл-индустрии, знаете сценарии применения облачных сервисов в этом бизнесе – Готовы искать новые контакты и создавать возможности для роста бизнеса – Быстро осваиваете новые технологии – Знаете английский на уровне не ниже Intermediate Будет плюсом, если вы: – Разбираетесь в российском и международном облачном рынке, знаете ключевых поставщиков, особенности продуктов и конкурентные отличия
Зарплата не указана
Account Manager (госсектор) в Yandex Cloud
Yandex Cloud — это облачная платформа, которую используют тысячи компаний и предпринимателей, от частных специалистов до международных корпораций. Наши сервисы и продукты позволяют быстро и просто получить доступ к современным технологиям обработки и хранения данных: распознаванию и синтезу речи, виртуальным машинам и управляемым базам данных. Мы ищем опытного менеджера, который будет продавать наши сервисы и продукты государственным структурам и корпорациям с государственным участием. Обязанности: – Взаимодействовать с Минцифры, госкорпорациями и организациями госсектора – Совместно с архитекторами и отделами маркетинга и аналитики находить оптимальные для клиентов решения – Выполнять план по росту объёмов потребляемых клиентом ресурсов и разнообразию сценариев использования платформы – Координировать весь цикл взаимодействия с заказчиком и вовлечения специалистов смежных подразделений – Внимательно работать с CRM, планировать и прогнозировать развитие бизнеса Требования: – Работали с организациями госсектора и госкорпорациями от 7 лет – Глубоко понимаете специфику работы с госсектором и госкорпорациями, знаете, как облачные технологии применяются в этом сегменте – Продавали сложные технологические продукты и решения на уровне руководителей высшего уровня – Придерживаетесь принципов тотальной прозрачности по отношению к клиенту при ведении бизнеса – Умеете решать сложные задачи в меняющихся условиях – Готовы искать новые контакты и создавать возможности для роста бизнеса – Понимаете цикл продаж в сегментах B2B и B2G
Зарплата не указана
Менеджер по развитию бизнеса (здравоохранение) в Yandex Cloud
В Yandex Cloud мы работаем с ключевыми организациями в сфере здравоохранения: привлекаем и развиваем клиентов, ведём сложные проекты с использованием GenAI-технологий Яндекса и технологий партнёров. Наша команда помогает клиентам быстрее реагировать на изменения рынка и повышать надёжность бизнеса. Мы растём и ищем нового менеджера по развитию. Это должен быть вдумчивый человек с хорошими навыками переговоров, который знаком с облачными и GenAI-технологиями и спецификой их использования в индустрии здравоохранения. Обязанности: – Продажи облачных сервисовВам предстоит вести прямые и партнёрские продажи GenAI-технологий и облачных сервисов крупнейшим организациям сектора здравоохранения, участвовать в тендерах и госзакупках. – Поиск возможностей применения технологийВы будете искать возможности использовать технологии для инновационных решений в здравоохранении, формировать портфолио актуальных сценариев с учётом потребностей заказчика, планировать и прогнозировать бизнес — как в краткосрочной, так и в долгосрочной перспективе. – Взаимодействие со смежными подразделениямиНужно будет тесно сотрудничать с архитекторами, маркетологами, аналитиками и находить лучшие способы реализации проектов с заказчиками. Требования: – Занимались прямыми продажами крупным корпоративным клиентам, в том числе госкомпаниям и компаниям с госучастием в сфере здравоохранения, знаете специфику сегмента и готовы в неё детально погружаться – Хорошо понимаете особенности сектора здравоохранения, национальные приоритеты и государственные программы, а также тренды и стратегию развития – Разбираетесь в российском и международном GenAI- и облачном рынке, знаете ключевых поставщиков, системных интеграторов и разработчиков SaaS-решений, особенности продуктов и конкурентные отличия – Готовы работать на уровне руководителей высшего звена, заключать соглашения, участвовать в тендерах и привлекать партнёров для роста бизнеса – Умеете переводить задачи с технического языка на язык отрасли и приоритеты государства, мыслить сценариями, выстраивать партнёрскую экосистему из консультантов, интеграторов, разработчиков, инсорсеров – Понимаете основы нормативно-правового регулирования использования и процесса закупки сервисов у государственных заказчиков (Федеральные законы 223, 44, 152) – Быстро осваиваете новые технологии
Зарплата не указана
Технический менеджер продукта в Observability Platform
Платформа Observability Яндекса позволяет легко и быстро получить однозначный ответ о состоянии систем в любой момент. В состав платформы входят количественный мониторинг, алертинг, система нотификаций, логи и трейсы. Почти все команды Яндекса с помощью платформы отслеживают состояние своих сервисов — как внешних, так и внутренних. Кроме этого, сервисы Yandex Monitoring и Yandex Cloud Logging доступны пользователям Yandex Cloud. Вызовы, которые перед нами стоят: – Создавать единую платформу, в которую будут легко, удобно и по общим принципам встраиваться сервисы, позволяющие пользователям быстро получать ответ о состоянии своих систем на основе всех данных платформы – Развивать сервисы платформы – Упрощать порог входа и решать популярные пользовательские сценарии из коробки. Например, автоматическую поставку метрик, дашбордов и алертов от сервисов, развитие комьюнити и инструментов для шеринга популярных решений – Поддерживать опенсорс-решения: Prometheus, Kubernetes, Grafana и другие Мы ищем технического продуктового или проектного менеджера, который вместе с нами будет отвечать за развитие платформы в целом и за отдельные её направления. Какие задачи вас ждут Предоставление агрегированных инсайдовКоманда Observability работает с большим объёмом сырых данных. Важно из всего потока извлекать полезную информацию и представлять её пользователю в удобном формате. Например, показывать агрегированную картину по числу и характеру ошибок в системе, а также их корреляции с другими данными. Получение телеметрии «из коробки»Довольно часто наши пользователи используют типовые инфраструктурные решения в своих сервисах: базы данных, агенты, балансировщики и многое другое. Мы делаем так, чтобы телеметрию для них пользователи получали «из коробки». Поэтому каждому пользователю не нужно заново решать задачу мониторинга этих систем. Развитие клиентских библиотекДля отправки телеметрии на платформу Observability используются готовые библиотеки, которые упрощают подключение для пользователей. Вам предстоит работать над развитием этих библиотек, снижением порога входа и расширением предоставляемой функциональности. Мы ждем, что вы – Получили высшее техническое или математическое образование – Отвечали за развитие продукта или его частей – Непосредственно разрабатывали программное обеспечение – Отлично умеете управлять проектами, планировать и приоритизировать задачи – Аналитически мыслите — способны анализировать данные, извлекать ценные инсайты и принимать обоснованные решения – Умеете расставлять приоритеты и решать задачи в срок – Умеете управлять обсуждениями и фиксировать результаты – Точно и внятно говорите и пишете, найдёте общий язык с разработчиками – Хотите погрузиться в предметную область и стать экспертом в области инфраструктуры распределённых систем Будет плюсом, если вы – Знаете инструменты мониторинга, трассировки и анализа логов: Prometheus, Grafana, ELK, Jaeger и др.
Зарплата не указана
Технический менеджер продукта в Observability Platform
Платформа Observability Яндекса позволяет легко и быстро получить однозначный ответ о состоянии систем в любой момент. В состав платформы входят количественный мониторинг, алертинг, система нотификаций, логи и трейсы. Почти все команды Яндекса с помощью платформы отслеживают состояние своих сервисов — как внешних, так и внутренних. Кроме этого, сервисы Yandex Monitoring и Yandex Cloud Logging доступны пользователям Yandex Cloud. Вызовы, которые перед нами стоят: – Создавать единую платформу, в которую будут легко, удобно и по общим принципам встраиваться сервисы, позволяющие пользователям быстро получать ответ о состоянии своих систем на основе всех данных платформы – Развивать сервисы платформы – Упрощать порог входа и решать популярные пользовательские сценарии из коробки. Например, автоматическую поставку метрик, дашбордов и алертов от сервисов, развитие комьюнити и инструментов для шеринга популярных решений – Поддерживать опенсорс-решения: Prometheus, Kubernetes, Grafana и другие Мы ищем технического продуктового или проектного менеджера, который вместе с нами будет отвечать за развитие платформы в целом и за отдельные её направления. Какие задачи вас ждут Предоставление агрегированных инсайдовКоманда Observability работает с большим объёмом сырых данных. Важно из всего потока извлекать полезную информацию и представлять её пользователю в удобном формате. Например, показывать агрегированную картину по числу и характеру ошибок в системе, а также их корреляции с другими данными. Получение телеметрии «из коробки»Довольно часто наши пользователи используют типовые инфраструктурные решения в своих сервисах: базы данных, агенты, балансировщики и многое другое. Мы делаем так, чтобы телеметрию для них пользователи получали «из коробки». Поэтому каждому пользователю не нужно заново решать задачу мониторинга этих систем. Развитие клиентских библиотекДля отправки телеметрии на платформу Observability используются готовые библиотеки, которые упрощают подключение для пользователей. Вам предстоит работать над развитием этих библиотек, снижением порога входа и расширением предоставляемой функциональности. Мы ждем, что вы – Получили высшее техническое или математическое образование – Отвечали за развитие продукта или его частей – Непосредственно разрабатывали программное обеспечение – Отлично умеете управлять проектами, планировать и приоритизировать задачи – Аналитически мыслите — способны анализировать данные, извлекать ценные инсайты и принимать обоснованные решения – Умеете расставлять приоритеты и решать задачи в срок – Умеете управлять обсуждениями и фиксировать результаты – Точно и внятно говорите и пишете, найдёте общий язык с разработчиками – Хотите погрузиться в предметную область и стать экспертом в области инфраструктуры распределённых систем Будет плюсом, если вы – Знаете инструменты мониторинга, трассировки и анализа логов: Prometheus, Grafana, ELK, Jaeger и др.
Зарплата не указана
Аналитик-прогнозист в команду Прогнозирования ключевых показателей Поиска
Яндекс Поиск стремится оставаться востребованным у пользователей, сохранять и укреплять свои позиции на рынке. Чтобы достичь бизнес-результатов, важно правильно выставлять цели для отдельных продуктовых и маркетинговых команд. Ключевой инструмент здесь – прогнозирование. Мы ищем аналитика, который поможет нам с построением и улучшением наших прогнозных моделей.Яндекс Поиск — старейший, но при этом динамично развивающийся сервис. Наша цель — оставаться востребованными у пользователей, сохранять и укреплять наши позиции на рынке. Однако, чтобы превратить стратегические намерения в реальные результаты, нужно правильно выставить цели для отдельных продуктовых и маркетинговых команд. Ключевой инструмент здесь — прогнозирование. На основе прогнозов мы формируем целевые показатели, контролируем их выполнение и корректируем действия команд.Мы ищем аналитика, который поможет нам с построением и улучшением наших прогнозных моделей. Какие задачи вас ждут Прогнозирование ключевых показателей. Мы создаем новые прогнозные модели с учетом запросов бизнеса: смотрим на более узкие срезы, делаем прогнозы в новых разбивках или для новых метрик. Также мы корректируем наши старые прогнозы с учетом новых вводных и текущего положения дел. Всё это важно для правильного целеполагания. Моделирование различных сценариев. Иногда у бизнеса возникают вопросы: например, что будет с нашими ключевыми показателями, если случится определенное внешнее событие или если мы примем решение о другом перераспределении бюджетов. Прогнозы служат основой для построения подобных моделей.Улучшение прогнозных моделей. Мы стремимся сделать процессы подготовки и согласования прогнозов более простыми и быстрыми. И в то же время мы совершенствуем и усложняем наши модели, чтобы учитывать больше факторов и дополнительных вводных. Мы ждём, что вы: – Пишете понятный и поддерживаемый код на Python– Уверенно владеете хотя бы одним диалектом SQL– Имеете опыт работы с временными рядами и понимаете, как валидировать прогнозные модели– Критично относитесь к полученным результатам и умеете перепроверять себя и итоги своей работы Будет плюсом, если вы: – Работали с BI-системами, визуализировали данные и строили дашборды
Зарплата не указана
Операционный руководитель WFM в клиентском сервисе
Обязанности: Взаимодействие с заказчикамиВы будете работать с группами клиентского сервиса и продуктовыми командами Яндекса. Оптимизация процессовВам предстоит анализировать текущие процессы, находить узкие места и предлагать решения, чтобы повысить эффективность: автоматизировать рутинные задачи и сократить трудозатраты. Развитие командыВы будете способствовать профессиональному росту сотрудников, формировать кадровый резерв и создавать комфортную рабочую среду для всех членов команды. Управление проектамиВ числе основных задач — запуск и контроль внутренних инициатив, которые улучшат работу поддержки и помогут внедрить новые практики WFM. Мы ждем что вы: – Занимались планированием, прогнозированием и мониторингом в крупных контакт-центрах – Запускали новые процессы – Работали над операционными задачами, понимаете, как функционирует дистанционная поддержка клиентов – Собирали статистику, занимались мониторингом – Умеете анализировать процессы, находить проблемные места и способы их устранения – Знаете, как работать с командой, готовы проводить регулярные встречи, планировать работу подразделения, мотивировать сотрудников профессионально развиваться, составлять графики отпусков и работы, заниматься наймом и т. д. – Приоритизируете задачи и быстро анализируете ситуации
Зарплата не указана
MultiTrack для опытных бэкендеров
Яндекс — большой и разнообразный: у нас сотни проектов с самыми разными технологиями и процессами. В командах есть общие подходы и практики, при этом у каждой свои особенности в зависимости от размера сервиса и специфики продукта. Чтобы вы могли понять, какое направление подойдёт именно вам, мы создали Multitrack — уникальную программу для опытных разработчиков, в которой можно попробовать себя в трёх разных командах Яндекса. Это не просто знакомство: вы действительно вливаетесь в процессы, решаете реальные задачи и взаимодействуете с кодовой базой проектов. В конце программы выбираете команду, работа в которой понравилась больше всего. Когда начинается Multitrack Сначала вам предстоит трудоустроиться в Яндекс — пройти онлайн-собеседования и решить несколько задач на знание базовых алгоритмов и проверку навыков написания кода. Если вы проектировали сервисы с нуля, вам могут предложить пройти архитектурную секцию. В конце будет финальная встреча в формате обсуждения ваших навыков и разбора кейсов из реальной работы. Также один из руководителей направления расскажет о карьерных возможностях в Яндексе и ответит на ваши вопросы, после чего мы сделаем вам предложение о работе. Дальше самое интересное: ближе к вашей дате выхода вы выберете команды, в которых потенциально хотите поработать, и мы назначим вам знакомства. Как работает Multitrack – Подписываете документы. Multitrack - это не стажировка, и не временная работа. Вы подписываете трудовой договор и с первого дня получаете зарплату, все бонусы и бенефиты, доступные штатным сотрудникам Яндекса. – Погружаетесь в процессы Яндекса. Сначала узнаете о том, как устроена работа в компании в целом. У вас появляется постоянный бадди, который на протяжении всей программы отвечает на ваши вопросы, помогает с адаптацией и подбором интересных команд. – Выбираете интересные вам команды. Мы организуем встречи-знакомства, на которых можно задать любые вопросы о процессе работы, попросить показать пример задачи или посмотреть фрагменты кода сервиса. После знакомства с командами вы решаете, в какой из них начнёте работать. – Работаете в разных командах. В выбранной команде вы работаете несколько недель, одновременно подбирая следующую, к которой хотите присоединиться. При этом команды сервисов могут сами пригласить вас к себе — у них есть информация об участниках Multitrack. Во всех трёх командах вы полностью вливаетесь в процессы: работаете над реальными задачами, участвуете во встречах и синках, получаете нужные доступы. – Принимаете решение. В последний день работы в каждой из команд вы встречаетесь с руководителем и обмениваетесь фидбэком. В конце MultiTrack вы выбираете команду, с которой случился мэтч, и приступаете к работе. Мы ждём, что вы – Уверенно владеете Java, Python, Go или C++. – Разрабатывали коммерческие приложения не менее 5 лет. – Поддерживали программное обеспечение от написания до выкладки в продакшен. – Качественно тестируете свой код и свободно работаете с чужим. – Умеете мониторить работу готового ПО и оперативно реагировать на проблемы. – Занимались многопоточным программированием. – Разбираетесь в классических алгоритмах и структурах данных. – Обладаете широким техническим кругозором. Будет плюсом, если вы: – Проектировали архитектуру и разрабатывали продуктовые фичи. – Занимались разработкой для Unix/Linux и сетевым программированием. – Понимаете основы TCP/IP и HTTP. – Понимаете принципы работы СУБД. Вот что говорят о MultiTrack сами разработчики – «Это отличный способ поиска подходящей команды, потому что за час финального интервью невозможно понять особенности команды и проекта, а за 2 недели можно. Лучше узнал, как устроен Яндекс». – «Очень понравилась сама идея, встречи с техлидами команд, заинтересованность в тебе как в кандидате, хорошая информативность». – «Понравилось работать в нескольких командах, прежде чем выбрать постоянное место. Это помогло актуализировать мои ожидания и сматчить их с реальностью». – «Считаю, что такую программу надо предлагать всем и сразу. Знаю, не всем предлагают такую возможность. Мне повезло. Возможность сравнить практики и подходы работы — это супер». – «Была возможность попробовать поработать в разных командах (все по-разному работают). Выбрать команду по душе — это круто!».
Зарплата не указана
Десктоп-разработчик в Яндекс Телемост (С++, Qt)
Телемост — это сервис для проведения видеоконференций. С его помощью пользователи Яндекс 360 организуют рабочие видеовстречи, удалённо проводят школьные и университетские занятия, вебинары и стримы для широкой аудитории, общаются с родными и друзьями и даже занимаются аэробикой в группах или с тренером. Пользователи приложения Телемост могут делиться экраном, устанавливать виртуальные фоны, писать в чат, планировать встречи, управлять их участниками и так далее. Приложение доступно для Windows и macOS. Ищем в команду сильных инженеров. Наш стек: Trunk Based Development, C++20, Qt, Boost, CMake. Какие задачи вас ждут: Разработка продуктовых фичВы будете участвовать во всех этапах создания продукта: от проектирования архитектуры до написания кода. Активное участие в принятии ключевых технических решенийВам предстоит разбираться в бизнес-целях, технических ограничениях и потребностях пользователей для поиска возможных решений. Вы будете анализировать преимущества и недостатки техрешений с учётом производительности, масштабируемости и сроков реализации. Улучшение developer experienceВам нужно будет взаимодействовать с другими инженерными и продуктовыми командами, помогать им развиваться и улучшать опыт разработки. Мы ждем, что вы: – Разрабатывали приложения для Windows и macOS – Больше трёх лет писали код на C++ – Работали с Qt и WebRTC – Способны тестировать собственный код и работать с чужим – Ответственны и аккуратны – Умеете работать в команде
Зарплата не указана
Разработчик бэкенда (Python/Django) в команду развития сотрудников
Мы сильная продуктовая команда, которая создаёт и улучшает платформу для корпоративного обучения и развития сотрудников. Наша цель — сделать процесс обучения современным, увлекательным и максимально эффективным. Мы автоматизируем ключевые бизнес-процессы: от адаптации новичков до программ развития топ-талантов. Наш продукт — это не просто классическая LMS. Мы стремимся внедрять инновации, такие как AI-ассистент и микрообучение, чтобы обучение в компании было действительно интересным. Наша технологическая кухня: – Основной стек: Python 3, Django, Django REST Framework – Фоновые задачи и кеширование: Celery, Redis – База данных: PostgreSQL – Внедряем и развиваем Kotlin (для новых сервисов), Temporal (для оркестрации сложных рабочих потоков) Вас ждёт ключевая роль в масштабной пересборке и развитии нашей платформы. Вы будете напрямую влиять на продукт, который используют тысячи сотрудников. Какие задачи вас ждут: Архитектура и развитие ядра платформыПонадобится перепроектировать и реализовать личные кабинеты для разных ролей (сотрудник, руководитель, рекрутер). Разработать и внедрить гибкую ролевую модель и системы доступов. Создать и поддерживать новые форматы обучения: микрообучение, интеграция AI-ассистента. Автоматизация бизнес-процессовЭто лектории (лекции спикеров Яндекса), адаптация новых сотрудников и при ротации внутри, опросники 180/360. Разработка нового сервиса с нуляВы создадите нагруженный сервис онлайн-расписаний для бронирования сессий с тренерами, менторами и для записи на мероприятия. Техническое развитиеВажно участвовать во внедрении современных технологий, таких как Kotlin и Temporal, чтобы строить отказоустойчивые и масштабируемые сервисы. Кроме того, необходимо оптимизировать производительность и надёжность бэкенда. Мы ждем, что вы: – Имеете опыт коммерческой разработки на Python и хорошо знакомы с Django и Django REST Framework – Уверенно работаете с PostgreSQL, понимаете принципы проектирования баз данных – Знакомы с Celery и Redis – Понимаете принципы REST API – Занимались контейнеризацией приложений с помощью Docker – Понимаете важность чистого, поддерживаемого кода и следуете лучшим практикам (code review, тестирование) – Умеете работать в команде, предлагать, как улучшить продукт, и аргументировать свои решения Будет плюсом, если вы: – Работали с Kotlin (или хотите его изучить и применять) – Знакомы с Temporal или другими workflow-оркестраторами – Занимались разработкой в сфере EdTech или HRTech – Понимаете процессы корпоративного обучения и развития
Зарплата не указана
Разработчик бэкенда в Managed Service for PostgreSQL
Наш продукт — сервис для управления кластерами популярной объектно-реляционной СУБД PostgreSQL в инфраструктуре Yandex Cloud. Managed Service for PostgreSQL — это удобный, масштабируемый и отказоустойчивый инструмент. Мы обеспечиваем работу всех крупных сервисов Яндекса. Ищем разработчика, который будет отвечать за инфраструктурные задачи, масштабирование и отказоустойчивость сервиса. Какие задачи вас ждут: Улучшение надёжности парка PostgreSQLВам предстоит улучшать мониторинг кластеров, выявлять и решать наиболее частые проблемы. Кроме того, нужно будет уменьшить число ошибочных операций и срабатываний мониторинга в условиях роста числа кластеров. Управление жизненным циклом мажорных релизов PostgreSQLВам нужно будет обеспечивать своевременный запуск новых мажорных версий и расширений для них, а также готовить механизмы обновления либо вывода из эксплуатации кластеров старых версий. Разработка и поддержка Go APIВам предстоит доработать и стабилизировать Go API, исправить баги, внедрить новую функциональность. Завершение MVP нового сервисаВ рамках квартального плана вам нужно будет закончить разработку MVP сервиса, который автоматизирует ключевые процессы поддержки и эксплуатации PostgreSQL, включая управление обновлениями и мониторинг. Прочие задачиВы будете оптимизировать и автоматизировать обслуживание баз; модернизировать расширения и модули; отвечать за безопасность и управление доступом; внедрять Connection Manager, а также организовывать мониторинг и визуализацию метрик. Мы ждем, что вы: – Хорошо разбираетесь в том, как устроена PostgreSQL – Отлично знаете Go или Python – Проектировали отказоустойчивые сервисы – Пишете надёжный код – Готовы исследовать сложные проблемы Будет плюсом, если вы: – Знаете опенсорс-инфраструктуру баз – Знакомы с контейнерами и системами их оркестрации (Kubernetes) – Разбираетесь в облачной инфраструктуре, мониторингах, конфигураторах
Зарплата не указана
Разработчик инфраструктуры RL-обучения LLM
О вакансии Мы создаём инфраструктуру для обучения и дообучения больших языковых (LLM) и визуально-языковых (VLM) моделей, которые используются в Алисе, Поиске, Рекламе и других сервисах Яндекса. Современное обучение таких моделей — это сложная система, которая включает десятки тысяч серверов, миллионы вычислительных ядер и многоуровневые соединения между ними. Наша задача — сделать эту систему максимально эффективной, рационально используя вычислительные ресурсы и минимизируя риски сбоев. Обучение моделей превратилось в задачу управления сложными распределёнными системами. Нужно обеспечивать отказоустойчивость, эффективную доставку данных и минимизировать задержки в коммуникациях. Чем сложнее система, тем больше точек отказа, а чем больше ресурсов нужно на обучение, тем выше накладные расходы на запуск. Наша команда работает на стыке ML-математики и «железной» инфраструктуры: мы должны понимать и особенности аппаратного обеспечения (GPU, сети, шины данных, диски, память), и нюансы самого процесса обучения: составные части, взаимодействие компонентов, узкие места. Один из популярных подходов к обучению LLM — обучение с подкреплением, Reinforcement Learning, RL. С ростом популярности этого метода появляются всё более сложные подходы, увеличивается потребность в вычислительных ресурсах — и, как следствие, возникает необходимость строить специализированную инфраструктуру. Какие задачи вас ждут: – Оптимизация инфраструктуры RL-обученияВам предстоит улучшать ключевые компоненты: оптимизировать доставку и сохранение данных, оптимизировать коммуникации между блоками обучения, повышать эффективность работы внутри блоков. – Развитие инструментов диагностикиВы будете создавать и совершенствовать инструменты, которые позволят быстро выявлять и устранять инфраструктурные проблемы.. – Повышение отказоустойчивости инфраструктурыПредстоит реализовывать подходы, которые сделают инфраструктуру обучения устойчивой к различным ошибкам и сбоям. – Исследование и внедрение современных решенийБудете изучать новейшие подходы к организации инфраструктуры RL-обучения, оценивать их эффективность и внедрять в реальные проекты. Мы ждем, что вы: – Знаете Python и имеете опыт системного программирования, разработки библиотек или фреймворков – Хорошо знакомы и работали на практике с фреймворком PyTorch и распределённым обучением через torch.distributed – Владеете подходами параллелизации: понимаете data parallelism, tensor parallelism, pipeline parallelism, expert parallelism для распределённого инференса или обучения – Интересуетесь LLM и MLOps: понимаете задачи и вызовы, которые связаны с эксплуатацией больших моделей в продакшне – Умеете эффективно работать в команде и делиться знаниями Будет плюсом, если вы: – Участвовали в создании инфраструктуры обучения ML-моделей – Внедряли и оптимизировали RL-решения – Работали с библиотеками RL-обучения для LLM: veRL, slime, NeMo-RL, SkyRL и другими, а также с библиотеками инференса: vLLM, SGLang и TRTLLM – Владеете C++ и имеете опыт низкоуровневого программирования и оптимизации – Имеете опыт с GPU NVIDIA: понимаете архитектуру GPU, разрабатывали или оптимизировали алгоритмы с использованием CUDA или Triton
Зарплата не указана
Разработчик на python в команду инфраструктуры Браузера
Наша команда делает инструменты для команды разработки Яндекс Браузера Мы пишем код, который автоматизирует существующие процессы, а новые помогаем строить так, чтобы в них всё что можно делалось бы нашими алгоритмами, а ручной работы был минимум. Наша основная зона ответственности и крупнейший источник нагрузки на сборочные машины — контур CI. Кроме CI, мы: – пишем код для упрощения обновления на новую версию Chromium; – разрабатываем инструменты для контроля качества Браузера; – строим конвейеры и интеграции с другими внутренними сервисами Яндекса; – придумываем новые утилиты для разработчиков; – выполняем десятки других задач. Наш код: – работает локально под Windows, macOS, Linux у пары сотен разработчиков; – работает в CI под Windows, macOS, Linux более чем на тысяче сборочных машин; – проверяет в CI по несколько сотен пул-реквестов в день, в каждом из них — для пяти платформ: Windows, macOS, Linux, iOS, Android; – строит и анализирует граф сборки, определяя, какая часть проекта задета изменениями; – собирает задетую часть проекта, до 100 тысяч файлов C++ на платформу, в дебажной и релизной конфигурации, распределяя и кешируя сборку на сотнях машин в облаке; – прогоняет все задетые тесты — до 300 тысяч уникальных тестов; – проверяет код статическими анализаторами и линтерами; – анализирует логи сборки, ошибки компиляции, время работы и стабильность тестов, вероятность конфликта изменений с Chromium и многое другое. Какие задачи вас ждут – писать на Python 3; – решать повседневные рабочие задачи команды Браузера; – писать код, который будет работать стабильно и надёжно даже в плохо контролируемых окружениях; – писать код, который будет комфортен в поддержке спустя месяцы и даже годы; – писать код, который легко масштабировать и удобно переиспользовать. Мы ждем, что вы – имеете опыт разработки на Python 3 и хорошо знакомы с этим языком; – готовы слушать пользователей и придумывать технические решения для их проблем; – готовы следить за работой своих сервисов: чинить баги, улучшать скорость и стабильность; – готовы изучать новые инструменты: сервисы, утилиты, системы сборки. Будет плюсом, если вы – работали с системами CI/CD; – работали более чем с одной десктопной ОС: Windows, macOS или Linux; – работали с какими-либо системами сборки компилируемого кода; – не боитесь читать незнакомый код и разбираться в нём.
Зарплата не указана
Разработчик на С++ в команду распределённой системной инфраструктуры YDB
YDB — это распределённая отказоустойчивая реляционная БД с открытым исходным кодом. Вместе со стеком serverless-технологий YDB позволяет организовать систему хранения и обработки данных для самых сложных и требовательных приложений. Также YDB — это платформа для создания инфраструктурных компонентов. Мы предлагаем пользователям не только надёжные транзакции поверх таблиц, но и готовые решения на основе самого движка: персистентные очереди, федеративные запросы, сетевые диски для виртуальных машин (Yandex Network Block Store) и другие. Важные свойства YDB — горизонтальное масштабирование, высокая доступность и отказоустойчивость. Система реагирует на изменения нагрузки в компонентах и узлах системы, динамически перераспределяет логические компоненты по узлам, обеспечивает консистентное выполнение пользовательских SQL-запросов и автоматическое управление партицированием таблиц. От качественного решения подобных задач зависят многие видимые пользователю характеристики БД: консистентность, отзывчивость и пропускная способность. Мы постоянно улучшаем управляющие компоненты, чтобы увеличивать производительность, создавать новую функциональность и расширять сценарии применения YDB. Ещё одна задача YDB — обеспечивать безопасный доступ к данным и безопасную работу с ними. Это включает в себя аутентификацию, проверку прав на действия с данными и объектами, манипуляции правами, интеграции с системами управления идентификацией и доступом, работу с секретами, аудитное логирование. От работы подсистем безопасности зависит безопасность пользовательских данных. Большая часть разработки ведётся в GitHub, поэтому вы сможете публично делиться результатами работы. Какие задачи вас ждут: Развитие новой функциональностиВы будете реализовывать новые алгоритмы балансировки. Разрабатывать подходы к масштабированию компонент системной распределённой инфраструктуры. Добавлять интеграции с внешними системами управления идентификацией и доступом. Развивать работу с секретами. Улучшение того, что уже естьПонадобится развивать алгоритмы балансировки логических компонент. Улучшать автоматическое партиционирование таблиц. Уменьшать стоимость выполнения пользовательских и системных операций со схемой. Развивать систему прав YDB и её взаимодействие с внешними системами управления доступом. Улучшать подсистему аудитного логирования. RnD и взаимодействие со смежными командамиВажно изучать проблемы в реализации и предлагать, как решить их. Вы будете общаться с командами других подсистем YDB и вместе выбирать оптимальные решения при проектировании изменений. Мы ждём, что вы: – Любите С++, хорошо им владеете и пишете на нём больше трёх лет – Знаете и умеете применять классические алгоритмы и структуры данных – Понимаете парадигму многопоточности, знакомы с основными подходами, проблемами и ограничениями в этой области – Разрабатывали высоконагруженные, распределённые, близкие к железу сервисы или сервисы реального времени
Зарплата не указана
Системный разработчик во внутреннее облако Яндекса
Мы развиваем внутреннее контейнерное облако (Runtime Cloud — RTC), в котором запущены все сервисы, создаваемые тысячами разработчиков Яндекса. Наша цель — сделать удобное облако для сервисов различного масштаба (от единиц до десятков тысяч контейнеров в сервисе), при этом рационально утилизировав все имеющиеся в нашем распоряжении аппаратные ресурсы. Сейчас под управлением внутреннего облака находится более 100К железных серверов и заведено более 50К сервисов (счёт контейнеров идёт на миллионы), а также несколько HPC-кластеров с современными GPU: мы занимаем три лидирующих места среди российских суперкомпьютеров. Мы позволяем не только настраивать и запускать сервисы, но и даём пользователю всё, что нужно, чтобы их эксплуатировать: настраиваем балансировку, предоставляем мониторинг поднятых сервисов, собираем логи, поддерживаем интеграцию с CI/CD и не только. Мы стремимся сделать из облака единую тесно интегрированную платформу (PaaS), которая обеспечит удобство и надёжность разработки и эксплуатации сервисов, позволив разработчикам использовать как стандартные API/UI-механизмы, так и подход Infrastructure as Code. Помимо этого, мы разрабатываем внутренние инструменты — управление железом, сертификатами, доступами, чтобы минимизировать нагрузку на эксплуатацию облака и поддержку наших пользователей. Группа системной разработки отвечает за базовый слой облачного ПО (в том числе ядро ОС — коммиты), являющийся фундаментом и основой, на которой строится внутреннее облако Яндекса. Базовый слой состоит, среди прочего, из: – системы контейнеризации приложений, которая разработана и широко используется в Яндексе. У системы есть и плагины — например, для сбора контейнерных метрик для экспорта во внутреннюю систему мониторинга, shim для реализации CRI-интерфейса для работы в Kubernetes; – системы для эффективной передачи данных на множество серверов по протоколу, схожему с BitTorrent; – сервиса для активного мониторинга состояния сети всего Яндекса; – агента для управления на хосте BPF-программами, которые гранулярно донастраивают сетевой стек для более эффективной работы; – системы для clusterwide-анализа производительности приложений, схожей с Google Cloud Profiler, и многого другого. Ищем разработчика, который не побоится большого разнообразия технологий и будет участвовать в их поддержке и развитии, чтобы повысить производительность, отказоустойчивость и удобство облака для пользователей. Какие задачи вас ждут Поддержка и развитие существующих систем контейнеризации и доставки данныхСовременное облако позволяет запускать множество сервисов на одном хосте. Важно, чтобы они не мешали друг другу и при этом получали все необходимые ресурсы для надёжной и быстрой работы. Наша система контейнеризации Porto это гарантирует, но со временем меняются как нагрузки, так и требования сервисов. Поэтому нужно уметь быстро реагировать на изменения и адаптировать систему контейнеризации под новые условия. Сервисы в своей работе опираются на надёжную доставку данных. Передача больших объёмов информации на тысячи хостов — сложная задача, и наша система успешно с ней справляется, однако вместе с ростом компании увеличиваются и требования к скорости и масштабируемости. Поддержка ядра LinuxЯдро Linux — фундамент операционной системы. Оно должно оставаться стабильным, безопасным и адаптированным под конкретные задачи компании. Мы поддерживаем его актуальное состояние, развиваем механизмы тестирования и автоматизированного развёртывания. Отдельное внимание уделяется собственному набору изменений, которые не входят в upstream, но расширяют функциональность ядра. Кроме того, в инфраструктуре регулярно появляется новое оборудование, требующее актуальных драйверов. Мы занимаемся их адаптацией и бэкпортированием, а также анализируем и решаем возникающие в продакшене проблемы, связанные с ядром. Развитие сетевого стекаНадёжный сетевой стек — основа внутреннего облака. Без стабильного и быстрого обмена данными между сервисами оно не сможет работать эффективно. Мы обеспечиваем взаимодействие тысяч контейнеров, гарантируя необходимые показатели задержек и пропускной способности. Система должна быть не только производительной, но и предсказуемой, чтобы сервисы получали чёткие гарантии качества работы сети. С ростом требований часть прежних решений перестаёт быть актуальной, поэтому мы постоянно анализируем и оптимизируем сетевой стек, устраняем узкие места и повышаем его надёжность. Мы ждем, что вы – Знаете C – Хорошо понимаете принципы ОС Linux, контейнеризации и сети – Работали с кодовой базой ядра Linux Будет плюсом, если вы – Имеете опыт проектирования и разработки распределённых сервисов – Разбираетесь в теме построения облачных сервисов – Занимались многопоточным и асинхронным программированием – Знаете Go, C++ или Python (не обязательно все языки сразу)
Зарплата не указана
Системный разработчик во внутреннее облако Яндекса
Мы развиваем внутреннее контейнерное облако (Runtime Cloud — RTC), в котором запущены все сервисы, создаваемые тысячами разработчиков Яндекса. Наша цель — сделать удобное облако для сервисов различного масштаба (от единиц до десятков тысяч контейнеров в сервисе), при этом рационально утилизировав все имеющиеся в нашем распоряжении аппаратные ресурсы. Сейчас под управлением внутреннего облака находится более 100К железных серверов и заведено более 50К сервисов (счёт контейнеров идёт на миллионы), а также несколько HPC-кластеров с современными GPU: мы занимаем три лидирующих места среди российских суперкомпьютеров. Мы позволяем не только настраивать и запускать сервисы, но и даём пользователю всё, что нужно, чтобы их эксплуатировать: настраиваем балансировку, предоставляем мониторинг поднятых сервисов, собираем логи, поддерживаем интеграцию с CI/CD и не только. Мы стремимся сделать из облака единую тесно интегрированную платформу (PaaS), которая обеспечит удобство и надёжность разработки и эксплуатации сервисов, позволив разработчикам использовать как стандартные API/UI-механизмы, так и подход Infrastructure as Code. Помимо этого, мы разрабатываем внутренние инструменты — управление железом, сертификатами, доступами, чтобы минимизировать нагрузку на эксплуатацию облака и поддержку наших пользователей. Группа системной разработки отвечает за базовый слой облачного ПО (в том числе ядро ОС — коммиты), являющийся фундаментом и основой, на которой строится внутреннее облако Яндекса. Базовый слой состоит, среди прочего, из: – системы контейнеризации приложений, которая разработана и широко используется в Яндексе. У системы есть и плагины — например, для сбора контейнерных метрик для экспорта во внутреннюю систему мониторинга, shim для реализации CRI-интерфейса для работы в Kubernetes; – системы для эффективной передачи данных на множество серверов по протоколу, схожему с BitTorrent; – сервиса для активного мониторинга состояния сети всего Яндекса; – агента для управления на хосте BPF-программами, которые гранулярно донастраивают сетевой стек для более эффективной работы; – системы для clusterwide-анализа производительности приложений, схожей с Google Cloud Profiler, и многого другого. Ищем разработчика, который не побоится большого разнообразия технологий и будет участвовать в их поддержке и развитии, чтобы повысить производительность, отказоустойчивость и удобство облака для пользователей. Какие задачи вас ждут Поддержка и развитие существующих систем контейнеризации и доставки данныхСовременное облако позволяет запускать множество сервисов на одном хосте. Важно, чтобы они не мешали друг другу и при этом получали все необходимые ресурсы для надёжной и быстрой работы. Наша система контейнеризации Porto это гарантирует, но со временем меняются как нагрузки, так и требования сервисов. Поэтому нужно уметь быстро реагировать на изменения и адаптировать систему контейнеризации под новые условия. Сервисы в своей работе опираются на надёжную доставку данных. Передача больших объёмов информации на тысячи хостов — сложная задача, и наша система успешно с ней справляется, однако вместе с ростом компании увеличиваются и требования к скорости и масштабируемости. Поддержка ядра LinuxЯдро Linux — фундамент операционной системы. Оно должно оставаться стабильным, безопасным и адаптированным под конкретные задачи компании. Мы поддерживаем его актуальное состояние, развиваем механизмы тестирования и автоматизированного развёртывания. Отдельное внимание уделяется собственному набору изменений, которые не входят в upstream, но расширяют функциональность ядра. Кроме того, в инфраструктуре регулярно появляется новое оборудование, требующее актуальных драйверов. Мы занимаемся их адаптацией и бэкпортированием, а также анализируем и решаем возникающие в продакшене проблемы, связанные с ядром. Развитие сетевого стекаНадёжный сетевой стек — основа внутреннего облака. Без стабильного и быстрого обмена данными между сервисами оно не сможет работать эффективно. Мы обеспечиваем взаимодействие тысяч контейнеров, гарантируя необходимые показатели задержек и пропускной способности. Система должна быть не только производительной, но и предсказуемой, чтобы сервисы получали чёткие гарантии качества работы сети. С ростом требований часть прежних решений перестаёт быть актуальной, поэтому мы постоянно анализируем и оптимизируем сетевой стек, устраняем узкие места и повышаем его надёжность. Мы ждем, что вы – Знаете C – Хорошо понимаете принципы ОС Linux, контейнеризации и сети – Работали с кодовой базой ядра Linux Будет плюсом, если вы – Имеете опыт проектирования и разработки распределённых сервисов – Разбираетесь в теме построения облачных сервисов – Занимались многопоточным и асинхронным программированием – Знаете Go, C++ или Python (не обязательно все языки сразу)
Зарплата не указана
Системный разработчик во внутреннее облако Яндекса
Мы развиваем внутреннее контейнерное облако (Runtime Cloud — RTC), в котором запущены все сервисы, создаваемые тысячами разработчиков Яндекса. Наша цель — сделать удобное облако для сервисов различного масштаба (от единиц до десятков тысяч контейнеров в сервисе), при этом рационально утилизировав все имеющиеся в нашем распоряжении аппаратные ресурсы. Сейчас под управлением внутреннего облака находится более 100К железных серверов и заведено более 50К сервисов (счёт контейнеров идёт на миллионы), а также несколько HPC-кластеров с современными GPU: мы занимаем три лидирующих места среди российских суперкомпьютеров. Мы позволяем не только настраивать и запускать сервисы, но и даём пользователю всё, что нужно, чтобы их эксплуатировать: настраиваем балансировку, предоставляем мониторинг поднятых сервисов, собираем логи, поддерживаем интеграцию с CI/CD и не только. Мы стремимся сделать из облака единую тесно интегрированную платформу (PaaS), которая обеспечит удобство и надёжность разработки и эксплуатации сервисов, позволив разработчикам использовать как стандартные API/UI-механизмы, так и подход Infrastructure as Code. Помимо этого, мы разрабатываем внутренние инструменты — управление железом, сертификатами, доступами, чтобы минимизировать нагрузку на эксплуатацию облака и поддержку наших пользователей. Группа системной разработки отвечает за базовый слой облачного ПО (в том числе ядро ОС — коммиты), являющийся фундаментом и основой, на которой строится внутреннее облако Яндекса. Базовый слой состоит, среди прочего, из: – системы контейнеризации приложений, которая разработана и широко используется в Яндексе. У системы есть и плагины — например, для сбора контейнерных метрик для экспорта во внутреннюю систему мониторинга, shim для реализации CRI-интерфейса для работы в Kubernetes; – системы для эффективной передачи данных на множество серверов по протоколу, схожему с BitTorrent; – сервиса для активного мониторинга состояния сети всего Яндекса; – агента для управления на хосте BPF-программами, которые гранулярно донастраивают сетевой стек для более эффективной работы; – системы для clusterwide-анализа производительности приложений, схожей с Google Cloud Profiler, и многого другого. Ищем разработчика, который не побоится большого разнообразия технологий и будет участвовать в их поддержке и развитии, чтобы повысить производительность, отказоустойчивость и удобство облака для пользователей. Какие задачи вас ждут Поддержка и развитие существующих систем контейнеризации и доставки данныхСовременное облако позволяет запускать множество сервисов на одном хосте. Важно, чтобы они не мешали друг другу и при этом получали все необходимые ресурсы для надёжной и быстрой работы. Наша система контейнеризации Porto это гарантирует, но со временем меняются как нагрузки, так и требования сервисов. Поэтому нужно уметь быстро реагировать на изменения и адаптировать систему контейнеризации под новые условия. Сервисы в своей работе опираются на надёжную доставку данных. Передача больших объёмов информации на тысячи хостов — сложная задача, и наша система успешно с ней справляется, однако вместе с ростом компании увеличиваются и требования к скорости и масштабируемости. Поддержка ядра LinuxЯдро Linux — фундамент операционной системы. Оно должно оставаться стабильным, безопасным и адаптированным под конкретные задачи компании. Мы поддерживаем его актуальное состояние, развиваем механизмы тестирования и автоматизированного развёртывания. Отдельное внимание уделяется собственному набору изменений, которые не входят в upstream, но расширяют функциональность ядра. Кроме того, в инфраструктуре регулярно появляется новое оборудование, требующее актуальных драйверов. Мы занимаемся их адаптацией и бэкпортированием, а также анализируем и решаем возникающие в продакшене проблемы, связанные с ядром. Развитие сетевого стекаНадёжный сетевой стек — основа внутреннего облака. Без стабильного и быстрого обмена данными между сервисами оно не сможет работать эффективно. Мы обеспечиваем взаимодействие тысяч контейнеров, гарантируя необходимые показатели задержек и пропускной способности. Система должна быть не только производительной, но и предсказуемой, чтобы сервисы получали чёткие гарантии качества работы сети. С ростом требований часть прежних решений перестаёт быть актуальной, поэтому мы постоянно анализируем и оптимизируем сетевой стек, устраняем узкие места и повышаем его надёжность. Мы ждем, что вы – Знаете C – Хорошо понимаете принципы ОС Linux, контейнеризации и сети – Работали с кодовой базой ядра Linux Будет плюсом, если вы – Имеете опыт проектирования и разработки распределённых сервисов – Разбираетесь в теме построения облачных сервисов – Занимались многопоточным и асинхронным программированием – Знаете Go, C++ или Python (не обязательно все языки сразу)
Зарплата не указана
Системный разработчик во внутреннее облако Яндекса
Мы развиваем внутреннее контейнерное облако (Runtime Cloud — RTC), в котором запущены все сервисы, создаваемые тысячами разработчиков Яндекса. Наша цель — сделать удобное облако для сервисов различного масштаба (от единиц до десятков тысяч контейнеров в сервисе), при этом рационально утилизировав все имеющиеся в нашем распоряжении аппаратные ресурсы. Сейчас под управлением внутреннего облака находится более 100К железных серверов и заведено более 50К сервисов (счёт контейнеров идёт на миллионы), а также несколько HPC-кластеров с современными GPU: мы занимаем три лидирующих места среди российских суперкомпьютеров. Мы позволяем не только настраивать и запускать сервисы, но и даём пользователю всё, что нужно, чтобы их эксплуатировать: настраиваем балансировку, предоставляем мониторинг поднятых сервисов, собираем логи, поддерживаем интеграцию с CI/CD и не только. Мы стремимся сделать из облака единую тесно интегрированную платформу (PaaS), которая обеспечит удобство и надёжность разработки и эксплуатации сервисов, позволив разработчикам использовать как стандартные API/UI-механизмы, так и подход Infrastructure as Code. Помимо этого, мы разрабатываем внутренние инструменты — управление железом, сертификатами, доступами, чтобы минимизировать нагрузку на эксплуатацию облака и поддержку наших пользователей. Группа системной разработки отвечает за базовый слой облачного ПО (в том числе ядро ОС — коммиты), являющийся фундаментом и основой, на которой строится внутреннее облако Яндекса. Базовый слой состоит, среди прочего, из: – системы контейнеризации приложений, которая разработана и широко используется в Яндексе. У системы есть и плагины — например, для сбора контейнерных метрик для экспорта во внутреннюю систему мониторинга, shim для реализации CRI-интерфейса для работы в Kubernetes; – системы для эффективной передачи данных на множество серверов по протоколу, схожему с BitTorrent; – сервиса для активного мониторинга состояния сети всего Яндекса; – агента для управления на хосте BPF-программами, которые гранулярно донастраивают сетевой стек для более эффективной работы; – системы для clusterwide-анализа производительности приложений, схожей с Google Cloud Profiler, и многого другого. Ищем разработчика, который не побоится большого разнообразия технологий и будет участвовать в их поддержке и развитии, чтобы повысить производительность, отказоустойчивость и удобство облака для пользователей. Какие задачи вас ждут Поддержка и развитие существующих систем контейнеризации и доставки данныхСовременное облако позволяет запускать множество сервисов на одном хосте. Важно, чтобы они не мешали друг другу и при этом получали все необходимые ресурсы для надёжной и быстрой работы. Наша система контейнеризации Porto это гарантирует, но со временем меняются как нагрузки, так и требования сервисов. Поэтому нужно уметь быстро реагировать на изменения и адаптировать систему контейнеризации под новые условия. Сервисы в своей работе опираются на надёжную доставку данных. Передача больших объёмов информации на тысячи хостов — сложная задача, и наша система успешно с ней справляется, однако вместе с ростом компании увеличиваются и требования к скорости и масштабируемости. Поддержка ядра LinuxЯдро Linux — фундамент операционной системы. Оно должно оставаться стабильным, безопасным и адаптированным под конкретные задачи компании. Мы поддерживаем его актуальное состояние, развиваем механизмы тестирования и автоматизированного развёртывания. Отдельное внимание уделяется собственному набору изменений, которые не входят в upstream, но расширяют функциональность ядра. Кроме того, в инфраструктуре регулярно появляется новое оборудование, требующее актуальных драйверов. Мы занимаемся их адаптацией и бэкпортированием, а также анализируем и решаем возникающие в продакшене проблемы, связанные с ядром. Развитие сетевого стекаНадёжный сетевой стек — основа внутреннего облака. Без стабильного и быстрого обмена данными между сервисами оно не сможет работать эффективно. Мы обеспечиваем взаимодействие тысяч контейнеров, гарантируя необходимые показатели задержек и пропускной способности. Система должна быть не только производительной, но и предсказуемой, чтобы сервисы получали чёткие гарантии качества работы сети. С ростом требований часть прежних решений перестаёт быть актуальной, поэтому мы постоянно анализируем и оптимизируем сетевой стек, устраняем узкие места и повышаем его надёжность. Мы ждем, что вы – Знаете C – Хорошо понимаете принципы ОС Linux, контейнеризации и сети – Работали с кодовой базой ядра Linux Будет плюсом, если вы – Имеете опыт проектирования и разработки распределённых сервисов – Разбираетесь в теме построения облачных сервисов – Занимались многопоточным и асинхронным программированием – Знаете Go, C++ или Python (не обязательно все языки сразу)
Зарплата не указана
Старший разработчик в группу GPU-инфраструктуры
Мы развиваем внутреннее контейнерное облако (Runtime Cloud — RTC), в котором запущены все сервисы, создаваемые тысячами разработчиков Яндекса. Наша цель — сделать удобное облако для сервисов различного масштаба, от единиц до десятков тысяч контейнеров в сервисе, и при этом рационально использовать все имеющиеся в нашем распоряжении аппаратные ресурсы. Сейчас под управлением внутреннего облака находится более 100 000 железных серверов, из которых 10 000 — это серверы с GPU. На них заведено более 50 000 сервисов, а счёт контейнеров идёт на миллионы. В нашем облаке живут также InfiniBand-кластеры для распределённого обучения, которые включены в рейтинг суперкомпьютеров TOP500. Мы не только позволяем настраивать и запускать сервисы, но и даём пользователю всё, что нужно, чтобы их эксплуатировать: настраиваем балансировку, предоставляем мониторинг поднятых сервисов, собираем логи, поддерживаем интеграцию с CI/CD, даём удобные способы ad-hoc- и fleet-wide-профилирования и не только. Мы стремимся сделать из облака единую тесно интегрированную платформу (PaaS), которая обеспечит удобство и надёжность разработки и эксплуатации сервисов, позволив разработчикам использовать как стандартные API/UI-механизмы, так и подход Infrastructure as Code. Помимо этого, мы разрабатываем внутренние инструменты для управления железом, сертификатами, доступами, чтобы минимизировать нагрузку на эксплуатацию облака и поддержку наших пользователей. Группа GPU-инфраструктуры отвечает за разработку сервисов для работоспособности GPU-инфраструктуры всего Яндекса, ML/HPC-компонентов для распределённого инференса и обучения, которые позволяют эффективно использовать современные ускорители и RDMA-сеть. Мы активно участвуем не только в разработке системного ПО и фреймворков распределённых вычислений для тренировки и инференса ML-моделей, но и в дизайне наших RDMA-кластеров, их конфигурировании, мониторинге, оптимизации на протяжении всего жизненного цикла. Наши внутренние разработки, которыми пользуются тысячи ML-инженеров Яндекса: – Оператор для распределения GPU-/RDMA-устройств в контейнеры сервисов инференса и обучений. Сервис умеет работать как во внутреннем облаке Яндекса с контейнерным рантаймом Porto, так и с K8s и рантаймами CRI – Механизмы HW-проверок GPU-/RDMA-устройств – Fleet-wide GPU-профилировщик для анализа производительности как обучений, так и инференс-сервисов – Сервис мониторинга GPU-кластеров внутреннего облака – Сервис автоматизированного тестирования GPU-кластеров с помощью наших собственных и известных опенсорс-бенчмарков Мы активно участвуем в разработке и улучшении опенсорс-решений, которые сами активно используем внутри. Вот список лишь некоторых из них: – UCX — фреймворк эффективной коммуникационной P2P поверх InfininiBand, ROCE, TCP/IP, CUDA IPC, GDR и т. д. – NCCL и UCC — фреймворки коллективных операций для CPU/GPU-памяти – SGLang/vLLM/TRT-LLM — фреймворк для инференса LLM – Dynamo — сервис для запуска инференс-фреймворков в disaggregated-режиме – PyTorch Kineto — сервис профилирования GPU с помощью CUPTI Какие задачи вас ждут Поддерживать и развивать системное программное обеспечение, которое отвечает за конфигурирование, мониторинг, выделение в пользовательские контейнеры GPU- и RDMA-устройств на серверахВнутреннее облако состоит из серверов с разными моделями GPU- и RDMA-устройств, которые должны быть выделены под заказ сервисов в Porto-контейнере в YP-кластере или в другие CRI-совместимые контейнерные рантаймы в K8s-кластере. Устройства должны быть правильно сконфигурированы, чтобы отвечать пользовательским требованиям, должны доставлять в контейнер необходимые драйверозависимые библиотеки для удобства сервисов. Во время работы в пользовательском контейнере сервисы должны получать метрики об утилизации, вероятных проблемах и так далее. Эти и другие задачи решаются нашим сервисом, который должен работать безотказно и постоянно дорабатываться для решения новых вызовов. К примеру, одной из последних задач была «раскраска» InfiniBand-трафика с помощью eBPF для реализации гарантий. Поддерживать и развивать fleet-wide GPU-профилирование для всех сервисов ЯндексаСовременные серверы, а тем более оснащённые ускорителями и высокоскоростными сетями RDMA, стоят больших денег. Это ставит новые вызовы перед облаками и сервисами, запускаемыми в них, чтобы как можно эффективнее использовать предоставляемое железо. Один из способов оптимизации — это профилирование приложений в то время, когда они запущены в облаке. В нашем облаке реализован и интегрирован профилировщик на основе CUPTI, который позволяет с минимальными накладными расходами профилировать приложения на всём флоте постоянно и тем самым давать сервисам актуальную информацию о проблемах с утилизацией. Развивать сервисы автоматизированного управления GPU-инфраструктуройВ нашем облаке около 10 000 серверов с GPU, и все они требуют эффективного управления без участия человека: они должны проходить необходимое тестирование GPU-устройств, RDMA-сети и других компонентов перед попаданием в продакшн после ремонта или других регламентных работ. Мы решаем эту задачу, интегрируя и разрабатывая современные бенчмарки, нагрузочные, регрессионные тесты. Новые технологии, которые интегрируются в наше облако, к примеру одна из последних IBGDA, должны быть обязательно покрыты регрессионными тестами. Также наши сервисы выполняют мониторинг состояния флота, чтобы находить серверы с различными проблемами и гарантировать высокую доступность аппаратных ресурсов, сравнимую с уровнем других компаний или превышающую его. Эти и другие методы позволяют нам гарантировать обнаружение проблем на ранних стадиях до того, как на эти серверы заедут сервисы. Развивать и оптимизировать инфраструктуру распределённого disaggregated-инференса и обученийМы считаем, что ML-инженеры должны решать задачи организации обучений и деплоить новые LLM в продакшн. А наше облако предоставляет базовые компоненты для организации эффективного распределённого инференса и обучений, которые доработаны и протестированы с учётом наших особенностей. Мы в нашем облаке участвуем в исследовании, разработке, развитии и эксплуатации cutting-edge-задачи: к примеру, мы предоставляем технологию распределённого disaggregated-инференса, которую любой сервис может развернуть буквально за один клик. Участвовать в дизайне и внедрении нового оборудования в нашем облакеСовременные облачные решения должны быть эффективными и высокопроизводительными с точки зрения утилизации железа. И этот процесс начинается с дизайна, конфигурирования и надёжных HW-мониторингов железа. Мы внедряем современное аппаратное обеспечение в нашем облаке, дорабатываем все уровни системного ПО — от пользовательских библиотек до контейнерного рантайма и драйверов вендора, чтобы наши пользователи могли использовать новое железо без каких-либо изменений в своих приложениях. Каждый раз перед нами встают всё новые и новые задачи, к примеру внедрение новых RDMA-сетей, новых ускорителей, поддержка ARM. Мы ждем, что вы – Знаете Go, C/C++, Python (не обязательно все сразу) – Умеете писать поддерживаемый и эффективный код – Хорошо понимаете принципы работы компьютерных сетей, операционных систем, контейнеризации и виртуализации – Умеете работать с K8s – Интересуетесь R&D-работой и умеете решать нетипичные задачи Будет плюсом, если вы – Знаете Rust – Занимались проектами, связанными с распределёнными вычислениями на GPU – Разрабатывали или использовали CUDA, OpenCL, SYCL, ROCm или другие рантаймы для параллельных вычислений – Разрабатывали или использовали Verbs, UCX, OFI, NCCL, UCC, MPI или другие рантаймы для P2P или коллективных сетевых коммуникаций – Разрабатывали или использовали в своей работе инференс-фреймворки: SGLang, vLLM, TRT-LLM, Mooncake, Dynamo и другие – Разрабатывали ядро Linux и его модули – Знаете устройство аппаратной архитектуры x86, AArch64 и её особенности
Зарплата не указана
Старший разработчик в группу GPU-инфраструктуры
Мы развиваем внутреннее контейнерное облако (Runtime Cloud — RTC), в котором запущены все сервисы, создаваемые тысячами разработчиков Яндекса. Наша цель — сделать удобное облако для сервисов различного масштаба, от единиц до десятков тысяч контейнеров в сервисе, и при этом рационально использовать все имеющиеся в нашем распоряжении аппаратные ресурсы. Сейчас под управлением внутреннего облака находится более 100 000 железных серверов, из которых 10 000 — это серверы с GPU. На них заведено более 50 000 сервисов, а счёт контейнеров идёт на миллионы. В нашем облаке живут также InfiniBand-кластеры для распределённого обучения, которые включены в рейтинг суперкомпьютеров TOP500. Мы не только позволяем настраивать и запускать сервисы, но и даём пользователю всё, что нужно, чтобы их эксплуатировать: настраиваем балансировку, предоставляем мониторинг поднятых сервисов, собираем логи, поддерживаем интеграцию с CI/CD, даём удобные способы ad-hoc- и fleet-wide-профилирования и не только. Мы стремимся сделать из облака единую тесно интегрированную платформу (PaaS), которая обеспечит удобство и надёжность разработки и эксплуатации сервисов, позволив разработчикам использовать как стандартные API/UI-механизмы, так и подход Infrastructure as Code. Помимо этого, мы разрабатываем внутренние инструменты для управления железом, сертификатами, доступами, чтобы минимизировать нагрузку на эксплуатацию облака и поддержку наших пользователей. Группа GPU-инфраструктуры отвечает за разработку сервисов для работоспособности GPU-инфраструктуры всего Яндекса, ML/HPC-компонентов для распределённого инференса и обучения, которые позволяют эффективно использовать современные ускорители и RDMA-сеть. Мы активно участвуем не только в разработке системного ПО и фреймворков распределённых вычислений для тренировки и инференса ML-моделей, но и в дизайне наших RDMA-кластеров, их конфигурировании, мониторинге, оптимизации на протяжении всего жизненного цикла. Наши внутренние разработки, которыми пользуются тысячи ML-инженеров Яндекса: – Оператор для распределения GPU-/RDMA-устройств в контейнеры сервисов инференса и обучений. Сервис умеет работать как во внутреннем облаке Яндекса с контейнерным рантаймом Porto, так и с K8s и рантаймами CRI – Механизмы HW-проверок GPU-/RDMA-устройств – Fleet-wide GPU-профилировщик для анализа производительности как обучений, так и инференс-сервисов – Сервис мониторинга GPU-кластеров внутреннего облака – Сервис автоматизированного тестирования GPU-кластеров с помощью наших собственных и известных опенсорс-бенчмарков Мы активно участвуем в разработке и улучшении опенсорс-решений, которые сами активно используем внутри. Вот список лишь некоторых из них: – UCX — фреймворк эффективной коммуникационной P2P поверх InfininiBand, ROCE, TCP/IP, CUDA IPC, GDR и т. д. – NCCL и UCC — фреймворки коллективных операций для CPU/GPU-памяти – SGLang/vLLM/TRT-LLM — фреймворк для инференса LLM – Dynamo — сервис для запуска инференс-фреймворков в disaggregated-режиме – PyTorch Kineto — сервис профилирования GPU с помощью CUPTI Какие задачи вас ждут Поддерживать и развивать системное программное обеспечение, которое отвечает за конфигурирование, мониторинг, выделение в пользовательские контейнеры GPU- и RDMA-устройств на серверахВнутреннее облако состоит из серверов с разными моделями GPU- и RDMA-устройств, которые должны быть выделены под заказ сервисов в Porto-контейнере в YP-кластере или в другие CRI-совместимые контейнерные рантаймы в K8s-кластере. Устройства должны быть правильно сконфигурированы, чтобы отвечать пользовательским требованиям, должны доставлять в контейнер необходимые драйверозависимые библиотеки для удобства сервисов. Во время работы в пользовательском контейнере сервисы должны получать метрики об утилизации, вероятных проблемах и так далее. Эти и другие задачи решаются нашим сервисом, который должен работать безотказно и постоянно дорабатываться для решения новых вызовов. К примеру, одной из последних задач была «раскраска» InfiniBand-трафика с помощью eBPF для реализации гарантий. Поддерживать и развивать fleet-wide GPU-профилирование для всех сервисов ЯндексаСовременные серверы, а тем более оснащённые ускорителями и высокоскоростными сетями RDMA, стоят больших денег. Это ставит новые вызовы перед облаками и сервисами, запускаемыми в них, чтобы как можно эффективнее использовать предоставляемое железо. Один из способов оптимизации — это профилирование приложений в то время, когда они запущены в облаке. В нашем облаке реализован и интегрирован профилировщик на основе CUPTI, который позволяет с минимальными накладными расходами профилировать приложения на всём флоте постоянно и тем самым давать сервисам актуальную информацию о проблемах с утилизацией. Развивать сервисы автоматизированного управления GPU-инфраструктуройВ нашем облаке около 10 000 серверов с GPU, и все они требуют эффективного управления без участия человека: они должны проходить необходимое тестирование GPU-устройств, RDMA-сети и других компонентов перед попаданием в продакшн после ремонта или других регламентных работ. Мы решаем эту задачу, интегрируя и разрабатывая современные бенчмарки, нагрузочные, регрессионные тесты. Новые технологии, которые интегрируются в наше облако, к примеру одна из последних IBGDA, должны быть обязательно покрыты регрессионными тестами. Также наши сервисы выполняют мониторинг состояния флота, чтобы находить серверы с различными проблемами и гарантировать высокую доступность аппаратных ресурсов, сравнимую с уровнем других компаний или превышающую его. Эти и другие методы позволяют нам гарантировать обнаружение проблем на ранних стадиях до того, как на эти серверы заедут сервисы. Развивать и оптимизировать инфраструктуру распределённого disaggregated-инференса и обученийМы считаем, что ML-инженеры должны решать задачи организации обучений и деплоить новые LLM в продакшн. А наше облако предоставляет базовые компоненты для организации эффективного распределённого инференса и обучений, которые доработаны и протестированы с учётом наших особенностей. Мы в нашем облаке участвуем в исследовании, разработке, развитии и эксплуатации cutting-edge-задачи: к примеру, мы предоставляем технологию распределённого disaggregated-инференса, которую любой сервис может развернуть буквально за один клик. Участвовать в дизайне и внедрении нового оборудования в нашем облакеСовременные облачные решения должны быть эффективными и высокопроизводительными с точки зрения утилизации железа. И этот процесс начинается с дизайна, конфигурирования и надёжных HW-мониторингов железа. Мы внедряем современное аппаратное обеспечение в нашем облаке, дорабатываем все уровни системного ПО — от пользовательских библиотек до контейнерного рантайма и драйверов вендора, чтобы наши пользователи могли использовать новое железо без каких-либо изменений в своих приложениях. Каждый раз перед нами встают всё новые и новые задачи, к примеру внедрение новых RDMA-сетей, новых ускорителей, поддержка ARM. Мы ждем, что вы – Знаете Go, C/C++, Python (не обязательно все сразу) – Умеете писать поддерживаемый и эффективный код – Хорошо понимаете принципы работы компьютерных сетей, операционных систем, контейнеризации и виртуализации – Умеете работать с K8s – Интересуетесь R&D-работой и умеете решать нетипичные задачи Будет плюсом, если вы – Знаете Rust – Занимались проектами, связанными с распределёнными вычислениями на GPU – Разрабатывали или использовали CUDA, OpenCL, SYCL, ROCm или другие рантаймы для параллельных вычислений – Разрабатывали или использовали Verbs, UCX, OFI, NCCL, UCC, MPI или другие рантаймы для P2P или коллективных сетевых коммуникаций – Разрабатывали или использовали в своей работе инференс-фреймворки: SGLang, vLLM, TRT-LLM, Mooncake, Dynamo и другие – Разрабатывали ядро Linux и его модули – Знаете устройство аппаратной архитектуры x86, AArch64 и её особенности
Зарплата не указана
Старший разработчик в группу GPU-инфраструктуры
Мы развиваем внутреннее контейнерное облако (Runtime Cloud — RTC), в котором запущены все сервисы, создаваемые тысячами разработчиков Яндекса. Наша цель — сделать удобное облако для сервисов различного масштаба, от единиц до десятков тысяч контейнеров в сервисе, и при этом рационально использовать все имеющиеся в нашем распоряжении аппаратные ресурсы. Сейчас под управлением внутреннего облака находится более 100 000 железных серверов, из которых 10 000 — это серверы с GPU. На них заведено более 50 000 сервисов, а счёт контейнеров идёт на миллионы. В нашем облаке живут также InfiniBand-кластеры для распределённого обучения, которые включены в рейтинг суперкомпьютеров TOP500. Мы не только позволяем настраивать и запускать сервисы, но и даём пользователю всё, что нужно, чтобы их эксплуатировать: настраиваем балансировку, предоставляем мониторинг поднятых сервисов, собираем логи, поддерживаем интеграцию с CI/CD, даём удобные способы ad-hoc- и fleet-wide-профилирования и не только. Мы стремимся сделать из облака единую тесно интегрированную платформу (PaaS), которая обеспечит удобство и надёжность разработки и эксплуатации сервисов, позволив разработчикам использовать как стандартные API/UI-механизмы, так и подход Infrastructure as Code. Помимо этого, мы разрабатываем внутренние инструменты для управления железом, сертификатами, доступами, чтобы минимизировать нагрузку на эксплуатацию облака и поддержку наших пользователей. Группа GPU-инфраструктуры отвечает за разработку сервисов для работоспособности GPU-инфраструктуры всего Яндекса, ML/HPC-компонентов для распределённого инференса и обучения, которые позволяют эффективно использовать современные ускорители и RDMA-сеть. Мы активно участвуем не только в разработке системного ПО и фреймворков распределённых вычислений для тренировки и инференса ML-моделей, но и в дизайне наших RDMA-кластеров, их конфигурировании, мониторинге, оптимизации на протяжении всего жизненного цикла. Наши внутренние разработки, которыми пользуются тысячи ML-инженеров Яндекса: – Оператор для распределения GPU-/RDMA-устройств в контейнеры сервисов инференса и обучений. Сервис умеет работать как во внутреннем облаке Яндекса с контейнерным рантаймом Porto, так и с K8s и рантаймами CRI – Механизмы HW-проверок GPU-/RDMA-устройств – Fleet-wide GPU-профилировщик для анализа производительности как обучений, так и инференс-сервисов – Сервис мониторинга GPU-кластеров внутреннего облака – Сервис автоматизированного тестирования GPU-кластеров с помощью наших собственных и известных опенсорс-бенчмарков Мы активно участвуем в разработке и улучшении опенсорс-решений, которые сами активно используем внутри. Вот список лишь некоторых из них: – UCX — фреймворк эффективной коммуникационной P2P поверх InfininiBand, ROCE, TCP/IP, CUDA IPC, GDR и т. д. – NCCL и UCC — фреймворки коллективных операций для CPU/GPU-памяти – SGLang/vLLM/TRT-LLM — фреймворк для инференса LLM – Dynamo — сервис для запуска инференс-фреймворков в disaggregated-режиме – PyTorch Kineto — сервис профилирования GPU с помощью CUPTI Какие задачи вас ждут Поддерживать и развивать системное программное обеспечение, которое отвечает за конфигурирование, мониторинг, выделение в пользовательские контейнеры GPU- и RDMA-устройств на серверахВнутреннее облако состоит из серверов с разными моделями GPU- и RDMA-устройств, которые должны быть выделены под заказ сервисов в Porto-контейнере в YP-кластере или в другие CRI-совместимые контейнерные рантаймы в K8s-кластере. Устройства должны быть правильно сконфигурированы, чтобы отвечать пользовательским требованиям, должны доставлять в контейнер необходимые драйверозависимые библиотеки для удобства сервисов. Во время работы в пользовательском контейнере сервисы должны получать метрики об утилизации, вероятных проблемах и так далее. Эти и другие задачи решаются нашим сервисом, который должен работать безотказно и постоянно дорабатываться для решения новых вызовов. К примеру, одной из последних задач была «раскраска» InfiniBand-трафика с помощью eBPF для реализации гарантий. Поддерживать и развивать fleet-wide GPU-профилирование для всех сервисов ЯндексаСовременные серверы, а тем более оснащённые ускорителями и высокоскоростными сетями RDMA, стоят больших денег. Это ставит новые вызовы перед облаками и сервисами, запускаемыми в них, чтобы как можно эффективнее использовать предоставляемое железо. Один из способов оптимизации — это профилирование приложений в то время, когда они запущены в облаке. В нашем облаке реализован и интегрирован профилировщик на основе CUPTI, который позволяет с минимальными накладными расходами профилировать приложения на всём флоте постоянно и тем самым давать сервисам актуальную информацию о проблемах с утилизацией. Развивать сервисы автоматизированного управления GPU-инфраструктуройВ нашем облаке около 10 000 серверов с GPU, и все они требуют эффективного управления без участия человека: они должны проходить необходимое тестирование GPU-устройств, RDMA-сети и других компонентов перед попаданием в продакшн после ремонта или других регламентных работ. Мы решаем эту задачу, интегрируя и разрабатывая современные бенчмарки, нагрузочные, регрессионные тесты. Новые технологии, которые интегрируются в наше облако, к примеру одна из последних IBGDA, должны быть обязательно покрыты регрессионными тестами. Также наши сервисы выполняют мониторинг состояния флота, чтобы находить серверы с различными проблемами и гарантировать высокую доступность аппаратных ресурсов, сравнимую с уровнем других компаний или превышающую его. Эти и другие методы позволяют нам гарантировать обнаружение проблем на ранних стадиях до того, как на эти серверы заедут сервисы. Развивать и оптимизировать инфраструктуру распределённого disaggregated-инференса и обученийМы считаем, что ML-инженеры должны решать задачи организации обучений и деплоить новые LLM в продакшн. А наше облако предоставляет базовые компоненты для организации эффективного распределённого инференса и обучений, которые доработаны и протестированы с учётом наших особенностей. Мы в нашем облаке участвуем в исследовании, разработке, развитии и эксплуатации cutting-edge-задачи: к примеру, мы предоставляем технологию распределённого disaggregated-инференса, которую любой сервис может развернуть буквально за один клик. Участвовать в дизайне и внедрении нового оборудования в нашем облакеСовременные облачные решения должны быть эффективными и высокопроизводительными с точки зрения утилизации железа. И этот процесс начинается с дизайна, конфигурирования и надёжных HW-мониторингов железа. Мы внедряем современное аппаратное обеспечение в нашем облаке, дорабатываем все уровни системного ПО — от пользовательских библиотек до контейнерного рантайма и драйверов вендора, чтобы наши пользователи могли использовать новое железо без каких-либо изменений в своих приложениях. Каждый раз перед нами встают всё новые и новые задачи, к примеру внедрение новых RDMA-сетей, новых ускорителей, поддержка ARM. Мы ждем, что вы – Знаете Go, C/C++, Python (не обязательно все сразу) – Умеете писать поддерживаемый и эффективный код – Хорошо понимаете принципы работы компьютерных сетей, операционных систем, контейнеризации и виртуализации – Умеете работать с K8s – Интересуетесь R&D-работой и умеете решать нетипичные задачи Будет плюсом, если вы – Знаете Rust – Занимались проектами, связанными с распределёнными вычислениями на GPU – Разрабатывали или использовали CUDA, OpenCL, SYCL, ROCm или другие рантаймы для параллельных вычислений – Разрабатывали или использовали Verbs, UCX, OFI, NCCL, UCC, MPI или другие рантаймы для P2P или коллективных сетевых коммуникаций – Разрабатывали или использовали в своей работе инференс-фреймворки: SGLang, vLLM, TRT-LLM, Mooncake, Dynamo и другие – Разрабатывали ядро Linux и его модули – Знаете устройство аппаратной архитектуры x86, AArch64 и её особенности
Зарплата не указана
Менеджер проектов в группу пользовательской документации
Какие задачи вас ждут Развитие отношений с заказчикамиВы будете вести портфель заказчиков: выявлять и изучать потребности, обрабатывать обратную связь, улучшать пользовательский опыт, консультировать заказчиков в вопросе оптимального решения их бизнес-задач с помощью Yandex Crowd. Расширение пакета услугПонадобится изучать конкурентов, рынок и спрос, развивать центр знаний и опыта по своему направлению, влиять на стратегическое развитие, запускать новые услуги. Управление ресурсами смежных командВам предстоит координировать весь цикл взаимодействия с заказчиками, в том числе вовлекать смежные подразделения (команду производства документации, группы локализации, дизайна и обучения), чтобы предоставлять заказчикам пакет услуг под ключ. Достижение целевых показателейВы будете продвигать услуги группы внутри компании, мониторить, оптимизировать бизнес-процессы и повышать их эффективность, улучшать операционные метрики, в том числе процент автоматизации. Мы ждем, что вы – Управляли командой от пяти человек (технические профессии) – Умеете вести переговоры, легко устанавливаете контакт с людьми – Знаете основные метрики продуктов – Мыслите системно, можете находить закономерности и создавать процессы, чтобы оптимизировать решение подобных задач в будущем – Знаете, как описать зоны ответственности, организовать исполнителей и вовлечь их в реализацию задач – Отлично разбираетесь в современных информационных технологиях – Инициативны, умеете самостоятельно принимать решения, запускать проекты – Способны работать при высоком уровне неизвестности, творчески мыслите, готовы изобретать новые методы решения задач – Заинтересованы достигать впечатляющих результатов – Любите и умеете проводить демо и презентации
Зарплата не указана
Менеджер проектов в группу пользовательской документации
Какие задачи вас ждут Развитие отношений с заказчикамиВы будете вести портфель заказчиков: выявлять и изучать потребности, обрабатывать обратную связь, улучшать пользовательский опыт, консультировать заказчиков в вопросе оптимального решения их бизнес-задач с помощью Yandex Crowd. Расширение пакета услугПонадобится изучать конкурентов, рынок и спрос, развивать центр знаний и опыта по своему направлению, влиять на стратегическое развитие, запускать новые услуги. Управление ресурсами смежных командВам предстоит координировать весь цикл взаимодействия с заказчиками, в том числе вовлекать смежные подразделения (команду производства документации, группы локализации, дизайна и обучения), чтобы предоставлять заказчикам пакет услуг под ключ. Достижение целевых показателейВы будете продвигать услуги группы внутри компании, мониторить, оптимизировать бизнес-процессы и повышать их эффективность, улучшать операционные метрики, в том числе процент автоматизации. Мы ждем, что вы – Управляли командой от пяти человек (технические профессии) – Умеете вести переговоры, легко устанавливаете контакт с людьми – Знаете основные метрики продуктов – Мыслите системно, можете находить закономерности и создавать процессы, чтобы оптимизировать решение подобных задач в будущем – Знаете, как описать зоны ответственности, организовать исполнителей и вовлечь их в реализацию задач – Отлично разбираетесь в современных информационных технологиях – Инициативны, умеете самостоятельно принимать решения, запускать проекты – Способны работать при высоком уровне неизвестности, творчески мыслите, готовы изобретать новые методы решения задач – Заинтересованы достигать впечатляющих результатов – Любите и умеете проводить демо и презентации
Зарплата не указана
Технический менеджер проектов в YTsaurus ML Platform
Яндекс — одна из немногих компаний в мире, оперирующих экcабайтами данных, которые нужно уметь эффективно хранить, обрабатывать и передавать между различными системами. Для решения этих задач мы создали и развиваем распределённую платформу хранения и обработки данных YTsaurus. YTsaurus в том числе управляет суперкомпьютерами Яндекса, на которых ML-инженеры решают задачи машинного обучения. Недавно мы начали новый проект, чтобы упростить жизнь коллег. Пользователями нового сервиса станет большинство ML-разработчиков Яндекса — сотни команд, которые обучают модели для Алисы, Нейро, Шедеврума. Ключевые компоненты нового сервиса: – Managed DevCluster для удалённой разработки и тестовых запусков задач на GPU – Инструмент простого с точки зрения UX и эффективного запуска процессов обучения на гигантском кластере YTsaurus с тысячами GPU – Оркестратор, который позволит описывать графы подготовки данных на Python и SQL – Решение для трекинга ML-экспериментов (по смыслу похожее на Weights & Biases) – MLOps-система для хранения жизненного цикла моделей и управления им Мы ищем человека, который поможет нам выстроить процессы разработки и наладить взаимодействие между ML-инженерами и инфраструктурой. Какие задачи вас ждут Взаимодействие с пользователямиВам предстоит много общаться с внутренними и внешними пользователями, участвовать в формировании лучших практик применения ML-инфраструктуры (например, следить за эффективным использованием ресурсов GPU). Кроме того, предстоит собирать и анализировать потребности ML-инженеров и доносить предложения об улучшениях по всему стеку. Технические вызовыВам предстоит разобраться в том, как устроен процесс разработки ML-моделей в Яндексе, и вести внутренние инфраструктурные проекты, а также участвовать в интеграционных проектах вместе с несколькими командами разработки, эксплуатации и тестирования. Выстраивание рабочих процессовВам предстоит сотрудничать с разработчиками других инфраструктурных сервисов, анализировать процессы, находить проблемные места, предлагать и внедрять улучшения. Кроме того, необходимо управлять процессом разработки и отвечать за его соответствие планам и требованиям. Мы ждем, что вы – Получили высшее техническое или математическое образование – Последний год работали в аналогичной должности – Управляли проектами и продуктами – Работали с командой разработчиков, найдёте с ними общий язык – Непосредственно разрабатывали программное обеспечение – Составляли FAQ и пользовательскую документацию – Способны управлять обсуждениями, фиксировать результаты, расставлять приоритеты и решать задачи в срок – Коммуникабельны, точно и понятно говорите и пишете Будет плюсом, если вы – Знакомы с инфраструктурными системами (Docker, Kubernetes, Ray, Slurm) – Участвовали в создании и внедрении инфраструктурных решений в больших компаниях – Пишете на Python или любом другом языке программирования
Зарплата не указана
Вакансии на карте
Ищите работу на карте рядом с домом
Информация о вакансиях предоставлена hh.ru
🍪
Мы используем cookies подробнее