Обязанности:
–
анализ исходных данных ЕС МТР, профилирование (качество, дубликаты, распределения);
– разработка и поддержка правил нормализации наименований: токенизация, стемминг/лемматизация, удаление мусора, нормализация наименований;
– создание и поддержка эталонного классификатора, словарей синонимов и справочников атрибутов;
– составление и поддержка таблиц сопоставлений (mapping) между исходными полями и атрибутами ОБД НСИ.
– ручная проверка и верификация проблемных/неоднозначных позиций, подготовка правил для дальнейшей нормализации;
– взаимодействие с профильными‑экспертами для согласования правил и принятия решений по классификации и нормализации;
– участие в тестировании программных продуктов.
Требования:
–
образование: высшее техническое (инженерное, информационные системы, прикладная математика и т.п.);
– опыт: не менее 2–3 лет в работе с данными/справочниками/классификаторами, предпочтительно по МТР или сопутствующим товарным справочникам;
– Excel: уровень выше среднего — уверенное владение формулами, сводными таблицами, умение автоматизировать обработки; базовые навыки макросов/VBA желательны;
– программирование / скрипты: уверенное знание регулярных выражений и навыки написания скриптов (минимум один язык) для обработки текстов; умение работать с библиотеками для очистки/парсинга;
– базы данных: практический опыт работы с реляционными СУБД и SQL (для извлечения и анализа источников данных.
– парсинг и обработка: опыт парсинга/парсинга web/файлов (HTML, XML, Excel), умение извлекать структурированную информацию из неструктурированных источников.
– классификация: практический опыт в классификации товарных позиций, создание/поддержка классификаторов и сопоставлений.
– нормативно‑справочная документация: умение работать с нормативными документами, каталогами производителей, спецификациями оборудования.
– работа с различными типами источников: опыт структурирования и нормализации информации, содержащей текст, таблицы и изображения
Условия:
– Социальный пакет
– ДМС
– Регулярные премии
– комфортные условия труда
–