Информационная безопасность угрозы/решения. GoodsForecast разработала эффективный алгоритм сопоставления наименований товаров

Алгоритм позволяет повысить точность сопоставления наименований товарных позиций в ритейле до 90–95%.

Российская компания GoodsForecast, разработчик решений для прогнозирования спроса и оптимизации товарных запасов, резидент «Сколково», разработала новую технологию «матчинга» чековых данных.

Система, основанная на искусственном интеллекте, позволяет решать проблему сопоставления и распознавания различных товарных позиций (SKU) в торговых точках.

«В среднем ассортимент российского магазина продуктов питания (FMCG) сегодня составляет около 5–10 тыс. SKU, а названия одних и тех же позиций в одном магазине могут сильно отличаться от их наименований в другом, — рассказывает Андрей Лисица, генеральный директор компании GoodsForecast. — Из-за невозможности точной идентификации товарных позиций компании сталкиваются с большими сложностями при обработке такой информации. Наиболее яркий пример — это аналитика на основе данных ОФД (операторов фискальных данных). Не обладая технологиями «матчинга» товарных позиций, практически невозможно на основе этих данных оценивать продажи того или иного товара в рамках региона, проводить конкурентный анализ, мониторинг пересечения ассортимента в разных магазинах, создавать прогноз спроса на тот или иной товар, а также оценивать и планировать эффект от промоакций».

Сегодня существуют два способа решения проблемы разного описания товарных позиций в различных торговых точках: 1) аналитики в розничных и аналитических компаниях вручную обрабатывают огромные массивы данных, что очень долго и трудозатратно; 2) используются системы на основе machinelearning, однако на 100% автоматизированная система не в состоянии дать точный результат как раз из-за проблемы разрозненности данных при сопоставлении различных товарных позиций. Во всех подобных примерах мы видим точность сопоставления, не превышающую 60–70%.

Технология, разработанная GoodsForecast, позволяет выделять у товарных позиций в различных магазинах общие признаки и с учетом этого создавать их категоризацию.

Анализируемая информация обогащается за счет следующего:

• словаря брендов;

• алгоритма определения и конвертации единиц измерения;

• словаря русского языка с определением частей речи;

• словаря синонимов-алиасов (gold = золото = голд) и т.п.

«На основе больших данных наша компания строит статистическую модель, которая постоянно развивается. Она хорошо работает с данными ОФД (информация с чеков покупателей в торговых точках) и на их основе вычисляет принципы, по которым сотрудники магазина могут назвать товар, — поясняет Андрей Лисица. — Алгоритм не пытается найти похожие строчки с названием товара, а, исходя из массива данных, формирует правила, согласно которым SKU получают наименование. Это очень похоже на то, как работает человек, и, помимо хорошей точности, позволяет легко интерпретировать результаты, а также улучшать полученные правила за счет экспертных корректировок».

Точность сопоставления данных при использовании новой технологии возрастает до 90–95%. Алгоритм знает несколько языков, правила написания слов на них, способен отличать формы слов и части речи. Он может анализировать правильность выстраивания предложения, исправлять допущенные ошибки и восстанавливать смысл. К примеру, найдя название груша «Форель», алгоритм понимает, что речь идет о товаре из категории «фрукты», а не «рыба». При этом алгоритм может с высокой долей вероятности определить и вес данного SKU, и динамику цены этого товара.

Разработка технологии началась два года назад, после того как в 2018 году GoodsForecast выиграла грант Фонда содействия инновациям. На сегодняшний день система внедрена в одной из крупнейших российских ритейловых компаний, активно идут пилоты применения алгоритма в области прогнозирования промоакций, также обсуждается его внедрение в ряде производственных компаний. «В данный момент мы готовы тиражировать разработанную технологию. Основным рынком для нас пока является ритейл, однако наша разработка вполне применима и в других отраслях, включая банковскую сферу, где она может быть использована, к примеру, для повышения точности кредитного скоринга (определения платежеспособности клиентов кредитной организации), — говорит Андрей Лисица. — Также мы видим востребованность продукта на рынке маркетинга и таргетированной рекламы, где для использования данных ОФД также важно решить задачу правильного сопоставления текстовых данных».

27 марта, 2020

От партнёров

GoodsForecast разработала эффективный алгоритм сопоставления наименований товаров

Безопасная «удаленка» для КИИ: актуальные рекомендации ФСТЭК России и инструкции от Astra Linux

Digital Q от "Диасофт" в числе глобальных цифровых платформ для банков

Банк «Открытие» внедрил новую технологию, которая упрощает кредитование бизнеса

Исследование Visa: Россияне доверяют биометрическим способам идентификации больше, чем паролям и пин-кодам

Dell Technologies: у 80% компаний Европы, Ближнего Востока и Африки проблемы с защитой данных

Техносерв Cloud обеспечивает надежное хранение ИТ-инфраструктуры компании «Elfin»

Решения Рутокен для безопасной удаленной работы сотрудников

"Лаборатория Касперского" обнаружила ранее неизвестную вредоносную кампанию WildPressure

«Диасофт» базирует свои разработки на лучших OpenSource-технологиях

Безопасная разработка

Читалка

ЦБ РФ опубликовал «Методические рекомендации по обеспечению ИБ при разработке и применении ИИ на финансовом рынке»

ЦБ РФ опубликовал «Методические рекомендации по обеспечению ИБ при разработке и применении ИИ на финансовом рынке»

Опубликован №166-ФЗ «О технологической платформе создания, развития и эксплуатации информационных систем»

Опубликован №166-ФЗ «О технологической платформе создания, развития и эксплуатации информационных систем»

Опубликовано распоряжение Правительства Российской Федерации от 27.05.2026 №1237-р

Опубликовано распоряжение Правительства Российской Федерации от 27.05.2026 №1237-р

Календарь мероприятий

Наши медиауслуги

Новый номер

Подписаться на новости BIS Journal / Медиа группы Авангард

Стать автором BIS Journal