Сравнение каналов данных из разных сетей (партнерский маркетинг)

Я работаю над интеграцией партнерских продаж в несколько существующих сайтов. Мы используем несколько мерчантов, которые работают через разные сети (cj, shareasale, linkshare, avantlink).

Теперь мое наблюдение заключается в том, что все эти сети предоставляют потоки данных в разных форматах. Но это не большая проблема. На самом деле меня больше всего беспокоят продавцы, использующие разные названия для одних и тех же продуктов. Я не хочу сталкиваться с такими ситуациями:

а) два объявления ОДНОГО ОДНОГО товара от N продавцов (если названия немного отличаются)

б) одно перечисление N разных товаров от продавцов (если не использовать строгий алгоритм сравнения)

Мы хотим максимально все автоматизировать, хотим, чтобы операторы постоянно не сканировали сомнительные списки.

Как обычно решается эта проблема?


person mvbl fst    schedule 31.03.2010    source источник


Ответы (4)


У нас есть аналогичная проблема с попыткой свернуть продукты из нескольких фидов продавцов. Что мы делаем, так это объединяем продукты на основе их бренда (или производителя) + комбинации артикула.

Наши данные довольно беспорядочны, поэтому нам нужно проделать некоторую работу, чтобы нормализовать как бренд, так и артикул, чтобы продукты хорошо складывались. У нас есть список брендов, которые нам небезразличны, и мы делаем некоторую работу, чтобы сопоставить бренды из фида продавцов с нашим брендом. например Если в нашей системе есть торговая марка ACME, мы можем сопоставить с этой торговой маркой следующее:

A.C.M.E => ACME
ACME Inc. => ACME
Acme Incorporated => ACME

Для SKUS мы обычно просто удаляем любые небуквенно-цифровые символы для сопоставления. например все следующее будет отображаться на один и тот же артикул:

abc-123 => abc123
abc.123 => abc123
abc 123 => abc123
ab.c1.23 => abc123

Итак, если мы увидим бренд «ACME Inc.» и артикул "abc-123" в одном фиде, который будет совмещен с брендом "A.C.M.E" и артикулом "abc 123" из другого фида.

В рамках процесса свертывания мы получаем несколько имен/изображений/описаний/категорий/и т. д. для каждой свернутой части, и нам нужно выбрать «лучшее» для отображения на веб-сайте.

Это очень общий обзор того, как мы справляемся с этим.

person tpunder    schedule 01.04.2010
comment
Большое спасибо! Я не знал, что SKU будут одинаковыми для разных брендов, я думал, что SKU специфичны для продавцов (то, как они каталогизируют свои запасы внутри компании). - person mvbl fst; 02.04.2010
comment
Это зависит от... Иногда продавец предоставляет артикул производителя, а иногда использует собственный внутренний артикул. А в других случаях они будут использовать вариант артикула производителя, который включает префикс или суффикс, характерный для бренда (например, acme-abc-123). Если продавец дает вам только свой внутренний артикул, может быть очень сложно сопоставить этот продукт с таким же продуктом от других продавцов. - person tpunder; 02.04.2010

Ищите продавцов, которые предоставляют коды UPC в своих каналах. Они универсальны. Кроме того, в AvantLink вы можете настроить свой собственный вывод ленты, так что это приятно.

person Max    schedule 01.04.2010
comment
Спасибо. Но смотрите мой комментарий выше. - person mvbl fst; 02.04.2010

На самом деле минуту назад я просматривал 2 образца данных из AvantLink. Вот список полей, которые они предоставляют (не отфильтровано, поэтому я предполагаю, что это все):

SKU 
Manufacturer 
Id  
Brand Name  
Product Name    
Long Description    
Short Description   
Category    
SubCategory 
Product Group   
Thumb URL   
Image URL   
Buy Link    
Keywords    
Reviews 
Retail Price    
Sale Price  
Brand 
Page Link   
Brand Logo Image    
Product Page View Tracking  
Product Content Widget

Я подумал, что да, наличие UPC было бы (почти) идеальным, но оба магазина, которые я искал (один из них — REI), не предоставляют UPC.

Проверено Commission Junction и Sshareasale, несколько крупных продавцов, они также не включают UPC.

person mvbl fst    schedule 01.04.2010

Как обычно решается эта проблема?

Такие сценарии обычно покрываются системами хранения данных, такими как ORACLE, HP, Microsoft, IBM, Netezza или Teradata.

person Robert    schedule 31.03.2010
comment
Мы используем MySQL. Тоже обработал не совсем информативно для меня. Как они обрабатываются? Я не думаю, что это может быть на 100% автоматизировано и работать без ошибочных результатов. - person mvbl fst; 01.04.2010