Как настроить правила типа Referential Integrity в DQS?

У меня есть сценарий, в котором мне нужно проверить домен, используя значения в другом домене. Правило: Каждое значение в домене 1 должно существовать в домене 2. Список уникальных значений во втором домене будет около 50 миллионов. Как это сделать в DQS?


person ash    schedule 19.06.2012    source источник


Ответы (2)


Вы правы, полагая, что сценарий целостности ссылок напрямую не поддерживается в этом выпуске DQS. Однако, используя комбинацию существующих методов, вы можете получить эту функциональность. Я перечислю их ниже. Также вы можете взглянуть на некоторые из коротких скринкастов, которые я сделал на DQS — здесь.

Чтобы имитировать ссылочную целостность: 1) Создайте домен из каждого исходного поля в базе знаний 2) Создайте составной домен из этих исходных полей 3) Создайте правило сопоставления для составного домена в вашей базе знаний, где значение из первой исходной таблицы является Запись 'pivot' установлена ​​в качестве предварительного условия - подробнее здесь и здесь.

Пример составного правила

person Lynn Langit    schedule 14.07.2012

Перекрестные проверки таблиц, по-видимому, отсутствуют во многих инструментах профилирования данных. Единственный способ, который я вижу, - это создать представление где-нибудь с левым соединением. Как правило, это будет означать восстановление данных, которые вы хотите профилировать, в вашей собственной среде (неплохо, если вы можете удовлетворить свои собственные требования к задержке) и создание представлений для определения отношений между таблицами, которые вы хотите протестировать.

Проверка ссылочной целостности казалась очевидным первым шагом в профилировании данных, но поиск в Интернете не кажется острой проблемой. Я что-то упускаю?

person Max    schedule 06.07.2012