Поиск повторяющихся значений в SQL Server 2008

Address(COLUMN NAME)
100 INDONIA DR  CAMP ROAD 600618
100 INDONIA  CAMP ROAD 600618
1009 CLARK STREET  STEFEN ROAD 876257
1009 S MAIN ST  HOLAN 654636
1007 OAKIRA ST  FARAL DELLS 600106
1007 OAKIRA STREET  FARAL DELLS 600106
19 SUN MARTIN ST  BELGIN 122010
145 CHARLES ST  JHARVAND 110012
1007 S SUPERIOR ST.  BILTON 625017
1007 S. SUPERIOR STREET  BILTON 625017
187 HOWARD STREET  VIRLITIN 220120

мне нужно выяснить, как сделать отдельный для этого столбца. значения - это тот же адрес, но написание в некоторых строках отличается.

Address
100 INDONIA DR  CAMP ROAD 600618
100 INDONIA  CAMP ROAD 600618
1009 CLARK STREET  STEFEN ROAD 876257
1009 S MAIN ST  HOLAN 654636
1007 OAKIRA ST  FARAL DELLS 600106
1007 OAKIRA STREET  FARAL DELLS 600106
19 SUN MARTIN ST  BELGIN 122010
145 CHARLES ST  JHARVAND 110012
1007 S SUPERIOR ST.  BILTON 625017
1007 S. SUPERIOR STREET  BILTON 625017
187 HOWARD STREET  VIRLITIN 220120

Вот моя попытка.

SELECT DISTINCT Ltrim(Rtrim([Address])) AS Address
FROM   [Vigness].[dbo].[Test]
WHERE  Address LIKE '% %'
       AND Len(Address) > 0
ORDER  BY 1 

person Vicky    schedule 18.11.2014    source источник
comment
Привет, добро пожаловать в StackOverflow. Обычно мы просим OP (вас) предоставить нам то, что вы пытались сделать до сих пор. Вы пробовали какой-либо запрос или что-то в этом роде? Можете ли вы показать нам свои усилия?   -  person mordack550    schedule 18.11.2014
comment
SELECT Distinct LTRIM(RTRIM([Address])) As Address FROM [Vigness].[dbo].[Test] Где Address Like '% %' And LEN(Address)›0 Order by 1 . Я попробовал вышеуказанный запрос, но он неправильно фильтрует значения.   -  person Vicky    schedule 18.11.2014
comment
@Vicky, все ли значения начинаются и заканчиваются цифрой (так что шаблон всегда представляет собой числовое значение varchar numeric ?   -  person Eduard Uta    schedule 18.11.2014
comment
Нет, у меня другой адрес. приведенные выше значения являются просто выборкой, выбранной случайным образом из таблицы.   -  person Vicky    schedule 18.11.2014
comment
Мне нужно отфильтровать данные, используя только адресное поле. чтобы найти правильные данные   -  person Vicky    schedule 18.11.2014
comment
выберите другие столбцы, группу max(address) по другим столбцам.   -  person radar    schedule 18.11.2014


Ответы (1)


Здесь есть аналогичный вопрос о стандартизации адресов с использованием soundex в SQL Server.

Данные адреса SQL беспорядочны, как убрать это в запросе?

Соответствующая функция soundex()

http://msdn.microsoft.com/en-us/library/ms187384(v=sql.100).aspx

person Vinnie    schedule 18.11.2014
comment
Похоже, так и будет. Из MSDN для входного значения: character_expression Буквенно-цифровое выражение символьных данных. - person Vinnie; 18.11.2014
comment
Если данные буквенно-цифровые, то они вернут 0000 - person Pரதீப்; 18.11.2014
comment
Но как я могу найти повторяющиеся значения с помощью soundex. - person Vicky; 18.11.2014