Нечеткое сравнение строк - DAX: Программирование

Logger · 14.10.2010, 00:13

Здравствуйте.

Кто-нибудь делал функцию нечеткого сравнения строк ?

Суть проблемы : есть ряд записей в справочнике, у которых отличаются наименования перестановкой слов, пропуском знаков препинания и кавычек, пропуском некоторых слов и т.п. Хотелось бы поиметь некую строковую функцию, которая позволила бы определить что формально разные названия суть одно и то же.
Ну то есть понимала бы что строки
"ООО "Рога и копыта""
"Рога и копыта ООО"
"Рога и копыта, inc"
"Рога и копыта"
""Рога и копыта""
""Рога и копыта, ООО""

-реально одно и то же. Ну или могла бы дать какую-то меру близости двух строк друг к другу, чтобы мы могли понять что две строки это почти одно и то же или наоборот что они совсем разные и не могут соответствовать одному и тому же контрагенту.

Задача возникла при внедрении аксапты в филиале компании. Т.е. справочники контрагентов и номенклатур у нас похожи, но кодировка разная. При закачке справочников в аксапту появились дубликаты. Выверка по ИНН и артикулам не дает нужного результата, так как в справочниках предоставленных филиалом было много ошибок, неточностей и т.п. При любой спорной ситуации только человек по названию может определить являются ли 2 записи дублем или это разные сущности. Хотелось бы как-то облегчить людям труд по выверке справочников и сгруппировать записи которые с большой долей вероятности могут быть дублями одной и той же сущности.

Похожие темы
Тема	Автор	Раздел	Ответов	Посл. сообщение
Сортировка и сравнение строк	Perc	DAX: Программирование	14	25.08.2010 20:06
Баг? Сравнение строк длиной более 32767 символов	vallys	DAX: База знаний и проекты	6	16.07.2008 12:18
Тормозит копирование строк в буфер обмена	ivas	DAX: Программирование	20	21.08.2007 15:05
Пользовательский генератор строк-перечислений...- 2: Доп.вкладка для SysQueryForm	Gustav	DAX: База знаний и проекты	1	04.05.2007 18:04
БАГ: копирование строк накладных в новый заказ	Антон Солдатов	DAX: Функционал	2	03.12.2004 09:02