У меня есть большой список (более 200 000) строк, которые я хотел бы сравнить с заданной строкой. Данная строка вставлена пользователем, поэтому она может быть немного неверной.
Я надеялся создать какой-то предварительно вычисленный хеш для каждой строки при добавлении ее в список. Этот хеш будет содержать такую информацию, как длина строки, добавление всех символов и т. Д.
У меня вопрос, существует ли что-то подобное? Наверняка есть что-то, что позволит мне избежать использования расстояния Левенштейна для каждой строки в списке?
Или, может быть, есть третий вариант, о котором я еще не подумал?