Я хочу создать большую масштабируемую базу данных с миллионами многомерных векторов, используя LSH. Поскольку мне нужно хранить все данные в оперативной памяти для быстрого запроса, данные должны быть распределены по нескольким серверам для хранения всех объектов.
Наивным подходом было бы разбросать все объекты по разным серверам и отправить один запрос на каждый сервер. Сервер с лучшим ответом правильно имеет правильный объект.
Я уверен, что должно быть какое-то лучшее решение, когда запрос не нужно отправлять на все узлы сервера, а похожие объекты сгруппированы вместе на одном сервере.
Что было бы хорошим подходом для распределенных таблиц LSH? Может быть, есть еще какие-то проекты?
Спасибо за любую подсказку.