У меня есть три разных решения, в которых я храню документы с document_ids (поисковая система, база данных nosql и самостоятельно разработанное приложение семантического индексирования).
Я выполняю запросы ко всем различным решениям и хотел бы объединить их, используя что-то похожее на SQL JOIN. Это означает, что иногда у меня может быть 3 или более разных набора данных, которые мне нужно объединить в document_id.
Знаете ли вы, является ли Map Reduce на Hadoop или что-то подобное лучшим способом решить эту проблему? Эти наборы данных могут содержать от 1 document_id до 100 000.
Спасибо за ваше время!