Я читаю Hadoop — Полное руководство Тома Уайта, 4-е издание, где он пишет:
«Однако хранилище пула блоков не разделено, поэтому узлы данных регистрируются с каждым узлом имен в кластере и хранят блоки из нескольких пулов блоков».
Кто-нибудь может это прояснить? Конкретно если...
NameNodeA: blockpool for DataNode1 and DataNode2
NameNodeB: blockpool for DataNode3 and DataNode4
... хранит ли NameNodeB пул блоков NodeNameA? Это кажется расточительным, поскольку автор ранее писал, что «узлы имен не взаимодействуют друг с другом».
Обновление: после просмотра комментариев здесь и повторного прочтения кажется, что это работает следующим образом: вы можете разделить пространство имен на федеративные узлы имен, которые управляют разделом (например, /user), но, тем не менее, содержат все пространство имен (например, /user /foo /bar).