Какой дистрибутив Linux лучше всего подходит для Nutch-Hadoop?

мы пытаемся выяснить, какой дистрибутив Linux лучше всего подходит для интеграции Nutch-Hadoop? мы планируем использовать кластеры для обхода большого контента через Nutch. Дайте мне знать, если вам нужно больше разъяснений по этому вопросу?

Спасибо.


person vipin k.    schedule 01.06.2010    source источник


Ответы (2)


В этом случае нет большой разницы между любым основным дистрибутивом Linux. Но я бы порекомендовал вам тот, у которого есть готовые пакеты для Hadoop. Я использую дистрибутив Cloudera Hadoop на Debian, и он работает очень хорошо.

person wlk    schedule 18.06.2010

Пакеты hadoop и hbase будут в следующей стабильной версии Debian:

http://packages.debian.org/search?keywords=hadoop

person Thomas Koch    schedule 20.06.2010