У меня есть собственный алгоритм обработки графика, который принимает текстовый файл в качестве входных данных. Поскольку это крупномасштабный график, я хочу реализовать его в рамках Apache Giraph. Я провел много исследований, но я до сих пор не уверен, что я на правильном пути.
Я читаю файл .csv, который содержит данные графика, и с помощью синтаксического анализатора я конвертирую его в файл txt и загружаю в файловую систему HDFS Hadoop.
Я прочитал пример SimpleShortestPathsVertex из руководства по быстрому запуску apache и вижу, что он обрабатывает данные из файла в HDFS, используя файл jar с зависимостями.
Моя проблема в том, что я еще не понял, как мне добавить свой алгоритм в фреймворк apache giraph и запустить процесс графа. Могу ли я добавить свой алгоритм в структуру apache с помощью eclipse и изменить его оттуда или есть какой-либо другой способ?
Благодарю вас!