Слияние данных с нескольких датчиков считается неотъемлемой проблемой приложений беспроводной сенсорной сети. Поэтому точное и точное методическое решение является сложной задачей. Чтобы решить эту проблему, гибридная модель, использующая грубый набор (RS) с нейронной сетью обратного распространения (BP-NN), используется для улучшения возможностей слияния данных системы с иллюстративным примером. Экспериментальные результаты продемонстрировали возрастающее улучшение точности прогнозирования гибридной модели по сравнению с традиционной моделью BPNN.
В этой работе классификатор на основе ML построен из автономной подписи входящих мультисенсорных данных с использованием гибридной модели RS и NN. На рис. 1 представлен расширенный вид предлагаемой архитектуры для прогнозирования уровня загрязнения в источниках воды.
На основе выходных данных классификатора оператор системы может легко принять решение об уровне загрязнения. Это позволяет ему предпринимать собственные шаги и своевременно инициировать график обслуживания. Проблемы, возникающие в приложениях для слияния данных, например, мультисенсорные системы, заставляют нас сочетать слияние данных и интеллектуальный анализ данных. В этой работе показано и обсуждается, как методы интеллектуального анализа данных и объединения данных вместе могут играть взаимодополняющую роль.
В реальном мире приложение для слияния данных решает несколько проблем, связанных с данными, которые показаны на рис. 2. Входные данные для мультисенсорной системы слияния непоследовательны, несовершенны, коррелированы и/или находятся в разрозненных формах.
Первый и основной шаг включает в себя предварительную обработку сенсорных данных. Он включает в себя нормализацию и уточнение набора данных. Следующий шаг включает в себя использование теории грубых наборов (RST) для определения важнейших функций из набора данных. Затем соответствующие элементы передаются в нейронную сеть, которая дополнительно обучается с помощью алгоритма обратного распространения Левенберга-Марквардта (LM-BP).
Шаг 1. Предварительная обработка данных
Первый этап включает в себя обработку данных. Он стремится очистить нерелевантные и лишние элементы из данных. Обычно в нем используется несколько методологий, таких как извлечение признаков, нормализация, выбор и преобразование признаков. В нашем случае мы дискретизировали весь набор данных до одного числового значения, чтобы упростить работу. На рис. 3 показан пример обучающего набора данных.
Шаг 2. Сокращение возможностей с помощью RST
RST — это математическая теория, позволяющая обнаружить неоднозначность в выборочном наборе данных и удалить избыточную информацию. Он предоставляет эффективный алгоритм для обнаружения скрытых закономерностей в наборе данных. Он широко используется для сокращения неэффективных данных из данных, поэтому очень полезен для уменьшения лишних функций.
Шаг 3. Обучение с помощью BP-NN для определения наилучшего набора сокращенных функций для системы.
10 сенсорных входных функций подаются в NN индивидуально и обучаются с использованием алгоритма LM-BP. База данных разделена на три набора. 10% выборок используются для проверки сети, чтобы остановить обучение до того, как произойдет переобучение. 20% выборки используется для тестирования, а остальные 70% используются для обучения сети. Используется двухуровневая сеть с прямой связью, использующая сигмовидную функцию. На рис. 4 показан рабочий процесс.
Шаг 4. Сравнение BPNN и RS–BPNN
На этом этапе мы использовали традиционный подход к тестированию NN с алгоритмом LM-BP без использования RS. Все 10 входных функций передаются в сеть для обучения системы без сокращения каких-либо входных функций. Чтобы оценить эффективность обоих методов, были проведены эксперименты для определения относительной значимости каждого независимого параметра вывода. MSE служит для оценки различий между ожидаемыми и фактическими значениями для обоих методов. На рис. 5 показано сравнение MSE для обоих методов.
Наконец, мы можем сравнить точность прогнозов RS-BPNN и BPNN с исходными выходными значениями, как показано на рис. 6.
Резюме :
Слияние данных в мультисенсорной системе — сложная задача. Чтобы решить эту проблему, в этой статье была предпринята попытка предложить гибридную архитектуру, которая связывает RST с NN на примере системы мониторинга загрязнения. RS используется в качестве слоя предварительной обработки в составе сети RS-BP для фильтрации неточных и избыточных данных. Он извлекает данные и определяет важные функции из набора данных. Эти атрибуты передаются в нейронную сеть, которая обучается с использованием алгоритма LM-BP. При сравнении результатов прогнозирования BPNN и RS-BPNN было обнаружено, что последний лучше первого.