Объединение данных с нескольких датчиков в сеть беспроводных датчиков с использованием машинного обучения

Слияние данных с нескольких датчиков считается неотъемлемой проблемой приложений беспроводной сенсорной сети. Поэтому точное и точное методическое решение является сложной задачей. Чтобы решить эту проблему, гибридная модель, использующая грубый набор (RS) с нейронной сетью обратного распространения (BP-NN), используется для улучшения возможностей слияния данных системы с иллюстративным примером. Экспериментальные результаты продемонстрировали возрастающее улучшение точности прогнозирования гибридной модели по сравнению с традиционной моделью BPNN.

В этой работе классификатор на основе ML построен из автономной подписи входящих мультисенсорных данных с использованием гибридной модели RS и NN. На рис. 1 представлен расширенный вид предлагаемой архитектуры для прогнозирования уровня загрязнения в источниках воды.

На основе выходных данных классификатора оператор системы может легко принять решение об уровне загрязнения. Это позволяет ему предпринимать собственные шаги и своевременно инициировать график обслуживания. Проблемы, возникающие в приложениях для слияния данных, например, мультисенсорные системы, заставляют нас сочетать слияние данных и интеллектуальный анализ данных. В этой работе показано и обсуждается, как методы интеллектуального анализа данных и объединения данных вместе могут играть взаимодополняющую роль.

В реальном мире приложение для слияния данных решает несколько проблем, связанных с данными, которые показаны на рис. 2. Входные данные для мультисенсорной системы слияния непоследовательны, несовершенны, коррелированы и/или находятся в разрозненных формах.

Первый и основной шаг включает в себя предварительную обработку сенсорных данных. Он включает в себя нормализацию и уточнение набора данных. Следующий шаг включает в себя использование теории грубых наборов (RST) для определения важнейших функций из набора данных. Затем соответствующие элементы передаются в нейронную сеть, которая дополнительно обучается с помощью алгоритма обратного распространения Левенберга-Марквардта (LM-BP).

Шаг 1. Предварительная обработка данных

Первый этап включает в себя обработку данных. Он стремится очистить нерелевантные и лишние элементы из данных. Обычно в нем используется несколько методологий, таких как извлечение признаков, нормализация, выбор и преобразование признаков. В нашем случае мы дискретизировали весь набор данных до одного числового значения, чтобы упростить работу. На рис. 3 показан пример обучающего набора данных.

Шаг 2. Сокращение возможностей с помощью RST

RST — это математическая теория, позволяющая обнаружить неоднозначность в выборочном наборе данных и удалить избыточную информацию. Он предоставляет эффективный алгоритм для обнаружения скрытых закономерностей в наборе данных. Он широко используется для сокращения неэффективных данных из данных, поэтому очень полезен для уменьшения лишних функций.

Шаг 3. Обучение с помощью BP-NN для определения наилучшего набора сокращенных функций для системы.

10 сенсорных входных функций подаются в NN индивидуально и обучаются с использованием алгоритма LM-BP. База данных разделена на три набора. 10% выборок используются для проверки сети, чтобы остановить обучение до того, как произойдет переобучение. 20% выборки используется для тестирования, а остальные 70% используются для обучения сети. Используется двухуровневая сеть с прямой связью, использующая сигмовидную функцию. На рис. 4 показан рабочий процесс.

Шаг 4. Сравнение BPNN и RS–BPNN

На этом этапе мы использовали традиционный подход к тестированию NN с алгоритмом LM-BP без использования RS. Все 10 входных функций передаются в сеть для обучения системы без сокращения каких-либо входных функций. Чтобы оценить эффективность обоих методов, были проведены эксперименты для определения относительной значимости каждого независимого параметра вывода. MSE служит для оценки различий между ожидаемыми и фактическими значениями для обоих методов. На рис. 5 показано сравнение MSE для обоих методов.

Наконец, мы можем сравнить точность прогнозов RS-BPNN и BPNN с исходными выходными значениями, как показано на рис. 6.

Резюме :

Слияние данных в мультисенсорной системе — сложная задача. Чтобы решить эту проблему, в этой статье была предпринята попытка предложить гибридную архитектуру, которая связывает RST с NN на примере системы мониторинга загрязнения. RS используется в качестве слоя предварительной обработки в составе сети RS-BP для фильтрации неточных и избыточных данных. Он извлекает данные и определяет важные функции из набора данных. Эти атрибуты передаются в нейронную сеть, которая обучается с использованием алгоритма LM-BP. При сравнении результатов прогнозирования BPNN и RS-BPNN было обнаружено, что последний лучше первого.

использованная литература

https://www.sciencedirect.com/science/article/abs/pii/S0166361515300609?via%3Dihub