LIDAR (обнаружение света и определение дальности)

Фон

В настоящее время использование современных датчиков позволило с высокой эффективностью внедрять инновации в мониторинг природных ресурсов, например, в случае технологии LIDAR (Light Detection And Ranging — обнаружение по свету и расстоянию), которая является результатом интеграции технологий GPS, инерциального измерительного устройства и лазерного датчика, используемых для измерения расстояний на различных расстояниях путем сбора данных, которые проецируются в виде облака точек в трех измерениях (x, y, z).

Эти данные используются для определения поверхности местности и создания цифровых моделей местности (DTM) и цифровых моделей поверхности (DSM), на основе которых создается модель высоты полога (CHM), равная высоте или остаточному расстоянию между землей и верхней частью объектов над землей (рис. 1).

С помощью этих цифровых моделей можно проводить биометрические исследования леса как на уровне отдельных деревьев (среди прочего, общая высота и высота кроны), так и на уровне растений (объем, площадь основания и биомасса) (рис. 2).

Учитывая этот контекст, мы применим науку о данных к этому типу многомерной информации для решения проблемы структурного разделения различных типов растительности (рис. 3), в которой различные распределения в (x, y, z) вызывают конфликт сегментации. между объектами, относящимися к деревьям, кустарникам, лугам и естественной почве, в основном за счет уклона, имеющегося на исследуемой территории (рис. 4).

В последующем ищется смысловая сегментация изображения, чтобы увидеть лесной и нелесной покров поверхности. И, наконец, количественная информация об изображении будет получена путем кластеризации и фильтрации оптимальных порогов для разделения различных элементов, содержащихся в изображении CHM.

Методология

Данные

Информация будет собираться с помощью LIDAR-съемки с беспилотного летательного аппарата (БПЛА) над небольшим участком земли. Из-за больших различий в окружающей среде и росте деревьев ширина полосы была установлена ​​равной 10 м, чтобы получить более широкий диапазон выборочных данных. Высота полета была установлена ​​на уровне 80 м для получения точных данных об облаках точек (рис. 5). На основе этой информации будет создана модель высоты купола (CHM) из DTM и DSM.

Разработка

1- Обработка больших данных.

Основной проблемой трехмерных облаков точек является плотность данных. Что приводит к более высоким вычислительным затратам при обработке и визуализации данных. Для этого необходимо реализовать методы подвыборки, чтобы уменьшить плотность данных в облаке точек. Некоторые из наиболее репрезентативных:

Случайный метод. Самый простой способ уменьшить плотность данных, при котором случайным образом выбирается определенное количество точек данных.

Метод минимального расстояния. Выбор точки данных ограничивается минимальным расстоянием, так что ни одна точка данных в выбранном подмножестве не находится ближе к другой точке данных, чем указанное минимальное расстояние.

Метод сетки вокселей. На облаке точек создается структура сетки и выбирается репрезентативная точка данных. Это основано на разделении трехмерного пространства на правильные кубические ячейки, называемые вокселами, где для каждой сетки в разделении трехмерного пространства мы будем хранить только одну репрезентативную точку. Для этого метода необходимо учитывать следующее:

A. Определяем размер ограничивающей рамки (длина, ширина и высота вокселя)
B. Для каждого вокселя мы проверяем, содержит ли он одну или несколько точек.
C. Наконец, мы вычисляем представитель вокселя, в данном случае центроид.

Благодаря сжатию данных с помощью воксельной подвыборки теперь цель состоит в том, чтобы иметь возможность четко отделить от лидарных данных то, что соответствует классу почвы, и то, что относится к классу растительности плюс пастбища. Для этого мы будем применять методы группировки и сегментации.

2- Разделение наземных точек многомерной группировкой.

Первой моделью, которую мы реализуем, будет кластеризация многомерных данных. Однако предполагается, что группа будет содержать объекты, которые связаны на основе наблюдений за их значениями атрибутов (x, y, z), поэтому вполне вероятно, что некоторые атрибуты коррелированы, и в группах могут существовать родственные подпространства. произвольно ориентированы.

Понятие расстояния становится менее точным по мере роста числа измерений, поскольку расстояние между двумя точками в заданном наборе данных сходится, поэтому различение ближайшей и самой дальней точки, в частности, теряет смысл.

3- Разделение наземных точек одномерной группировкой.

Второй моделью является так называемый метод классификации естественных разломов по Дженксу. В котором на основе значения Z лидарных данных решается проблема разделения диапазона чисел на смежные классы для минимизации квадрата отклонения внутри каждого класса. Это попытка сгруппировать данные в группы, которые минимизируют дисперсию внутри группы и максимизируют дисперсию между группами.

Разрывы классов создаются таким образом, чтобы наилучшим образом группировать схожие значения и максимизировать различия между классами. Объекты делятся на классы, границы которых устанавливаются там, где имеются относительно большие различия в значениях данных.

4- Разделение наземных точек по уклонам, рассчитанным с помощью K-MEANS.

Определена функция, которая фильтрует наземные точки облака точек, используя простой алгоритм (K-MEANS). Алгоритм вычисляет k ближайших соседей для каждой точки, вычисляет наклон каждой точки для k ближайших соседей и фильтрует точки рельефа на основе порога максимального наклона.

Важно отметить, что функция фильтра принимает три аргумента:
точки: входное облако точек в виде числового массива форм, представляющих координаты (x, y, z).
соседи: количество ближайших соседей, которые следует учитывать при расчете наклона каждой точки.
максимальный наклон: максимально допустимый наклон (в радианах). чтобы точка считалась местностью.

5 – Разделение наземных точек с помощью многомерной обработки изображений.

a — Гауссова фильтрация в CHM для сглаживания данных

Сглаживание модели высоты навеса (CHM) на основе LiDAR используется для удаления ложных локальных максимумов, вызванных ветвями деревьев. Это поможет убедиться, что мы правильно находим верхушки деревьев перед запуском алгоритма сегментации водосбора.

б – Сегментация

С помощью сегментации водосбора алгоритм водосбора обрабатывает значения пикселей как локальную топографию (высоту). Алгоритм затапливает бассейны от маркеров до тех пор, пока бассейны, относящиеся к разным маркерам, не встретятся на линиях водораздела.

Максимумы этого расстояния (т. е. минимумы, противоположные расстоянию) выбираются в качестве маркеров, и затопление бассейнов этих маркеров определяет разделительную функцию вдоль водораздела. Добиваясь таким образом определенной сегментации смежных объектов.

c — нижняя точка статистической сетки.

С помощью проведенной сегментации мы можем правильно получить самую низкую точку данных 3D-лидара, тем самым компенсируя разные уровни земли для различных содержащихся объектов.

Для этого генерируется цикл, в котором для каждой точки (x, y, z) она сравнивается с маской, помечающей ее как 1, если она отличается от минимального значения, полученного при сегментации, и 0, если она аналогична значению сегментации. Цикл будет продолжаться до тех пор, пока не будет предпринята попытка заполнить все значения соседними данными.

d- Разделение морфологическими операциями.

Наконец, чтобы лучше уточнить классификацию лидарных данных, значения (x, y, z) изображения морфологически обрабатываются на основе их соседей, чтобы минимизировать вычислительный расчет окончательной сегментации. Морфологическое расширение делает объекты более заметными и заполняет небольшие отверстия в объектах. А эрозия морфологии удаляет плавающие точки и изолированные точки, поэтому остаются только соответствующие объекты. Это вычисляет взвешенную разницу высот на основе разницы между соседними значениями.