Общее руководство по типам аугментации и советы по созданию качественных наборов данных
Введение:
В этой статье мы объясним каждый тип аугментации, их значение и несколько советов, о которых следует помнить при выборе конкретной техники аугментации.
Расширение обнаружения объектов
листать
— — — — — — — — — — — — — — — — — — — — — — — — — — — —
Перевернутое изображение или перевернутое изображение – это изображение, созданное путем зеркального переворачивания оригинала по горизонтальной оси, в то время как перевернутое изображение зеркально отражается по вертикальной оси.
Типы перелистывания
Отражение по горизонтали: изображение будет зеркально отражено вдоль горизонтальной оси исходного изображения.
Отразить по вертикали. Изображение будет зеркально отражено вдоль вертикальной оси исходного изображения.
Советы:
Вот несколько вещей, которые следует учитывать при использовании перелистывания:
- Обычно это помогает удвоить исходный набор данных, а в сочетании с обоими типами (H-flip 2x + V-flip 2x) увеличит количество изображений в четыре раза!
- В некоторых типах наборов данных лучше не использовать отражение → Если вы обучаете модель OCR, переворачивание символов не имеет смысла.
Аффинные преобразования
— — — — — — — — — — — — — — — — — — — — — — — — — — — —
Аффинное преобразование — это метод линейного отображения, который сохраняет точки, прямые линии и плоскости. Наборы параллельных прямых остаются параллельными после аффинного преобразования. Техника аффинного преобразования обычно используется для коррекции геометрических искажений или деформаций, возникающих при неидеальных ракурсах камеры [1].
Типы аффинных преобразований
Масштабирование
В компьютерной графике и цифровых изображениях масштабирование изображения означает изменение размера цифрового изображения.
Масштабирование. – это процесс увеличения изображения с более низким разрешением до изображения с большим разрешением.
Уменьшение масштаба: это процесс растягивания изображения с более высоким разрешением до изображения с более низким разрешением.
Советы:
Вот несколько вещей, которые следует учитывать при использовании масштабирования:
- Масштабирование полезно для изменения размера изображений в соответствии с определенными входными размерами сети.
- Масштабирование обычно приводит к потере функций в зависимости от типа метода интерполяции, используемого для масштабирования изображений.
- Уменьшение масштаба делает изображение плотным или сжатым с элементами в относительно небольшой области. Это полезно для изменчивости данных.
- Если вы хотите изменить размер изображения и сохранить функции, не растягивая изображение, используется другой метод, называемый Заполнение.
Вращение:
Советы:
Вот несколько вещей, которые следует учитывать при использовании поворота:
- Почти всегда можно безопасно использовать поворот на +/- 10° или 15°, не влияя на набор данных.
- Если ваша модель не поддерживает повернутые ограничивающие рамки, вам необходимо проверить метки, созданные для таких расширений.
- Углы поворота необходимо выбирать в зависимости от типа обнаруживаемого объекта → Если используется слишком большое вращение, это может привести к ложным срабатываниям в наборе данных. Если вы ищете людей, они обычно не стоят вверх ногами (180°) или под углом 75° (исключением является Майкл Джексон из гладкого преступника 😆).
Размытие
— — — — — — — — — — — — — — — — — — — — — — — — — — — —
Размытие — это наиболее часто используемый метод при расширении набора данных. Это делает изображение менее резким, тем самым сглаживая линии и края в процессе.
Нормальное размытие:равномерно размывает все изображение с указанным размером фильтра. Как видно на рис. 5, все пиксели размыты.
Размытие по Гауссу: используется для уменьшения шума и детализации изображения. Это используется для сглаживания краев без потери многих деталей изображения.
Советы:
Вот несколько моментов, которые следует учитывать при использовании размытия.
- Сила размытия должна быть минимальной → Чтобы избежать смазывания или стирания элементов
- Размытие необходимо при создании набора данных оптического распознавания символов, так как часто захваченные данные из реального мира размазываются из-за движения, дрожания рук или просто низкого разрешения устройств ввода.
- Это не только увеличит количество наборов данных, но и сделает модель более невосприимчивой к реальным зашумленным данным.
Краткое содержание:
— — — — — — — — — — — — — — — — — — — — — — — — — — — —
Мы обсудили следующие методы увеличения,
- Переворот — полезно для удвоения набора данных.
- Масштабирование — полезно для изменения размера изображений в соответствии с входными данными сети.
- Вращение — Увеличьте изменчивость в наборах данных
- Размытие — для размещения изображений реального мира в наборе данных.
В Части B мы обсудим другие методы, такие как заполнение, шум и т. д.