Общее руководство по типам аугментации и советы по созданию качественных наборов данных

Введение:

В этой статье мы объясним каждый тип аугментации, их значение и несколько советов, о которых следует помнить при выборе конкретной техники аугментации.

Расширение обнаружения объектов

листать

— — — — — — — — — — — — — — — — — — — — — — — — — — — —

Перевернутое изображение или перевернутое изображение – это изображение, созданное путем зеркального переворачивания оригинала по горизонтальной оси, в то время как перевернутое изображение зеркально отражается по вертикальной оси.

Типы перелистывания

Отражение по горизонтали: изображение будет зеркально отражено вдоль горизонтальной оси исходного изображения.

Отразить по вертикали. Изображение будет зеркально отражено вдоль вертикальной оси исходного изображения.

Советы:

Вот несколько вещей, которые следует учитывать при использовании перелистывания:

  1. Обычно это помогает удвоить исходный набор данных, а в сочетании с обоими типами (H-flip 2x + V-flip 2x) увеличит количество изображений в четыре раза!
  2. В некоторых типах наборов данных лучше не использовать отражение → Если вы обучаете модель OCR, переворачивание символов не имеет смысла.

Аффинные преобразования

— — — — — — — — — — — — — — — — — — — — — — — — — — — —

Аффинное преобразование — это метод линейного отображения, который сохраняет точки, прямые линии и плоскости. Наборы параллельных прямых остаются параллельными после аффинного преобразования. Техника аффинного преобразования обычно используется для коррекции геометрических искажений или деформаций, возникающих при неидеальных ракурсах камеры [1].

Типы аффинных преобразований

Масштабирование

В компьютерной графике и цифровых изображениях масштабирование изображения означает изменение размера цифрового изображения.

Масштабирование. – это процесс увеличения изображения с более низким разрешением до изображения с большим разрешением.

Уменьшение масштаба: это процесс растягивания изображения с более высоким разрешением до изображения с более низким разрешением.

Советы:

Вот несколько вещей, которые следует учитывать при использовании масштабирования:

  1. Масштабирование полезно для изменения размера изображений в соответствии с определенными входными размерами сети.
  2. Масштабирование обычно приводит к потере функций в зависимости от типа метода интерполяции, используемого для масштабирования изображений.
  3. Уменьшение масштаба делает изображение плотным или сжатым с элементами в относительно небольшой области. Это полезно для изменчивости данных.
  4. Если вы хотите изменить размер изображения и сохранить функции, не растягивая изображение, используется другой метод, называемый Заполнение.

Вращение:

Советы:

Вот несколько вещей, которые следует учитывать при использовании поворота:

  1. Почти всегда можно безопасно использовать поворот на +/- 10° или 15°, не влияя на набор данных.
  2. Если ваша модель не поддерживает повернутые ограничивающие рамки, вам необходимо проверить метки, созданные для таких расширений.
  3. Углы поворота необходимо выбирать в зависимости от типа обнаруживаемого объекта → Если используется слишком большое вращение, это может привести к ложным срабатываниям в наборе данных. Если вы ищете людей, они обычно не стоят вверх ногами (180°) или под углом 75° (исключением является Майкл Джексон из гладкого преступника 😆).

Размытие

— — — — — — — — — — — — — — — — — — — — — — — — — — — —

Размытие — это наиболее часто используемый метод при расширении набора данных. Это делает изображение менее резким, тем самым сглаживая линии и края в процессе.

Нормальное размытие:равномерно размывает все изображение с указанным размером фильтра. Как видно на рис. 5, все пиксели размыты.

Размытие по Гауссу: используется для уменьшения шума и детализации изображения. Это используется для сглаживания краев без потери многих деталей изображения.

Советы:

Вот несколько моментов, которые следует учитывать при использовании размытия.

  1. Сила размытия должна быть минимальной → Чтобы избежать смазывания или стирания элементов
  2. Размытие необходимо при создании набора данных оптического распознавания символов, так как часто захваченные данные из реального мира размазываются из-за движения, дрожания рук или просто низкого разрешения устройств ввода.
  3. Это не только увеличит количество наборов данных, но и сделает модель более невосприимчивой к реальным зашумленным данным.

Краткое содержание:

— — — — — — — — — — — — — — — — — — — — — — — — — — — —

Мы обсудили следующие методы увеличения,

  1. Переворот — полезно для удвоения набора данных.
  2. Масштабирование — полезно для изменения размера изображений в соответствии с входными данными сети.
  3. Вращение — Увеличьте изменчивость в наборах данных
  4. Размытие — для размещения изображений реального мира в наборе данных.

В Части B мы обсудим другие методы, такие как заполнение, шум и т. д.