Начало работы с YOLO



  1. Обнаружение встречного транспорта в режиме реального времени на основе YOLO и отслеживания центроидов(arXiv)

Автор: Зиллур Рахман, Амит Мазумдер Ами, Мухаммад Ахсан Улла

Вывод: Вождение по встречным полосам является одной из основных причин дорожно-транспортных происшествий и пробок во всем мире. Обнаружив транспортные средства, движущиеся по неверному пути, можно свести к минимуму количество аварий и сократить количество пробок. С ростом популярности систем управления дорожным движением в режиме реального времени и появлением более дешевых камер видеонаблюдение стало важным источником данных. В этой статье мы предлагаем автоматическую систему обнаружения транспортных средств, движущихся по неверному пути, по кадрам с камер дорожного наблюдения. Наша система работает в три этапа: обнаружение транспортных средств на видеокадре с использованием алгоритма You Only Look Once (YOLO), отслеживание каждого транспортного средства в заданной интересующей области с использованием алгоритма отслеживания центроида и обнаружение транспортных средств, движущихся не в том направлении. YOLO очень точно обнаруживает объекты, а алгоритм отслеживания центроидов может эффективно отслеживать любой движущийся объект. Эксперимент с некоторыми видеороликами о дорожном движении показывает, что предлагаемая нами система может обнаруживать и идентифицировать любое транспортное средство, движущееся по встречному маршруту, в различных условиях освещения и погоды. Система очень проста и легка в реализации

2.YOLO v3: Модель визуального обнаружения объектов и обнаружения объектов в реальном времени для интеллектуальных систем наблюдения (3s)(arXiv)

Автор:Каньифичукву Джейн Огине, Озиома Коллинз Огине, Хашим Ибрагим Бисаллах

Аннотация: Можем ли мы увидеть все это? Все ли мы знаем? Это вопросы, которые задают людям в нашем современном обществе, чтобы оценить нашу склонность решать проблемы. В недавних исследованиях изучалось несколько моделей обнаружения объектов; однако большинство из них не отвечают требованиям объективности и точности прогнозов, особенно в развивающихся и слаборазвитых странах. Следовательно, несколько глобальных угроз безопасности потребовали разработки эффективных подходов к решению этих проблем. В этой статье предлагается модель обнаружения объектов для киберфизических систем, известных как интеллектуальные системы наблюдения (3s). В этом исследовании предлагается двухэтапный подход, подчеркивающий преимущества архитектуры глубокого обучения YOLO v3 для обнаружения объектов в реальном времени и визуально. Для этого исследования был реализован подход к трансферному обучению, чтобы сократить время обучения и вычислительные ресурсы. Набор данных, используемый для обучения модели, представляет собой набор данных MS COCO, который содержит 328 000 аннотированных экземпляров изображений. Для повышения эффективности были реализованы методы глубокого обучения, такие как предварительная обработка, конвейерная обработка данных и обнаружение. По сравнению с другими новыми исследовательскими моделями результаты предложенной модели очень хорошо показали себя при обнаружении ДИКИХ объектов на видеозаписях наблюдения. Была зарегистрирована точность 99,71% с улучшенным mAP 61,5.

3. YOLO-FaceV2: детектор лиц с учетом шкалы и окклюзии(arXiv)

Автор:Цзыпин Ю, Хунбо Хуан, Вэйцзюнь Чен, Юнсинь Су, Яхуи Лю, Сюин Ван

Аннотация. В последние годы алгоритмы распознавания лиц, основанные на глубоком обучении, достигли значительного прогресса. Эти алгоритмы обычно можно разделить на две категории: двухэтапный детектор, такой как Faster R-CNN, и одноэтапный детектор, такой как YOLO. Из-за лучшего баланса между точностью и скоростью одноступенчатые детекторы широко используются во многих приложениях. В этой статье мы предлагаем детектор лиц в реальном времени на основе одноэтапного детектора YOLOv5, названный YOLO-FaceV2. Мы разрабатываем модуль улучшения рецептивного поля под названием RFE, чтобы улучшить рецептивное поле маленького лица, и используем NWD Loss, чтобы компенсировать чувствительность IoU к отклонению местоположения крошечных объектов. Для окклюзии лица мы представляем модуль внимания под названием SEAM и вводим Repulsion Loss для его решения. Кроме того, мы используем весовую функцию Slide для устранения дисбаланса между простыми и сложными образцами и используем информацию об эффективном рецептивном поле для разработки якоря. Экспериментальные результаты на наборе данных WiderFace показывают, что наш детектор лиц превосходит YOLO, и его варианты можно найти во всех простых, средних и сложных подмножествах. Исходный код в https://github.com/Krasjet-Yu/YOLO-FaceV2