Публикации по теме 'computer-vision'


Мем — Dank or Not?
Введение и обзор Мемы, само слово вызывает улыбку на нашем лице, когда мы видим мем, на первый взгляд наш разум думает: «О! это будет что-то интересное», независимо от того, заставит ли этот мем нас смеяться или улыбаться, или даже ничего. За последнее десятилетие мемы стали очень популярны во многих областях, таких как компьютерные науки, маркетинг, здравоохранение, социология, технологии и т. д., и с каждым днем, поскольку люди проводят все больше времени в Интернете, их..

Детектор пальцев в реальном времени над объектом - рабочий пример
Введение Недавно у меня была возможность создать PoC (Proof of Concept - демонстрация) для решения конкретной проблемы компьютерного зрения, и это был отличный опыт, так почему бы не поделиться им? Целью демонстрации было обнаружить в реальном времени, используя в качестве входного видеопотока с камеры, если на конкретном объекте - фальшивой идентификационной карте - есть пальцы, закрывающие информацию, которая может быть использована, например, в OCR. задачи, как только кадр будет..

Комментарий к видеоиграм на основе искусственного интеллекта со сквозными трансформаторами?
Комментарий к видеоиграм на основе искусственного интеллекта со сквозными трансформаторами? Обзор статьи Н. Кариона и др. «Сквозное обнаружение объектов с помощью трансформаторов». В прошлом году я поделился прототипом проекта системы комментариев на основе ИИ для игры в футбол с использованием языковой модели GPT-2 . Посмотрите это на видео, размещенном ниже. Основываясь на этом проекте, я пришел к выводу, что существует огромный потенциал для создания неповторяющихся..

Двухпотоковые сверточные сети для распознавания действий в видео
В следующем посте я хотел бы написать резюме этого исследования: https://papers.nips.cc/paper/5353-two-stream-convolutional-networks-for-action-recognition-in-videos. pdf . В данной статье сформулирован новый подход к решению проблемы распознавания действий в видеороликах. Я буду использовать методологию, изложенную в этом фантастическом блоге: https://violentmetaphors.com/2013/08/25/how-to-read-and-understand-a-scientific-paper-2/ , чтобы объяснить статью. Мы зададим основные вопросы,..

Kornia, вдохновленная OpenCV, - это отличная библиотека компьютерного зрения для PyTorch
OpenCV - самая популярная на сегодняшний день библиотека обработки изображений, охватывающая все, от классических алгоритмов обработки изображений до передовых предварительно обученных моделей с глубоким обучением. Однако, поскольку OpenCV не дифференцируем, он в основном фокусируется на задачах предварительной обработки и не может быть встроен во весь процесс обучения. Этот недостаток побудил исследователя OpenCV.org Эдгара Риба предложить новую дифференцируемую библиотеку..

-Почему у глубокого обучения такой разрушительный потенциал? -Как глубокое обучение влияет на наш бизнес? -Как мы сочетаем глубокое обучение с…
Таким образом, мы можем сказать: «Глубокое обучение — это семейство машинного обучения, основанное на искусственной нейронной сети. Глубокое обучение — это дисциплина в рамках искусственного интеллекта, которая учит компьютеры делать прогнозы на основе необработанных данных». Как все мы знаем, человеческий мозг является наиболее сложным и трудным для изучения. Человеческий мозг сам по себе очень сложен и состоит из миллионов, миллиардов нейронов. Таким образом, глубокое обучение имитирует..

Решение головоломок с помощью Python и OpenCV
Исходный код здесь В начале 2018 года мне подарили потрясающий пазл из 5000 деталей Звездные войны (его можно найти на Amazon здесь ). На решение пазла у меня ушло около 2 месяцев терпения и настойчивости, но теперь я могу смотреть на свой шедевр с удовлетворением и радостью. Тем не менее, я до сих пор помню, когда мне приходилось решать центральную часть головоломки, которую составляли массивные Дарт Вейдер и Люк Скайуокер (спойлер: сын Дарта Вейдера !!). Я фактически..