Можете ли вы представить себе, что Playboy внесет наибольший вклад в вашу академическую область? Каждый студент, изучающий компьютерное зрение, узнает о Лене, одной из самых известных фотографий, используемых для обработки изображений, полученной инженерами с разворота Playboy. Каким-то образом во всех лекциях Введение в резюме, онлайн-презентациях и даже ссылках на учебные пособия по OpenCV у меня никогда не было реального разговора об этом с кем-либо из моих коллег или профессоров.

Отчасти это забавная причуда… а отчасти напоминание о том, кто должен определять то, как мы узнаем и думаем о компьютерном зрении. А кто этого не сделал. Лена может быть наследием прошлых десятилетий, но в новых технологиях мы видим похожую картину. Из предвзятых наборов данных, используемых для обучения наших моделей машинного обучения или в основном односторонних вариантов использования (re: porn), которые стимулируют развитие виртуальной реальности, мы видим, что технологии разрабатывались исключительно для определенной группы или приносили ей наибольшую пользу. Независимо от того, сделано ли это непреднамеренно или нет, имеет значение, как начать создавать продукты и вести разговоры, которые формируют саму технологию. Структуры, которые мы создаем, неизбежно формируют то, как мы думаем, взаимодействуем и создаем.
Недавно исследование MIT Media Lab выявило серьезные предубеждения в программном обеспечении распознавания лиц, при этом частота ошибок у темнокожих женщин выше на 35% по сравнению с светлокожими мужчинами. Учитывая внимание и финансирование распознавания лиц, удивительно, что несбалансированное представление различных этнических групп в базовых наборах данных обсуждается только сейчас.
Но правда в том, что предвзятость принимает разные формы, и ее трудно увидеть в нас самих. Когда наше восприятие мира во многом основывается на индивидуальной жизни, которую мы прожили, пройденном пути, конечно, он всегда будет неполным. Подобно моделям, с которыми мы работаем, предвзятость - неизбежная часть каждого из нас. Важно признать и нормализовать наши предубеждения до того, как мы попытаемся прийти к заключению. Но как мы это делаем? Я полагаю, это то, что они называют мудростью, но я надеюсь на обнаружение признаков избыточного / недостаточного представления OpenCV ... или, может быть, на функцию Sci-kit Learn для определения дисбаланса в наборах данных ...

Я закончу двумя своими предубеждениями. Когда я выбрал изображения для своего проекта Компьютерное зрение на этой неделе, я сразу подумал, что это щенки и тайская еда! Бьюсь об заклад, если бы больше женщин участвовало в создании этой области, по крайней мере одно пушистое животное вошло бы в историю обработки изображений. Стоит отметить, что в наши дни кошки, кажется, взяли верх как самый популярный предмет ...