Немногие социальные проблемы в США привлекли к себе столько внимания, как полицейская деятельность и ее разрозненное влияние на группы людей. Смерть Джорджа Флойда вызвала всплеск эмоций и споров о состоянии полиции в США и о том, зависит ли поведение полиции от расы человека.

Поскольку этот вопрос стал предметом общественного обсуждения, были высказаны различные точки зрения, чтобы сформировать наше представление о справедливости и полезности полицейской деятельности. Некоторые из них включают:

- Полицейские в США коррумпированы, и нужно ликвидировать всю оккупацию. (например, «Defund the Police»)

- Результаты полицейской деятельности склонны к определенным группам, но различия становятся менее серьезными, если учесть, как часто различные группы людей взаимодействуют с полицией. (т. е. частота задержек за взаимодействие для разных типов поведения примерно одинакова для разных демографических категорий)
- Результаты полицейской деятельности склонны к определенным группам, но этот эффект более распространен среди одних типов конфликтов, чем среди других. (т.е. меньшинства обыскиваются более агрессивно, но не арестовываются и не расстреливаются более агрессивно)
- Работа полиции как институт настолько важна, что мы должны терпимо относиться к отклонениям, если это означает, что общественная безопасность в целом сохраняется. Полиция несовершенна, но в целом действует разумно и способствует социальному благополучию.

По перечисленным выше вопросам возникли разного рода дискуссии. Самыми яркими из них были заснятые в реальном времени видео, на которых полиция жестоко обращается с подозреваемыми, такими как Джордж Флойд и Тони Тимпа. (Предупреждение: оба видео графические).

На основе академических материалов возникли и другие типы дискуссий, целью которых является количественная оценка конкретных деталей того, как полиция обращается с различными группами людей. Вот некоторые из наиболее цитируемых примеров:

- Исследование, в ходе которого было проанализировано более 100 миллионов остановок полиции и обнаружено, что полиция использует более низкие пороговые значения для оправдания поисков представителей меньшинств, чем белые.
- В статье Роланда Фрайера, изучившей 4 различных набора данных, выяснилось, что существует явное свидетельство расовой предвзятости для поиска подозреваемых, но не для применения к ним насилия .
- Исследование, которое обнаружило, что расовые различия исчезают после того, как вы учтете обстоятельства их встречи .

Все эти моменты имеют свое место, но вместе взятые они не лучше всего описывают, как и когда результаты полиции определяются тем, кто мы и что мы делаем. По крайней мере, для широкой публики. Видео - это мощно, но это не данные. Академические исследования важны, но большинство людей не в состоянии их понять, в том числе журналисты, которые их освещают.

Полицейский рентген: лучший способ понять работу полиции

Police Xray - это веб-приложение, которое дает вам простой способ увидеть, как различные обстоятельства влияют на роль расы, пола, возраста и поведения в зависимости от того, обысканы ли вы или арестованы во время остановки полиции.

Он использует современные методы машинного обучения для набора данных из Open Policing Project, который включает более 4,5 миллионов остановок в Северной Каролине, которые содержат последовательные записи об обстоятельствах и результатах остановки полиции.

Для его использования достаточно заполнить единую форму на главной странице:

Вам будет предложено ответить на вопросы, которые описывают вашу личную информацию, причину остановки и на каком этапе процесса вы находитесь. Затем приложение будет использовать свою модель для прогнозирования вероятности результата, а также индивидуальный вклад в конечный результат. Это позволяет детально понять, что способствует результату в различных обстоятельствах.

Например, предположим, что вас остановили, а полиция еще не предприняла никаких действий. Каковы ваши шансы на обыск и почему?

Если вас остановили из-за чего-то безобидного, например превышения скорости, то «вкусовые характеристики», такие как возраст, раса или пол, существенно повлияют на исход. У 40-летней белой женщины, остановившейся из-за превышения скорости, анализ сценария будет выглядеть следующим образом:

Здесь вы можете легко увидеть, что принадлежность к белому, женскому полу и 40 вычитает 22% от базовой вероятности поиска или снижает вероятность поиска на 50%. Точно так же такие вещи, как остановка в середине дня и превышение скорости, уменьшают вероятность обысков. Только тот факт, что событие произошло в Шарлотте, увеличивает шансы на результат поиска.

Если вы изучите тот же сценарий, но замените черный на белый, вы получите следующие результаты:

Здесь мы видим, что вероятность поиска увеличивается с 11% до 17%, а влияние расы субъекта полностью меняется: от снижения вероятности на 5% до добавления 5% к ожидаемому результату. Однако быть женщиной более выгодно для чернокожего, чем для белого, о чем свидетельствует влияние пола подозреваемого в обоих сценариях.

Однако, если мы изменим причину, по которой кого-то остановили, с чего-то безобидного, например превышения скорости, на что-то, что более явно нарушает закон, например, вождение в нетрезвом виде, результаты значительно изменятся.

Вот как разворачивается сценарий 40-летней белой женщины, остановившейся за вождение в нетрезвом виде:

Здесь вы можете видеть, что вероятность того, что вас обыщут, практически гарантирована, а расовая принадлежность не играет особо важной роли. Исход во многом определяется поведением подозреваемого.

Изменение расы человека мало влияет на этот результат, поскольку вы можете видеть, что результаты для чернокожего человека с такими же характеристиками почти идентичны:

Если вас остановили за рулем в нетрезвом виде, чья-то белизна или чернота не так важны, как его пьянство.

Приложение позволяет вам просматривать результаты в трех разных сценариях и изучать два разных результата:
- Для результата вы можете изучить свои шансы быть обысканным или арестованным
- Для сценария вы можете выбрать три точки в процесс взаимодействия с полицией:
- - - Когда вас впервые останавливают (обыск не проводился)
- - - После того, как вас обыскала полиция
- - - Результаты Полицейский обыск завершен (т. е. нашли ли что-нибудь у вас?)

Рассмотрение того, как по-разному меняются результаты в процессе остановки, показывает важность различных частей ситуации с течением времени.
Например, представьте, что вы азиатский мужчина, и вас остановили, потому что полиция проверила ваши номера и обнаружила что-то подозрительное.

Когда полиция впервые задерживает вас, это ваша вероятность ареста:

Вы можете видеть, что остановка по этой причине в значительной степени способствует отрицательному исходу, без предоставления дополнительной информации.

Однако что, если, остановив вас, они не обнаружат дополнительных признаков подозрительного поведения и не проведут поиск? Ваши шансы на негативный исход существенно снижаются:

Однако предположим, что вас обыскивают из-за подозрительного поведения во время остановки. Тогда ваши результаты будут иметь следующую разбивку:

Как видите, то, что происходит во время поиска, оказывает огромное влияние на ожидаемые результаты!

Однако, если вас обыскивали и контрабанды не нашли, вы можете увидеть, что чьи-то шансы быть арестованными вернулись к тому, если бы их вообще не обыскивали:

Основная идея здесь заключается в том, что теперь люди могут изучать различные аспекты взаимодействия с полицией таким образом, чтобы это было очень доступно для людей любого происхождения, и получать конкретную информацию из источника, который является точным в количественном отношении. Инструмент, который понравится и разуму, и сердцу.

Хорошая наука воспроизводима

Правильно сделанная наука должна вестись таким образом, чтобы она была доступна для использования другими и легко воспроизводилась.

С этой целью Police Xray пытается сделать свою работу прозрачной тремя различными способами:
- Его результаты доступны через REST api, которые другие могут использовать для изучения результатов или повторного использования по своему усмотрению. Разработчик программного обеспечения может легко подключиться к службе, которая используется для работы приложения, если он хочет использовать ее в своих целях. Он не требует аутентификации и является бесплатным для использования.
- Моделирование, выполненное для создания результатов, может быть воспроизведено из репозитория проекта на github. Если вы можете использовать командную строку, вы можете повторно запустить анализ в одной строке и получить результаты модели, а также копию фактической модели, используемой в проекте.
- Если вы чувствуете амбициозность, вы можете даже внести свой вклад в анализ проекта, чтобы использовать его внутри приложения, отправив записную книжку IPython со своей работой.

Это должно дать разработчикам, исследователям и начинающим специалистам по данным возможность оценить работу любым способом, который они выберут, и улучшить ее, если захотят.

То, что лежит впереди

Если эти усилия окажутся полезными, есть много путей для расширения масштабов проекта. Эти дополнения включают:
- охват большего числа городов в США по мере появления данных;
- объяснение того, что важно в более глобальном смысле (например, является ли пол человека статистически значимым предиктором ареста, когда он остановились?)
- способы, позволяющие людям легко сравнивать разные сценарии друг с другом, чтобы легче было увидеть, как меняются результаты для деталей, которые их волнуют

Это поможет вам лучше понять проблемы, которые нас волнуют, с ориентацией на данные.