Удар в темноте

Какой к черту "укол"?

Задний план

Все началось с невинной беседы в Твиттере о «самом раненом человеке в истории», что, как оказалось, не очень интересная тема для исследования, потому что большинство ножевых ранений на самом деле довольно печальны. Но! В ходе разговора мы отвлеклись, потому что что в данном контексте считается поножовщиной? Кто-то, в кого прострелили стрелы, борется за «лучшую в мире жертву ножевого ранения»? Или они соревнуются в своей категории? Если я споткнусь и упаду в мусорное ведро на ножевой фабрике, получу ли я приз или просто смертельные раны? Трудно провести грань между подлинным ударом ножа, который нельзя заменить, и дешевым ударом или проколом по сниженной цене.

Похоже, никто не согласился с их определениями, поэтому я решил применить более описательный подход к проблеме. В этом я опираюсь на область лингвистики (о которой я почти ничего не знаю), и, в частности, на практику в этой области описания языка, а не прописания это. Другими словами, я не пытаюсь найти «истинное» значение слова «удар ножом» и не собираюсь набирать очки, доказывая, что мое определение лучше. Что я хочу сделать, так это понять «форму» определения слова, как оно используется. Я хочу выяснить, где находятся грани — какие варианты использования однозначно правильны, а какие обычно считаются ошибками. Где люди чувствуют себя неловко, используя слово «удар» для описания чего-либо? Каковы границы этого?

Вот я и сделала опрос! Я придумал 12 предложений, которые, как я надеялся, будут смесью примеров как бесспорных, так и очень необычных вариантов употребления слова «удар». Я попросил респондентов ответить по каждому предложению, было ли это предложение «Совершенно хорошо», «Немного странно, но нормально» или «Неправильное употребление». Вот 12 вопросов:

«Он взял нож и ударил меня».
«Я споткнулся и упал, и нож на полу вонзился в меня».
«В полу была воткнута стрела, и я получил ранение, когда упал в нее».
«Нож упал со стойки и вонзился мне в ногу».
«Меня ранили ножом, который лежал на полу».
«Меня ранила падающая стрела».
«Он бросил нож, который пролетел через всю комнату и ударил меня».
«Он поднял с земли стрелу и пронзил ею меня».
«Лучники на верхушках деревьев пронзили меня стрелами из своих луков».
«Он ударил меня ножом, бросив в меня нож».
«Меня случайно ранили ножом, когда мы дрались».
«Солдаты метнули в меня свои копья, нанеся несколько ударов ножом».

Было несколько вещей, которые я узнал, просто написав предложения. Я пытался написать предложения, которые включали бы примеры ножевых ранений «на расстоянии», но для этого я обнаружил, что мне нужно очень четко указать, что происходит. «Лучники пронзили меня своими стрелами» для меня означает, что лучники стоят прямо передо мной, держа свои стрелы в руках. Чтобы было понятно, что это был дальнобойный удар, пришлось добавить уточнения «в верхушках деревьев» и «из их луков». Мне было трудно писать предложения, которые, на мой взгляд, были явными примерами неправильного употребления, но при этом оставались четкими и грамматически правильными.

Я также попытался разделить предложения по нескольким осям, что, как я надеялся, даст представление о пределах определения слова. Это были:

Расстояние: держит ли нападающий свой кинжал или он выпал из его руки?
Орудие: это классическое колющее оружие, например нож, или более необычный вариант, например стрела?
Воля: Есть ли у поножовщины активное действующее вещество или она совершена только жестокой судьбой?

В идеале, я полагаю, у меня было бы, может быть, вдвое больше предложений, чтобы обеспечить исчерпывающие комбинации этих элементов, а также включить другие виды колющих орудий. Я решил сделать опрос кратким, предполагая, что терпение других, пытающихся копаться в тонкостях употребления английского языка, может не сравниться с моим собственным.

Результаты

В опросе приняли участие 53 респондента, из которых все, кроме одного, ответили на все вопросы. На приведенных ниже диаграммах показаны общие результаты для каждого из предложений:

Рис. 1. Общие результаты

Есть некоторые результаты, которых я ожидал: почти единодушная поддержка фразы «Он взял нож и ударил меня» (кроме первого, я полагаю, постоянно сбит с толку, воздерживаюсь), и некоторые результаты были более удивительными: широкое осуждение за удары падающими стрелами, такое же поведение от ножа в значительной степени приемлемо.

Чтобы понять эти удивительные результаты, я посмотрел, как ответы распределяются по осям, которые я заложил в предложения: расстояние, реализация и воля.

Регрессия

Я хотел выделить каждый из трех факторов, которые я заложил в предложения, чтобы понять, как каждый из них влияет на общую приемлемость предложения.

Я сделал набор данных, который представлял собой общую «оценку приемлемости» каждого предложения. Это было рассчитано из среднего показателя «полностью ок» за вычетом среднего количества «неправильных использований» для каждого предложения. Это означает, что каждое предложение получило оценку от 1 (всеобщее признание) до -1 (абсолютная ненависть).

При этом упускается много нюансов, поскольку ответ «Немного странно, но нормально» — это не совсем то же самое, что «нет мнения», но он позволяет нам значительно упростить наш анализ. Для каждого предложения я также добавил флаг для каждого предложения, указывающий, является ли оно:

Имел активного «ножовщика», который совершал ножевое ранение
Описан дальнобойный удар
Описан удар ножом (классическое колющее оружие)

Этот набор данных позволил мне использовать метод под названием «линейная регрессия», который вычислял «коэффициент» для каждой входной функции (три флага), указывающий, насколько этот фактор влияет на общую оценку каждого предложения.

Полученные коэффициенты были следующими:

Активный удар: 0,42 (Активный удар в предложении увеличивает оценку на 0,42)
Колющие удары с дальней дистанции: -0,76 (снижает счет на 0,76)
Нож: 0,10 (увеличивает оценку на 0,10)

Таким образом, это говорит нам о том, что из трех проанализированных факторов «диапазон» представляется наиболее важным с большим отрицательным эффектом. Присутствие активного участника в нанесении ножевых ранений, казалось, помогло на счет, в то время как наличие или отсутствие ножа само по себе мало повлияло.

Я хотел проверить, насколько хорошо эти коэффициенты объясняют ответы, которые я видел в данных. Коэффициенты можно использовать для создания прогнозируемой оценки для предложения (даже для ранее невиданных предложений), и мы можем посмотреть на разницу между этими прогнозами и фактическими оценками, чтобы проверить, насколько хорошо работает наша модель.

Рис. 2. Регрессионный анализ: точность соответствия

На диаграмме показано, насколько хорошо наша модель линейной регрессии соответствует нашим данным. На оси X указана фактическая оценка, которую мы видели в данных, а на оси Y — оценка, предсказанная нашей моделью. Цифра «r2» является мерой того, насколько хорошо прогнозы соответствуют наблюдаемым данным. В данном случае это говорит нам о том, что наша модель объясняет только около 60% наблюдаемой дисперсии оценок.

Респонденты

Одна из вещей, которую я хотел понять, заключалась в том, существуют ли различия в совокупности респондентов по их общей склонности включать или исключать обычаи. Есть ли сторонники жесткой линии и грязные либералы? Или у всех нас одинаковый уровень общего комфорта, но разные границы?

Я создал гистограмму, которая оценивает использование по чистой сумме их ответов: каждый «полностью хорошо» добавляет один балл к их баллу, а каждый «неправильное использование» вычитает один.

Рис. 3. Респонденты по количеству ответов

Там приличный разброс! Мы видим нормальное распределение со средним значением чуть более 2 с небольшим перекосом вниз. У нас есть небольшое количество ножевых фундаменталистов, в то время как население в целом содержит довольно широкое распределение — от одного щедрого респондента, который ответил «полностью хорошо» на девять из двенадцати вопросов, до ненавидящего нож, который считает, что восемь из двенадцати вопросов были «неправильное использование».

Я хотел пойти глубже. Поэтому я попробовал метод кластеризации, чтобы сгруппировать респондентов в соответствии с тем, как они отвечали на разные вопросы. Алгоритм — «кластеризация k-средних» — берет заданное количество кластеров и разбивает набор данных на такое количество кластеров, пытаясь найти разделение, которое наиболее эффективно различает группы.

Я позволил алгоритму разделить респондентов на 4 группы, а затем посмотрел характеристики каждой из групп.

Группа 1: Держи меня ближе (22 респондента — 41%)

Этой группе было заметно комфортнее, чем большинству, ситуации, в которых у колющего удара не было активного агента: «В полу вонзилась стрела, и я получил ножевое ранение, когда упал в нее». , «Меня ранило лежащим на полу ножом», «Меня ранило падающей стрелой», и заметно менее комфортно, когда ножевые ранения наносили действующие агенты, когда этот агент находился на расстоянии: «Солдаты бросали в меня свои копья, нанося несколько ударов ножом», «Он нанес мне удар, бросив в меня нож».

2 группа: Как хочешь (14 респондентов — 26%)

Эта группа была уникальна тем, что решительно поддерживала «Он ударил меня ножом, бросив в меня нож». и «Солдаты метнули в меня свои копья, нанеся несколько ударов ножом», но они были более благосклонны, чем в среднем, почти по всем вопросам, что свидетельствует об очень либеральном подходе к нанесению ударов ножом.

3 группа: Сделай это со мной (10 респондентов — 19%)

Во многом диаметрально противоположная Группе 1, эта группа имела чрезвычайно сильную поддержку: «Лучники на верхушках деревьев пронзили меня стрелами из своих луков». и «Солдаты метнули в меня свои копья, несколько раз ударив меня ножом», в то же время больше выступая против случаев, когда не было активного агента: «В полу была застряла стрела, и я получил ножевое ранение, когда упал в нее». .

Группа 4: Playa Hater (7 респондентов — 13%)

Эта группа отличалась от группы 2: они были более оппозиционны, чем в среднем, почти по каждому вопросу, особенно «Я получил удар ножом, который лежал на полу», «Солдаты метали в меня свои копья, нанося мне удары. несколько раз." и «Он ударил меня ножом, бросив в меня нож».

Кластерный анализ дает некоторую поддержку идее о том, что и диапазон, и активность агента являются важными факторами в том, как мы определяем удар. Но были и нестыковки. Группе 3 нравилось колоть на расстоянии, но им не нравилось каждое предложение с такой формулировкой. Группа 1 была в основном против колющих ударов на дальние дистанции, но с некоторыми из них они были относительно согласны. Казалось, что происходит больше, чем я видел.

Кластеризация предложений

Я хотел глубже понять, как мнения респондентов коррелируют друг с другом — есть ли вопросы, на которые респонденты обычно отвечали одинаково? Я надеялся, что это поможет мне лучше понять некоторые запутанные вещи, которые я видел в данных.

Для этого я использовал аналогичный подход к кластеризации, который я использовал для групп респондентов, но с немного другим представлением данных. Я посмотрел на коэффициент корреляции каждого предложения с каждым другим предложением — другими словами, для каждого предложения в опросе, насколько ответы на это предложение коррелируют с ответами на каждое другое предложение. Получилась матрица корреляций 12x12, которая легла в основу моей кластеризации — предложения, на которые респонденты обычно отвечали одинаково, группировались вместе.

Чтобы визуализировать это, я использовал метод под названием «Анализ основных компонентов», который сводит матрицу 12x12 к графику 12x2 — для каждого предложения вместо двенадцати различных точек данных, по одной для каждого другого предложения, есть только две точки данных, которые мы можно строить в двухмерном пространстве.

Рис. 4. Группировка предложений по соотношению ответов

Имейте в виду, что при уменьшении до двух измерений диаграмма рассеивания потеряла часть информации, которая была доступна для алгоритма кластеризации. Тем не менее, мы видим, что достигли некоторых разумных результатов: группа 1, выделенная зеленым цветом, содержит в основном неоднозначные предложения актеров. Группа 2, крайняя справа, — это два предложения «Дай мне», на которые почти все ответили одинаково. Группа 3, выделенная желтым цветом и расположенная в левом верхнем углу, представляет собой большую часть «диапазонных» предложений, а группа 4 немного относится к группе «все остальные».

Самое интересное для меня из этого — трактовка «Он метнул нож, который пролетел через всю комнату и ударил меня». Он находится почти посередине между Группой 1 и Группой 3, что, если подумать, имеет смысл.

Сначала я был удивлен, увидев его там, болтающимся с толпой группы 1, когда можно было бы ожидать, что он будет болтаться со своими приятелями из группы 3. Но если вы посмотрите, что-то еще происходит с предложение: Как и все другие предложения в группе 1, это предложение переносит ответственность за нанесение удара ножом с активного наносящего удар на орудие нанесения удара. Это заметно отличается от «Он нанес мне удар, бросив в меня нож», и когда мы смотрим на общие баллы, респонденты гораздо чаще одобряют эту конструкцию (35% «полностью согласен» против 21%). Даже группа респондентов, которым больше всего не нравились дальнобойные колющие удары, относилась к этому предложению относительно спокойно.

Это вводит фактор, который я не рассматривал ранее, и я думаю, что это ключевое понимание этого анализа: одним из ключевых факторов в определении того, как респонденты относились к каждому предложению, была их готовность принять неодушевленный предмет как автора ножевых ранений. Люди, которые считали нож архитектором нанесения удара, а не его владельцем, были гораздо более довольны тем, что этот нож наносит удар даже при броске, даже при падении. Кажется, что здесь важна структура предложения, а не вымышленные обстоятельства — даже когда присутствует подразумеваемое действующее лицо, люди реагируют на то, как в предложении возлагается ответственность.

Выводы

Если честно, я немного больше запутался, чем раньше.

Регрессионный анализ показывает, что диапазон является явно негативным фактором для большинства респондентов, но была группа, для которой это было меньшей проблемой. Точно так же наличие активного нападающего было положительным фактором, но некоторых респондентов, похоже, это тоже не заботило. Казалось, что реальное орудие, наносящее удары, слабо влияло на ответы.

Что мы узнали из корреляций между ответами, так это то, что существуют более сложные отношения, чем три оси, которые я первоначально предполагал. Построение предложений имеет значение, а точный анализ намерений и действий может оказать большое влияние на ответы некоторых групп.

Я уверен, что там есть что найти, и это очень богатый набор данных. Вы можете найти весь мой код и данные в моем github, и я приветствую переписку!