Обновите свой отчет по машинному обучению с помощью необычного классификационного графика.

Я люблю хорошую визуализацию данных. Еще в те дни, когда я защищал диссертацию по физике элементарных частиц, я был ошеломлен гистограммами, построенными моими коллегами, и тем, сколько информации было собрано на одном графике.

Информация на графиках

Действительно сложно улучшить существующие методы визуализации или перенести методы из других областей исследований. Вы должны подумать о размерах вашего участка и способах их добавления. Хорошим примером является путь от ящика для скрипки и роя. Это непрерывный процесс добавления размеров и, следовательно, информации.

Возможности добавления информации или размеров к сюжету практически безграничны. Категории могут быть добавлены с маркерами различной формы, цветовые карты, как на тепловой карте, могут служить еще одним измерением, а размер маркера может дать представление о дальнейших параметрах.

Графики работы классификатора

Когда дело доходит до машинного обучения, есть много способов построить график производительности классификатора. Существует огромное количество показателей для сравнения различных оценщиков, таких как точность, прецизионность, отзыв или полезная MMC.

Все общие показатели классификации рассчитываются на основе истинно положительных, истинно отрицательных, ложноположительных и ложно отрицательных инцидентов. Самыми популярными графиками, безусловно, являются ROC-кривая, PRC, CAP-кривая и матрица неточностей.

Я не буду вдаваться в подробности трех кривых, но есть много разных способов справиться с матрицей путаницы, например, добавить тепловую карту.

Классификационная мозаичная диаграмма

Во многих случаях этого, вероятно, достаточно и легко получить всю необходимую информацию, но для задачи с несколькими классами сделать это может быть намного сложнее.

Читая несколько статей, я наткнулся на:

Якоб Раймекерс, Питер Дж. Руссеу, Миа Хуберт. Визуализация результатов классификации. arXiv: 2007.14495 [stat.ML]

и оттуда в

Дружелюбный, Майкл. Мозаичные дисплеи для многосторонних таблиц непредвиденных обстоятельств. Журнал Американской статистической ассоциации, vol. 89, нет. 425, 1994, с. 190–200. JSTOR, www.jstor.org/stable/2291215. По состоянию на 13 августа 2020 г.

Авторы предлагают мозаичную диаграмму для отображения дискретных значений. Мы можем перенести эту идею в область машинного обучения с предсказанными классами в качестве дискретных значений.

В многоклассовой среде такой сюжет выглядел бы следующим образом:

У нее есть несколько преимуществ перед классической матрицей неточностей. Можно легко увидеть предсказанные классы по оси Y и числовую пропорцию каждого класса по оси X. Большим отличием от простого столбчатого графика является ширина столбцов, которые дают представление о дисбалансе классов.

Вы можете найти код для такого сюжета с матрицей путаницы здесь:

Удачи вам в построении ваших следующих результатов классификации!