EDA — это первый шаг для любого проекта по науке о данных, который требует больших усилий для понимания поведения данных.

В этом вам поможет библиотека «sweetviz». Вы можете выполнить EDA для сложных данных в две-три строки кода.

Пример:

!pip установить sweetviz

# Для этого урока я беру набор данных радужной оболочки от Seaborn.

импортировать Seaborn как sns
df = sns.load_dataset(‘iris’)

#EDA

импортировать sweetviz как sv
report = sv.analyze(df)
report.show_html()

#Это откроет html-файл в вашем браузере с полной статистикой. Если вы работаете в colab, этот файл будет сохранен в папке по умолчанию.

Отчет будет выглядеть так:

Это так просто. Наслаждайтесь счастливым обучением!