EDA — это первый шаг для любого проекта по науке о данных, который требует больших усилий для понимания поведения данных.
В этом вам поможет библиотека «sweetviz». Вы можете выполнить EDA для сложных данных в две-три строки кода.
Пример:
!pip установить sweetviz
# Для этого урока я беру набор данных радужной оболочки от Seaborn.
импортировать Seaborn как sns
df = sns.load_dataset(‘iris’)
#EDA
импортировать sweetviz как sv
report = sv.analyze(df)
report.show_html()
#Это откроет html-файл в вашем браузере с полной статистикой. Если вы работаете в colab, этот файл будет сохранен в папке по умолчанию.
Отчет будет выглядеть так:

Это так просто. Наслаждайтесь счастливым обучением!