Публикации по теме 'data-visualization'
EDA была не такой простой до SWEETVIZ
EDA — это первый шаг для любого проекта по науке о данных, который требует больших усилий для понимания поведения данных.
В этом вам поможет библиотека «sweetviz». Вы можете выполнить EDA для сложных данных в две-три строки кода.
Пример:
!pip установить sweetviz
# Для этого урока я беру набор данных радужной оболочки от Seaborn.
импортировать Seaborn как sns df = sns.load_dataset(‘iris’)
#EDA
импортировать sweetviz как sv report = sv.analyze(df) report.show_html()..
Помимо R²
Разоблачение обманчивой стороны метрик данных
Являетесь ли вы новичком в мире статистического анализа (или науки о данных, анализа данных, машинного обучения и т. д.) или опытным ветераном; тогда шансы — одна из первых вещей, о которых вы узнали, — это линейный регрессионный анализ. Также весьма вероятно, что среда (без каламбура), в которой вы узнали о регрессии, реализовала метрику R² во время оценки модели. Хотя R² является популярной метрикой для оценки регрессионных моделей,..
Недостаточная выборка набора данных с использованием R
Я работаю над набором данных классификации, который предвзят, что означает, что выходные данные или независимая переменная в наборе данных имеют неравномерное распределение классов.
Что касается набора данных, он касается Диабета , и я скачал его с Kaggle. Он имеет 2000 экземпляров с восемью входными переменными и одной выходной или целевой переменной. Целевая переменная имеет два класса: 1 и 0. 1 означает, что у человека диабет, а 0 означает, что у человека нет диабета.
Из 2000..
Почему использование train_test_split от scikit-learn (часто) ошибочно
tl;dr
Хотя разделение ваших данных на обучающие и оценочные данные кажется простым, оно может быть источником многих ошибок, особенно бессмысленных оценок. Ключевые моменты, которые вы должны учитывать:
Убедитесь, что все варианты , важные для вашего варианта использования, представлены в вашей оценке. Убедитесь, что ваше разделение измеряет обобщение , необходимое для вашего варианта использования. Остерегайтесь дубликатов , которые могут сделать ваши результаты оценки лучше,..
Data in Motion: история создания MVP
Data in Motion — это автоматизированная служба публикации для социального взаимодействия, основанная на изменениях важных данных. Его основная цель — инициировать оповещения при изменении данных.
Алехандро Лопес: разработчик программного обеспечения, постоянно работающий над решением проблем с помощью творчества, критического мышления и самообучения. Всегда адаптируемся к новым технологиям благодаря страсти к развитию.
Роль Алехандро в проекте заключается в том, чтобы придумывать..
Как построить логарифмические оси с помощью Matplotlib в Python
Понимание того, когда и как визуализировать данные в логарифмическом масштабе
Введение
При визуализации данных важно следить за тем, чтобы точки данных отображались на рисунках или графиках таким образом, чтобы «история», которую мы пытаемся рассказать читателям, была достаточно ясной. Это означает, что в зависимости от характера данных нам нужно выбрать наиболее подходящие параметры. И одним из наиболее важных аспектов в этом контексте является масштабирование.
В сегодняшней..
Аккордовые диаграммы: как заставить ваши данные петь в Python 🎸
Аккордовые диаграммы – это тип визуализации данных, представляющий отношения между набором объектов. Сущности обычно представляются точками по окружности окружности, а отношения между ними представляются хордами, соединяющими точки.
Диаграммы аккордов можно использовать для представления широкого спектра отношений, таких как связи между различными отраслями, отношения между различными музыкальными жанрами или связи между различными темами в текстовом корпусе. Аккордовые..