Публикации по теме 'eda'
EDA была не такой простой до SWEETVIZ
EDA — это первый шаг для любого проекта по науке о данных, который требует больших усилий для понимания поведения данных.
В этом вам поможет библиотека «sweetviz». Вы можете выполнить EDA для сложных данных в две-три строки кода.
Пример:
!pip установить sweetviz
# Для этого урока я беру набор данных радужной оболочки от Seaborn.
импортировать Seaborn как sns df = sns.load_dataset(‘iris’)
#EDA
импортировать sweetviz как sv report = sv.analyze(df) report.show_html()..
Автовиз и Автовизвиджет
Autoviz — это библиотека Python с открытым исходным кодом, которая в основном работает над визуализацией взаимосвязи данных, она может найти наиболее важные функции и построить творческую визуализацию всего в одной строке кода.
Автовиз невероятно быстрый и очень полезный.
Для использования autoviz сначала нам нужно импортировать класс autoviz и создать его экземпляр.
#импорт класса Автовиз
из autoviz.AutoViz_Class импортировать AutoViz_Class
# Создание экземпляра класса AutoViz
AV..
Обнаружение SMS-спама с использованием модели машинного обучения с развертыванием в рендере
Обнаружение спама в SMS за несколько секунд с помощью алгоритмов машинного обучения
В этом блоге мы обсудим, как обнаруживать спам в SMS с помощью алгоритмов машинного обучения. Он помогает как пользователям, так и поставщикам услуг значительно сэкономить время и финансовые ресурсы.
В среднем пользователь мобильного телефона в Индии получает от 4 до 5 SMS-сообщений со спамом на свой почтовый ящик каждый день. Эта статистика очень шокирует, хотя все мы ежедневно сталкиваемся с..
Исследовательский анализ данных в твитах о COVID-19
Во время этой пандемии платформы социальных сетей были наводнены тоннами сообщений, связанных с COVID-19. Сегодня в этой статье я представлю вам исследовательский анализ данных набора данных kaggle covid19-tweets.
Для выполнения EDA я использовал набор данных kaggle — covid19_tweets.csv.
Что такое EDA?
EDA расшифровывается как исследовательский анализ данных. Исследовательский анализ данных относится к критическому процессу выполнения первоначальных исследований данных с целью..
Одномерный анализ в python КОРОТКО
Термин одномерный анализ относится к анализу одной переменной. Мы можем запомнить это, потому что приставка «уни» означает «один».
Переменная может быть измерена с различными параметрами. В основном их можно разделить на три категории .
Первый параметр — это Показатель центральной тенденции . Например, Среднее значение, медиана и мода .
Второй параметр — это Показатель распространения данных . Например, Процентиль, Квартиль, IQR, Блочная диаграмма, Дисперсия и стандартное..
Рекрутинг в кампусе: есть ли у вас то, что для этого нужно?
Введение:
Последний год обучения в колледже сильно отличается от предыдущих студенческих лет. Это год, когда наше внимание смещается с учебы на жизнь за пределами школы, когда мы начинаем принимать участие в мероприятиях по набору студентов в кампусе. Приоритеты смещаются с получения более высоких оценок на более высокую заработную плату. В связи с этим набор данных Campus Recruitment на Keggle меня очень заинтриговал. Набор данных содержал данные о размещении студентов MBA из..
Риск дефолта Home Credit (Часть 1): понимание бизнеса, очистка данных и EDA
«Своевременный возврат кредита облегчает получение второго займа».
Примечание. Это комплексное исследование машинного обучения, состоящее из трех частей, для конкурса Kaggle Риск дефолта по домашнему кредиту . Для второй части этой серии, которая состоит из Разработка функций и моделирование-I , нажмите здесь . Для части 3 этой серии, которая состоит из Моделирование-II и развертывание модели , нажмите здесь .
Мы все знаем, что кредиты были очень важной частью жизни..