Публикации по теме 'eda'


EDA была не такой простой до SWEETVIZ
EDA — это первый шаг для любого проекта по науке о данных, который требует больших усилий для понимания поведения данных. В этом вам поможет библиотека «sweetviz». Вы можете выполнить EDA для сложных данных в две-три строки кода. Пример: !pip установить sweetviz # Для этого урока я беру набор данных радужной оболочки от Seaborn. импортировать Seaborn как sns df = sns.load_dataset(‘iris’) #EDA импортировать sweetviz как sv report = sv.analyze(df) report.show_html()..

Автовиз и Автовизвиджет
Autoviz — это библиотека Python с открытым исходным кодом, которая в основном работает над визуализацией взаимосвязи данных, она может найти наиболее важные функции и построить творческую визуализацию всего в одной строке кода. Автовиз невероятно быстрый и очень полезный. Для использования autoviz сначала нам нужно импортировать класс autoviz и создать его экземпляр. #импорт класса Автовиз из autoviz.AutoViz_Class импортировать AutoViz_Class # Создание экземпляра класса AutoViz AV..

Обнаружение SMS-спама с использованием модели машинного обучения с развертыванием в рендере
Обнаружение спама в SMS за несколько секунд с помощью алгоритмов машинного обучения В этом блоге мы обсудим, как обнаруживать спам в SMS с помощью алгоритмов машинного обучения. Он помогает как пользователям, так и поставщикам услуг значительно сэкономить время и финансовые ресурсы. В среднем пользователь мобильного телефона в Индии получает от 4 до 5 SMS-сообщений со спамом на свой почтовый ящик каждый день. Эта статистика очень шокирует, хотя все мы ежедневно сталкиваемся с..

Исследовательский анализ данных в твитах о COVID-19
Во время этой пандемии платформы социальных сетей были наводнены тоннами сообщений, связанных с COVID-19. Сегодня в этой статье я представлю вам исследовательский анализ данных набора данных kaggle covid19-tweets. Для выполнения EDA я использовал набор данных kaggle — covid19_tweets.csv. Что такое EDA? EDA расшифровывается как исследовательский анализ данных. Исследовательский анализ данных относится к критическому процессу выполнения первоначальных исследований данных с целью..

Одномерный анализ в python КОРОТКО
Термин одномерный анализ относится к анализу одной переменной. Мы можем запомнить это, потому что приставка «уни» означает «один». Переменная может быть измерена с различными параметрами. В основном их можно разделить на три категории . Первый параметр — это Показатель центральной тенденции . Например, Среднее значение, медиана и мода . Второй параметр — это Показатель распространения данных . Например, Процентиль, Квартиль, IQR, Блочная диаграмма, Дисперсия и стандартное..

Рекрутинг в кампусе: есть ли у вас то, что для этого нужно?
Введение: Последний год обучения в колледже сильно отличается от предыдущих студенческих лет. Это год, когда наше внимание смещается с учебы на жизнь за пределами школы, когда мы начинаем принимать участие в мероприятиях по набору студентов в кампусе. Приоритеты смещаются с получения более высоких оценок на более высокую заработную плату. В связи с этим набор данных Campus Recruitment на Keggle меня очень заинтриговал. Набор данных содержал данные о размещении студентов MBA из..

Риск дефолта Home Credit (Часть 1): понимание бизнеса, очистка данных и EDA
«Своевременный возврат кредита облегчает получение второго займа». Примечание. Это комплексное исследование машинного обучения, состоящее из трех частей, для конкурса Kaggle Риск дефолта по домашнему кредиту . Для второй части этой серии, которая состоит из Разработка функций и моделирование-I , нажмите здесь . Для части 3 этой серии, которая состоит из Моделирование-II и развертывание модели , нажмите здесь . Мы все знаем, что кредиты были очень важной частью жизни..