Публикации по теме 'data-analytics'


Понимание тестов Колмогорова-Смирнова (KS) для дрейфа данных на профилированных данных
Дрейф данных соответствует профилированию данных TLDR: мы экспериментировали со статистическими тестами, в частности Колмогорова-Смирнова (К.С.), применяемыми к полным наборам данных, а также к профилям наборов данных, и сравнивали результаты. Результаты позволяют нам обсудить ограничения профилирования данных для обнаружения дрейфа KS, а также плюсы и минусы алгоритма KS для различных сценариев. Мы также предоставляем код для самостоятельного воспроизведения экспериментов...

Краткое руководство по SQL — Глава 9: Представления и индексы
В предыдущем уроке мы узнали об изменении структуры таблицы. В этом уроке мы рассмотрим две важные концепции SQL: представления и индексы. Представления позволяют упростить сложные запросы и обеспечивают логическое представление данных из одной или нескольких таблиц. С другой стороны, индексы повышают производительность запросов за счет оптимизации операций извлечения данных. Понимание того, как создавать и использовать представления и индексы, необходимо для эффективного управления..

Прогнозирование временных рядов с использованием машинного обучения
Временной ряд — это набор наблюдений, сделанных в определенный период времени. Прогнозирование временных рядов относится к использованию статистических моделей для прогнозирования будущих значений с использованием ранее записанных наблюдений. В целом его можно разделить на две части: Прогнозирование одномерных временных рядов . Включает одну переменную. Многомерное прогнозирование временных рядов: задействует несколько переменных. Построение модели статистического..

Дерево D3JS — Легкий способ — Часть 1
Давайте использовать D3JS простым способом, то есть просто как простую библиотеку JavaScript. Как это легко/просто? Использует D3.js как библиотеку JavaScript, не реагирует. Обычный старый блокнот и один HTML-файл, без веб-сервера. Что мы делаем? Мы создаем D3-дерево, используя иерархические данные и используя код для наблюдения. Шаг 1: HTML-скаффолдинг <!-- d3js-tree-v7.html --> <!DOCTYPE html> <meta charset="utf-8"> <body>..

Основы статистики
В наши дни все говорят о машинном обучении, искусственном интеллекте и науке о данных, где статистика очень недооценена, и люди меньше заинтересованы в ее изучении. Статистика является ключевым компонентом в мире науки о данных, который предоставляет необходимые инструменты и методы для извлечения идей и знаний из данных. Статистика — это раздел математики, который занимается сбором, анализом и интерпретацией данных. Он играет жизненно важную роль во многих областях, включая науку,..

Как визуализировать футбольные данные с помощью R
Учебники по созданию снимков, проходов и тепловых карт Введение Футбольная аналитика быстро развивалась в последние годы. С данными мы можем понять игру с другой точки зрения. В этой статье я покажу вам, как визуализировать футбольные данные с помощью R. В конце этой статьи вы сможете создавать такие визуализации: Без лишних слов, приступим! Выполнение Источник данных Мы будем использовать открытые данные от StatsBomb, у меня есть разрешение на..

Оптимизация производительности обучения XGBoost
Оптимизация производительности обучения XGBoost XGBoost продолжает работать быстрее Алгоритм градиентного повышения деревьев имеет множество реальных приложений в качестве универсального контролируемого метода обучения для задач регрессии, классификации и ранжирования страниц. Самая популярная реализация этого алгоритма XGBoost завоевала популярность на платформе соревнований по машинному обучению Kaggle , где получила признание за высокую точность и эффективность. Оптимизация..