Публикации по теме 'data-science'


Статистический анализ курса акций
Простой статистический анализ курса акций Google Фондовый рынок всегда считался вызовом для статистики. Кто-то думает, что знание статистики рынка позволяет нам обыграть его и зарабатывать деньги. На самом деле все может быть иначе. В этой статье я покажу вам статистический анализ стоимости акций Google. В 2008 году для получения степени бакалавра теоретической физики мне пришлось анализировать цены на акции, чтобы проверить правильность модели фондового рынка. В следующей части..

Методы выбора функций с примерами кода
Почему выбор функций? Выбор функций - это процесс поиска и выбора наиболее полезных функций в наборе данных. Это важный этап в конвейере машинного обучения. Причина, по которой мы должны заботиться о методе выбора функций, связана с плохими последствиями наличия ненужных функций в нашей модели: переоснащение, снижение производительности обобщения на тестовой выборке. снизить скорость тренировки уменьшить объяснимость модели Основные типы инструментов выбора функций В общем,..

Тенденции в области науки о данных на 2020 год
Важнейшие тенденции в области науки о данных в новом десятилетии Наука о данных - это дисциплина, позволяющая сделать данные полезными. Нет абсолютно никаких сомнений в том, что за это десятилетие появилось множество инноваций в области искусственного интеллекта . Помимо искусственного интеллекта, мы наблюдаем значительный рост данных, генерируемых из тысяч источников. Тот факт, что миллионы устройств ответственны за этот огромный всплеск данных, подводит нас к теме их..

Загадка использования систем на основе правил и систем машинного обучения
Сегодня многие с энтузиазмом относятся к внедрению новых технологий, таких как искусственный интеллект, машинное обучение и глубокое обучение. Но основано ли внедрение на реальных потребностях или использование самых современных технологий просто ради них? Что происходит с такими технологиями, как системы, основанные на правилах, которые были в моде до того, как появились системы искусственного интеллекта, такие как машинное обучение? Должны ли все организации перейти на машинное..

Исследовательский анализ данных - визуализация, обобщение и интерпретация данных
Исследовательский анализ данных - визуализация, обобщение и интерпретация данных Что такое EDA? ... Проще говоря, как следует из названия, это исследование и анализ данных. Исследовательский анализ данных - это графический или, я бы сказал, художественный способ увеличить масштаб данных, которые имеют значение, превращая сложные данные в четкую информацию с помощью визуальных дисплеев. Когда мы получаем данные, очевидно, что мы иногда оказываемся перегруженными огромными наборами..

Учебное пособие. Проведение кластеризации с помощью Python на примере чемпионата мира по футболу 2018 года между Францией и Бельгией…
Цель этого руководства — объяснить построение простой кластеризации пасов, а также графические визуализации, которые позволяют добавить кирпичик понимания в тактическое исследование. Что такое кластеризация и как ее адаптировать к футболу и пасу? Кластеризация — это метод обучения без учителя, который заключается в группировании данных, близких в пространстве. Данные определяются кортежем, каждое значение которого относится к другой переменной. Этот метод используется в области..

Применение машинного обучения в реальной жизни
Введение Машинное обучение (ML) использует примеры данных или предыдущий опыт для программирования компьютера таким образом, чтобы оптимизировать производительность. По сути, это означает, что компьютеры должны учиться самостоятельно с помощью алгоритма машинного обучения. Это позволяет компьютеру распознавать шаблоны в примерах данных, строить модели для оптимизации своей производительности и прогнозировать результаты с помощью этих моделей. Три основных типа алгоритмов ML:..