Публикации по теме 'data-science'
Статистический анализ курса акций
Простой статистический анализ курса акций Google
Фондовый рынок всегда считался вызовом для статистики. Кто-то думает, что знание статистики рынка позволяет нам обыграть его и зарабатывать деньги. На самом деле все может быть иначе.
В этой статье я покажу вам статистический анализ стоимости акций Google.
В 2008 году для получения степени бакалавра теоретической физики мне пришлось анализировать цены на акции, чтобы проверить правильность модели фондового рынка. В следующей части..
Методы выбора функций с примерами кода
Почему выбор функций?
Выбор функций - это процесс поиска и выбора наиболее полезных функций в наборе данных. Это важный этап в конвейере машинного обучения. Причина, по которой мы должны заботиться о методе выбора функций, связана с плохими последствиями наличия ненужных функций в нашей модели:
переоснащение, снижение производительности обобщения на тестовой выборке. снизить скорость тренировки уменьшить объяснимость модели
Основные типы инструментов выбора функций
В общем,..
Тенденции в области науки о данных на 2020 год
Важнейшие тенденции в области науки о данных в новом десятилетии
Наука о данных - это дисциплина, позволяющая сделать данные полезными.
Нет абсолютно никаких сомнений в том, что за это десятилетие появилось множество инноваций в области искусственного интеллекта . Помимо искусственного интеллекта, мы наблюдаем значительный рост данных, генерируемых из тысяч источников. Тот факт, что миллионы устройств ответственны за этот огромный всплеск данных, подводит нас к теме их..
Загадка использования систем на основе правил и систем машинного обучения
Сегодня многие с энтузиазмом относятся к внедрению новых технологий, таких как искусственный интеллект, машинное обучение и глубокое обучение. Но основано ли внедрение на реальных потребностях или использование самых современных технологий просто ради них?
Что происходит с такими технологиями, как системы, основанные на правилах, которые были в моде до того, как появились системы искусственного интеллекта, такие как машинное обучение? Должны ли все организации перейти на машинное..
Исследовательский анализ данных - визуализация, обобщение и интерпретация данных
Исследовательский анализ данных - визуализация, обобщение и интерпретация данных
Что такое EDA? ... Проще говоря, как следует из названия, это исследование и анализ данных.
Исследовательский анализ данных - это графический или, я бы сказал, художественный способ увеличить масштаб данных, которые имеют значение, превращая сложные данные в четкую информацию с помощью визуальных дисплеев. Когда мы получаем данные, очевидно, что мы иногда оказываемся перегруженными огромными наборами..
Учебное пособие. Проведение кластеризации с помощью Python на примере чемпионата мира по футболу 2018 года между Францией и Бельгией…
Цель этого руководства — объяснить построение простой кластеризации пасов, а также графические визуализации, которые позволяют добавить кирпичик понимания в тактическое исследование.
Что такое кластеризация и как ее адаптировать к футболу и пасу?
Кластеризация — это метод обучения без учителя, который заключается в группировании данных, близких в пространстве. Данные определяются кортежем, каждое значение которого относится к другой переменной.
Этот метод используется в области..
Применение машинного обучения в реальной жизни
Введение
Машинное обучение (ML) использует примеры данных или предыдущий опыт для программирования компьютера таким образом, чтобы оптимизировать производительность. По сути, это означает, что компьютеры должны учиться самостоятельно с помощью алгоритма машинного обучения. Это позволяет компьютеру распознавать шаблоны в примерах данных, строить модели для оптимизации своей производительности и прогнозировать результаты с помощью этих моделей. Три основных типа алгоритмов ML:..