Публикации по тегам data-science

Публикации по теме 'data-science'

Инструментарий аналитиков данных: модели

Вы очистили свои данные и провели предварительный анализ данных. Что теперь? Как аналитики данных, у нас есть много инструментов в нашем наборе инструментов, но точно так же, как отверткой можно забить гвоздь, это не лучший инструмент для работы. Наши инструменты - это модели или, если вы предпочитаете математический термин, алгоритмы. Они позволяют нам анализировать собранные данные и делать прогнозы. В зависимости от типа данных существует три основных типа моделей. Для..

Просеивание данных: понимание методов выбора признаков для повышения эффективности модели

Откройте для себя внутреннюю работу VIF, IFE, FFS, LASSO, MRMR и Boruta для оптимального выбора функций Выбор признаков — важный шаг в процессе построения прогностических моделей и анализа данных. Он включает в себя выбор наиболее релевантных и информативных функций из набора данных для повышения производительности модели, снижения вычислительной сложности и предотвращения переобучения. «Все должно быть сделано как можно проще, но не проще». - Альберт Эйнштейн В этом блоге мы..

Повышение градиента: что должен знать каждый специалист по данным

Повышение градиента — это метод машинного обучения, который используется как в программах классификации, так и в программах регрессии. Это один из самых мощных алгоритмов предиктивного обучения, хорошо известный своей точностью и скоростью. GBM отлично подходят для больших и сложных наборов данных и обладают универсальностью для обработки нулевых значений, высокой кардинальности в категориальных переменных и выбросов. Создание моделей повышения градиента очень просто с помощью XGBoost или..

MLflow: идеальное решение для управления и отслеживания экспериментов по машинному обучению

Узнайте, как MLflow упрощает и ускоряет отслеживание экспериментов, управление моделями и развертывание MLflow — это платформа с открытым исходным кодом для управления сквозным жизненным циклом машинного обучения. Он позволяет легко отслеживать, воспроизводить и развертывать модели машинного обучения. Вот некоторые ключевые особенности MLflow: Отслеживание: MLflow позволяет отслеживать производительность и показатели ваших моделей машинного обучения с течением времени, включая..

Сравнение глубокого обучения и машинного обучения с упором на углубленное изучение

Машинное обучение и глубокое обучение — две важные концепции в обширной области искусственного интеллекта. Несмотря на то, что они обычно используются взаимозаменяемо, это не одно и то же. Машинное обучение и глубокое обучение являются подмножествами искусственного интеллекта, но у них есть определенные характеристики, которые отличают их друг от друга. Машинное обучение фокусируется на создании алгоритмов, которые могут учиться на данных и делать прогнозы, а глубокое обучение — это..

16 моделей НЛП с открытым исходным кодом для анализа настроений; Один поднимается на вершину

Знакомство с 16 моделями и более глубокое знакомство с Flair Анализ настроений - это процесс количественной оценки и классификации мнений, выраженных в письменном тексте; на протяжении многих лет я также слышал, как это называют анализом мнений, искусственным интеллектом эмоций и текстовой аналитикой. Как правило, результаты анализа тональности можно использовать для обоснования бизнес-решений, например, какие продукты продвигать, как улучшить обслуживание клиентов или какой контент..

Как запустить воздушный поток

Мои личные заметки из книги «Конвейеры данных с Apache Airflow» Баса Харенслака и Джулиана де Руйтера — глава 2, часть 2 Введение Эта серия постов предназначена для того, чтобы обобщить мои выводы из книги Баса Харенслака и Джулиана де Руйтера. Если вы…