Публикации по теме 'data-science'
Инструментарий аналитиков данных: модели
Вы очистили свои данные и провели предварительный анализ данных. Что теперь? Как аналитики данных, у нас есть много инструментов в нашем наборе инструментов, но точно так же, как отверткой можно забить гвоздь, это не лучший инструмент для работы. Наши инструменты - это модели или, если вы предпочитаете математический термин, алгоритмы. Они позволяют нам анализировать собранные данные и делать прогнозы.
В зависимости от типа данных существует три основных типа моделей. Для..
Просеивание данных: понимание методов выбора признаков для повышения эффективности модели
Откройте для себя внутреннюю работу VIF, IFE, FFS, LASSO, MRMR и Boruta для оптимального выбора функций
Выбор признаков — важный шаг в процессе построения прогностических моделей и анализа данных. Он включает в себя выбор наиболее релевантных и информативных функций из набора данных для повышения производительности модели, снижения вычислительной сложности и предотвращения переобучения.
«Все должно быть сделано как можно проще, но не проще».
- Альберт Эйнштейн
В этом блоге мы..
Повышение градиента: что должен знать каждый специалист по данным
Повышение градиента — это метод машинного обучения, который используется как в программах классификации, так и в программах регрессии. Это один из самых мощных алгоритмов предиктивного обучения, хорошо известный своей точностью и скоростью. GBM отлично подходят для больших и сложных наборов данных и обладают универсальностью для обработки нулевых значений, высокой кардинальности в категориальных переменных и выбросов. Создание моделей повышения градиента очень просто с помощью XGBoost или..
MLflow: идеальное решение для управления и отслеживания экспериментов по машинному обучению
Узнайте, как MLflow упрощает и ускоряет отслеживание экспериментов, управление моделями и развертывание
MLflow — это платформа с открытым исходным кодом для управления сквозным жизненным циклом машинного обучения. Он позволяет легко отслеживать, воспроизводить и развертывать модели машинного обучения. Вот некоторые ключевые особенности MLflow:
Отслеживание: MLflow позволяет отслеживать производительность и показатели ваших моделей машинного обучения с течением времени, включая..
Сравнение глубокого обучения и машинного обучения с упором на углубленное изучение
Машинное обучение и глубокое обучение — две важные концепции в обширной области искусственного интеллекта. Несмотря на то, что они обычно используются взаимозаменяемо, это не одно и то же. Машинное обучение и глубокое обучение являются подмножествами искусственного интеллекта, но у них есть определенные характеристики, которые отличают их друг от друга. Машинное обучение фокусируется на создании алгоритмов, которые могут учиться на данных и делать прогнозы, а глубокое обучение — это..
16 моделей НЛП с открытым исходным кодом для анализа настроений; Один поднимается на вершину
Знакомство с 16 моделями и более глубокое знакомство с Flair
Анализ настроений - это процесс количественной оценки и классификации мнений, выраженных в письменном тексте; на протяжении многих лет я также слышал, как это называют анализом мнений, искусственным интеллектом эмоций и текстовой аналитикой. Как правило, результаты анализа тональности можно использовать для обоснования бизнес-решений, например, какие продукты продвигать, как улучшить обслуживание клиентов или какой контент..
Как запустить воздушный поток
Мои личные заметки из книги «Конвейеры данных с Apache Airflow» Баса Харенслака и Джулиана де Руйтера — глава 2, часть 2
Введение
Эта серия постов предназначена для того, чтобы обобщить мои выводы из книги Баса Харенслака и Джулиана де Руйтера. Если вы…