Публикации по теме 'scikit-learn'


Максимизация точности для редких случаев: подход с нулевым завышением MSE к обучению моделей
Обучение модели, когда большинство прогнозов должны быть нулевыми. Недавно я столкнулся со случаем, когда мне нужно было предсказать количество ошибок в сценарии, где ошибки происходят только в ~ 1% случаев. Очевидная проблема заключается в том, что если модель идентифицирует 0 ошибок в 100% случаев, она будет точной на 99%. Это хорошо известная проблема с классификаторами, и она решается соответствующей настройкой кривой точности/отзыва — мы хотим убедиться, что хотим максимизировать..

Автоматический выбор модели с RapidMiner
Автоматический выбор модели с RapidMiner Перетаскиваемая альтернатива пакету Python scikit-learn. Среди прочего, scikit-learn используется для обучения алгоритмов выбору лучшей модели. RapidMiner также позволяет автоматический выбор модели. Моя первая встреча с RapidMiner Несколько лет назад у меня была короткая остановка в карьере в небольшом AI-стартапе. Эта работа вывела меня на новый уровень. Спустя почти четыре года я все еще продолжаю распространять информацию об..

Несбалансированные данные? Прекратите использовать ROC-AUC и вместо этого используйте AUPRC
Преимущества AUPRC при измерении производительности при наличии дисбаланса данных — понятное объяснение Приемщик O работает C характеристика — A причина в под >Показатель C urve (ROC-AUC) широко используется для оценки производительности бинарных классификаторов. Однако иногда более уместно оценивать классификатор на основе измерения A причины, U n P recision- R ecall C urve (AUPRC). Мы представим подробное сравнение этих двух показателей, сопровождаемое эмпирическими..

Почему недостаточно просто запускать модули, чтобы стать хорошим специалистом по данным
Итак, все мы знаем, что быть специалистом по данным - это просто загрузить последний и лучший модуль машинного обучения Python, запустить его, направить на наши данные, может быть, немного подстроить, а затем раздаются аплодисменты, верно? Легкий! Однако что происходит, когда вы загружаете один из этих модулей, и что-то работает не так, как вы ожидаете? Вы просто отказываетесь от этого и теряете всю функциональность, которую так ждали? Или вы упорствуете и пытаетесь решить это? Если..

Обычное руководство по обучению с учителем с помощью scikit-learn - Логистическая регрессия - Обобщенное…
Обычное руководство по обучению с учителем с помощью scikit-learn - Логистическая регрессия - Обобщенные линейные модели (12) Это двенадцатая часть из 92 частей традиционного руководства по контролируемому обучению с помощью scikit-learn, написанного с целью научиться реализовывать алгоритмы для продуктивного использования и быть в состоянии объяснить алгоритмическую логику, лежащую в основе этого. Ссылки на все разделы вы найдете в первой статье . Логистическая регрессия..

Решение проекта DataCamp «Подари жизнь: прогнозирование донорства крови» с конвейерами scikit-learn
Целью этого Проекта Data Camp является работа с данными, собранными из базы данных доноров Центра переливания крови в городе Синь-Чу на Тайване. Центр передает свой автобус службы переливания крови в один из университетов в городе Синь-Чу для сбора донорской крови примерно каждые три месяца. Набор данных, полученный из Репозитория машинного обучения UCI , состоит из случайной выборки 748 доноров. Ваша задача будет заключаться в том, чтобы предсказать, будет ли донор крови сдавать кровь..

гиперпараметры
Термин гиперпараметр относится к любому параметру в модели машинного обучения, значение которого не выводится напрямую из данных. Другими словами, гиперпараметр - это параметр, значение которого заранее явно указывается исследователем. Для большинства моделей машинного обучения требуется хотя бы одна переменная, которая устанавливается перед обучением. Это верно для деревьев решений, опорных векторных машин, нейронных сетей и алгоритмов регуляризации для обычных наименьших квадратов...