Публикации по теме 'scikit-learn'


Несбалансированные данные? Прекратите использовать ROC-AUC и вместо этого используйте AUPRC
Преимущества AUPRC при измерении производительности при наличии дисбаланса данных — понятное объяснение Приемщик O работает C характеристика — A причина в под >Показатель C urve (ROC-AUC) широко используется для оценки производительности бинарных классификаторов. Однако иногда более уместно оценивать классификатор на основе измерения A причины, U n P recision- R ecall C urve (AUPRC). Мы представим подробное сравнение этих двух показателей, сопровождаемое эмпирическими..

Почему недостаточно просто запускать модули, чтобы стать хорошим специалистом по данным
Итак, все мы знаем, что быть специалистом по данным - это просто загрузить последний и лучший модуль машинного обучения Python, запустить его, направить на наши данные, может быть, немного подстроить, а затем раздаются аплодисменты, верно? Легкий! Однако что происходит, когда вы загружаете один из этих модулей, и что-то работает не так, как вы ожидаете? Вы просто отказываетесь от этого и теряете всю функциональность, которую так ждали? Или вы упорствуете и пытаетесь решить это? Если..

Обычное руководство по обучению с учителем с помощью scikit-learn - Логистическая регрессия - Обобщенное…
Обычное руководство по обучению с учителем с помощью scikit-learn - Логистическая регрессия - Обобщенные линейные модели (12) Это двенадцатая часть из 92 частей традиционного руководства по контролируемому обучению с помощью scikit-learn, написанного с целью научиться реализовывать алгоритмы для продуктивного использования и быть в состоянии объяснить алгоритмическую логику, лежащую в основе этого. Ссылки на все разделы вы найдете в первой статье . Логистическая регрессия..

Решение проекта DataCamp «Подари жизнь: прогнозирование донорства крови» с конвейерами scikit-learn
Целью этого Проекта Data Camp является работа с данными, собранными из базы данных доноров Центра переливания крови в городе Синь-Чу на Тайване. Центр передает свой автобус службы переливания крови в один из университетов в городе Синь-Чу для сбора донорской крови примерно каждые три месяца. Набор данных, полученный из Репозитория машинного обучения UCI , состоит из случайной выборки 748 доноров. Ваша задача будет заключаться в том, чтобы предсказать, будет ли донор крови сдавать кровь..

гиперпараметры
Термин гиперпараметр относится к любому параметру в модели машинного обучения, значение которого не выводится напрямую из данных. Другими словами, гиперпараметр - это параметр, значение которого заранее явно указывается исследователем. Для большинства моделей машинного обучения требуется хотя бы одна переменная, которая устанавливается перед обучением. Это верно для деревьев решений, опорных векторных машин, нейронных сетей и алгоритмов регуляризации для обычных наименьших квадратов...

Шаг за шагом Scikit
Python завораживает. Имеет огромный список областей применения, как и в машинном обучении. Ответом на ML с использованием Python является его собственная библиотека ML под названием Scikit-learn. Он работает с другими библиотеками Python, такими как Numpy, Scipy, Matplotlib. Имеет лицензию BSD с открытым исходным кодом, со стабильным списком экспертов-разработчиков и доступностью или инструментами для большинства задач машинного обучения, так что это выбор. Но для кого-то начать с..

Прогнозирование усыновления и перевода кошек из приюта с помощью Scikit-learn и машинного обучения
В предыдущем анализе мы определили несколько вероятных признаков и переменных, которые могут быть важны для прогнозирования исхода кошки, когда она входит в приют. Используя эту информацию и научное обучение , мы можем обучить модель машинного обучения, чтобы предсказать, будет ли кошка усыновлена ​​​​или переведена в партнерское учреждение. Для этой первой задачи нас интересуют только результаты внедрения и передачи, чтобы увидеть, совпадают ли наши предположения, основанные на опыте..