Публикации по теме 'data-science'


Проверка модели: ключ к точным прогнозам
Введение Добро пожаловать в наш блог «Проверка модели: ключ к точным прогнозам»! В этом посте мы обсудим важный этап проверки модели в процессе машинного обучения. Проверка модели — это процесс оценки производительности модели на отдельном наборе данных, известном как набор проверки, для оценки ее способности обобщать новые данные. Это важно, потому что помогает определить, насколько хорошо модель будет работать с невидимыми данными, и может предотвратить переоснащение, которое..

Обработка естественного языка (NLP)
Введение в НЛП Что такое НЛП? это обработка естественного языка 😌. Эй 😡 Я не просил вас о полной форме НЛП, дайте мне краткое введение в НЛП, что оно делает и как оно работает? Если вы хотите ответить, что такое НЛП, а не только в полной форме, то придерживайтесь этой статьи до конца, и в следующий раз, когда кто-нибудь спросит вас, что такое НЛП? вы сможете с легкостью ответить ему. Давайте разберем НЛП для лучшего понимания. Естественный язык (NL): Что такое естественный..

50 вопросов по SQL-запросам с примерами кода — часть 4
Это уже четвертая часть из 50 вопросов по SQL с примерами кода. Надеюсь, вы пробовали все предыдущие части. Если нет, сделайте это, оставив ссылку здесь ЧАСТЬ-I "ЧАСТЬ II" ЧАСТЬ-III В этой части мы увидим вопросы SQL и примеры кода для запросов на присоединение и подзапросы. Как и в предыдущей части, даже в этой части мы начнем с создания набора данных, чтобы упростить вам тестирование SQL. Давай начнем !! Набор данных для тестов . Рассмотрим следующие две..

Как развивается прогнозирование заболеваний, часть 4 (машинное обучение)
Количественный текстурный метод КТ для прогнозирования диагноза и прогноза фиброзирующих интерстициальных заболеваний легких (arXiv) Автор: Бабак Хагиги , Уоррен Б. Гефтер , Лорен Панталоне , Деспина Контос , Эдуардо Мортани Барбоза-младший Резюме: Цель: использовать возможности количественной КТ (ККТ) высокого разрешения для прогнозирования диагноза и прогноза при фиброзирующих интерстициальных заболеваниях легких (ИЗЛ). Подход: 40 пациентов с ИЗЛ (20 с обычной интерстициальной..

Экстремальная наука о данных
Статья посвящена экстремальной науке о данных , но позвольте мне начать с истории, в которой нет ни машинного обучения, ни науки о данных. Давным-давно у компании был масштабный проект, целью которого было заменить беспорядок из нескольких полезных приложений единой системой, достаточно мощной и эффективной, чтобы поддерживать всю обработку заработной платы для десятков тысяч сотрудников. Но три года спустя система не напечатала ни одного чека на зарплату, и с начала проекта не было..

Решение дилеммы данных: эффективная загрузка данных CSV в базу данных SQL
Вы, вероятно, читаете эту статью, потому что перед вами стоит задача, похожая на ту, что была у меня — вам нужно получить данные из электронной таблицы в базу данных SQL. Выберите свой яд, но Python — отличный инструмент для достижения этой цели. В этой статье будет сравниваться не один, а ЧЕТЫРЕ способа записи данных из электронной таблицы в таблицу SQL с помощью Python, чтобы определить наиболее эффективный метод. Подключиться к SQL Если вы еще не подключились к SQL в Python,..

Алгоритмы выбора признаков для машинного обучения
Правильный выбор Выбор функций — это необязательный, но важный этап предварительной обработки вашей модели машинного обучения. Распространенной практикой является предоставление данных модели машинного обучения по мере их получения. Это очень распространенная ошибка новичков, данные, которые вы получаете из любого источника, всегда будут содержать ошибки. Есть два важных шага, которые вы должны выполнить с этими данными, прежде чем переходить к обучению моделей. Очистка данных..