Публикации по теме 'data-science'
Недостаточная выборка набора данных с использованием R
Я работаю над набором данных классификации, который предвзят, что означает, что выходные данные или независимая переменная в наборе данных имеют неравномерное распределение классов.
Что касается набора данных, он касается Диабета , и я скачал его с Kaggle. Он имеет 2000 экземпляров с восемью входными переменными и одной выходной или целевой переменной. Целевая переменная имеет два класса: 1 и 0. 1 означает, что у человека диабет, а 0 означает, что у человека нет диабета.
Из 2000..
Как я устроился на работу аналитиком данных за 4 месяца
Руководство по прохождению собеседования на аналитика данных
В разгар пандемии я получил свою первую работу аналитика данных. Мне, как новичку с небольшим опытом, это было определенно сложно. Но после четырех месяцев подачи заявок, собеседований и подготовки я получил множество предложений о работе. В этой статье я объясню, чего вы можете ожидать на этих собеседованиях и как лучше всего подготовиться к получению своей первой работы аналитиком данных.
Техническая оценка (SQL, R,..
Классификация аудио – как идентифицировать гудения и свистки.
Проект машинного обучения по идентификации аудиоинтерпретации с помощью Librosa, Mfccs as a Feature.
Целью Soul при запуске проекта такого типа было совместное усилие всех одноклассников и профессора по созданию базы данных с несколькими записями Hums and Whistles.
Сбор данных
Наши данные представлены в файлах .wav, созданных студентами по всему университету с различными аудиоинтерпретациями и песнями.
Все, что нам нужно сделать, это перебрать эти файлы и добавить их метки и..
Краткое изложение XGBoost Math Intuition
Полное объяснение XGBoost - самой популярной модели повышения градиента
XGBoost является производным от Gradient Boosting Model (GBM), по сравнению с GBM, XGBoost представляет другой способ обучения ансамбля более слабым, так что давайте начнем с этого.
Предположим, у нас есть режим усиления деревьев K ниже
Где fₖ - k -ое дерево в ансамбле, xᵢ - i -я точка данных
Точно так же прогноз на t -м шаге можно определить как
Цель обучения
Ниже..
MIT 6.00.1x Обзор
Информатика
MIT 6.00.1x Обзор
Обзор «Введение в информатику и программирование с использованием Python»
Я только что закончил аудит 6.00.1x Массачусетского технологического института (Введение в информатику и программирование с использованием Python) на EdX. Это первый MOOC, который я дошел до конца, не говоря уже о том, чтобы пройти! Обратите внимание, что этот курс полностью доступен: вы можете получить свои коды для всех наборов задач и экзаменов бесплатно; вам нужно..
Мой путь от коммерции к науке о данных
Путешествие студента-специалиста по коммерции в науку о данных: мой путь к науке о данных.
Сегодня мы наблюдаем множество карьерных переходов в науку о данных, но некоторые студенты все еще обеспокоены тем, что если они начнут изучать науку о данных и в какой-то момент, у них начнутся трудности с пониманием концепций науки о данных. Большинство студентов, не занимающихся программированием, испытывают этот страх, они также продолжают спрашивать, может ли кто-то, не занимающийся..
Почему нейронные сети не будут работать, если веса инициализированы равными 0 и работают в линейной модели/регрессии?
Инициализация весов — одна из самых важных частей нейронных сетей . Наиболее широко используемый подход заключается в установке весов для некоторых небольших случайных чисел. Но в этой статье мы обсудим следующее:
Почему это работает в линейной модели/регрессии , когда веса инициализированы равными 0? Почему это не работает в нейронных сетях , когда веса инициализированы равными 0?
Q1-) Почему это работает в линейной модели/регрессии , когда веса инициализированы равными 0?..