Публикации по теме 'data-science'


Недостаточная выборка набора данных с использованием R
Я работаю над набором данных классификации, который предвзят, что означает, что выходные данные или независимая переменная в наборе данных имеют неравномерное распределение классов. Что касается набора данных, он касается Диабета , и я скачал его с Kaggle. Он имеет 2000 экземпляров с восемью входными переменными и одной выходной или целевой переменной. Целевая переменная имеет два класса: 1 и 0. 1 означает, что у человека диабет, а 0 означает, что у человека нет диабета. Из 2000..

Как я устроился на работу аналитиком данных за 4 месяца
Руководство по прохождению собеседования на аналитика данных В разгар пандемии я получил свою первую работу аналитика данных. Мне, как новичку с небольшим опытом, это было определенно сложно. Но после четырех месяцев подачи заявок, собеседований и подготовки я получил множество предложений о работе. В этой статье я объясню, чего вы можете ожидать на этих собеседованиях и как лучше всего подготовиться к получению своей первой работы аналитиком данных. Техническая оценка (SQL, R,..

Классификация аудио – как идентифицировать гудения и свистки.
Проект машинного обучения по идентификации аудиоинтерпретации с помощью Librosa, Mfccs as a Feature. Целью Soul при запуске проекта такого типа было совместное усилие всех одноклассников и профессора по созданию базы данных с несколькими записями Hums and Whistles. Сбор данных Наши данные представлены в файлах .wav, созданных студентами по всему университету с различными аудиоинтерпретациями и песнями. Все, что нам нужно сделать, это перебрать эти файлы и добавить их метки и..

Краткое изложение XGBoost Math Intuition
Полное объяснение XGBoost - самой популярной модели повышения градиента XGBoost является производным от Gradient Boosting Model (GBM), по сравнению с GBM, XGBoost представляет другой способ обучения ансамбля более слабым, так что давайте начнем с этого. Предположим, у нас есть режим усиления деревьев K ниже Где fₖ - k -ое дерево в ансамбле, xᵢ - i -я точка данных Точно так же прогноз на t -м шаге можно определить как Цель обучения Ниже..

MIT 6.00.1x Обзор
Информатика MIT 6.00.1x Обзор Обзор «Введение в информатику и программирование с использованием Python» Я только что закончил аудит 6.00.1x Массачусетского технологического института (Введение в информатику и программирование с использованием Python) на EdX. Это первый MOOC, который я дошел до конца, не говоря уже о том, чтобы пройти! Обратите внимание, что этот курс полностью доступен: вы можете получить свои коды для всех наборов задач и экзаменов бесплатно; вам нужно..

Мой путь от коммерции к науке о данных
Путешествие студента-специалиста по коммерции в науку о данных: мой путь к науке о данных. Сегодня мы наблюдаем множество карьерных переходов в науку о данных, но некоторые студенты все еще обеспокоены тем, что если они начнут изучать науку о данных и в какой-то момент, у них начнутся трудности с пониманием концепций науки о данных. Большинство студентов, не занимающихся программированием, испытывают этот страх, они также продолжают спрашивать, может ли кто-то, не занимающийся..

Почему нейронные сети не будут работать, если веса инициализированы равными 0 и работают в линейной модели/регрессии?
Инициализация весов — одна из самых важных частей нейронных сетей . Наиболее широко используемый подход заключается в установке весов для некоторых небольших случайных чисел. Но в этой статье мы обсудим следующее: Почему это работает в линейной модели/регрессии , когда веса инициализированы равными 0? Почему это не работает в нейронных сетях , когда веса инициализированы равными 0? Q1-) Почему это работает в линейной модели/регрессии , когда веса инициализированы равными 0?..