Публикации по теме 'r'


Между R и Python, какой язык я бы предложил начинающему эксперту по анализу данных?
В последние годы я наблюдал эволюцию использования обоих этих языков в мире аналитики данных. Вот мои мысли. До сих пор я всегда избегал участия в драке тех, кто заинтересован в битве R против Python. Но недавно мой коллега по компьютерным данным Брайан Джулиус спросил мое мнение о дебатах между Python и R в своем посте на LinkedIn: Брайан Джулиус в LinkedIn: #r #python #datascience #dataanalysis | 37 комментариев Я давно отказываюсь от военной службы..

Как перекодировать 40 000 упоминаний бренда без обучающих данных, используя матрицу расстояний Левенштейна в R.
Если вам когда-либо приходилось иметь дело с открытыми вопросами в онлайн-интервью, вы определенно сталкивались с проблемой их количественной оценки. Данные ответы респондентов часто полны опечаток и несоответствий, необходимых для правильной перекодировки, что еще хуже, у большинства брендов есть различные псевдонимы, которые вы должны учитывать в своем анализе. Я покажу вам, как правильно классифицировать 95%-99% полученных ответов, даже не используя модель машинного обучения или..

Шаблон IIFE в R
Все здесь избыточно, так как R имеет встроенную функцию оценки локальной области видимости, называемую local() . x <- local({ temp <- 5 temp + 5 }) local({ temp <- 5 x <<- temp + 5 }) Любого из приведенных выше способов достаточно, чтобы присвоить значение x, не оставляя временной переменной, загрязняющей окружающую среду. Выражение немедленно вызываемой функции (IIFE) — это популярный шаблон программирования в Javascript. Цель состоит в том, чтобы использовать..

Логистическая регрессия ясно объяснена
Что такое логистическая регрессия, как выглядит простой пример и когда вы будете ее использовать? Логистическая регрессия — это статистическая модель, которая используется для задач бинарной классификации, целью которых является предсказание бинарного результата (например, да/нет или 0/1). В логистической регрессии модель оценивает вероятность принадлежности примера к определенному классу. Прогнозируемый класс — это класс с…

Сюжеты силуэта и баннера с буквой R
Библиотека Cluster для агломеративной кластеризации и кластеризации k-mediods . И k-medoids , и агломеративная иерархическая кластеризация могут использоваться для группировки похожих точек данных в кластеры, но они используют разные подходы для достижения этой цели. K-medoids — это метод разделения, который требует от пользователя заранее указать количество кластеров, а агломеративная иерархическая кластеризация — это иерархический метод, который строит иерархию кластеров..

Основы науки о данных
Руководство для начинающих по фундаментальным принципам науки о данных. Эволюция данных Данные стали неотъемлемой частью нашей жизни. Он больше не ограничивается только цифрами и текстом, но также включает изображения и видео. Два десятилетия назад данные были небольшими и структурированными, представленными в килобайтах, а не даже в мегабайтах. Популярное в то время запоминающее устройство, гибкий диск, имело максимальную емкость всего 512 КБ. Данные были структурированы в..

Что можно делать с R? 6 основных пакетов R для программистов
Как программист может получить выгоду от использования R? Вот 6 основных пакетов. R - это язык программирования, созданный Россом Ихакой и Робертом Джентльманом в 1993 году. Он был разработан для аналитики, статистики и визуализации данных. В настоящее время R может обрабатывать все, от базового программирования до машинного обучения и глубокого обучения. R работает лучше всего, когда применяется ко всему, что связано с данными, например к статистике, науке о данных и машинному..