Публикации по теме 'r'


Слова, которые вдохновят, проект по науке о данных TED Talks
«Слова, которые вдохновят» - это анализ более 2500 выступлений на TED с использованием текстовой аналитики и машинного обучения на R, чтобы найти факторы, которые делают одни выступления более популярными, чем другие. Что послужило мотивацией для выполнения этого проекта? Я участвую в группе встреч под названием «Спикеры Data Scientist» в Лондоне, которая регулярно встречается, чтобы попрактиковаться в беседах по науке о данных и получить отзывы для улучшения публичных выступлений...

Как использовать сценарии R с Quarkus | Кваркифицировать
Иногда вам нужно вызвать какой-нибудь R-скрипт из Quarkus. Один из вариантов — создать микросервис, но что, если это что-то очень маленькое, и вы просто хотите вызывать его в одном месте, не перегружая архитектуру проекта. Здесь на помощь приходит GraalVM. С GraalVm вы можете выполнять R-скрипты прямо из Java без каких-либо преобразований, микросервисов или конечных точек. Мы уже видели пример на Python , посмотрим, как это сделать на R. Для более удобного копирования и вставки,..

Приключения с R — Реклама в Facebook (Часть 1)
Приключения с R — реклама в Facebook (часть 1) Новогодняя резолюция 2018 года заключалась в попытке изучить новые технологии обработки данных. В течение последних нескольких недель предпринимались попытки освоить R. R — это язык программирования с открытым исходным кодом, поддерживаемый фондом R для статистических вычислений. Первоначально использовавшийся статистиками, теперь он нашел применение практически во всех областях машинного обучения. Одним из интересных приложений в..

Машины опорных векторов - думайте как векторы!
Машины опорных векторов - думайте как векторы! Машины опорных векторов хорошо работают в многомерном пространстве с четкими границами или разделением, поэтому они думают, как векторы. Машина опорных векторов (SVM) - это управляемый алгоритм нелинейного машинного обучения, который можно использовать как для задач классификации, так и для задач регрессии. SVM используется для создания нескольких разделяющих гиперплоскостей, так что он разделяет сегменты пространства данных, и каждый..

Несбалансированные наборы данных и что делать
Несбалансированные наборы данных распространены во множестве областей и секторов, и, конечно же, это включает в себя финансовые услуги. Специалисты по обработке данных сталкиваются с ними во многих контекстах - от мошенничества до безнадежных кредитов. Проблема возникает, когда алгоритмы машинного обучения пытаются идентифицировать эти редкие случаи в довольно больших наборах данных. Из-за несоответствия классов в переменных алгоритм имеет тенденцию относиться к классу с большим..

Введение в работу с R и Python
Эта статья предназначена для введения в работу с R в Python. Когда я был студентом университета, курсы статистики (анализ выживаемости, многомерный анализ и т. Д.) Преподавались в R. Тем не менее, поскольку я хотел изучать Data Science, я выбрал Python, потому что он казался мне «жутким». Работая только с Python, я сталкиваюсь с необходимостью реализации некоторых статистических методов, таких как тест Грабба для выбросов, Монте-Карло цепи Маркова для моделирования или байесовские..

Хотел бы я знать, прежде чем изучать R
Некоторые неприятные факты об этом надежном языке программирования. В этом разделе я помогу вам разрушить некоторые предубеждения и мифы о Р. 1-Это не похоже на любой другой язык программирования Изучение различных функций R делает его довольно трудным для изучения, потому что его возможности намного больше, чем у других языков программирования. Например, вам нужно запускать каждую строку кода, чтобы вся программа работала. 2-Это разные типы данных По сравнению с..