Публикации по теме 'cluster-analysis'


Подход машинного обучения к стратегическому исследованию рынка и сегментации
Кластеризация - это алгоритм машинного обучения без учителя, при котором цель неизвестна. Цель оценивается путем группировки неотличимых наблюдений в один кластер с выделением совершенно несопоставимых наблюдений. Кластеризация включает в себя разделение числа n наблюдений на кластеры p-типа. Например, в маркетинговом анализе аналитик имеет оценку нескольких других показателей для статистической сегментации групп клиентов, таких как возраст, доход, пол, географическое положение и т. Д...

Кластеризация — Что, почему и когда?
Кластеризация, или кластерный анализ, или сегментация данных определяется как группировка похожих объектов в классы, называемые кластерами. В основном это называется неконтролируемым подходом к обучению для классификации шаблонов в группы (кластеры) на основе сходства. Кластеризация — это алгоритм обучения без присмотра, т. е. алгоритм для данных, в котором мы не знаем о результате эксперимента, а даем только экспериментальные наблюдения. Это одна из наиболее важных областей исследований..

Профилирование моих любимых песен на Spotify через кластеризацию
Музыка играет неотъемлемую часть нашей жизни. Это общий язык, который помогает нам выразить себя, когда никакие слова не могут описать наши чувства. Музыка также помогает нам поднять настроение. Это влияет на нашу душу и наши эмоции, заставляя нас чувствовать себя счастливыми, грустными или полными энергии. Мы, вероятно, будем играть песни петь во время наших долгих поездок или слушать оптимистичную песню во время нашего занятия в тренажерном зале, или слушать расслабляющую ПЕСНИ при..

Вопросы по теме 'cluster-analysis'

Эффективный способ вычисления оценок сходства строк при большом размере выборки?
Предположим, у вас есть список из 10 000 адресов электронной почты, и вы хотите узнать, какие из ближайших «соседей» в этом списке определены как адреса электронной почты, которые подозрительно близки к другим адресам электронной почты в вашем списке....
4855 просмотров

Можно ли указать собственную функцию расстояния с помощью кластеризации K-средних в scikit-learn?
Можно ли указать собственную функцию расстояния с помощью кластеризации K-средних в scikit-learn?
92286 просмотров

Кластеризация объектов с взвешенными атрибутами
Я хочу сгруппировать набор объектов, которые имеют несколько атрибутов, и некоторые атрибуты более важны, чем другие. Есть ли простой способ придать этим конкретным атрибутам большой вес, чтобы придать им большее значение, чем другим?
983 просмотров

ввод должен быть пустым или строкой формата
Привет, я продолжаю получать ошибку с этим: %% generate sample data K = 3; numObservarations = 12000; dimensions = 20; data = fopen('M.dat','rt'); C = textscan(data,[numObservarations dimensions]); ??? Ошибка при использовании ==> textscan...
1198 просмотров
schedule 25.10.2023

Кластеризация списка с использованием граничной функции
Учитывая список, я хотел бы разделить его на кластеры, используя «граничную функцию». Такая функция будет принимать два последовательных элемента списка и решать, должны ли они принадлежать одному и тому же кластеру. По сути, я хочу что-то вроде...
166 просмотров
schedule 27.01.2024

Извлечение элементов из кластеров (листьев)
После того, как вы создадите кластеры, используя hclust , затем cutree , чтобы указать нижние кластеры; как вы можете получить членов, образующих разные кластеры? Предположим, вы создали простой иерархический кластер, какая команда может получить...
568 просмотров
schedule 11.10.2023

Неконтролируемая кластеризация с неизвестным количеством кластеров
У меня есть большой набор векторов в 3-х измерениях. Мне нужно сгруппировать их на основе евклидова расстояния, чтобы все векторы в любом конкретном кластере имели евклидово расстояние между собой меньше порогового значения «T». Я не знаю, сколько...
50760 просмотров

Найдите элемент HTML, который содержит наибольшее количество упоминаний данного слова
У меня есть документ HTML, и я хотел бы найти элемент HTML, который является ближайшей оболочкой для самого большого кластера упоминаний данного слова. Со следующим HTML: <body> <p> Hello <b>foo</b>, I like...
373 просмотров

java.lang.IllegalStateException: кластеры не найдены. Проверьте путь -c
Я использую следующую команду в командной строке для кластеризации данных с использованием алгоритма Mahout kmeans mahout kmeans -i /vect_out/tfidf-vectors/ -c /out_canopy -o /out_kmeans -dm...
478 просмотров

DBSCAN с потенциально неточными координатами широты/долготы
Я запускал реализацию DBSCAN sci-kit Learn для кластеризации набора фотографий с геотегами по широте/долготе. По большей части это работает довольно хорошо, но я столкнулся с несколькими случаями, которые озадачили. Например, было два набора...
718 просмотров

Определение членства в кластере в SOM (самоорганизующаяся карта) для данных временных рядов
Я также работаю над проектом, который требует кластеризации данных временных рядов. Я использую набор инструментов SOM, который работает в MATLAB для целей кластеризации, и столкнулся со следующей проблемой: «Как мы можем определить, какие данные...
1212 просмотров

ELKI - Используйте List‹String› объектов для заполнения базы данных
Извините за наивный вопрос, но я застрял, следуя всем доступным руководствам. Итак, есть ли способ заполнить базу данных из простого списка, а не загружать ее для чтения файла? В основном то, что я ищу, похоже на: Список объектов = ... БД...
157 просмотров
schedule 26.03.2024

Диаграмма рассеяния разделяет кластеры по цвету matplotlib python
Я работаю над алгоритмом кластеризации, и мне нужно, чтобы все точки на моем графике рассеяния, принадлежащие одному кластеру, были помечены одним цветом. У меня есть список, который указывает для каждой точки, к какому кластеру принадлежит эта...
9349 просмотров

Результаты Affinity Propagation не совпадают
Я пытаюсь реализовать алгоритм кластеризации Affinity Propagation на C++. В рамках тестирования я хочу сравнить свои результаты с хорошо зарекомендовавшими себя реализациями алгоритма в Matlab ( Ссылка ) и в R ( пакет apcluster ). К сожалению,...
1100 просмотров
schedule 10.07.2022

Кластеризация: как выделить наиболее отличительные черты?
У меня есть набор документов, которые я пытаюсь кластеризовать на основе их словарного запаса (то есть сначала делаю корпус, а затем разреженную матрицу с помощью команды DocumentTermMatrix и так далее). Чтобы улучшить кластеры и лучше понять,...
1304 просмотров
schedule 07.10.2023

кластеризация 3D-массива в R
Я пытаюсь сгруппировать 3D-данные, которые у меня есть в массиве. На самом деле это информация из трехмерного изображения, поэтому этот массив представляет собой одно изображение со значениями x, y, z. Я хотел бы знать, какой воксель имеет тенденцию...
3796 просмотров
schedule 17.05.2024

Попытка найти сетевые показатели с помощью R
Я создал направленную сеть в R. Мне нужно найти среднюю степень, которая, как мне кажется, у меня есть, диаметр и максимальную/минимальную кластеризацию. Диаметр — это наибольшее из кратчайших расстояний между двумя узлами. Если это имеет смысл для...
387 просмотров
schedule 30.12.2023

Как кластеризоваться с помощью K-средних, когда известно количество кластеров и их размеры
Я группирую некоторые данные, используя scikit. У меня самая простая задача: я знаю количество кластеров. И я знаю размер каждого кластера . Можно ли указать эту информацию и передать ее функции К-средних?
1714 просмотров

Как определить окончательные кластеры при использовании алгоритма сдвига средних?
Я немного читаю об алгоритме кластеризации со сдвигом по средним значениям ( http://en.wikipedia.org/wiki/Mean_shift ), и это то, что я получил до сих пор. Для каждой точки в вашем наборе данных: выберите все точки на определенном расстоянии от нее...
53 просмотров
schedule 23.08.2022

Межкластерные и внутрикластерные расстояния
Я нашел следующие формулы для межкластерных и внутрикластерных расстояний, и я не уверен, что понимаю, как они работают. Межкластерное расстояние Разве в приведенных выше формулах не должен быть квадратный корень? Межкластерные и...
15917 просмотров
schedule 13.04.2024