Вопросы по теме 'pandas-groupby'

Подсчитайте уникальные значения для каждой группы с помощью Pandas
Мне нужно подсчитывать уникальные ID значения в каждом domain . У меня есть данные: ID, domain 123, 'vk.com' 123, 'vk.com' 123, 'twitter.com' 456, 'vk.com' 456, 'facebook.com' 456, 'vk.com' 456, 'google.com' 789, 'twitter.com' 789, 'vk.com'...
729781 просмотров

Самый эффективный способ определить перекрывающиеся временные ряды в Python
Я пытаюсь определить, какой процент времени, когда два временных ряда перекрываются, используя библиотеку python pandas. Данные несинхронны, поэтому время для каждой точки данных не совпадает. Вот пример: Временной ряд 1 2016-10-05...
2590 просмотров

pandas подсчитывает последовательные события в мультииндексном фрейме данных
Я работаю над этим некоторое время и, похоже, не могу решить это. Я работаю с мультииндексированным фреймом данных с двумя уровнями, которые выглядят следующим образом: def data(): data = {'date': pd.Series(['2016-1-1', '2016-1-1',...
460 просмотров

Разделить кадры данных на основе префикса заголовка столбца
У меня есть кадр данных, в котором имена столбцов имеют общий элемент, другие столбцы были созданы с суффиксом для этого общего элемента. У меня есть список этих элементов, который составляет около 100 записей. Я хотел бы итеративно нарезать большой...
114 просмотров

Замените значения столбца в группе и условии
У меня есть кадр данных, в котором я хочу найти минимальное значение столбца в группе, а затем на основе этой строки обновить значения некоторых других столбцов. Следующий код делает то, что я хочу: import pandas as pd df = pd.DataFrame({'ID':...
2991 просмотров

pandas groupby, не может применить iloc к сгруппированным объектам
Извиняюсь, если на мой вопрос уже был дан ответ или ответ очевиден. Допустим, в моем наборе данных есть две задачи по 20 разных испытаний в каждой. Теперь я хотел бы выбрать только последние 6 секунд каждого испытания для дальнейшего анализа....
1015 просмотров
schedule 28.08.2022

Pandas groupby, агрегировать по строковой переменной и перемещаться вверх по пустым ячейкам
У меня есть фрейм данных со строковыми переменными с повторяющимися идентификаторами и множеством пустых ячеек. Я хочу сгруппировать по идентификатору и иметь все значения в одной строке. В случае, если столбец имеет несколько записей для одного...
520 просмотров

Как агрегировать значения выплат по месяцам из кадра данных pandas?
Как агрегировать значения по месяцам и датам из этого фрейма данных: payout_date payout_value 2017-01-14 1 2017-01-14 30 2017-01-16 216 2017-02-17 23 2017-02-17 2 2017-03-19 745 2017-03-19 32 2017-03-20 11 2017-03-20 222 2017-03-21 4...
1086 просмотров

pandas Dataframe Замените значения NaN на предыдущее значение на основе ключевого столбца
У меня есть pd.dataframe, который выглядит так: key_value a b c d e value_01 1 10 x NaN NaN value_01 NaN 12 NaN NaN NaN value_01 NaN 7 NaN NaN NaN value_02 7 4 y NaN NaN value_02 NaN 5...
887 просмотров
schedule 22.04.2024

Pandas groupby подсчитывает с условиями
Пример данных Учитывая следующий фрейм данных: | feature | gene | target | pos | | 1_1_1 | NRAS | AATTGG | 60 | | 1_1_1 | NRAS | TTGGCC | 6 | | 1_1_1 | NRAS | AATTGG | 20 | | 1_1_1 | KRAS | GGGGTT | 0 | | 1_1_1 |...
891 просмотров
schedule 17.01.2024

Pandas - агрегировать по несогласованным типам значений (строка или список)
Учитывая следующий DataFrame, я пытаюсь агрегировать столбцы 'A' и 'C' . для 'A' подсчитайте уникальные появления строк, а для 'C' суммируйте значения. Проблема возникает, когда некоторые образцы в 'A' на самом деле являются списками этих...
51 просмотров
schedule 24.01.2024

Сумма и итоги Pandas с использованием выбора loc или iloc на мультииндексе
Я пытаюсь обновить эту таблицу 1 (уровень I, уровень II и уровень III), используя pandas iloc или loc с набором данных, указанным ниже. Я открыт для лучшего способа, чем loc и iloc, если есть предложения. Таблица 1 Пример 1 Если...
1034 просмотров
schedule 21.08.2022

Подсчет общих значений за месяц при построении только годовых меток
У меня есть следующий DataFrame: H T date date 1990-08-26 11:30:00 38.0 11.6 1990-08-26 1990-08-26 11:30:00 63.0 11.3 1990-08-26 1990-08-26 11:30:00 87.0 10.9...
32 просмотров

Цвет гистограммы Pandas / Matplotlib по условию
Я пытаюсь сделать гистограмму оценок учащихся по задаче домашнего задания с помощью pandas / matplotlib. Я могу сделать гистограмму без проблем, но я бы хотел выбрать цвет по оценке ученика. Например, я надеюсь, что смогу набрать 50 и ‹= 75 за...
1260 просмотров
schedule 12.09.2022

Исходный код Pandas импортирует несколько модулей
Я просматривал исходный код панд здесь , и я нашел следующее утверждение немного странным: from pandas._libs import NaT, groupby as libgroupby, iNaT, lib, reduction Кажется, что он импортировал Nat и groupby, которые представляют собой две...
88 просмотров

Есть ли способ разгруппировать группу по данным
Я хотел бы разгруппировать фрейм данных после применения группы по условию. Я использовал pandas group by & sum для группировки. Ниже приведена группа по таблице +------------+--------------+----------------+-----------------+ | Month |...
1845 просмотров
schedule 27.10.2023

Питон. Медианное значение Pandas столбца groupby
У меня есть фрейм данных здесь: https://www.dropbox.com/s/ja6kn0f55599xul/test.csv Итак, я хочу рассчитать медианное значение df.bid , но в соответствии со значением df.candle , т.е. : медиана df.bid для строк, где df.candle равна 0,...
43 просмотров
schedule 15.08.2022

Объедините парные строки после группы pandas, дайте значение NaN, если идентификатор не встречается дважды в df
У меня есть один кадр данных, содержащий столбец идентификатора id , и я знаю, что идентификатор будет существовать либо точно в одной строке («несоответствие»), либо в двух строках («совпадение») в кадре данных. Чтобы выбрать несовпадающие...
589 просмотров
schedule 17.11.2022

Как получить минимум каждой группы на каждый день на основе часовых критериев
Я дал вам два кадра данных ниже для проверки. df = pd.DataFrame({ 'subject_id':[1,1,1,1,1,1,1,1,1,1,1], 'time_1' :['2173-04-03 12:35:00','2173-04-03 17:00:00','2173-04-03 20:00:00','2173-04-04 11:00:00','2173-04-04...
148 просмотров

Pandas groupот ewm
У меня есть помеченные данные о событиях (временных рядах), где события происходят через случайные промежутки времени для данной метки. Я хотел бы вычислить ewma внутри группы и добавить его в фреймворк данных в виде нового столбца «X1_EWMA». Вот...
3712 просмотров