Вопросы по теме 'pandas-groupby'
Подсчитайте уникальные значения для каждой группы с помощью Pandas
Мне нужно подсчитывать уникальные ID значения в каждом domain .
У меня есть данные:
ID, domain
123, 'vk.com'
123, 'vk.com'
123, 'twitter.com'
456, 'vk.com'
456, 'facebook.com'
456, 'vk.com'
456, 'google.com'
789, 'twitter.com'
789, 'vk.com'...
729781 просмотров
schedule
08.08.2022
Самый эффективный способ определить перекрывающиеся временные ряды в Python
Я пытаюсь определить, какой процент времени, когда два временных ряда перекрываются, используя библиотеку python pandas. Данные несинхронны, поэтому время для каждой точки данных не совпадает. Вот пример:
Временной ряд 1
2016-10-05...
2590 просмотров
schedule
14.12.2023
pandas подсчитывает последовательные события в мультииндексном фрейме данных
Я работаю над этим некоторое время и, похоже, не могу решить это. Я работаю с мультииндексированным фреймом данных с двумя уровнями, которые выглядят следующим образом:
def data():
data = {'date': pd.Series(['2016-1-1', '2016-1-1',...
460 просмотров
schedule
07.05.2024
Разделить кадры данных на основе префикса заголовка столбца
У меня есть кадр данных, в котором имена столбцов имеют общий элемент, другие столбцы были созданы с суффиксом для этого общего элемента. У меня есть список этих элементов, который составляет около 100 записей. Я хотел бы итеративно нарезать большой...
114 просмотров
schedule
03.01.2024
Замените значения столбца в группе и условии
У меня есть кадр данных, в котором я хочу найти минимальное значение столбца в группе, а затем на основе этой строки обновить значения некоторых других столбцов.
Следующий код делает то, что я хочу:
import pandas as pd
df = pd.DataFrame({'ID':...
2991 просмотров
schedule
24.11.2023
pandas groupby, не может применить iloc к сгруппированным объектам
Извиняюсь, если на мой вопрос уже был дан ответ или ответ очевиден.
Допустим, в моем наборе данных есть две задачи по 20 разных испытаний в каждой. Теперь я хотел бы выбрать только последние 6 секунд каждого испытания для дальнейшего анализа....
1015 просмотров
schedule
28.08.2022
Pandas groupby, агрегировать по строковой переменной и перемещаться вверх по пустым ячейкам
У меня есть фрейм данных со строковыми переменными с повторяющимися идентификаторами и множеством пустых ячеек.
Я хочу сгруппировать по идентификатору и иметь все значения в одной строке. В случае, если столбец имеет несколько записей для одного...
520 просмотров
schedule
24.10.2023
Как агрегировать значения выплат по месяцам из кадра данных pandas?
Как агрегировать значения по месяцам и датам из этого фрейма данных:
payout_date payout_value
2017-01-14 1
2017-01-14 30
2017-01-16 216
2017-02-17 23
2017-02-17 2
2017-03-19 745
2017-03-19 32
2017-03-20 11
2017-03-20 222
2017-03-21 4...
1086 просмотров
schedule
13.04.2024
pandas Dataframe Замените значения NaN на предыдущее значение на основе ключевого столбца
У меня есть pd.dataframe, который выглядит так:
key_value a b c d e
value_01 1 10 x NaN NaN
value_01 NaN 12 NaN NaN NaN
value_01 NaN 7 NaN NaN NaN
value_02 7 4 y NaN NaN
value_02 NaN 5...
887 просмотров
schedule
22.04.2024
Pandas groupby подсчитывает с условиями
Пример данных
Учитывая следующий фрейм данных:
| feature | gene | target | pos |
| 1_1_1 | NRAS | AATTGG | 60 |
| 1_1_1 | NRAS | TTGGCC | 6 |
| 1_1_1 | NRAS | AATTGG | 20 |
| 1_1_1 | KRAS | GGGGTT | 0 |
| 1_1_1 |...
891 просмотров
schedule
17.01.2024
Pandas - агрегировать по несогласованным типам значений (строка или список)
Учитывая следующий DataFrame, я пытаюсь агрегировать столбцы 'A' и 'C' . для 'A' подсчитайте уникальные появления строк, а для 'C' суммируйте значения.
Проблема возникает, когда некоторые образцы в 'A' на самом деле являются списками этих...
51 просмотров
schedule
24.01.2024
Сумма и итоги Pandas с использованием выбора loc или iloc на мультииндексе
Я пытаюсь обновить эту таблицу 1 (уровень I, уровень II и уровень III), используя pandas iloc или loc с набором данных, указанным ниже. Я открыт для лучшего способа, чем loc и iloc, если есть предложения.
Таблица 1
Пример 1
Если...
1034 просмотров
schedule
21.08.2022
Подсчет общих значений за месяц при построении только годовых меток
У меня есть следующий DataFrame:
H T date
date
1990-08-26 11:30:00 38.0 11.6 1990-08-26
1990-08-26 11:30:00 63.0 11.3 1990-08-26
1990-08-26 11:30:00 87.0 10.9...
32 просмотров
schedule
16.08.2022
Цвет гистограммы Pandas / Matplotlib по условию
Я пытаюсь сделать гистограмму оценок учащихся по задаче домашнего задания с помощью pandas / matplotlib. Я могу сделать гистограмму без проблем, но я бы хотел выбрать цвет по оценке ученика. Например, я надеюсь, что смогу набрать 50 и ‹= 75 за...
1260 просмотров
schedule
12.09.2022
Исходный код Pandas импортирует несколько модулей
Я просматривал исходный код панд здесь , и я нашел следующее утверждение немного странным:
from pandas._libs import NaT, groupby as libgroupby, iNaT, lib, reduction
Кажется, что он импортировал Nat и groupby, которые представляют собой две...
88 просмотров
schedule
09.05.2024
Есть ли способ разгруппировать группу по данным
Я хотел бы разгруппировать фрейм данных после применения группы по условию. Я использовал pandas group by & sum для группировки. Ниже приведена группа по таблице
+------------+--------------+----------------+-----------------+
| Month |...
1845 просмотров
schedule
27.10.2023
Питон. Медианное значение Pandas столбца groupby
У меня есть фрейм данных здесь: https://www.dropbox.com/s/ja6kn0f55599xul/test.csv
Итак, я хочу рассчитать медианное значение df.bid , но в соответствии со значением df.candle , т.е. :
медиана df.bid для строк, где df.candle равна 0,...
43 просмотров
schedule
15.08.2022
Объедините парные строки после группы pandas, дайте значение NaN, если идентификатор не встречается дважды в df
У меня есть один кадр данных, содержащий столбец идентификатора id , и я знаю, что идентификатор будет существовать либо точно в одной строке («несоответствие»), либо в двух строках («совпадение») в кадре данных.
Чтобы выбрать несовпадающие...
589 просмотров
schedule
17.11.2022
Как получить минимум каждой группы на каждый день на основе часовых критериев
Я дал вам два кадра данных ниже для проверки.
df = pd.DataFrame({
'subject_id':[1,1,1,1,1,1,1,1,1,1,1],
'time_1' :['2173-04-03 12:35:00','2173-04-03 17:00:00','2173-04-03
20:00:00','2173-04-04 11:00:00','2173-04-04...
148 просмотров
schedule
05.07.2022
Pandas groupот ewm
У меня есть помеченные данные о событиях (временных рядах), где события происходят через случайные промежутки времени для данной метки. Я хотел бы вычислить ewma внутри группы и добавить его в фреймворк данных в виде нового столбца «X1_EWMA». Вот...
3712 просмотров
schedule
28.06.2022