У меня есть довольно большой файл HDF5, в котором хранится (среди прочего) большой набор данных временных рядов с данными отслеживания глаз для 150 участников.
In [20]: f['data_collection/events/eyetracker/BinocularEyeSampleEvent/']
Out[21]: <HDF5 dataset "BinocularEyeSampleEvent": shape (8297323,), type "|V178">
Я не могу прочитать все это в память, потому что оно слишком большое, но как я могу прочитать его часть?
Я хотел бы сделать что-то вроде этого - прочитать одного участника за раз (имя столбца для участников - «имя»), выполнить некоторые операции и сохранить в меньший фрейм данных:
for name in f['data_collection/events/eyetracker/BinocularEyeSampleEvent/'][name]:
df = f['data_collection/events/eyetracker/BinocularEyeSampleEvent/']
...
...
Как я могу это сделать? Я использую h5py для чтения файла HDF5.
/Мартин