
Добро пожаловать в наш еженедельный блог с советами и рекомендациями FiftyOne, где мы резюмируем интересные вопросы и ответы, недавно появившиеся на Slack, GitHub, Stack Overflow и Reddit.
Подождите, а что такое FiftyOne?
FiftyOne — это набор инструментов машинного обучения с открытым исходным кодом, который позволяет группам специалистов по обработке и анализу данных повышать производительность своих моделей компьютерного зрения, помогая им выбирать высококачественные наборы данных, оценивать модели, находить ошибки, визуализировать встраивания и быстрее приступать к работе.

Хорошо, давайте погрузимся в советы и рекомендации этой недели!
Сортировка образцов в коллекции по полям или выражениям
Член сообщества Slack Сибил Люу спросила:
"Можно ли использовать SortBy с выражением в FiftyOne с помощью кнопки add stage в приложении FiftyOne?"
Сегодня лучший способ сортировки по выражению — через Python. Если вы запустите некоторые из примеров из Документов, вы увидите эквивалентный JSON, который вам нужно будет ввести на этапе SortBy на панели просмотра приложения, чтобы создать представление:
Подключение клиента FiftyOne к MongoDB
Член сообщества Slack Наман Гупта спросил:
«Можно ли подключиться к уже работающему локальному экземпляру FiftyOne из записной книжки Jupyter, не запуская другой сервер FiftyOne? Я хочу подключиться к локально запущенному экземпляру и загрузить, отфильтровать или экспортировать наборы данных на том же компьютере».
Вы можете запустить MongoDB в отдельном контейнере, а затем настроить свой клиент FiftyOne в контейнере Jupyter для подключения к нему. Кроме MongoDB, в пакете с открытым исходным кодом нет сервера FiftyOne. FiftyOne Teams, с другой стороны, предоставляет централизованную базу данных MongoDB и сервер приложений FiftyOne, что позволяет всем в вашей команде легко загружать одни и те же наборы данных в Python и в приложение.
Узнайте больше о работе с данными и блокнотами в FiftyOne Docs.
Отображение наземных меток истины в задаче о ограничивающей рамке
Член сообщества Slack Рагхав Мечери спросил:
"Я пытаюсь сопоставить набор меток истинности с более широким набором категорий для задачи с ограничивающей рамкой. Например, превратить ограничивающие прямоугольники с метками «ауди», «бмв», «мерседес» в «автомобиль». Я мог бы перебирать каждое изображение по мере его загрузки, но мне кажется, что в FiftyOne есть «правильный» способ сделать это — есть хорошие отправные точки?»
Вы можете использовать map_labels()для этого!
view = dataset.map_labels(...)
Это даст вам представление, которое динамически переименовывает метки, когда вы повторяете/визуализируете их в приложении. Если вы хотите сохранить изменения в фактическом наборе данных, просто добавьте:
view.save()
Объединение образцов и обновление ярлыков
Член сообщества Slack Джейсон Барби спросил:
«Я клонировал набор данных, изменил метки Ground_Truth для образцов, но запуск main_dataset.merge(working_dataset), похоже, не перезаписывает мои существующие метки. Есть ли API типа replace_sample?»
По умолчанию при использовании merge_samples() атрибут merge_lists имеет значение True, что означает, что для списков меток, таких как обнаружения, два списка будут объединены на основе идентификатора метки, а не рабочего набора данных, перезаписывающего все основные метки набора данных. Если вы установите merge_lists=False, то все существующие метки будут отброшены и останутся только метки из объединяемого набора данных.
Узнайте больше о merge_samples в FiftyOne Docs.
Использование наборов данных FiftyOne с загрузчиком данных Pytorch
Сидни Гуаро, член сообщества Slack, спросил:
«Можно ли использовать набор данных FiftyOne в загрузчике данных Pytorch?»
У нас есть некоторые интеграции с Pytorch Lightning Flash, а также Обучение Detectron2. Но вы также всегда можете интегрировать наборы данных FiftyOne прямо в загрузчики данных Pytorch (посмотрите этот блог). Вот пример из блога, который настраивает набор данных torch от FiftyOne:
Что дальше?
- Если вам нравится то, что вы видите на GitHub, поставьте проекту звезду
- "Начать!" Мы упростили запуск и запуск за несколько минут
- Присоединяйтесь к сообществу Slack FiftyOne, мы всегда рады помочь