Публикации по тегам dataset

Публикации по теме 'dataset'

Генерация синтетических данных с использованием генераторов наборов данных

Данные являются фундаментальным требованием для всех задач, связанных с машинным обучением, и часто недоступны в больших масштабах или в достаточном качестве. Кроме того, особенно при работе с данными изображения, может возникнуть проблема конфиденциальности. Синтетические данные могут устранить эти недостатки и позволяют генерировать гораздо больше данных, чем было бы в начале. Поэтому в последнее время появилось множество публикаций, предлагающих генераторы наборов данных для разных..

Аннотаторы данных: настоящие тренеры мыслящих машин

Видео изначально было опубликовано на канале The Medical Futurist на YouTube 10 июня 2019 г. Доктор Берталан Меско, также известный как Медицинский футурист, прав, и аннотаторы данных действительно являются лидерами, которые работают над тем, чтобы проложить путь к эффективным решениям ИИ. Почему? Потому что точность меток данных в конечном итоге влияет на функциональную точность модели ML. Потребность в услугах аннотирования данных значительно превышает глобальное предложение..

Исследовательский анализ данных и классификационная модель набора данных о преступности в Чикаго

Этот пост в блоге предназначен для изучения процесса очистки данных и демонстрации методов исследовательского анализа набора данных о преступлениях в Чикаго. Исходный набор данных содержит около 7 миллионов строк с 2001 по 2017 год ; однако для нашего анализа мы выбрали набор данных с 2012 по 2017 год , содержащий около 1,4 миллиона строк и 23 объекта . Очистка данных: Прежде чем мы начнем анализ набора данных, мы сначала предварительно обработаем или очистим наш набор..

Как создать набор данных машинного обучения с нуля?

Поваренная книга моей бабушки встречает машинное обучение, часть I Моя бабушка была прекрасным поваром. Поэтому, когда я недавно наткнулся на ее старую кулинарную книгу, я попытался прочитать некоторые рецепты, надеясь, что смогу воссоздать некоторые из блюд, которые мне нравились в детстве. Однако это оказалось труднее, чем ожидалось, поскольку книга была напечатана примерно в 1911 году шрифтом под названием f raktur . К сожалению, шрифт fraktur в некоторых случаях отличается от..

Как получить доступ к наборам данных напрямую из Kaggle

Предисловие Kaggle — одна из крупнейших платформ сообщества специалистов по данным , которая предоставляет доступ к различным наборам данных , соревнованиям , strong>ресурсы и мощные инструменты для изучения данных и машинного обучения. Kaggle позволяет нам использовать свои наборы данных , загружая их или используя свой API . В этой статье мы рассмотрим последнюю часть, где мы можем просто использовать ключ API , предоставленный нам Kaggle.com, который можно..

How2Sign: знаковая инициатива Facebook AI Research (FAIR)

Если вы внимательно следите за событиями в мире искусственного интеллекта, вы, скорее всего, слышали о новой захватывающей инициативе Facebook AI Research (FAIR) под названием How2Sign. Это инструмент, который использует машинное обучение для понимания и перевода языка жестов. Давайте углубимся в то, что представляет собой этот проект, и его потенциальное влияние на общество. Что такое How2Sign? How2Sign — это новаторский исследовательский проект, целью которого является преодоление..

Обнаружение доминирующих цветов в изображениях с помощью алгоритма K-mean

В сфере глубокого обучения крайне важно иметь всестороннее представление о наборе данных, включая его размер, статистические характеристики и технические сложности. Для устранения изменчивости цвета в наборе данных можно использовать несколько методов. Один из таких подходов включает использование сопоставления гистограмм, при котором одно изображение сопоставляется с другим в наборе данных. Этот метод доказал свою эффективность в гармонизации распределения цветов на изображениях. Еще..