Публикации по теме 'dataset'
Генерация синтетических данных с использованием генераторов наборов данных
Данные являются фундаментальным требованием для всех задач, связанных с машинным обучением, и часто недоступны в больших масштабах или в достаточном качестве. Кроме того, особенно при работе с данными изображения, может возникнуть проблема конфиденциальности.
Синтетические данные могут устранить эти недостатки и позволяют генерировать гораздо больше данных, чем было бы в начале. Поэтому в последнее время появилось множество публикаций, предлагающих генераторы наборов данных для разных..
Аннотаторы данных: настоящие тренеры мыслящих машин
Видео изначально было опубликовано на канале The Medical Futurist на YouTube 10 июня 2019 г.
Доктор Берталан Меско, также известный как Медицинский футурист, прав, и аннотаторы данных действительно являются лидерами, которые работают над тем, чтобы проложить путь к эффективным решениям ИИ. Почему? Потому что точность меток данных в конечном итоге влияет на функциональную точность модели ML. Потребность в услугах аннотирования данных значительно превышает глобальное предложение..
Исследовательский анализ данных и классификационная модель набора данных о преступности в Чикаго
Этот пост в блоге предназначен для изучения процесса очистки данных и демонстрации методов исследовательского анализа набора данных о преступлениях в Чикаго.
Исходный набор данных содержит около 7 миллионов строк с 2001 по 2017 год ; однако для нашего анализа мы выбрали набор данных с 2012 по 2017 год , содержащий около 1,4 миллиона строк и 23 объекта .
Очистка данных:
Прежде чем мы начнем анализ набора данных, мы сначала предварительно обработаем или очистим наш набор..
Как создать набор данных машинного обучения с нуля?
Поваренная книга моей бабушки встречает машинное обучение, часть I
Моя бабушка была прекрасным поваром. Поэтому, когда я недавно наткнулся на ее старую кулинарную книгу, я попытался прочитать некоторые рецепты, надеясь, что смогу воссоздать некоторые из блюд, которые мне нравились в детстве. Однако это оказалось труднее, чем ожидалось, поскольку книга была напечатана примерно в 1911 году шрифтом под названием f raktur . К сожалению, шрифт fraktur в некоторых случаях отличается от..
Как получить доступ к наборам данных напрямую из Kaggle
Предисловие
Kaggle — одна из крупнейших платформ сообщества специалистов по данным , которая предоставляет доступ к различным наборам данных , соревнованиям , strong>ресурсы и мощные инструменты для изучения данных и машинного обучения.
Kaggle позволяет нам использовать свои наборы данных , загружая их или используя свой API . В этой статье мы рассмотрим последнюю часть, где мы можем просто использовать ключ API , предоставленный нам Kaggle.com, который можно..
How2Sign: знаковая инициатива Facebook AI Research (FAIR)
Если вы внимательно следите за событиями в мире искусственного интеллекта, вы, скорее всего, слышали о новой захватывающей инициативе Facebook AI Research (FAIR) под названием How2Sign. Это инструмент, который использует машинное обучение для понимания и перевода языка жестов. Давайте углубимся в то, что представляет собой этот проект, и его потенциальное влияние на общество.
Что такое How2Sign?
How2Sign — это новаторский исследовательский проект, целью которого является преодоление..
Обнаружение доминирующих цветов в изображениях с помощью алгоритма K-mean
В сфере глубокого обучения крайне важно иметь всестороннее представление о наборе данных, включая его размер, статистические характеристики и технические сложности. Для устранения изменчивости цвета в наборе данных можно использовать несколько методов. Один из таких подходов включает использование сопоставления гистограмм, при котором одно изображение сопоставляется с другим в наборе данных. Этот метод доказал свою эффективность в гармонизации распределения цветов на изображениях.
Еще..