Публикации по тегам data-science

Публикации по теме 'data-science'

Адаптация домена - ML для нескольких наборов данных

Записки из промышленности Адаптация домена Производительность машинного обучения зависит от набора данных, на котором оно обучается. Наборы данных несовершенны, поэтому проблемы с данными влияют на модели. Один из типов проблем - это сдвиг домена. Это означает, что модель, обученная изучению задачи на одном наборе данных, может быть не в состоянии выполнять ту же задачу на немного другом наборе данных. Допустим, вы обучаете модель обнаруживать собак на открытом воздухе, например в..

«Идите полным ходом вперед: использование сегментации экземпляра YOLOv8 для раскрытия потенциала ваших данных»

TL;DR: Африканский лев сталкивается с резким сокращением популяции из-за потери среды обитания, конфликтов между людьми и львами и незаконной охоты. TL;DR: африканские львы находятся под угрозой исчезновения из-за потери среды обитания, конфликтов между людьми и львами и браконьерства. Их количество быстро сокращается, поэтому необходимо принять меры по сохранению, чтобы обеспечить их выживание. Краткое содержание: Хотите получить максимальную отдачу от тренировки? Если да, то..

Последние обновления автокодировщиков в масках 2023, часть 4

SurgMAE: Маскированные автоэнкодеры для анализа длинных хирургических видео (arXiv) Автор: Мухаммад Абдулла Джамал , Омид Мохарери . Аннотация: Растет интерес к использованию моделей глубокого обучения для обработки длинных хирургических видеороликов, чтобы автоматически обнаруживать клинические/операционные действия и извлекать метрики, которые могут включать инструменты и приложения для повышения эффективности рабочего процесса. Однако для обучения таких моделей требуются огромные..

Как решить проблему замены отсутствующего значения

Топ-5 профессиональных советов по решению самой распространенной проблемы в науке о данных Замена отсутствующих значений может показаться тривиальной, но это может быть самый важный шаг в процессе машинного обучения. То, как вы это делаете, может оказать большое влияние на вашу модель машинного обучения. Кроме того, поскольку вы будете создавать некоторые новые данные, у вас есть некоторые важные обязанности по отношению к отделам данных в организации. Данные — один из самых важных..

Наборы данных классификации большого текста

Данные - самый важный компонент для построения модели машинного обучения. Недавно исследователи из Google обучили модель CNN классификации изображений на 300 миллионах изображений и продемонстрировали, что даже в масштабе сотен миллионов примеров добавление дополнительных данных помогает улучшить производительность модели. Видимо, чем больше данных, тем лучше. Но где вы можете получить большие наборы данных, если вы занимаетесь исследованием классификации текста? Я нашел хорошие ссылки..

Является ли специалист по данным только созданием моделей прогнозирования?

Этот пост предназначен для людей, которые плохо знакомы с областью науки о данных или хотят сменить карьеру и заинтересованы в использовании наборов данных Kaggle, чтобы получить практический опыт работы с алгоритмами и построить модели статистического прогнозирования в качестве ключевого шага к тому, чтобы стать специалистом по данным. ученый Наука о данных — это область, которая включает в себя извлечение идей и знаний из данных. Конечной целью науки о данных является создание..

Новые методы в геометрическом глубоком обучении, часть 2 (машинное обучение)

Контролируемая фильтрация трактограмм с использованием геометрического глубокого обучения (arXiv) Автор: Пьетро Астольфи , Рубен Верхаген , Лоран Пети , Эмануэле Оливетти , Сильвио Саруббо , Джонатан Маски , Давиде Боскаини , Паоло Авесани . Аннотация: Трактограмма представляет собой виртуальное представление белого вещества головного мозга. Он состоит из миллионов виртуальных волокон, закодированных в виде трехмерных полилиний, которые аппроксимируют пути аксонов белого..