Публикации по теме 'data'


Стать инженером данных: основные навыки и инструменты
Data Engineering — это создание и управление инфраструктурой для хранения, обработки и анализа больших объемов данных. Давайте рассмотрим рабочий процесс и инструменты, объяснив важность и альтернативы для каждого этапа. Сбор данных Сбор данных — это первый важный шаг в конвейере разработки данных, когда данные собираются из множества источников. Чтобы эффективно справиться с этой задачей, инженеры данных используют различные инструменты. Давайте рассмотрим некоторые из самых..

Текстовый анализ по науке о данных
На первой неделе я изучил интеллектуальный анализ текста, чтобы изучить концепции, связанные с областью науки о данных. Часто встречающиеся термины раскрывают важные ключевые слова, связанные с наукой о данных, такие как статистика, исследования и регрессия. Он также содержит другие слова, описывающие область науки о данных: машинное обучение, большие данные и искусственный интеллект. Пакет Wordcloud может преобразовать частотность терминов в облака слов, замаскированные..

Стажировки — Вирджини Марелли
Мы уже планируем стажировки в следующем году, вот краткий обзор того, что это влечет за собой 🤖 Ищете стажировку? Стажировки — это идеальный способ для вас понять, хотите ли вы продолжить карьеру в области искусственного интеллекта, а для нас — увидеть, подходит ли вам долгосрочное сотрудничество! В человеческой жизни не хватает времени, чтобы разработать все классные идеи, которые у нас есть в голове, поэтому наша команда экспертов не заняла много времени, чтобы составить классный..

Применение коллекторов в машинном обучении и глубоком обучении (искусственный интеллект +…
Глубокое многообразное обучение с помощью анализа графов ( arXiv ) Автор: Сюэлун Ли , Цзыхэн Цзяо , Хунъюань Чжан , Руй Чжан Аннотация . По общему признанию, сеть свертки графов (GCN) добилась отличных результатов на наборах графических данных, таких как социальные сети, сети цитирования и т. д. Однако softmax, используемый в качестве уровня принятия решений в этих средах, обычно оптимизирован с помощью итераций методом градиентного спуска. Кроме того, из-за игнорирования..

Прогнозирование временных рядов с использованием машинного обучения
Временной ряд — это набор наблюдений, сделанных в определенный период времени. Прогнозирование временных рядов относится к использованию статистических моделей для прогнозирования будущих значений с использованием ранее записанных наблюдений. В целом его можно разделить на две части: Прогнозирование одномерных временных рядов . Включает одну переменную. Многомерное прогнозирование временных рядов: задействует несколько переменных. Построение модели статистического..

Приложения распознавания текста сцены, часть 3 (искусственный интеллект)
Распознавание текста сцены с помощью пермутированных моделей авторегрессионной последовательности (arXiv) Автор: Дарвин Баутиста , Роуэл Атиенса Выдержка . Контекстно-зависимые методы STR обычно используют внутренние авторегрессионные (AR) языковые модели (LM). Врожденные ограничения моделей AR мотивировали двухэтапные методы, в которых используется внешний LM. Условная независимость внешнего LM от входного изображения может привести к тому, что он ошибочно исправит..

Как построить Route to Live (RTL) для продуктов данных, таких как модели машинного обучения
Чаще всего наши корпоративные платформы предназначены для разработки традиционных программных приложений. Обычно они состоят из четырех сред — Dev, Test, Pre-Prod и Prod — где среды становятся все более безопасными по мере прохождения через них. Таким образом, «Dev» или «Разработка» — это наиболее либеральная из зон, где разработчики обычно могут делать все, что им заблагорассудится, а, с другой стороны, «Prod» или «Производство» — это бесконтактная зона и, как правило, единственное место,..