Публикации по теме 'airflow'


Как запустить воздушный поток
Мои личные заметки из книги «Конвейеры данных с Apache Airflow» Баса Харенслака и Джулиана де Руйтера — глава 2, часть 2 Введение Эта серия постов предназначена для того, чтобы обобщить мои выводы из книги Баса Харенслака и Джулиана де Руйтера. Если вы…

Понимание инженерии данных
Мир технологий полон соблазнительных модных словечек. Крайне желательны знания в таких областях, как машинное обучение, искусственный интеллект и нейронные сети. В современной сфере больших данных задача написания алгоритмов не влечет за собой автоматически ответственности за очистку данных. Организация и подготовка данных для ученых и исследователей сами по себе превратились в сложные задачи. Именно здесь инженеры данных вступают в игру и выполняют свою решающую роль в этой..

Проектирование систем оркестровки машинного обучения для стартапов
"Часы работы" Разработка систем оркестровки машинного обучения для стартапов Пример создания облегченной системы оркестровки машинного обучения производственного уровня Недавно у меня была возможность создать платформу машинного обучения в стартапе в области здравоохранения. В этой статье рассказывается о архитектурном проектировании, технических компромиссах, деталях реализации и извлеченных уроках на примере разработки платформы оркестровки машинного обучения для стартапов..

101 Руководство по операторам Apache Airflow
Apache Airflow — это инструмент для автоматизации рабочих процессов, задач и координации других программ в кластерах компьютеров. Airflow расширяет возможности организаций благодаря простому языку, основанному на правилах, который позволяет кодировать сложную обработку данных за считанные минуты. В этом посте мы узнаем об операторах воздушного потока, которые вы можете использовать для создания собственных пайплайнов. Операторы выполняют инструкции, содержащиеся в вашем скрипте или..

Использование декораторов воздушного потока для создания DAG
Создание DAG и задач Apache Airflow с помощью декораторов Python Введение Наиболее распространенный способ написания конвейеров в Airflows — использование менеджеров контекста DAG для автоматического назначения новых операторов этой DAG. Начиная с Airflow 2, теперь вы можете использовать декораторы для создания DAG и задач Airflow. В сегодняшнем уроке мы представим эти декораторы и покажем, как их можно использовать для написания более чистого кода. Кроме того, мы также..

Airflow: развертывание DAG в AWS
В предыдущих статьях мы впервые подчеркнули важность инструментов оркестровки и преимущества Airflow в этой области. После этого мы углубились в техническую часть воздушного потока, изучая его архитектуру и то, как мы можем автоматизировать рабочие процессы с помощью некоторых примеров кода. Вот ссылки на предыдущие две статьи. Airflow: ведущий оркестратор И почему вам следует об этом знать medium.com..

Как постепенно обрабатывать данные в Airflow
Мои личные заметки из книги «Конвейеры данных с Apache Airflow» Баса Харенслака и Джулиана де Руйтера — глава 3, часть 3 Введение Эта серия постов подытоживает мои выводы из книги Баса Харенслака и Джулиана де Рюйтера. Если вам нравится контент, вы можете…