Публикации по тегам emr [amazon-web-services, amazon-emr, emr, amazon-s3, amazon-dynamodb]

Вопросы по теме 'emr'

Возможный дубликат: Повторное использование экземпляра Amazon Elastic MapReduce Могу ли я оставить запущенный кластер EMR работающим и продолжать отправлять ему новые задания, пока я не закончу (скажем, через пару дней), а затем закрыть...

1348 просмотров

amazon-web-services amazon-emr emr

18.05.2024

использовать EMR для копирования таблиц DynamoDB в разные учетные записи

У меня есть много таблиц с информацией в одной учетной записи DynamoDB, которую я хотел бы перенести в другую учетную запись. Я вижу, что вы можете копировать таблицы в одной учетной записи с помощью EMR следующим образом:...

2703 просмотров

amazon-s3 amazon-dynamodb amazon-emr emr

11.09.2022

EMR Как объединить файлы в один?

Я разбил большой двоичный файл на куски (2 Гб) и загрузил их на Amazon S3. Теперь я хочу объединить его обратно в один файл и обработать с помощью своего пользовательского я пытался бежать elastic-mapreduce -j $JOBID -ssh \ "hadoop dfs -cat...

2723 просмотров

amazon-web-services amazon-s3 amazon-emr hadoop-streaming emr

13.10.2022

Свинья на EMR: как включить точку с запятой в аргумент регулярного выражения функции EXTRACT

Я работаю с некоторыми данными в Pig, которые включают интересующие строки, необязательно разделенные точкой с запятой и в случайном порядке, например. test=12345;foo=bar test=12345 foo=bar;test=12345 Следующий код должен извлечь значение...

930 просмотров

amazon-emr hadoop apache-pig emr

27.10.2022

Ошибка при выполнении настроенного jar-файла WordCount в AWS EMR

Привет, я пытаюсь выполнить настроенную банку WordCount в AWs EMR. Моя банка для подсчета слов работает правильно, потому что я попытался добавить ее как шаг без аргументов задания, и она успешно работает. Моя проблема в том, что я запускаю ее с...

125 просмотров

amazon-web-services amazon-emr elastic-map-reduce emr

22.03.2024

Как лучше всего отслеживать ход выполнения задания AWS EMR?

У меня есть следующий код для запуска задания EMR, и он работает успешно. И я также хочу следить за состоянием работы. Я использую DescribeJobFlows API, но он говорит, что этот API устарел в соответствии с...

2029 просмотров

java amazon-web-services amazon-emr elastic-map-reduce emr

17.08.2022

Подключите Hadoop + Hive к MongoDB на AWS EMR (класс не найден com / mongodb / DBObject)

Мне нравится подключать кластер EMR к нашей MongoDB через соединение MongoDB (а не через дампы BSON). Для этого я создал кластер через Консоль управления AWS. В конфигурации Bootstrap я указал на этот файл, который находится на S3: #!/bin/sh...

1058 просмотров

amazon-web-services hadoop hive mongodb-java emr

02.04.2024

AWS EMR — получить IP-адрес главного узла из кода Java

Я хочу реализовать следующий поток из кода Java: Создайте новый экземпляр AWS EMR (с помощью AWS SDK) Подключитесь к AWS EMR с помощью Hive JDBC (требуется IP-адрес). Запустите мои запросы «SQL» в EMR Уничтожить AWS EMR (с помощью AWS SDK)...

1851 просмотров

java amazon-emr aws-sdk emr

26.02.2024

Spark: запуск spark-submit с правильным количеством исполнителей

Я настроил базовый кластер EMR из 3 узлов и запустил spark-submit с настройкой --executor-memory 1G и без других конфигураций. Сам сценарий представляет собой базовую задачу бенчмаркинга: from pyspark import SparkConf, SparkContext from...

303 просмотров

apache-spark amazon-emr apache-spark-sql emr

26.06.2022

Apache Hive: как преобразовать строку в метку времени?

Я пытаюсь преобразовать строку в столбце REC_TIME в формат метки времени в улье. Пример: Вс, 31 июля, 09:28:20 UTC 2016 => 2016-07-31 09:28:20 SELECT xxx, UNIX_TIMESTAMP(REC_TIME, "E M dd HH:mm:ss z yyyy") FROM wlogs LIMIT 10; Когда...

22853 просмотров

hadoop hive hiveql emr

21.04.2024

Каков хороший способ автоматически изменить hive-site-xml AWS EMR во время запуска

Чтобы инструменты BI, такие как Microstrategy, могли получать доступ к данным в кластере AWS EMR с помощью Spark SQL, необходимо добавить свойство в файл hive-site.xml. Мы автоматически поднимаем кластеры EMR с помощью шаблонов CloudFormation, но не...

329 просмотров

amazon-web-services apache-spark emr

30.04.2024

Как установить графический интерфейс на Amazon AWS EC2 или EMR с помощью Amazon AMI

Мне нужно запустить приложение, для запуска и настройки которого требуется графический интерфейс. Мне также нужно иметь возможность запускать это приложение в сервисе Amazon EC2 и сервисе EMR. Требование EMR означает, что он должен работать на Linux...

9682 просмотров

amazon-ec2 amazon-emr xfce emr

22.07.2022

Flink на EMR не может получить доступ к ведру S3 из команды запуска flink

Я создаю прототип использования AWS EMR для системы на основе Flink, которую мы планируем развернуть. У моего кластера есть следующие версии: Release label: emr-5.10.0 Hadoop distribution: Amazon 2.7.3 Applications: Flink 1.3.2 В...

610 просмотров

amazon-s3 apache-flink emr

28.10.2022

Spark на EMR с несколькими банками JDBC

Моя установка: небольшой проект Spark, созданный с SBT (+ sbt-assembly для создания «толстых» банок), который должен взаимодействовать с несколькими бэкэндами БД с использованием JDBC (в данном случае PostgreSQL + SQL Server, но я думаю, что моя...

423 просмотров

apache-spark jdbc sbt emr

13.10.2023

Вопросы по теме 'emr'

Похожие вопросы