Вопросы по теме 'hiveql'
Понимание Hive UDF
Я создал несколько пользовательских функций куста. Теперь мы думаем об использовании этих UDF внутри hiveql для создания таблицы.
Создать сказку xyz{ field1..
fieldn } as {выбрать udf1(), udf2(), ...
udfn() из abc,def)
Теперь мы не...
472 просмотров
schedule
23.03.2024
СВИНЬЯ: придайте значение твитам
Моя цель — оценивать твиты на Pig Latin. У меня есть 3 списка слов для использования в качестве словаря (положительные слова, отрицательные слова и нерелевантные слова). Я бы оценил список твитов с помощью этого словаря. Я должен анализировать...
370 просмотров
schedule
25.07.2022
запрос hive с использованием регулярного выражения
привет, я искал способ запросить таблицу кустов ( user_acc_detl ), где данные столбца (ACC_DETAILS) выглядят так, как показано ниже,
COUNTRY[0]_united staes~DATE[0]_6/10/2014~AMOUNT[0]_200~ID[0]_20140509065052159324~COUNTRY[1]_united...
531 просмотров
schedule
03.03.2024
Hive Passing Property/Text File для чтения значений нескольких переменных в -hiveconf
В настоящее время я могу использовать следующую команду:
hive -f hive-job.hql -hiveconf city='CA' -hiveconf country='US'
Здесь я передаю только 2 значения переменных. Но у меня есть от 15 до 20 значений переменных, которые мне нужно передать...
4387 просмотров
schedule
16.09.2022
Множественные соединения с одной и той же таблицей в HIVE
В приведенном ниже запросе я присоединяю таблицу T1 к нескольким таблицам на основе одного и того же ключа. Мне интересно, в этом случае мне нужно указать условия
AND a.ds = '2014-12-10'
AND a.org_id IS NULL
для каждого соединения? В чем...
3383 просмотров
schedule
03.11.2022
Влияет ли порядок условий в запросах куста на производительность запроса?
У меня проблема в том, что мои SQL-запросы куста иногда приводят к сканированию всей таблицы и длятся очень долго. Поэтому мне было интересно, действительно ли порядок операторов where влияет на производительность запросов.
Например. запрос имеет...
1499 просмотров
schedule
11.05.2024
Загрузка пар "ключ-значение" на карту в улье
У меня есть таблица Table1 с 5 столбцами и таблица 2 с 3 столбцами
DESCRIBE Table1;
col1 int
col2 int
col3 int
col4 int
col5 int
DESCRIBE Table2;
col1 int
col2 int
mapcol map<string, int>
Теперь я хотел бы скопировать данные из...
446 просмотров
schedule
03.11.2023
Асинхронное выполнение запроса куста: OperationHandle очищается на стороне сервера, как только клиент инициатора запроса отключается.
Можно ли асинхронно выполнить запрос на сервере улья?
Например, как я могу/можно ли сделать что-то подобное с клиента?
QueryHandle handle = executeAsyncQuery(hiveQuery);
Status status = handle.checkStatus();
if(status.isCompleted()) {...
1470 просмотров
schedule
16.10.2022
Сохранение запросов куста
Мне нужно знать, как мы можем сохранить запрос, который я написал в командной строке, точно так же, как мы это делаем в sql (мы используем ctrl + S на сервере sql).
Я слышал, что запросы hive QL используют расширение .q или .hql. Есть ли...
3002 просмотров
schedule
02.10.2023
Подключиться к hiveserver2 с помощью PHP
Мне нужно создать отчет в моем приложении PHP, используя данные в Hadoop. Я установил hiveserver2 на свой локальный компьютер. Я попытался найти способ подключения к hiveserver2 из моего PHP-кода, используя следующие примеры....
937 просмотров
schedule
13.11.2022
Улей к улью ETL
У меня есть две большие таблицы Hive, скажем, TableA и TableB (которые загружаются из разных источников).
Эти две таблицы имеют почти идентичную структуру таблицы/столбцы с одним и тем же столбцом раздела, дата хранится в виде строки.
Мне нужно...
670 просмотров
schedule
31.03.2024
можем ли мы указать путь к файлу x.csv при создании внешней таблицы куста?
Исходя из синтаксиса создания внешней таблицы:
CREATE EXTERNAL TABLE page_view(viewTime INT, userid BIGINT,
page_url STRING, referrer_url STRING,
ip STRING COMMENT 'IP Address of the User',
country STRING COMMENT 'country of...
143 просмотров
schedule
09.12.2023
куст - можно ли создать столбец из другого столбца
Мне было интересно, можно ли создать новый столбец из существующего столбца в улье.
Допустим, у меня есть таблица People (name string, age int) , и я хочу добавить столбец is_old string , который будет определен как if(age > 70, 'old',...
5996 просмотров
schedule
05.05.2024
Перегородки в улье
У меня есть набор данных в кластере CDH, и он разделен на ггггмм.
Когда я запускаю следующий запрос в улье:
select actvydt, cast((concat(trim(substr(ActvyDt, 1, 4)), trim(substr(ActvyDt, 6, 2)))) as int) from pos where yyyymm=201601 and...
441 просмотров
schedule
23.01.2024
Apache Hive: как преобразовать строку в метку времени?
Я пытаюсь преобразовать строку в столбце REC_TIME в формат метки времени в улье.
Пример: Вс, 31 июля, 09:28:20 UTC 2016 => 2016-07-31 09:28:20
SELECT xxx, UNIX_TIMESTAMP(REC_TIME, "E M dd HH:mm:ss z yyyy") FROM wlogs LIMIT 10;
Когда...
22853 просмотров
schedule
21.04.2024
получение максимального значения столбца отметки времени как подзапрос в улье
У меня есть столбцы временных меток с именами start_dt и end_dt в моем улье table1, и в таблице всегда будет только одна запись.
В таблице 2 у меня есть столбец даты под названием load_dt .
Я пытаюсь добиться чего-то вроде этого:
select...
867 просмотров
schedule
09.11.2023
Hive on Spark CTAS не работает с прямым SELECT, но успешно с SELECT GROUP BY
Я успешно использовал Hive on Spark в течение нескольких недель, выполняя операторы CTAS, которые включали агрегированные данные. Недавно мне потребовалось выполнить CTAS с прямым оператором выбора (без GROUP BY), и я был удивлен, что это не удалось....
680 просмотров
schedule
18.02.2024
Разбор URL-адреса улья
У меня есть вопрос о разборе URL-адресов с помощью куста. Например, у меня есть таблица URL-адресов,
http://xxxx.com&key1 = 1 & key2 = 2 & key4 = 4
http://xxxx.com&key1 = 1 & key2 = 2 & key3 = 3 & key 4 = 4
http://xxxx.com&key1 = 1...
1088 просмотров
schedule
02.01.2024
Hive — более быстрый способ проверки данных
У меня есть пакет scala/spark, который работает с базой данных Hive. Он запускает цикл, в котором выполняется запрос, чтобы проверить, существуют ли данные для некоторых конкретных значений.
SELECT * FROM myTable WHERE col1 = 7879 AND col2= 1071...
780 просмотров
schedule
09.08.2022
передача параметров в раздел не работает в улье
Я хочу передать значение раздела в качестве параметра.
SET runmdt = date_sub(current_date,5);
Приведенный ниже запрос работает нормально.
SELECT
cal_id,caller_name,location
from
amobe_tbl a
WHERE a.create_dt IN
(select DISTINCT create_dt...
1399 просмотров
schedule
05.03.2024