У меня есть две большие таблицы Hive, скажем, TableA и TableB (которые загружаются из разных источников).
Эти две таблицы имеют почти идентичную структуру таблицы/столбцы с одним и тем же столбцом раздела, дата хранится в виде строки.
Мне нужно отфильтровать записи из каждой таблицы на основе определенных (идентичных) критериев фильтрации.
В этих таблицах есть несколько столбцов, содержащих «коды», которые необходимо просмотреть, чтобы получить соответствующие им «значения».
Существует восемь-десять таких таблиц поиска, скажем, LookupA, LookupB, LookupC и т. д.,
Теперь мне нужно:
- сделать объединение этих отфильтрованных записей из TableA и TableB.
- выполните поиск в таблицах поиска и замените эти «коды» из отфильтрованных записей их соответствующими «значениями». Если «код» или «значение» недоступны в отфильтрованных записях или таблице поиска соответственно, мне нужно заменить их нулем или пустой строкой.
- преобразовать даты в отфильтрованных записях из одного формата в другой
Я новичок в Hive. Пожалуйста, дайте знать, как я могу это сделать. Спасибо.
Примечание. Я могу справиться с объединением таблиц. Нужны некоторые рекомендации по поиску и преобразованию.