Нужна работа, которая выполняется в зависимости от наличия наборов данных, созданных в разделах Hive. Я заставил это работать, но теперь я хочу, чтобы все мои каналы запускались в номинальное время, но один всегда запускался с задержкой на день. Итак, если сегодня 5-19, все каналы должны быть там на 5-19, кроме одного, который нам нужен на 5-18.
Это то, что у меня есть на данный момент:
<dataset name="mvHost" frequency="${coord:days(1)}" initial-instance="${jobStart}" timezone="America/New_York">
<uri-template>${nameNode}/apps/hive/warehouse/uat_db.db/mv_host/create_date=${YEAR}${MONTH}${DAY}</uri-template>
<done-flag></done-flag>
</dataset>
<!-- ensure MV_INTERFACE exists on partition date, need to delay by ONE day -->
<dataset name="mvInterface" frequency="${coord:days(1)}" initial-instance="${jobStart}" timezone="America/New_York">
<uri-template>${nameNode}/apps/hive/warehouse/uat_db.db/mv_interface/create_date=${YEAR}${MONTH}${DAY}</uri-template>
<done-flag></done-flag>
</dataset>
</datasets>
<input-events>
<data-in name="input1" dataset="mvHost">
<instance>${coord:current(0)}</instance>
</data-in>
<data-in name="input2" dataset="mvInterface">
<instance>${coord:current(0)}</instance>
</data-in>
</input-events>
What is the best way to instill the latency? I have tried editing the instance to be ${coord:current(-24)} but that failed. Also, I have tried using coord:dateOffset on initial-instance for MV_INTERFACE but the coordinator would never build.
Какие-либо предложения?