Пользовательский классификатор grok AWS Glue не работает

У меня есть структурированный текстовый файл с разделителями, с двумя столбцами, с двоеточиями в качестве разделителей, в S3, который выглядит так:

[email protected]:abc
[email protected]:def

У меня есть собственный классификатор с этим выражением grok: %{NOTSPACE:email}:%{NOTSPACE:data}

Это выражение работает в тестере выражений grok здесь: https://grokdebug.herokuapp.com/

Но когда я запускаю это в своем сканере, таблица создается, но имеет пустую схему и данные. Какие-либо предложения? Спасибо.


person David    schedule 17.01.2019    source источник
comment
У вас все строки в одной строке?   -  person j.b.gorski    schedule 21.01.2019


Ответы (1)


Пришлось использовать %{DATA:email}:%{WORD:data}

person David    schedule 23.01.2019
comment
ты знаешь почему? Столкнулся с той же проблемой: паттерн валидный у тестеров, а aws клей его игнорирует - person Danilo Gomes; 10.03.2019