Я использую цепочку инструментов для преобразования уценки в HMTL5, используя Pandoc для вставки в визуальный редактор WordPress в качестве содержимого HTML. .
Когда дело доходит до вставки изображений, WordPress помещает то, что называется shortcode
формы
[caption id="attachment_100" align="aligncenter" width="300" caption="This is an image caption"]
в текст HTML. На самом деле это не уценка, но Pandoc интерпретирует ее так, что каждая пара " ... "
преобразуется в пару <q> ... </q>
для вывода HTML. Это неправильно работает в WordPress.
Мне нужно предотвратить преобразование " ... "
, но только тех, которые встречаются в четко определенных квадратных скобках [caption ... ]
, которые вставляются исключительно WordPress и не могут быть перепутаны с другим содержимым, которое я добавляю.
Я недостаточно знаю об API Pandoc или Haskell, чтобы написать встроенный paseser/фильтр, чтобы исключить этот текстовый фрагмент из обработки Pandoc. Совет, который я получил в списке рассылки pandoc, до сих пор был выше моего понимания, учитывая мое отсутствие знакомства с Pandoc и Haskell.
Я думал о написании Perl-фильтра, но меня сильно отговорили от использования регулярных выражений по очень веской причине.
Я прошу здесь выяснить, есть ли надежный способ сделать обратную замену тегов <q> ... </q>
на " ... "
только для текста в блоке [caption ... ]
после его прохождения через pandoc в качестве этапа постобработки.
Может кто-нибудь предложить, как я могу это сделать?
Большое спасибо.