Я пытаюсь найти и заменить текстовые фрагменты в файлах docx на POI 3.8, как описано здесь.
Это прекрасно работает, если я вставляю свои теги при первом запуске. Но как только я снова открываю файл docx и вношу некоторые изменения, Word фактически фрагментирует фрагменты текста. Так, например, «привет, мир» может быть:
<w:r><w:t>Hello wo</w:t></w:r><w:r w:rsidR="00FB0672"><w:t>rld</w:t></w:r>
Я думаю, что такая фрагментация будет связана с такими вещами, как отслеживание изменений, форматирование и проверка орфографии.
Кто-нибудь знает, как...
а) ... отключить эту функцию в MS Word?
б) ... как-то потом дефрагментировать файл docx?
в) ... любое другое решение, чтобы избавиться от этой фрагментации?
Я уже пытался сохранить файл как .doc/.odt и пересохранить файл в .docx. Но эти фрагментации все еще сохраняются...
Любая помощь высоко ценится — заранее спасибо за вашу помощь!