Я использую Notepad++ для очистки длинной и запутанной HTML-таблицы и пытаюсь использовать регулярные выражения.
Мне нужно удалить все строки таблицы, которые не содержат определенного значения (могу ли я назвать это подстрокой?).
После того, как все содержимое файла было развернуто, я смог использовать следующее регулярное выражение, чтобы выбрать одну за другой каждую строку таблицы со всем ее содержимым:
<tr>.+?</tr>
Как я могу улучшить регулярное выражение, чтобы выбирать и заменять только те строки таблицы, которые содержат где-то внутри <td>
части определенную подстроку?
Я не знаю, имеет ли это значение, но структура каждой строки таблицы следующая (я поместил туда каждый HTML-тег, точки означают стандартный контент/значения)
<tr>
<td> ... </td>
<td> ... </td>
<td> <a sfref="..." href="...">!! SUBSTRING I HAVE TO MATCH HERE !!</a> </td>
<td> <img /> </td>
<td> ... </td>
<td> ... </td>
<td> ... </td>
<td> ... </td>
</tr>