Строка HTML для объекта документа в VBScript

У меня есть строка, содержащая HTML-код страницы, полученный по запросу GET.

Dim http
Set http = CreateObject("MSXML2.XMLHTTP")
http.open "GET", "http://www.example.com", False
http.send
// http.responseText is the string

Как я могу преобразовать эту строку в объект документа? Мне нужен более естественный способ разбора HTML, чем поиск по нему вручную.


person tskuzzy    schedule 05.08.2011    source источник


Ответы (1)


Если это действительный XHTML, вы можете загрузить его в DOMDocument с помощью LoadXml(). Другой пример: http://msdn.microsoft.com/en-us/library/ms756007(v=vs.85).aspx

В противном случае вы можете использовать какой-либо COM-объект браузера (как ранее было дано здесь: Как вы извлекаете данные с веб-сайта поставщика в vbscript?), но ПРИМЕЧАНИЕ: это не то, что вы хотели бы делать на стороне сервера на страницах ASP, так как это может привести ко всевозможным утечкам ресурсов и нестабильности.

Наконец, вы можете использовать сторонний COM-объект для анализа HTML, например http://www.miken.com/htmlzap/ (я не рекомендую это, это результат быстрого поиска в Google, но, насколько я знаю, это может быть здорово).

person Tao    schedule 05.08.2011