Вопросы по теме 'nokogiri'

xpath: как выбрать конкретный текстовый узел до и после тега ‹br›?
учти это List of Alcohol Beer <br> Vodka <br> rum <br> whiskey как бы вы выразили пиво в xpath? /br/preceding-sibling::text() ? что с водкой? ром ?
8104 просмотров
schedule 23.11.2023

Нокогири против Хприкота?
Какой из них вы бы выбрали? Мои важные атрибуты (не по порядку): Поддержка и будущие улучшения. Сообщество и общая база знаний (в Интернете). Всеобъемлющий (т.е., доказано, что он анализирует широкий диапазон страниц *.*ml). Представление....
7351 просмотров
schedule 09.04.2024

Как с помощью Nokogiri сделать так, чтобы пустые теги закрывались автоматически?
Я создал XML-шаблон в ERB. Я заполняю его данными из базы данных в процессе экспорта. В некоторых случаях есть нулевое значение, и в этом случае элемент может быть пустым, например: <someitem> </someitem> В этом случае клиент,...
1650 просмотров
schedule 11.11.2023

Как мне сделать это с помощью nokogiri?
Как настроить таргетинг на следующие... Каждый атрибут href внутри li, внутри ul, внутри ПЕРВОГО div с классом "listing". На странице много div.listing div, и внутри каждого около 1000 ul>li>a[href="http://whatever.com"] Я хочу получить все...
78 просмотров
schedule 20.04.2024

Как парсить сайт и получать информацию
Я пытаюсь разобрать веб-сайт. Это то, что я делаю. Я загружаю исходный код и просматриваю данные с помощью nokogiri и получаю необходимую мне информацию, например ссылки, контент и т. д. У меня уже есть сценарий для получения данных. Но столкнулся с...
420 просмотров
schedule 05.12.2023

Имитация «тела» объекта Faraday::Response и Nokogiri::XML::NodeSet
При попытке издеваться над объектом Faraday::Response я пробовал: mock(Faraday::Response, :env => {:body => "...some xml..."}) ... но это не удается, когда я вызываю response.body.xpath(...) , потому что тело представляет собой...
2264 просмотров

Нокогири захватывает только видимый inner_text
Есть ли лучший способ извлечь видимый текст на веб-странице с помощью Nokogiri? В настоящее время я использую метод inner_text , однако этот метод считает большую часть JavaScript-кода видимым текстом. Единственный текст, который я хочу захватить,...
5137 просмотров
schedule 10.04.2024

Найти тег xpath не по указанному пути
Можно ли использовать Nokogiri::XML.xpath или любой другой анализатор XML для поиска тегов, которые находятся за пределами указанного пути? Например. Если у меня есть следующий XML: <root> <bar>baz</bar> <foo>...
540 просмотров
schedule 22.11.2023

Нокогири рекурсивно получает всех потомков
Проблема Я запускаю некоторую статистику по различным URL-адресам. Я хочу найти элемент верхнего уровня с наиболее концентрированным количеством детей. Метод, которому я хотел бы следовать, состоит в том, чтобы идентифицировать все элементы...
9793 просмотров
schedule 02.01.2024

Использование драгоценного камня Mechanize для возврата набора ссылок в зависимости от их положения в DOM.
Я борюсь с механизацией. Я хочу «щелкнуть» по набору ссылок, которые можно идентифицировать только по их положению (все ссылки внутри div#content) или их href. Я пробовал оба этих метода идентификации выше без успеха. Из документации я так и не...
6805 просмотров
schedule 30.03.2024

Получить дочерние узлы с тем же именем, что и родительский
Мне нужно проанализировать все дочерние узлы для родительского узла, однако дочерние узлы имеют то же имя, что и родитель: <div> <img></img> <div> <img></img> </div> <img></img>...
913 просмотров
schedule 02.01.2024

Дезинфицируйте драгоценный камень (и Люфу), удалив текст перед двоеточием внутри тегов
Столкнулся с каким-то странным поведением как с Loofah, так и с Sanitize, пытаясь очистить некоторые фрагменты html, когда заметил, что время, подобное «18:30», превращается в «30pm». Провел небольшое расследование и обнаружил следующее:...
676 просмотров
schedule 14.10.2022

Nokogiri выбирает гиперссылки из XML::NodeSet
Я написал следующий простой скрипт для разбора reddit/r/documentaries. require 'open-uri' require 'nokogiri' top_docs = Nokogiri::XML(open("http://www.reddit.com/r/Documentaries/top.rss")) top_docs.xpath('//item').each do |documentary|...
207 просмотров
schedule 31.01.2024

Сбой сборки собственного расширения Nokogiri (не проблема отсутствия libxml2 или libxslt)
Как следует из названия, сбой не происходит из-за отсутствия libxml2 или libxslt. Я не совсем уверен, что сделать с ошибкой. (Понятно? Потому что проблема во время сборки? хе-хе...) Во всяком случае, вот результат, который я получаю. Любые...
1884 просмотров
schedule 03.02.2024

Как я могу проанализировать страницу с помощью Nokogiri, когда контент загружается с использованием Javascript?
Я пытаюсь проанализировать некоторый контент с веб-сайта Twitch.tv как обучающее упражнение для нокогири. При извлечении HTML-документа я не получаю источник, который вижу в Google Chrome, кажется, что контент загружается через Javascript, а не...
987 просмотров
schedule 14.03.2024

Разбираем сложный HTML с помощью nokogiri
Я пытаюсь разобрать этот html с помощью Nokogiri, но я застрял. <b>Dudule Francis</b> <br> <b>Tél. : </b> 01 02 03 04 05 <br> <b>Fax : </b> 10 90 80 70 60 Я хотел бы извлечь первый номер...
95 просмотров
schedule 13.01.2024

Позиция тега Nokogiri до/после контента
Я хотел знать, возможно ли (и как, конечно) сравнить положение тега с содержимым родительского тега. Например: Case 1: <a>Hello<br/></a> Case 2: <a><br/>Hello</a> Здесь я хочу знать, стоит ли br до или...
338 просмотров
schedule 21.02.2024

Как преобразовать файл XML для использования в приложении Rails?
Я пытаюсь загрузить файл XML , чтобы он поместился в приложение Rails, и у меня очень небольшой успех. Я думаю, что мне следует использовать Nokogiri для анализа данных. Конечная цель здесь — взять данные по приведенной выше ссылке, статистику...
2358 просмотров
schedule 15.02.2024

Как очистить веб-страницу с динамическим содержимым, добавленным с помощью JavaScript?
Я пытаюсь очистить эту веб-страницу , она загружается лениво, когда мы прокручиваем ее. Используя Nokogiri, я могу очистить начальную страницу, но не остальную часть страницы, которая загружается после прокрутки.
2759 просмотров
schedule 17.10.2023

Ошибка при установке Nokogiri на OSX 10.9 Maverick?
Я обновил свою OSX (Lion) до Mavericks и не могу установить Nokogiri для своих проектов. Я уже установил XCode 5.0.1, инструменты командной строки (используя xcode-select --install ) и уже установил libxml2 из Homebrew, и у меня все еще есть...
53222 просмотров
schedule 23.03.2024