Вопросы по теме 'nokogiri'
xpath: как выбрать конкретный текстовый узел до и после тега ‹br›?
учти это
List of Alcohol
Beer
<br>
Vodka
<br>
rum
<br>
whiskey
как бы вы выразили пиво в xpath?
/br/preceding-sibling::text() ?
что с водкой? ром ?
8104 просмотров
schedule
23.11.2023
Нокогири против Хприкота?
Какой из них вы бы выбрали? Мои важные атрибуты (не по порядку):
Поддержка и будущие улучшения.
Сообщество и общая база знаний (в Интернете).
Всеобъемлющий (т.е., доказано, что он анализирует широкий диапазон страниц *.*ml).
Представление....
7351 просмотров
schedule
09.04.2024
Как с помощью Nokogiri сделать так, чтобы пустые теги закрывались автоматически?
Я создал XML-шаблон в ERB. Я заполняю его данными из базы данных в процессе экспорта.
В некоторых случаях есть нулевое значение, и в этом случае элемент может быть пустым, например:
<someitem>
</someitem>
В этом случае клиент,...
1650 просмотров
schedule
11.11.2023
Как мне сделать это с помощью nokogiri?
Как настроить таргетинг на следующие...
Каждый атрибут href внутри li, внутри ul, внутри ПЕРВОГО div с классом "listing".
На странице много div.listing div, и внутри каждого около 1000 ul>li>a[href="http://whatever.com"]
Я хочу получить все...
78 просмотров
schedule
20.04.2024
Как парсить сайт и получать информацию
Я пытаюсь разобрать веб-сайт. Это то, что я делаю. Я загружаю исходный код и просматриваю данные с помощью nokogiri и получаю необходимую мне информацию, например ссылки, контент и т. д. У меня уже есть сценарий для получения данных. Но столкнулся с...
420 просмотров
schedule
05.12.2023
Имитация «тела» объекта Faraday::Response и Nokogiri::XML::NodeSet
При попытке издеваться над объектом Faraday::Response я пробовал:
mock(Faraday::Response, :env => {:body => "...some xml..."})
... но это не удается, когда я вызываю response.body.xpath(...) , потому что тело представляет собой...
2264 просмотров
schedule
14.11.2023
Нокогири захватывает только видимый inner_text
Есть ли лучший способ извлечь видимый текст на веб-странице с помощью Nokogiri? В настоящее время я использую метод inner_text , однако этот метод считает большую часть JavaScript-кода видимым текстом. Единственный текст, который я хочу захватить,...
5137 просмотров
schedule
10.04.2024
Найти тег xpath не по указанному пути
Можно ли использовать Nokogiri::XML.xpath или любой другой анализатор XML для поиска тегов, которые находятся за пределами указанного пути?
Например. Если у меня есть следующий XML:
<root>
<bar>baz</bar>
<foo>...
540 просмотров
schedule
22.11.2023
Нокогири рекурсивно получает всех потомков
Проблема
Я запускаю некоторую статистику по различным URL-адресам. Я хочу найти элемент верхнего уровня с наиболее концентрированным количеством детей. Метод, которому я хотел бы следовать, состоит в том, чтобы идентифицировать все элементы...
9793 просмотров
schedule
02.01.2024
Использование драгоценного камня Mechanize для возврата набора ссылок в зависимости от их положения в DOM.
Я борюсь с механизацией. Я хочу «щелкнуть» по набору ссылок, которые можно идентифицировать только по их положению (все ссылки внутри div#content) или их href.
Я пробовал оба этих метода идентификации выше без успеха.
Из документации я так и не...
6805 просмотров
schedule
30.03.2024
Получить дочерние узлы с тем же именем, что и родительский
Мне нужно проанализировать все дочерние узлы для родительского узла, однако дочерние узлы имеют то же имя, что и родитель:
<div>
<img></img>
<div>
<img></img>
</div>
<img></img>...
913 просмотров
schedule
02.01.2024
Дезинфицируйте драгоценный камень (и Люфу), удалив текст перед двоеточием внутри тегов
Столкнулся с каким-то странным поведением как с Loofah, так и с Sanitize, пытаясь очистить некоторые фрагменты html, когда заметил, что время, подобное «18:30», превращается в «30pm».
Провел небольшое расследование и обнаружил следующее:...
676 просмотров
schedule
14.10.2022
Nokogiri выбирает гиперссылки из XML::NodeSet
Я написал следующий простой скрипт для разбора reddit/r/documentaries.
require 'open-uri'
require 'nokogiri'
top_docs = Nokogiri::XML(open("http://www.reddit.com/r/Documentaries/top.rss"))
top_docs.xpath('//item').each do |documentary|...
207 просмотров
schedule
31.01.2024
Сбой сборки собственного расширения Nokogiri (не проблема отсутствия libxml2 или libxslt)
Как следует из названия, сбой не происходит из-за отсутствия libxml2 или libxslt. Я не совсем уверен, что сделать с ошибкой. (Понятно? Потому что проблема во время сборки? хе-хе...)
Во всяком случае, вот результат, который я получаю. Любые...
1884 просмотров
schedule
03.02.2024
Как я могу проанализировать страницу с помощью Nokogiri, когда контент загружается с использованием Javascript?
Я пытаюсь проанализировать некоторый контент с веб-сайта Twitch.tv как обучающее упражнение для нокогири.
При извлечении HTML-документа я не получаю источник, который вижу в Google Chrome, кажется, что контент загружается через Javascript, а не...
987 просмотров
schedule
14.03.2024
Разбираем сложный HTML с помощью nokogiri
Я пытаюсь разобрать этот html с помощью Nokogiri, но я застрял.
<b>Dudule Francis</b>
<br>
<b>Tél. : </b>
01 02 03 04 05
<br>
<b>Fax : </b>
10 90 80 70 60
Я хотел бы извлечь первый номер...
95 просмотров
schedule
13.01.2024
Позиция тега Nokogiri до/после контента
Я хотел знать, возможно ли (и как, конечно) сравнить положение тега с содержимым родительского тега. Например:
Case 1: <a>Hello<br/></a>
Case 2: <a><br/>Hello</a>
Здесь я хочу знать, стоит ли br до или...
338 просмотров
schedule
21.02.2024
Как преобразовать файл XML для использования в приложении Rails?
Я пытаюсь загрузить файл XML , чтобы он поместился в приложение Rails, и у меня очень небольшой успех.
Я думаю, что мне следует использовать Nokogiri для анализа данных. Конечная цель здесь — взять данные по приведенной выше ссылке, статистику...
2358 просмотров
schedule
15.02.2024
Как очистить веб-страницу с динамическим содержимым, добавленным с помощью JavaScript?
Я пытаюсь очистить эту веб-страницу , она загружается лениво, когда мы прокручиваем ее. Используя Nokogiri, я могу очистить начальную страницу, но не остальную часть страницы, которая загружается после прокрутки.
2759 просмотров
schedule
17.10.2023
Ошибка при установке Nokogiri на OSX 10.9 Maverick?
Я обновил свою OSX (Lion) до Mavericks и не могу установить Nokogiri для своих проектов.
Я уже установил XCode 5.0.1, инструменты командной строки (используя xcode-select --install ) и уже установил libxml2 из Homebrew, и у меня все еще есть...
53222 просмотров
schedule
23.03.2024