Я пишу сканер и постоянно сталкиваюсь с элементами управления формами, для которых механизация не может дать мне никакой информации, кроме типа. Есть ли способ получить удобочитаемый текст, связанный с элементом управления? Я знаю, что это немного нечеткая область, поскольку нет идеального способа получить эту информацию, но, возможно, что-то может помочь?
Может ли механизм Python извлечь текст, связанный с элементом управления?
Ответы (1)
Ищите текст на родственных узлах и текст родительского узла, потому что именно там они часто находятся. LXML может помочь, если вам действительно нужно проанализировать html.
person
Snakes and Coffee
schedule
02.05.2012