Я пытался очистить комментарии facebook, используя Beautiful Soup, на страницах ниже.
import BeautifulSoup
import urllib2
import re
url = 'http://techcrunch.com/2012/05/15/facebook-lightbox/'
fd = urllib2.urlopen(url)
soup = BeautifulSoup.BeautifulSoup(fd)
fb_comment = soup("div", {"class":"postText"}).find(text=True)
print fb_comment
Выход представляет собой нулевой набор. Тем не менее, я ясно вижу, что комментарий facebook находится внутри этих тегов выше в элементе проверки сайта techcrunch (я немного новичок в Python, и мне было интересно, правильный ли подход и где я ошибаюсь?)
fd. - person Justin Peel   schedule 19.01.2013