Я довольно новичок в Python и программировании в целом. Я сделал несколько руководств и примерно 2/3 прочитал довольно хорошую книгу. При этом я пытался освоиться с Python и программированием, просто пробуя что-то в стандартной библиотеке.
при этом я недавно столкнулся со странной причудой, которая, я уверен, является результатом моего собственного неправильного или не "питоновского" использования модуля urllib (с Python 3.2.2)
import urllib.request
HTML_source = urllib.request.urlopen(www.somelink.com).read()
print(HTML_source)
когда этот бит запускается через активный интерпретатор, он возвращает исходный HTML-код какой-либо ссылки, однако он добавляет к нему префикс b', например
b'<HTML>\r\n<HEAD> (etc). . . .
если я разобью строку на список с помощью пробела, перед каждым элементом будет стоять префикс b'
На самом деле я не пытаюсь сделать что-то конкретное, просто пытаюсь ознакомиться со стандартной библиотекой. Я хотел бы знать, почему это b' получает префикс
также бонус - есть ли лучший способ получить исходный код HTML БЕЗ использования стороннего модуля. Я знаю весь этот бред о том, что нельзя изобретать велосипед и тому подобное, но я пытаюсь учиться, «создавая свои собственные инструменты».
Заранее спасибо!