Beautiful Soup

如果包含Chinese characters, apply decode() method.



Urllib vs Request

下載圖片:
An unordered list starts with the <ul> tag.?



值得注意的1. 我沒有用lxml,而是html5lib
2. ?img['src'] 這個(gè)似乎是一個(gè)html component


爬百度百科:
但是爬的速度特別慢,因?yàn)樗窍萪ownload下來html文件再尋找東西。

