久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

beautifulsoup解析中文網頁亂碼解決

 夢醉千秋 2012-12-06
Jul31

【原創(chuàng)】beautifulsoup解析中文網頁亂碼解決

Author: leeon  Click: 3504   Date: 2011.07.31 @ 15:35:24 pm Category: python

1 import urllib2
2 from BeautifulSoup import BeautifulSoup
3  
4 page = urllib2.urlopen('http://www.');
5 soup = BeautifulSoup(page,fromEncoding="gb18030")
6  
7 print soup.originalEncoding
8 print soup.prettify()

如果中文頁面編碼是gb2312,gbk,,在BeautifulSoup構造器中傳入fromEncoding="gb18030"參數(shù)即可解決亂碼問題,,即使分析的頁面是utf8的頁面使用gb18030也不會出現(xiàn)亂碼問題!

    本站是提供個人知識管理的網絡存儲空間,,所有內容均由用戶發(fā)布,,不代表本站觀點。請注意甄別內容中的聯(lián)系方式,、誘導購買等信息,,謹防詐騙。如發(fā)現(xiàn)有害或侵權內容,,請點擊一鍵舉報,。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多