久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

搜索

QQ空間 QQ好友新浪微博微信

beautifulsoup解析中文網頁亂碼解決

夢醉千秋 2012-12-06

展開全文

Jul31

【原創(chuàng)】beautifulsoup解析中文網頁亂碼解決

Author: leeon Click: 3504 Date: 2011.07.31 @ 15:35:24 pm Category: python

1
import urllib2

2
from BeautifulSoup import BeautifulSoup

3
 
4
page = urllib2.urlopen('http://www.');

5
soup = BeautifulSoup(page,fromEncoding="gb18030")

6
 
7
print soup.originalEncoding

8
print soup.prettify()

如果中文頁面編碼是gb2312，gbk,，在BeautifulSoup構造器中傳入fromEncoding="gb18030"參數(shù)即可解決亂碼問題,，即使分析的頁面是utf8的頁面使用gb18030也不會出現(xiàn)亂碼問題！

本站是提供個人知識管理的網絡存儲空間,，所有內容均由用戶發(fā)布,，不代表本站觀點。請注意甄別內容中的聯(lián)系方式,、誘導購買等信息,，謹防詐騙。如發(fā)現(xiàn)有害或侵權內容,，請點擊一鍵舉報,。

轉藏分享

QQ空間 QQ好友新浪微博微信

獻花（0） +1

來自：夢醉千秋 > 《Python》

舉報/認領

0條評論

發(fā)表

請遵守用戶評論公約

類似文章 更多

夢醉千秋

關注對話

TA的最新館藏

設置chroot環(huán)境ssh直通
ubuntu下對Qt工程進行deb打包發(fā)布
qt5.15源碼編譯 fontconfig無法編譯成功問題的解決 | 碼農家園
[轉] Linux udev識別移動設備
[轉] *益福堂風水精髓——從形派真訣談起(一)
一款簡單的記事本 - EasyNote

喜歡該文的人也喜歡更多

熱門閱讀換一換