第一個: urllib.request.urlopen()#需要傳遞一個url;獲得的是一個對象 對象名.read():得到的是二進制數(shù)據(jù) 二進制-->字符串:decode() 字符串-->二進制:encode() 在網(wǎng)上碰到的編碼格式只有 gbk 和 utf8 其他的方法: 對象名.readlines():按行讀取 對象名.url:獲取請求的網(wǎng)址 對象名.headers:獲取響應(yīng)頭部,,字符串格式的 對象名.getheaders():列表 列表里面是元組 對象名.getcode():獲取響應(yīng)的狀態(tài)碼 舉例: url = 'http://www.baidu.com/' res = urllib.request.urlopen(url)#打開該url 獲取一個對象 print(res.read().decode("utf8"))#讀取該對象的內(nèi)容,,以字符串的格式讀取 #將響應(yīng)的信息保存到文件中 with open('baidu.html','wb') as fp: fp.write(res.read()) 第二個: urllib.request.urlretrieve() urllib.request.urlretrieve(url,filepath)#將獲取的URL的內(nèi)容寫到文件目錄中去 舉例: 圖片的下載 #普通的下載 img_url = "http://i1./uploads/tu/201807/9999/89162d0319.jpg" urllib.request.urlretrieve(img_url,'baidu.jpg')#通過url獲取到該圖片,并且存儲到baidu.jpg #一般圖片都有防盜鏈,,如果有防盜鏈的話需要使用下面的方式 img_url = "http://i1./uploads/tu/201807/9999/89162d0319.jpg" res = urllib.request.urlopen(img_url) #存儲文件 with open('qizhi.jpg','wb') as fp: fp.write(res.read())
|
|