久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

<button id="en4r8"></button>

<object id="en4r8"></object>

搜索

分享

QQ空間 QQ好友新浪微博微信

我是怎么保存公眾號歷史文章合集到本地的？當(dāng)然是用python了,！

Four兄 2019-08-24

展開全文

本文授權(quán)轉(zhuǎn)載自：小癡印記

不知道你有沒有這樣的經(jīng)歷,。

偶然間，關(guān)注了一個自己特別感興趣的公眾號,，感覺就像是挖到了一個寶藏,。于是，我們就想翻一翻寶藏里都有什么,。

但是,，如果你想看到寶藏最開始的內(nèi)容，你不得不翻山越嶺,，刷到公眾號的歷史起點,。這還不算什么，等你下次想要接著看下一篇時,，不得不重蹈覆轍,。

那么，我們有什么辦法解決一下這個問題呢,？

用萬能的python寫個腳本,，我們就可以把公眾號歷史所有的文章批量的保存為本地的PDF，這樣，就可以根據(jù)標(biāo)題和日期來看自己喜歡的文章啦,！

核心內(nèi)容：

1 抓包工具Fiddler的配置及其使用

2 python獲取公眾號全部歷史文章url地址

3 把url轉(zhuǎn)化為PDF

4 獲取單個文章的方法

1 抓包工具Fiddler的配置及使用

1）工作原理

客戶端和服務(wù)器之間建立一個代理服務(wù)器,，監(jiān)聽本機發(fā)出的請求和服務(wù)器返回的響應(yīng)結(jié)果。

瀏覽器與服務(wù)器之間通過建立TCP連接以HTTP協(xié)議進行通信,，瀏覽器默認(rèn)通過自己發(fā)送HTTP請求到服務(wù)器,。

而Fiddler是c#開發(fā)（微軟出品，主要作者Eric Lawrence）的http代理服務(wù)器,，fiddler工作于七層中的應(yīng)用層,，能夠捕獲到通過的http(s)請求。

2）下載地址

這是官網(wǎng)：http://www./fiddler

你也可以在公眾號【小癡印記】后臺,，回復(fù)關(guān)鍵字“Fiddler抓包”直接獲取,。

3）配置https

默認(rèn)情況下，F(xiàn)iddler是不會捕獲HTTPS會話的,，初次使用時,，需要下載安全證書，并配置,。

具體步驟：

依次點擊“Tools-Options-Https”,，進行如下圖的配置，“Actions-Trust root”是下載安全證書的,。

4）設(shè)置局域網(wǎng)ip和端口號

Fiddler的運行機制其實就是本機上監(jiān)聽 8888 端口的 HTTP 代理,。

Fiddler 啟動的時候默認(rèn) IE 的代理設(shè)為了127.0.0.1:8888，而其他瀏覽器是需要手動設(shè)置的,，所以將 Chrome 瀏覽器的代理改為127.0.0.1:8888 就可以監(jiān)聽數(shù)據(jù)了,。

具體操作步驟，見第一篇參考文章：

https://blog.csdn.net/jingjingshizhu/article/details/80566191

注意：運行爬蟲程序時,，要關(guān)閉Fidder客戶端

2 python源碼分析

1）打開微信客戶端,，

點開某一個公眾號的歷史文章界面

以我的公眾號為例，如圖,。

2）打開Fiddler,，監(jiān)聽url

通過對比，前后兩個url,，可以發(fā)現(xiàn),，只是offset這個參數(shù)有所改變。

一些重要的關(guān)鍵字段：

__biz : 用戶和公眾號之間的唯一id

uin ：用戶的私密id

key ：請求的秘鑰,，一段時候只會就會失效

offset ：偏移量

圖的右下角,，我們可以看到返回的數(shù)據(jù)類型，及其格式,。

好啦,，接下來,，我們可以獲取一頁內(nèi)容看看啦。

看看,，reponse_dict的內(nèi)容,。

根據(jù)上圖的json字符串，我們要做的是把title,、content_url、datetime提取出來,。

見下圖,。

至此，我們成功的獲取到了標(biāo)題,、時間,、內(nèi)容url等信息。

只有在最后一篇文章時,，can_msg_continue=0,，其余所有文章都是1。

因此,，獲取公眾號歷史文章全部內(nèi)容,，可以加一個死循環(huán)，當(dāng)判斷為最后一篇文章時,，直接break,，結(jié)束循環(huán)。

完整代碼：

本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,，所有內(nèi)容均由用戶發(fā)布,，不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息,，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,，請點擊一鍵舉報,。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻花（0） +1

來自： Four兄 > 《Python好代碼》

舉報/認(rèn)領(lǐng)

0條評論

請遵守用戶評論公約

類似文章 更多

Four兄

關(guān)注對話

TA的最新館藏

[轉(zhuǎn)] 居間合同違約金數(shù)額可依據(jù)居間報酬來認(rèn)定（仲裁機構(gòu)編輯出版的參考性案例中確定的審判規(guī)則）
[轉(zhuǎn)] 發(fā)包方在建設(shè)工程合同簽訂及履行過程中的法律風(fēng)險及防范
[轉(zhuǎn)] 二胡換把的導(dǎo)指、首滑指和尾滑指的正確練習(xí)技巧
[轉(zhuǎn)] 【金鷹視點】房地產(chǎn)律師：以房抵工程款的法律風(fēng)險及控制
[轉(zhuǎn)] 以房抵工程款的合同通常系實踐性合同,，房子過戶前有反悔的風(fēng)險
[轉(zhuǎn)] 二胡教程第三章《空弦練習(xí)》每天必練

喜歡該文的人也喜歡更多

熱門閱讀換一換

_{<sub id="l8jq7"></sub>}

<label id="l8jq7"><table id="l8jq7"></table></label>

<object id="l8jq7"><th id="l8jq7"></th></object>

<acronym id="l8jq7"><th id="l8jq7"></th></acronym>