久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

如何使用dedecms織夢(mèng)的采集功能 | 我是程序員

 nizhaodan 2014-05-21

Dedecms采集功能的使用方法 — 不含分頁(yè)的普通文章(一)

 

1.1進(jìn)入采集節(jié)點(diǎn)管理界面

如(圖1)所示,,在后臺(tái)管理界面的主菜單中單擊“采集”,然后單擊“采集節(jié)點(diǎn)管理”,,即可進(jìn)入采集節(jié)點(diǎn)管理界面,,如(圖2)所示。

圖1-后臺(tái)管理界面

 

圖2-采集節(jié)點(diǎn)管理界面

 

1.2. 增加新節(jié)點(diǎn)

在采集節(jié)點(diǎn)管理界面中,,單擊左下角的“增加新節(jié)點(diǎn)”或者右上角的“添加新節(jié)點(diǎn)”(如圖2),,都可進(jìn)入“選擇內(nèi)容模型”界面,如(圖3)所示,,

圖3-選擇內(nèi)容模型界面

 

在“選擇內(nèi)容模型”界面的下拉列表框中,,有“普通文章”和“圖片集”可供選擇。根據(jù)被采集頁(yè)面的類型,,選擇相應(yīng)的內(nèi)容模型,。本文這里選擇“普通文章”,單擊確定后,,便可進(jìn)入“新增采集節(jié)點(diǎn):第一步設(shè)置基本信息及網(wǎng)址索引頁(yè)規(guī)則”界面,,如(圖4)所示,

圖4-新增采集節(jié)點(diǎn):第一步設(shè)置基本信息及網(wǎng)址索引頁(yè)規(guī)則

 

1.2.1 設(shè)置節(jié)點(diǎn)基本信息

圖5-節(jié)點(diǎn)基本信息

如(圖5)所示,,

節(jié)點(diǎn)名稱:給新建立的節(jié)點(diǎn)起一個(gè)名字,,這里填上“采集測(cè)試(一)”,;

 

目標(biāo)頁(yè)面編碼:設(shè)定被采集目標(biāo)頁(yè)的編碼格式,有GB2312,、UTF8和BIG5三種,。可通過(guò)在被采集目標(biāo)頁(yè)面上,,單擊右鍵后選擇“查看源文件”來(lái)獲取,。

操作步驟:

(a)打開(kāi)被采集的目標(biāo)頁(yè):http://www./knowledge/web-based/dreamweaver/

 

(b)單擊右鍵后選擇“查看源文件”,,找到“charset”,, 如(圖6)所示,

圖6-查看源文件

 

其等號(hào)后面的代碼就是所需的“編碼格式”,,這里是“gb2312”,。

 

 “區(qū)域匹配模式”:設(shè)定如何匹配所需采集的內(nèi)容部分,可采用字符串或者正則表達(dá)式,。系統(tǒng)默認(rèn)的模式是字符串,。如果比較了解正則表達(dá)式的朋友,可以在這里選擇正則表達(dá)式的模式,。

 

“內(nèi)容導(dǎo)入順序”:指定文章列表導(dǎo)入時(shí)候的順序,,可以選擇“與目標(biāo)站一致”或“與目標(biāo)站相反”。

 

“防盜鏈模式”:針對(duì)被采集的目標(biāo)站點(diǎn)有無(wú)刷新限制,。一開(kāi)始很難判斷出來(lái),,需要測(cè)試后才能知道。如果有的話,,這里需要設(shè)置一下“資源下載超時(shí)時(shí)間”,。

“引用網(wǎng)址”:填入任何一個(gè)即將被采集的文章內(nèi)容頁(yè)面的網(wǎng)址。

 

具體操作步驟:

(a)在已打開(kāi)的文章列表頁(yè)中,,單擊第一篇文章的

標(biāo)題“在Dreamweaver中為插入的Flash添加透明”,,以打開(kāi)文章內(nèi)容頁(yè)面,如(圖7)所示,,

 

圖7-文章內(nèi)容頁(yè)面

 

(b)此時(shí)在瀏覽器的URL地址欄中顯示的網(wǎng)址,,即為需要填寫在“引用網(wǎng)址”處的網(wǎng)址,,如(圖8)所示,,

圖8-瀏覽器的URL地址欄

 

到這里,“節(jié)點(diǎn)基本信息”就設(shè)置完成了,。最后結(jié)果,,如(圖9)所示,

圖9-設(shè)置后的節(jié)點(diǎn)基本信息

 

檢查無(wú)誤后,,進(jìn)入下一步設(shè)置,。

 

1.2.2 設(shè)置列表網(wǎng)址獲取規(guī)則

如(圖10)所示,,

圖10-列表網(wǎng)址獲取規(guī)則

 

這里是設(shè)置被采集的文章列表頁(yè)的匹配規(guī)則。如果被采集的文章列表頁(yè)有一定的規(guī)律,,可選擇“批量生成列表網(wǎng)址”,;如果被采集的文章列表頁(yè)完全沒(méi)有規(guī)律可循,那么可選擇“手工指定列表網(wǎng)址”,;如果被采集的站點(diǎn)提供了RSS,,則可以選擇“從RSS中獲取”。對(duì)于特殊情況,,例如:部分列表頁(yè)有規(guī)律,,而其余的又沒(méi)有規(guī)律,則可在“匹配網(wǎng)址”中填上有規(guī)律的部分,,然后把沒(méi)有規(guī)律的部分填寫在“手動(dòng)指定網(wǎng)址”,。

具體操作步驟:

(a)首先,回到已打開(kāi)的文章列表頁(yè),,找到瀏覽器的URL地址欄中顯示的網(wǎng)址(圖8)和頁(yè)面底部的換頁(yè)部分,。如(圖11)所示,

圖11-換頁(yè)

 

(b)單擊“2”,,打開(kāi)文章列表頁(yè)的第二頁(yè),,此時(shí)瀏覽器的URL地址欄中所顯示的網(wǎng)址和頁(yè)面底部的換頁(yè)部分,如(圖12)和(圖13)所示,,

圖12-第二頁(yè)的網(wǎng)址

 

圖13-第二頁(yè)的換頁(yè)部分

 

(c)在已打開(kāi)的文章列表頁(yè)的第二頁(yè)上面,,單擊(1),打開(kāi)文章列表頁(yè)的首頁(yè),,這時(shí)頁(yè)面底部的換頁(yè)部分與圖11相同,,而瀏覽器的URL地址欄中所顯示的網(wǎng)址與之前圖8并不相同,如(圖14)所示,,

圖14-第一頁(yè)的網(wǎng)址

 

(d)由(b)和(c)推知,,此處被采集的文章列表頁(yè)的網(wǎng)址所遵循規(guī)律為:

http://www./knowledge/web-based/dreamweaver/list_47_(*).html。穩(wěn)妥起見(jiàn),,請(qǐng)自行測(cè)試更多列表頁(yè),。確定規(guī)律后,在“匹配網(wǎng)址”中,,填入文章列表頁(yè)所遵循的規(guī)律,。

 

(e)最后,指定需要采集的頁(yè)碼或者規(guī)律數(shù)字,,并設(shè)定其遞增規(guī)律,。

到這里,“列表網(wǎng)址獲取規(guī)則”部分就設(shè)置結(jié)束了。最后結(jié)果,,如(圖15)所示,,

圖15-設(shè)置后的列表網(wǎng)址獲取規(guī)則

 

確定正確后,進(jìn)入下一步設(shè)置,。

 

1.2.3設(shè)置文章網(wǎng)址匹配規(guī)則

如(圖16)所示,,

圖16-文章網(wǎng)址匹配規(guī)則

 

這里是設(shè)置被采集文章列表頁(yè)的匹配規(guī)則。

具體操作步驟:

(a)對(duì)于“區(qū)域開(kāi)始的HTML”,,可通過(guò)在打開(kāi)的文章列表首頁(yè)上,,單擊右鍵后選擇“查看源文件”。在源文件中,,找到第一篇文章的標(biāo)題“在Dreamweaver中為插入的Flash添加透明”,,如(圖17)所示,

圖17-查看源文件中,,第一篇文章的標(biāo)題

 

通過(guò)觀察,,不難看出“<div class=“arc_list”>”為整個(gè)文章列表的開(kāi)始部分。因此,,在“區(qū)域開(kāi)始的HTML”中,,填入”<div class=“arc_list”>”。

 

(b)在源文件中,,找到最后一篇文章標(biāo)題“通過(guò)Dreamweaver設(shè)計(jì)網(wǎng)頁(yè)時(shí)組織CSS的建議”,,如(圖18)所示,

圖18-查看源文件中,,最后一篇文章的標(biāo)題

 

結(jié)合文章列表的開(kāi)始部分并通過(guò)觀察可知,,第一個(gè)“</div>”為整個(gè)文章列表的結(jié)束部分。因此,,在“區(qū)域結(jié)束的HTML”中,,應(yīng)填入”</div>”。

 

“如果鏈接中含有圖片”:設(shè)置對(duì)鏈接中含有圖片的處理方式,,有不處理和采集為縮略圖可選,。可根據(jù)實(shí)際需要選擇,。

 

“對(duì)區(qū)域網(wǎng)址進(jìn)行再次篩選”:可以使用正則表達(dá)式對(duì)區(qū)域網(wǎng)站進(jìn)行再次篩選,,這是針對(duì)一些需要被保留或者需要濾掉的內(nèi)容,尤其是混編的列表頁(yè)面,,通過(guò)使用“必須包含”或者“不能包含”過(guò)濾掉所希望獲取或者不希望獲取的文章內(nèi)容頁(yè)面的網(wǎng)址,。

具體操作步驟:

回到正在打開(kāi)的文章列表首頁(yè)的源文件,通過(guò)觀察可知,,每一個(gè)文章內(nèi)容頁(yè)面地址的擴(kuò)展名均為.html,。因此,,可在“必須包含”中,,填入“.html”,。

到這里,“文章網(wǎng)址匹配規(guī)則“就設(shè)置結(jié)束了,。最后結(jié)果,, 如(圖19)所示,

圖19-設(shè)置后的文章網(wǎng)址匹配規(guī)則

 

通過(guò)1.2.1小節(jié),、1.2.2小節(jié)和1.2.3小節(jié),,新增采集節(jié)點(diǎn)的第一步就已經(jīng)設(shè)置完成了。設(shè)置后的結(jié)果,,如(圖20)所示,,

圖20-設(shè)置后的新增采集節(jié)點(diǎn):第一步設(shè)置基本信息及網(wǎng)址索引頁(yè)規(guī)則

 

全部完成并檢查無(wú)誤后,單擊“保存信息并進(jìn)入下一步設(shè)置“,。如果之前設(shè)置正確,,單擊后,將會(huì)進(jìn)入“新增采集節(jié)點(diǎn):測(cè)試基本信息及網(wǎng)址索引頁(yè)規(guī)則設(shè)置的網(wǎng)址獲取規(guī)則測(cè)試”頁(yè)面并看到相應(yīng)的文章列表地址,。如(圖21)所示,,

圖21-網(wǎng)址獲取規(guī)則測(cè)試

 

確定正確無(wú)誤后,單擊“保存信息并進(jìn)入下一步設(shè)置”,。否則,,請(qǐng)單擊“返回上一步進(jìn)行修改“。

到這里,,第一節(jié)就結(jié)束了,。下面進(jìn)入第二節(jié)。,。,。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn),。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào),。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多