久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

搜索引擎的技術(shù)發(fā)展趨勢(shì) - 搜索引擎技術(shù)與應(yīng)用 - 中文搜索引擎指南

 accesine 2005-08-27

搜索引擎的技術(shù)發(fā)展趨勢(shì)

 

搜狐科技

     
 

  搜索引擎經(jīng)過(guò)幾年的發(fā)展和摸索,,越來(lái)越貼近人們的需求,搜索引擎的技術(shù)也得到了很大的發(fā)展,。搜索引擎的最新技術(shù)發(fā)展包括以下幾個(gè)方面:

一,、提高搜索引擎對(duì)用戶檢索提問(wèn)的理解

  為了提高搜索引擎對(duì)用戶檢索提問(wèn)的理解,就必須有一個(gè)好的檢索提問(wèn)語(yǔ)言,,為了克服關(guān)鍵詞檢索和目錄查詢的缺點(diǎn),,現(xiàn)在已經(jīng)出現(xiàn)了自然語(yǔ)言智能答詢。用戶可以輸入簡(jiǎn)單的疑問(wèn)句,,比如“how can kill virus of computer?”,。搜索引擎在對(duì)提問(wèn)進(jìn)行結(jié)構(gòu)和內(nèi)容的分析之后,,或直接給出提問(wèn)的答案,或引導(dǎo)用戶從幾個(gè)可選擇的問(wèn)題中進(jìn)行再選擇,。自然語(yǔ)言的優(yōu)勢(shì)在于,,一是使網(wǎng)絡(luò)交流更加人性化,二是使查詢變得更加方便,、直接,、有效。就以上面的例子來(lái)講,,如果用關(guān)鍵詞查詢,,多半人會(huì)用“virus”這個(gè)詞來(lái)檢索,結(jié)果中必然會(huì)包括各類病毒的介紹,、病毒是怎樣產(chǎn)生的等等許多無(wú)效信息,,而用“how can kill virus of computer?”,搜索引擎會(huì)將怎樣殺病毒的信息提供給用戶,,提高了檢索效率,。

二、對(duì)檢索結(jié)果進(jìn)行處理

1)基于鏈接評(píng)價(jià)的搜索引擎

  基于鏈接評(píng)價(jià)的搜索引擎的優(yōu)秀代表是Googel(http://www.),,它獨(dú)創(chuàng)的“鏈接評(píng)價(jià)體系”是基于這樣一種認(rèn)識(shí),,一個(gè)網(wǎng)頁(yè)的重要性取決于它被其它網(wǎng)頁(yè)鏈接的數(shù)量,特別是一些已經(jīng)被認(rèn)定是“重要”的網(wǎng)頁(yè)的鏈接數(shù)量,。這種評(píng)價(jià)體制與《科技引文索引》的思路非常相似,,但是由于互聯(lián)網(wǎng)是在一個(gè)商業(yè)化的環(huán)境中發(fā)展起來(lái)的,一個(gè)網(wǎng)站的被鏈接數(shù)量還與它的商業(yè)推廣有著密切的聯(lián)系,,因此這種評(píng)價(jià)體制在某種程度上缺乏客觀性,。

2)基于訪問(wèn)大眾性的搜索引擎

  基于訪問(wèn)大眾性的搜索引擎的代表是direct hit,它的基本理念是多數(shù)人選擇訪問(wèn)的網(wǎng)站就是最重要的網(wǎng)站,。根據(jù)以前成千上萬(wàn)的網(wǎng)絡(luò)用戶在檢索結(jié)果中實(shí)際所挑選并訪問(wèn)的網(wǎng)站和他們?cè)谶@些網(wǎng)站上花費(fèi)的時(shí)間來(lái)統(tǒng)計(jì)確定有關(guān)網(wǎng)站的重要性排名,,并以此來(lái)確定哪些網(wǎng)站最符合用戶的檢索要求。因此具有典型的趨眾性特點(diǎn),。這種評(píng)價(jià)體制與基于鏈接評(píng)價(jià)的搜索引擎有著同樣的缺點(diǎn),。

3)去掉檢索結(jié)果中附加的多余信息

  有調(diào)查指出,過(guò)多的附加信息加重了用戶的信息負(fù)擔(dān),,為了去掉這些過(guò)多的附加信息,,可以采用用戶定制、內(nèi)容過(guò)濾等檢索技術(shù),。

三,、確定搜索引擎信息搜集范圍,提高搜索引擎的針對(duì)性

1)垂直主題搜索引擎

  網(wǎng)上的信息浩如煙海,,網(wǎng)絡(luò)資源以十倍速的增長(zhǎng),,一個(gè)搜索引擎很難收集全所有主題的網(wǎng)絡(luò)信息,,即使信息主題收集得比較全面,由于主題范圍太寬,,很難將各主題都做得精確而又專業(yè),,使得檢索結(jié)果垃圾太多。這樣以來(lái),,垂直主題的搜索引擎以其高度的目標(biāo)化和專業(yè)化在各類搜索引擎中占據(jù)了一系席之地,,比如象股票、天氣,、新聞等類的搜索引擎,,具有很高的針對(duì)性,用戶對(duì)查詢結(jié)果的滿意度較高,。作者認(rèn)為,垂直主題有著極大的發(fā)展空間,。

2)非www信息的搜索

  提供FTP等類信息的檢索

3)多媒體搜索引擎

  多媒體檢索主要包括聲音,、圖像的檢索。

四,、將搜索引擎的技術(shù)開(kāi)發(fā)重點(diǎn)放在對(duì)檢索結(jié)果的處理上,,提供更優(yōu)化的檢索結(jié)果

1)純凈搜索引擎

  這類搜索引擎沒(méi)有自己的信息采集系統(tǒng),利用別人現(xiàn)有的索引數(shù)據(jù)庫(kù),,主要關(guān)注檢索的理念,、技術(shù)和機(jī)制等。

2)元搜索引擎

  現(xiàn)在出現(xiàn)了許多的搜索引擎,,其收集信息的范圍,、搜索機(jī)制、算法等都不同,,用戶不得不去學(xué)習(xí)多個(gè)搜索引擎的用法,。每個(gè)搜索引擎平均只能涉及到整個(gè)www資源的30-50%(search engine watch數(shù)據(jù)),這樣導(dǎo)致同一個(gè)搜索請(qǐng)求在不同搜索引擎中獲得的查詢結(jié)果的重復(fù)率不足34%,,而每一個(gè)搜索引擎的查準(zhǔn)率不到45%,。

  元搜索引擎(metasearch enging)是將用戶提交的檢索請(qǐng)求到多個(gè)獨(dú)立的搜索引擎上去搜索,并將檢索結(jié)果集中統(tǒng)一處理,,以統(tǒng)一的格式提供給用戶,,因此有搜索引擎之上的搜索引擎之稱。它的主要精力放在提高搜索速度,、智能化處理搜索結(jié)果,、個(gè)性搜索功能的設(shè)置和用戶檢索界面的友好性上,查全率和查準(zhǔn)率都比較高,。目前比較成功的元搜索引擎有metacrawler,、dopile,、ixquick等。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購(gòu)買(mǎi)等信息,,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請(qǐng)點(diǎn)擊一鍵舉報(bào),。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多