12月12日北京OSC源創(chuàng)會 —— 開源技術(shù)的年終盛典 ? 本文介紹若干款開源搜索引擎,,他們具有不同的特性,,總之都很強(qiáng)大。對于開發(fā)者來說,,應(yīng)該了解,。 Constellio 是一個開源的搜索解決方案,,適合企業(yè)級的搜索,。基于 Apache Solr 項目構(gòu)建,,使用 Lucene 做為搜索引擎,,并提供基于 Web 的網(wǎng)頁和文檔的檢索??蛇x擇文檔類型,、文件夾以及文件名進(jìn)行檢索,。 SearchBlox 是一個企業(yè)搜索解決方案,,基于 Lucene 構(gòu)建,。可進(jìn)行快速發(fā)布,、輕松管理以及支持云環(huán)境,。這是與 Google Mini 最接近的一款搜索產(chǎn)品。 Apache Solr 是一個開源的搜索服務(wù)器,。Solr 使用 Java 語言開發(fā),主要基于 HTTP 和 Apache Lucene 實現(xiàn),。Apache Solr 中存儲的資源是以 Document 為對象進(jìn)行存儲的,。每個文檔由一系列的 Field 構(gòu)成,每個 Field 表示資源的一個屬性,。Solr 中的每個 Document 需要有能唯一標(biāo)識其自身的屬性,,默認(rèn)情況下這個屬性的名字是 id,在 Schema 配置文件中使用: Solr是一個高性能,,采用Java5開發(fā),基于Lucene的全文搜索服務(wù)器,。文檔通過Http利用XML加到一個搜索集合中,。查詢該集合也是通過 http收到一個XML/JSON響應(yīng)來實現(xiàn)。它的主要特性包括:高效,、靈活的緩存功能,,垂直搜索功能,高亮顯示搜索結(jié)果,,通過索引復(fù)制來提高可用性,,提 供一套強(qiáng)大Data Schema來定義字段,類型和設(shè)置文本分析,,提供基于Web的管理界面等,。 Sphinx是一個基于SQL的全文檢索引擎,,可以結(jié)合MySQL,PostgreSQL做全文搜索,,它可以提供比數(shù)據(jù)庫本身更專業(yè)的搜索功能,使得應(yīng)用程序更容易實現(xiàn)專業(yè)化的全文檢索,。Sphinx特別為一些腳本語言設(shè)計搜索API接口,,如PHP,Python,Perl,Ruby等,同時為MySQL也設(shè)計了一個存儲引擎插件。 Sphinx 單一索引最大可包含1億條記錄,,在1千萬條記錄情況下的查詢速度為0.x秒(毫秒級),。Sphinx創(chuàng)建索引的速度為:創(chuàng)建100萬條記錄的索引只需 3~4分鐘,創(chuàng)建1000萬條記錄的索引可以在50分鐘內(nèi)完成,,而只包含最新10萬條記錄的增量索引,,重建一次只需幾十秒。 5,、Google Search for WordPress 地址: http:///extend/plugins/google-search/ 如果你想使用 Google search API 運(yùn)行更快,,這個WordPress插件提供了API的實現(xiàn)。 wordPress搜索插件還包括:Search API,、Relevanssi、Search Everything,、Search Unleashed 主頁: http://www./ - 是個高性能的開源基于web的搜索引擎,開源許可采用GNU,。 URL: http://www./ - 文本搜索引擎,,基于開源技術(shù)創(chuàng)建,OpenSearchServer是個高性能的軟件,,你可以嵌入到自己的應(yīng)用中,。 URL: http://openfts./ - OpenFTS 是個開源文本搜索引擎,基于PostgreSQL,,提供數(shù)據(jù)在線索引和數(shù)據(jù)庫搜索的相關(guān)性排名,。 關(guān)閉與數(shù)據(jù)庫的集成允許使用元數(shù)據(jù)來限制搜索結(jié)果。 URL: http://www./ – Elastic Search具有非常先進(jìn)的分布式模型,,通過本地JSON,,拓展很多的高級搜索功能,所有都是通過JSON層顯示,。 更多見:http://www.oschina.net/project/tag/130/search-engine 原文:http://blog./2011/05/29/open-source-search-engines/
本文轉(zhuǎn)載自: 企業(yè)搜索解決方案 Constellio
(本站只作轉(zhuǎn)載,不代表本站同意文中觀點或證實文中信息) |
|