自然語言搜索又來了
在網上混了10年,“自然語言搜索”這個炒作專用詞,,早就讓人麻木,。從Excite,到Ask Jeeves,,到Accoona,,再到最近嚷嚷得很大聲的Powerset,畫餅一張摞一張,,自然語言搜索從來沒真正實現過,。資深搜索引擎觀察家Danny Sullivan說,自然語言搜索總能引起兩類人關注:完全不懂搜索的人或從來沒聽說過自然語言這一咒語的人,。鼓噪者通常會這么做:
Powerset當然不例外,,它先告訴你,,現有的搜索引擎根本無法區(qū)分“為孩子寫的書”、“孩子寫的書”和“有關孩子的書”("book for children", "book by children", and "book about children")之間的區(qū)別,。該公司CEO Barney Pell在自己的blog上很有力地批判了現有搜索引擎的“壞”,,當然也順便謳歌了自然語言搜索的“好”。 Powerset的炒作不限于此,,他們還握有大量吸引眼球的武器,。比如,Powerset正在秘密研發(fā),,其目標是打敗Google,,改變搜索產業(yè)的內核,他們已經拿到了1000萬美元投資,,他們的投資者中有Esther Dyson這樣的如雷貫耳的名字…… 我并非完全不信任自然語言搜索,,我只是不相信“革命”這種東西的有效性,。基于關鍵詞的搜索技術的確不完美,,但這種技術卻是迄今為止最有效,、成本最低的信息查詢方式。輸入幾個關鍵詞,,回車,,結果就列在那兒了。Sullivan把這種搜索用戶的行為模式稱之為“搜索的DOS”(DOS Of Search),,它已經成為人機對話的一種基本模式,。輸入一個長長的句子,或者在顯示結果之前先要從一長排列表中選取某個范圍,,顯然違反了用戶的行為習慣,。 而且我不相信,讓用戶輸入一個語句,,搜索引擎就能更好地理解用戶的意圖,。對搜索結果來說,語鏡很重要,。但一個句子相比幾個關鍵詞,,恐怕并不能提供一個更好的語鏡。如果是為了更好地理解用戶意圖,,干嗎不讓用戶就其想搜索的內容寫一篇論文呢,?為了讓用戶輸入更多的內容,搜索框是不是該改成一個大大的文本框呢,? Sullivan說得好,,Google打敗它之前的搜索引擎,靠的是改變機器一端,,而不是改變用戶一端,。Google只是讓搜索結果變得更有用,而沒有試圖改變用戶的搜索行為本身,。 而且,,自然語言搜索在某種意義上,就像機器翻譯一樣,,需要改變一個算法打天下的思路,。當你有了大量的已索引數據和用戶行為數據,基于對這些數據的統(tǒng)計,、歸納,、分析,你就能更好地理解用戶的搜索意圖。所以,,即使就自然語言搜索本身來說,,我也認為,優(yōu)勢在Google一邊,,而不是Powerset一邊,。 我猜想,Powerset可能確實有它的獨門絕技,,但VC投資它,,肯定不會是指望出現另一個Google。更大的可能,,是作為對現有搜索引擎的一種補充,,它有可能被GYM中的某個大頭收購。不過,,Powerset產品還沒拿出來,,就先炒,很有可能適得其反,。 |
|
來自: 蜀中流氓 > 《互聯(lián)網》