01 今天來讀一本書,,書名是:《為什么偉大不能被計劃》。這本書最近很火爆,,跟兩位作者的身份有關,。肯尼斯·斯坦利(Kenneth Stanley)和喬爾·雷曼(Joel Lehman)都是人工智能專家,,都有在OpenAI的工作經(jīng)驗,。 對,OpenAI就是研發(fā)出ChatGPT的那家公司,。ChatGPT是一個令人激動的革命性技術(shù)創(chuàng)新,。蒸汽機的出現(xiàn)標志著工業(yè)革命的到來,而ChatGPT則標志著人工智能革命的到來,。在技術(shù)演進的歷史中,,ChatGPT有著和蒸汽機一樣的里程碑意義。更有意思的是,,這項技術(shù)創(chuàng)新更多的是源自研發(fā)人員的興趣,,而非對商業(yè)利益的追逐。這項技術(shù)創(chuàng)新是由一群游俠,,而不是正規(guī)軍和大部隊實現(xiàn)的,。在這個過程中,OpenAI的團隊摸索出了一套獨特的方法論,。本書就是基于兩位作者在研究AI算法中的一項創(chuàng)新而獲得的頓悟,,從中推演出了一套新的實踐指南,。 02 這是一個顛覆性的建議。 常規(guī)的打法總是在約束條件下求目標函數(shù)最大化,。也就是說,,想要取得成就,,總要先有目標,,然后,行動方案就要圍繞著這個目標而定,。本書的觀點是:目標會誤導你,。越是偉大的目標越容易有誤導性。沒有目標比有目標更容易實現(xiàn)目標,。 為什么會是這樣呢,?我們先講個故事,看看從中能有什么啟發(fā),。 假設有兩個探索隊,。一支探險隊有著明確的目標,他們要到山的另外一側(cè),,比如說山的北面,,去尋找傳說中的金礦。因為目標明確,,他們就會嘗試用各種不同的辦法越過這座山,。一條路不通,再退回來找另外的路,。每一次,,他們都會先看看指南針,確定好方向,,堅定地朝北走,。 另一支探險隊更像出門旅游。他們一邊走一邊欣賞風景,。他們會在湖邊露營,,用地質(zhì)錘敲打路上遇見的巖石。他們會對河流的方向,、風的方向感興趣,。看到一條路,,他們可能就會順著這條路走,,哪怕這條路是朝南走的,因為他們總想看看這條路到底通向何方,。 最終會有收獲的可能未必是第一支探險隊,,而是第二支探險隊,。或許,,越過山峰的路可能是要先朝南走,,再朝東走,迂回包抄,。也可能,,第二支探險隊會在南邊找到了更大的金礦。又或許,,他們出發(fā)的時候是想找金礦,,最后找到了一處石油礦。又或者,,他們找到了一處美麗的風景,,找到了“優(yōu)勝美地”,可以做國家公園,。 這當然只是個假想的故事,。不過,人工智能科學家在實驗室里做過相似的實驗,。他們把機器人放進迷宮,,讓機器人在迷宮中摸索。一種指令是目標導向,,告訴機器人必須找到迷宮的出口,;另一種指令是新奇性搜索,鼓勵機器人在迷宮里瞎轉(zhuǎn),。結(jié)果,,在重復40次的新奇性搜索迷宮實驗中,機器人在39次實驗中找到了出口,;而在重復40次基于目標的迷宮實驗中,,機器人只成功了3次。 03 這背后的底層邏輯是啥,? 創(chuàng)新就是發(fā)現(xiàn),,這是一個隨機的探索過程。你不可能預測技術(shù)的演進路徑,。比如,,現(xiàn)代內(nèi)燃機的前身是感應線圈,但其最初不是以制造發(fā)動機為目的的,。當內(nèi)燃機剛剛出現(xiàn)的時候,,還沒有飛機,也不會有人想到要把內(nèi)燃機應用到飛機上。從感應線圈到內(nèi)燃機再到飛機,,整個創(chuàng)新鏈條上,,每一個環(huán)節(jié)的發(fā)明者都沒有想到下一個環(huán)節(jié)會是啥。 這就意味著,,過程比目的更重要,,比起到達終點,路上的風景更值得關注,。在發(fā)現(xiàn)的過程中,,我們會遇到很多新奇的現(xiàn)象,這些新奇的現(xiàn)象似乎和最終的目標沒有什么關系,,其實卻是奠定技術(shù)創(chuàng)新的墊腳石,。沒有這些墊腳石,我們就無法往前走,。所以,在探索的過程中,,應該注意找到更多的墊腳石,,這些墊腳石預示著更多的可能性。 偉大的創(chuàng)新不是被計劃出來的,,而是來自誤打誤撞,。比如說,在研發(fā)飛機的過程中,,在當時看來最有可能成功的不是萊特兄弟,,而是塞繆爾·皮爾龐特·蘭利(Samuel Pierpont Langley)。蘭利一度獲得了大量的政府資助,,萊特兄弟卻只能自籌資金,,而且錢少得可憐。那為什么萊特兄弟會成功呢,?原因出乎意料,,因為萊特兄弟原來本是自行車制造商。自行車就是通向飛行器的墊腳石,。只有身為自行車制造商的萊特兄弟意識到,,飛行器就是空中的自行車,于是,,機緣巧合,,他們才造出了最早能升空的飛機。 這就是墊腳石的妙處,,你都不可能知道它們能用來干啥,。這也是物種演化的規(guī)律。在進化論里,有個現(xiàn)象叫擴展適應,,說的是生物曾經(jīng)使用過某種功能的結(jié)構(gòu),,在進入一個新的環(huán)境之后,又被用于另一個不同功能的現(xiàn)象,。比如說,,羽毛最初是在恐龍身上進化的,主要功能是為了保持體溫,,后來才逐漸成為適合鳥類飛行的結(jié)構(gòu),。骨骼一開始只是用于儲存供身體其它功能所需要的礦物質(zhì),后來才進化成為人體的支撐性結(jié)構(gòu),。 這給我們的啟發(fā)是,,要把自己變成一個尋寶者,在積極地追求實現(xiàn)某個特定目標時,,我們要做的是盡可能保留多塊備選的墊腳石,,以確保實現(xiàn)目標的成功率。尋寶者可以說是秉持著機會主義的探險家,,他們致力于尋找任何有價值的東西,,而不在乎這些東西具體是啥。 04 你可能會問,,這跟人工智能又有什么關系呢,? OpenAI團隊曾經(jīng)建過一個叫圖片孵化器的網(wǎng)站。圖片網(wǎng)站上的圖片就像動物一樣能夠繁衍出和“父母一代”略有不同的“孩子”,。研究人工智能的科學家找到了一種方法,,為存儲在計算機內(nèi)部的圖片創(chuàng)造了一種人工DNA,然后再將這些圖片的基因像動物那樣整合在一起,。大概是這樣一個過程:屏幕上顯示出一組圖片,,比如同時顯示10張或20張圖片,然后,,用戶點擊自己喜歡的圖片,。這些圖片就成為下一代圖片的父母。然后,,屏幕上再顯示一組新的圖片,,用戶繼續(xù)點擊自己喜歡的圖片,以此類推,,直到最后用戶找到了自己最滿意的圖片,。 實驗表明,用戶培育出的令他們最滿意的圖片往往并非他們最初設定的目標,。以進化出一張?zhí)囟▓D片為目標去繁育圖片,,其實是一個糟糕的想法。在實驗的過程中,你會發(fā)現(xiàn),,一張外星人臉的圖片,,最終會變成汽車的圖片。最終的圖片很少與作為墊腳石的圖片相似,。網(wǎng)站上最成功的用戶是沒有設定目標的那些人,。 由此,兩位作者提出了一種新的AI算法,,叫新奇性搜索,。這個算法會隨機生成一組解決方案,評估新奇性,,保留新奇性比較高的方案,,循環(huán)往復,直到將問題徹底解決,。換言之,,這種算法的標準是:只問新不新,不問好不好,。 05 那么,,為什么目標會誤導我們呢? 因為通向最終目標的道路往往是曲折的,,是需要在各個不同的方向上探索的,那就需要給予探索者更多的主動性,,而且,,要求探索者對新奇事物更為敏感,心態(tài)更為開放,。一旦想要通過設定目標來完成任務,,往往就會帶來意想不到的扭曲。 比如,,印度受英國殖民統(tǒng)治時期,,英國政府為了消滅毒蛇,出臺了一項政策:每上交一條死蛇就能領取一筆報酬,。但這項措施并沒有達到預期的效果,,反而導致印度人為了獲得賞金爭相飼養(yǎng)眼鏡蛇,然后殺死他們牟利,。最終,,毒蛇的數(shù)量反而增加了。還有,,考古學家為工人發(fā)現(xiàn)的每塊恐龍骨碎片支付報酬,,會導致工人選擇砸碎整個骨頭獲取更多的獎賞;企業(yè)為了提高企業(yè)收益,給高管支付獎金,,會導致帶來長期隱患的短期逐利行為,。 兩位作者指出,目標越是高大上,,越容易帶來誤導,。若想實現(xiàn)豐功偉業(yè),目標往往會成為絆腳石,。 正確的辦法是:扔掉絆腳石,,去找墊腳石。 和我一起,,尋找中國經(jīng)濟新趨勢 |
|
來自: 中山春天奏鳴曲 > 《個人管理丶自我修養(yǎng)》