本文來(lái)自微信公眾號(hào):集智俱樂(lè)部(ID:swarma_org),,作者:郭瑞東,編輯:鄧一雪,,原文標(biāo)題:《吾與AI孰智慧,?PNAS刊文提出AI回答智商測(cè)試的五種策略》 前言: 在智力測(cè)試中,,與視覺(jué)相關(guān)的題目很常見(jiàn),。然而通過(guò)訓(xùn)練一個(gè)智能agent來(lái)解答這類(lèi)問(wèn)題,依然困難重,。一篇發(fā)表于《美國(guó)國(guó)家科學(xué)院院刊》(PNAS)的最新論文,,在統(tǒng)一的框架下,對(duì)如何使用AI解決視覺(jué)類(lèi)謎題給出了五條策略,,并討論了人工智能與認(rèn)知科學(xué)的相互啟發(fā),。 智力測(cè)驗(yàn)必考的圖形推理問(wèn)題 看圖找不同,看圖找相似,,看圖找規(guī)律補(bǔ)全……這類(lèi)問(wèn)題被稱(chēng)為圖形推理問(wèn)題,。因?yàn)閳D形推理問(wèn)題需要測(cè)試者從情境中提取并理解信息,所以它既是一種人類(lèi)智力測(cè)驗(yàn)的問(wèn)題,,也是小學(xué)考試題的??汀?/p> 圖1:經(jīng)典的圖形推理測(cè)試——Raven 如圖所示的問(wèn)題叫做 Raven 測(cè)試,,是很經(jīng)典的一種智力測(cè)驗(yàn)題目,。甚至不用任何文字說(shuō)明,就大概就能猜出來(lái)接下來(lái)要干什么——根據(jù)已知圖片找尋規(guī)律,進(jìn)而從多個(gè)選項(xiàng)中,,挑出空缺的圖片,。 即使是對(duì)第一次接觸這類(lèi)題目的人而言,這類(lèi)測(cè)試也很簡(jiǎn)單,。 這是因?yàn)槿祟?lèi)能夠?qū)σ曈X(jué)符號(hào)進(jìn)行抽象,,并將提取的特征儲(chǔ)存在工作記憶中。然而這樣的問(wèn)題,,對(duì)已有的智能體(agent)來(lái)說(shuō),,由于其目前仍依賴(lài)于模式識(shí)別進(jìn)行推理,進(jìn)而無(wú)法在第一次接觸這類(lèi)題目時(shí)就給出解答,。 為什么需要AI嘗試解決 Raven 測(cè)試,? 對(duì) Raven 等圖形推理問(wèn)題的研究早已有之,但往往依賴(lài)于設(shè)計(jì)良好的程序和背景知識(shí),。 最早期的工作,,用邏輯式編程語(yǔ)言(如 Lisp),將該圖像推理問(wèn)題經(jīng)由手工編寫(xiě)的程序,,轉(zhuǎn)換成命題表示(如屬性值對(duì)列表),,然后再解決對(duì)應(yīng)的邏輯問(wèn)題。該過(guò)程用不到機(jī)器學(xué)習(xí),。其中的代表是上世紀(jì)60年代的 ANALOGY,。跟人相比差距較大,人類(lèi)在不經(jīng)受任何事先訓(xùn)練的前提下,,就可以輕松回答 Raven 問(wèn)題,。 第二代針對(duì) Raven 測(cè)試問(wèn)題的程序,仍然是基于知識(shí)的,,包括旋轉(zhuǎn),、圖像合成、視覺(jué)相似性等,。程序可以直接訪問(wèn)和操縱題干圖像,,甚至在推理過(guò)程中經(jīng)常產(chǎn)生新的圖像。 而第三代解決 Raven 測(cè)試問(wèn)題的程序,,則是通過(guò)對(duì)大量實(shí)例問(wèn)題的輸入輸出對(duì)進(jìn)行訓(xùn)練,,以學(xué)到視覺(jué)空間域知識(shí)的綜合表示與問(wèn)題作為解決策略。 類(lèi)似 Raven 這樣的難題之所以重要,,是因?yàn)槠渥鳛橹橇y(cè)試,,考察了人類(lèi)認(rèn)知中最基礎(chǔ)的能力——從復(fù)雜情境中提取和理解信息。 目前 Raven 測(cè)試的難度范圍跨越很大,,針對(duì)孩子或成人的都有,。如果智能體能夠在這類(lèi)問(wèn)題解決上取得突破,,那么其方法就有可能應(yīng)用到更廣泛的問(wèn)題解答中。 怎樣用智能主體解決圖形推理問(wèn)題,? 一個(gè)框架與五種策略 研究者在論文中給出了一個(gè)通用框架,,從輸入問(wèn)題到形成解決方案。 圖2:解決視覺(jué)謎題的智能體所需的算法框架 在該算法框架中,,首先是定義問(wèn)題,,即將問(wèn)題中的視覺(jué)元素抹去。其次通過(guò)問(wèn)題模板,,將原始問(wèn)題變?yōu)檫壿媶?wèn)題,。這一步類(lèi)似于將國(guó)際象棋的棋盤(pán)圖像,變轉(zhuǎn)化成抽象的棋局形勢(shì),。而圖中的領(lǐng)域知識(shí),,則是基于諸如對(duì)稱(chēng)性、順序幾何圖案,、行和列等,,為解決給定類(lèi)型問(wèn)題所需的知識(shí)或概念。而在備選答案中進(jìn)行選擇的模塊,,則是根據(jù)多種指標(biāo),,從多個(gè)可能的答案中挑出最優(yōu)的那一個(gè)。 在上述框架中,,最重要的是位于中間的部分,,即根據(jù)領(lǐng)域知識(shí)和抽象后的問(wèn)題,找出解決策略的步驟,。這也是接下來(lái)的五種策略所要討論的,。 圖3:解決 Raven 問(wèn)題的五種策略 策略一,構(gòu)建搜索(圖3-A),。利用圖中完全已知的第一行中的元素,,尋找能夠解釋圖中規(guī)律的轉(zhuǎn)變方式,。之后再尋找所有的回答中,,哪一個(gè)適用于這樣的規(guī)律,由此解決問(wèn)題,。 策略二,,反應(yīng)排除(圖3-B)。和第一種策略類(lèi)似,,先是根據(jù)第一行的元素尋找規(guī)律,,之后逐個(gè)將可能的回答帶入,尋找規(guī)律,,通過(guò)判定第一行和第二行的規(guī)律是否相似,,排除錯(cuò)誤答案,,得出正確回答。構(gòu)建搜索與反應(yīng)排除這兩種解法,,都是基于局部特征與分析的進(jìn)行的,。 圖5:全局搜索策略示意,通過(guò)編碼器生成Raven測(cè)試的答案 策略三:全局搜索(圖3-C),。如果將視覺(jué)謎題當(dāng)成一塊缺失的圖片,,利用對(duì)抗神經(jīng)網(wǎng)絡(luò),使用不完全的圖片訓(xùn)練編碼器對(duì)圖像進(jìn)行壓縮,,之后再通過(guò)解碼器解壓圖像,。據(jù)此可以從不完全的圖像中,彌補(bǔ)缺失的部分,。最后對(duì)比所有選項(xiàng)中,,哪一個(gè)圖像最類(lèi)似解碼器的生成圖像來(lái)導(dǎo)出答案。 策略四:格式塔排除(圖3-D),?;谝讯x的格式塔評(píng)估矩陣(如圖像之間是否具有恒常性、組織性,、對(duì)稱(chēng)性與連貫性),,將每一種可能的解一一帶入,根據(jù)哪一種解的得分最高,,確定哪種解正確,。 第五種策略,則是將一個(gè) Raven 問(wèn)題轉(zhuǎn)換為多個(gè),,之后逐個(gè)解決,。其次再將每個(gè)問(wèn)題子問(wèn)題的解拼裝起來(lái),求得原始 Raven 問(wèn)題的答案,。 以上的五種策略,,可以看成智能體學(xué)習(xí)到如何將視覺(jué)元素在空間內(nèi)形成規(guī)律這個(gè)問(wèn)題上的領(lǐng)域知識(shí)(domain knowledge)。前兩種是學(xué)習(xí)如何在每個(gè)元素間進(jìn)行轉(zhuǎn)換,,其后兩種是如何學(xué)到全局的格式塔規(guī)則,。 圖6:格式塔規(guī)則示例 格式塔規(guī)則指的是示例左邊的圓形和長(zhǎng)方形都是不完全的,但人類(lèi)能夠很自然地認(rèn)出這是圓形或長(zhǎng)方形,,如圖6所示,。而圖右側(cè)的鑰匙圖像,即便因覆蓋而實(shí)際上分為兩節(jié),,但人類(lèi)仍會(huì)認(rèn)為圖像是兩個(gè)完整的鑰匙,。 至于第五種解決問(wèn)題的策略,則是問(wèn)題拆分后多種問(wèn)題的組合,,屬于多主體建模,。在該文作者提出的框架中,,還包括抽象問(wèn)題定義,以及從多種解法中選擇最合適的模塊,。這些都是利用復(fù)雜系統(tǒng)的視角,,來(lái)解決AI領(lǐng)域的問(wèn)題。 認(rèn)知科學(xué)與AI智力檢測(cè) 該文論述了為何 Raven 問(wèn)題對(duì)人工智能的發(fā)展很重要,,提出了一個(gè)解決該類(lèi)問(wèn)題對(duì)的框架,,同時(shí)對(duì)如何解決這樣的問(wèn)題,以及這類(lèi)問(wèn)題可以以何種方式依賴(lài)于從數(shù)據(jù)領(lǐng)域知識(shí)與問(wèn)題定義來(lái)自動(dòng)解決,,而不必人工編寫(xiě)解答程序等方面提出了暢想,。 認(rèn)知科學(xué)關(guān)心當(dāng)人看到圖像時(shí),頭腦中會(huì)進(jìn)行哪些計(jì)算,。目前的AI研究無(wú)法直接回答,,因此作者把這一問(wèn)題轉(zhuǎn)化為——如果智能主體,能夠基于視覺(jué)圖像進(jìn)行知識(shí)表示和推理操作,,那么有哪些潛在的問(wèn)題解決方式,?這是對(duì)“何為智能”的追問(wèn)。 針對(duì)人類(lèi)兒童的研究表明,,兒童通過(guò)兩類(lèi)策略來(lái)學(xué)習(xí)解決范圍不斷擴(kuò)大的問(wèn)題:第一類(lèi)是“策略發(fā)現(xiàn)” ,,即針對(duì)特定問(wèn)題或任務(wù)發(fā)現(xiàn)新策略;第二類(lèi)是“策略概括” ,,即針對(duì)其他問(wèn)題或任務(wù)調(diào)整已知的策略,。而本文提出 AI 解決 Raven 問(wèn)題的若干種策略,也可以概括為上述的人類(lèi)學(xué)習(xí)策略的組合,。 人工智能的發(fā)展,,需要對(duì)何為智能這一問(wèn)題有更深刻的認(rèn)識(shí),并且與認(rèn)知科學(xué)結(jié)合,。 本文來(lái)自微信公眾號(hào):集智俱樂(lè)部(ID:swarma_org),,作者:郭瑞東,編輯:鄧一雪 |
|
來(lái)自: 昵稱(chēng)535749 > 《IT業(yè)與人工智能》