知識工程學(xué):一個(gè)新的重要研究領(lǐng)域
黃榮懷 (北京師范大學(xué)網(wǎng)絡(luò)教育實(shí)驗(yàn)室 100875) 李茂國 (教育部高等教育司100816) 沙景榮 (北京師范大學(xué)網(wǎng)絡(luò)教育實(shí)驗(yàn)室 100875)
摘要 知識工程是源于專家系統(tǒng)建造而形成的一個(gè)研究領(lǐng)域,目前已經(jīng)成為一個(gè)跨學(xué)科的綜合學(xué)科,。本文簡要介紹了知識工程的概念,,分析了知識工程主要研究領(lǐng)域,如軟計(jì)算,、Agent,、自然語言理解、邏輯與推理,、形象思維研究,、基于事例的推理、機(jī)器學(xué)習(xí),、知識本體論等的主要進(jìn)展及存在的問題,。最后提出廣義的知識工程學(xué)是“一門研究人類智能及人類知識的機(jī)理,以及如何用機(jī)器模擬人的智能并促進(jìn)人類知識發(fā)展的學(xué)科”,,也可以且應(yīng)該作為教育技術(shù)學(xué)的一個(gè)重要研究方向,。 關(guān)鍵詞 知識工程 人工智能 教育技術(shù) 專家系統(tǒng) 一,、知識工程概述1977年第五屆國際人工智能聯(lián)合會議上,美國斯坦福大學(xué)(Stanford University)計(jì)算機(jī)系教授費(fèi)哥巴姆(Feigenbaum)作了關(guān)于“人工智能的藝術(shù)”(The Art of Artificial Intelligence)的講演,,提出“知識工程”這一名稱,,指出“知識工程是應(yīng)用人工智能的原理與方法,對那些需要專家知識才能解決的應(yīng)用難題提供求解的手段,。恰當(dāng)?shù)剡\(yùn)用專家知識的獲取,、表達(dá)和推理過程的構(gòu)成與解釋,是設(shè)計(jì)基于知識的系統(tǒng)的重要技術(shù)問題”[1],。 知識工程的發(fā)展從時(shí)間上劃分大體上經(jīng)歷了3個(gè)時(shí)期: 1. 大約從1965至1974年為實(shí)驗(yàn)性系統(tǒng)時(shí)期,。1965年費(fèi)哥巴姆教授與其它科學(xué)家合作,研制出DENDRAL專家系統(tǒng),。這是一種推斷分子結(jié)構(gòu)的計(jì)算機(jī)程序,,該系統(tǒng)貯存有非常豐富的化學(xué)知識,它所解決問題的能力達(dá)到專家水平,,甚至在某些方面超過同行專家的能力,,其中包括它的設(shè)計(jì)者,。DENDRAL系統(tǒng)標(biāo)志著“專家系統(tǒng)”的誕生,。 2. 從1975至1980年為MYCIN時(shí)期。70年代中期MYCIN專家系統(tǒng)研制成功,,這是一種用醫(yī)學(xué)診斷與治療感染性疾病計(jì)算機(jī)程序的“專家系統(tǒng)”,。MYCIN專家系統(tǒng)是規(guī)范性計(jì)算機(jī)專家系統(tǒng)的代表,許多其它專家系統(tǒng)都是在MYCIN專家系統(tǒng)的基礎(chǔ)上研制而成的,。MYCIN系統(tǒng)不但具有較高的性能,,而且具有解釋功能和知識獲取功能,可以用英語與用戶對話,,回答用戶提出的問題,,還可以在專家指導(dǎo)下學(xué)習(xí)醫(yī)療知識,該系統(tǒng)還使用了知識庫的概念和不精確推理技術(shù),。MYCIN系統(tǒng)對計(jì)算機(jī)專家系統(tǒng)的理論和實(shí)踐,,都有較大的貢獻(xiàn)。 3. 1980年以來為知識工程的“產(chǎn)品”在產(chǎn)業(yè)部門開始應(yīng)用的時(shí)期,。知識工程的研究,,目前在美國開展得較為活躍和深入,并且主要集中在斯坦福大學(xué),。 人工智能的研究表明,,專家之所以成為專家,主要在于他們擁有大量的專門知識,,特別是長時(shí)期地從實(shí)踐中總結(jié)和積累的經(jīng)驗(yàn)技能知識,。從知識工程的發(fā)展歷史可以看出,,知識工程是伴隨“專家系統(tǒng)”建造的研究而產(chǎn)生的。實(shí)際上,,知識工程的焦點(diǎn)就是知識,。知識工程領(lǐng)域的主要研究方向主要包含知識獲取、知識表示和推理方法等,,其研究目標(biāo)是挖掘和抽取人類知識,,用一定的形式表現(xiàn)這些知識,使之成為計(jì)算機(jī)可操作的對象,,從而使計(jì)算機(jī)具有人類的一定智能,。 人工智能的研究方向非常廣泛,本文對以下幾個(gè)典型的研究方向作簡要介紹和分析,,以此說明如何使機(jī)器(主要指計(jì)算機(jī))“具有”人類智能所面臨的困難及存在的問題: l 軟計(jì)算:模仿自然法則的計(jì)算方法 l 主體Agent:機(jī)器世界中有“思維”的個(gè)體 l 自然語言理解與機(jī)器翻譯:讓機(jī)器“懂得”人類語言 l 邏輯與推理:機(jī)器的“思維”機(jī)制 l 形象思維研究:讓機(jī)器具有“視覺認(rèn)知” l 基于事例的推理:讓機(jī)器應(yīng)用“經(jīng)驗(yàn)(知識)” l 機(jī)器學(xué)習(xí):讓機(jī)器也能“學(xué)習(xí)” l 知識本體論:認(rèn)識“知識”的本質(zhì) 要讓計(jì)算機(jī)“具有”人類智能,,首先必須了解“人類智能”,“人類智能”離不開“人類知識”,,因此必須研究“人類知識”的機(jī)理,。另一方面,人工智能的最終目的還是為人類服務(wù),,讓人類具有更多的“智能”,,促進(jìn)人類知識的發(fā)展,因此需要從教育,、心理,、傳播、社會,、經(jīng)濟(jì)等不同的角度和維度來研究有關(guān)人類知識的問題,。所以,筆者認(rèn)為需要提出一個(gè)廣義的知識工程學(xué)的概念,,它是“一門研究人類智能及人類知識的機(jī)理,,以及如何用機(jī)器模擬人的智能并促進(jìn)人類知識發(fā)展的學(xué)科”。 教育技術(shù)學(xué)作為一門涉及教育,、心理,、傳播、信息科學(xué)等的綜合性交叉學(xué)科,,它不僅要研究教育中的“技術(shù)”問題,,而且要利用其研究主體的特殊知識背景來研究知識發(fā)現(xiàn)、知識處理,、知識傳播,、知識擴(kuò)散等問題。因此,,教育技術(shù)學(xué)作為一個(gè)聯(lián)結(jié)教育,、心理,、傳播、信息科學(xué)等學(xué)科的重要紐帶,,也可以且應(yīng)該把(廣義的)知識工程作為其一個(gè)重要的研究方向,。 二、關(guān)于智能計(jì)算凡是仿照自然法則構(gòu)造的計(jì)算,,均可稱為智能計(jì)算(Computational intelligence),,有時(shí)也稱為軟計(jì)算(Soft computing)。它主要包括三個(gè)內(nèi)容:模仿人類處理方式引入的模糊計(jì)算(Fuzzy computing),、依據(jù)生物神經(jīng)網(wǎng)絡(luò)的工作規(guī)則引入的神經(jīng)計(jì)算(Neural computing)和模仿生物界的“優(yōu)勝劣汰”法則的遺傳算法和進(jìn)化計(jì)算(Evolution computing),。 人工神經(jīng)網(wǎng)絡(luò)是模仿人類大腦的某些工作機(jī)制的一類計(jì)算模型。它始于1943年美國學(xué)者McCulloch和Pitts首先提出的一種神經(jīng)元的數(shù)學(xué)模型,,即M-P模型,。在20世紀(jì)40、50年代形成了第一次高潮,。由于理論及技術(shù)兩方面的限制,,60、70年代進(jìn)入第一個(gè)低潮,。到80年代中期,,由于理論研究的進(jìn)展,特別是有效學(xué)習(xí)算法(即下面要談到的機(jī)器學(xué)習(xí))的提出,,如BP算法等,,神經(jīng)網(wǎng)絡(luò)研究開始復(fù)蘇,,出現(xiàn)了第二次高潮,。到目前,第二次浪潮似乎已經(jīng)退去,。神經(jīng)網(wǎng)絡(luò)在模式識別方面有一些成功的應(yīng)用,,包括用于分類、識別或優(yōu)化計(jì)算等,。 遺傳算法是模擬自然界中按“優(yōu)勝劣汰”法則進(jìn)行進(jìn)化過程而設(shè)計(jì)的算法,。Bagley和Rosengerg于1967年在他們的博士論文中首先提出了遺傳算法的概念。1975年Holland出版的專著奠定了遺傳算法的理論基礎(chǔ),。如今遺傳算法不但給出了清晰的算法描述,,而且也建立了一些定量分析的結(jié)果,在眾多領(lǐng)域得到了廣泛的應(yīng)用,,如用于控制(煤氣管道的控制),、規(guī)劃(生產(chǎn)任務(wù)規(guī)劃)、設(shè)計(jì)(通信網(wǎng)絡(luò)設(shè)計(jì)),、組合優(yōu)化(TSP問題,、背包問題)以及圖像處理和信號處理等,。 對于軟計(jì)算問題,目前主要的問題是算法的“可擴(kuò)展性”和“可理解性”問題,,即所給的算法對處理海量的數(shù)據(jù)是否有效,,以及由所給的算法得來的規(guī)則,對人來說是否容易理解,。 三,、關(guān)于主體AgentAgent是Minsky在1986年出版的《思維的社會》一書中提出的,認(rèn)為社會中的某些個(gè)體經(jīng)過協(xié)商之后可求得問題的解,,這些個(gè)體就是Agent,。Agent應(yīng)具有自主性、社會交互性,、反應(yīng)能力和預(yù)動(dòng)能力,,能通過感知環(huán)境而做出動(dòng)作。從Agent模型來看,,有思考型Agent(如BDI表示和推理),、反映型Agent(不會推理,直接由感知到動(dòng)作)和兩者混合型,。 Agent理論最初是作為一種分布式智能模型被提出的,,其研究方法有邏輯方法與經(jīng)濟(jì)學(xué)方法兩種。對Agent思維狀態(tài)的直觀描述涉及信念,、愿望,、目標(biāo)、意圖,、承諾,、規(guī)劃等概念。 l 信念,,屬于思維狀態(tài)的認(rèn)知方面,,描述了Agent對當(dāng)前世界狀況以及為達(dá)到某種效果可能采取的行為路線的估計(jì)。 l 愿望,,屬于思維狀態(tài)的感情方面,,描述了Agent對未來世界狀況以及可能采取的行為路線的喜好。 l 目標(biāo),,描述Agent的追求,,實(shí)際是Agent從愿望中選擇的子集。 l 意圖,,引導(dǎo)并監(jiān)督Agent的動(dòng)作,,屬于思維狀態(tài)的意向方面。 l 承諾,描述Agent對于所追求的意圖的堅(jiān)持程度,,并控制對意圖的重新考慮,,實(shí)際表示從目標(biāo)到意圖的轉(zhuǎn)換。 l 規(guī)劃,,把意圖按特定結(jié)構(gòu)組合為規(guī)劃,,它在意圖系統(tǒng)的實(shí)現(xiàn)中起重要作用。 關(guān)于Agent理論的地位仍有爭議,,有的認(rèn)為Agent理論用于具體實(shí)現(xiàn)Agent,,有的認(rèn)為Agent理論是用于知識表示方面的,還有的認(rèn)為Agent理論應(yīng)是對認(rèn)知科學(xué)和哲學(xué)中一些概念的形式化,。目前Agent的成功案例包括有產(chǎn)品拍賣,、軍事演習(xí)與機(jī)器人足球賽等。 四,、關(guān)于自然語言理解與機(jī)器翻譯自然語言理解的研究起始于機(jī)器翻譯,。早在1946年,英國的A. Donald Booth和美國的W. Weaver就開始了機(jī)器翻譯方面的研究,。經(jīng)過50多年的研究,,出現(xiàn)了許多的理論與方法,如基于對話的,、實(shí)例的,、知識的、詞匯的,、神經(jīng)網(wǎng)絡(luò)的,、原則的、規(guī)則的,、統(tǒng)計(jì)(或語料庫)的等機(jī)器翻譯方法,。但并不像市場上機(jī)器翻譯產(chǎn)品宣傳廣告講的那么成功,就是國際上研究時(shí)間最長,、最好的SYSTRAN系統(tǒng),,在英法機(jī)器翻譯過程中,1993年,,對開放文本,達(dá)到流暢程度的譯準(zhǔn)率只有54%,,一般還可以用的譯準(zhǔn)率達(dá)到74.3%,。可以想象,,英法這兩個(gè)同語系的語言的翻譯水平就僅如此,,那么不同語系的漢外翻譯(如漢語譯成英語),要困難得多。現(xiàn)今的機(jī)器翻譯還只能翻譯那些能想到的日常句子,,即教科書句子,。 信息檢索也是一個(gè)非常熱門的研究與開發(fā)領(lǐng)域,包括文本分類,、文本主題識別,、文本檢索與自然語言檢索、文本過濾,、文本摘要,、文本安排、文本信息獲取,、文本自動(dòng)書寫,、文本挖掘等諸多領(lǐng)域。從網(wǎng)上信息檢索或搜索引擎的情況看,,檢索的基本準(zhǔn)確率只有10%~20%,。 自然語言理解和信息檢索是語言信息研究的兩個(gè)重要部分。自然語言理解的基礎(chǔ)是現(xiàn)代語言學(xué)的研究,。語言學(xué)既是一個(gè)民族的根本,,又是知識的最好表現(xiàn)形式。但我國語言學(xué)的研究狀況并不樂觀,,比如在漢語里面,,到底應(yīng)該分成多少詞性,語言學(xué)界爭論不休,,至今沒有一個(gè)定論,。另外像漢語的基本句型、漢語的語義分類,、漢語帶詞性標(biāo)注語料庫等一系列基礎(chǔ)性的工作沒有開始或得不到足夠的重視,。 關(guān)于我國語言信息處理研究,基礎(chǔ)研究仍然還是最重要的,,包括提高分詞的精度,,建設(shè)帶詞性、詞法搭配,、句法和語義的國家級語料庫,。關(guān)于研究方法,將更多的采用統(tǒng)計(jì)方法,,特別是將統(tǒng)計(jì)與規(guī)則結(jié)合起來,。一個(gè)總的趨勢是部分分析代替全分析、部分理解代替全理解,,部分翻譯代替全翻譯,。另一個(gè)值得注意的重要研究方向是,隨機(jī)語言模型的建模工作正在由基本的線性詞匯統(tǒng)計(jì)轉(zhuǎn)向結(jié)構(gòu)化的句法領(lǐng)域。根據(jù)語料統(tǒng)計(jì)信息建立一定的優(yōu)先評價(jià)機(jī)制,,對輸入句子的分析結(jié)果進(jìn)行概率計(jì)算,,從而得到概率意義上的最優(yōu)分析結(jié)果。 五,、關(guān)于邏輯與推理一個(gè)數(shù)學(xué)理論通常包括概念的界定,、命題的陳述和定理的證明等三部分。數(shù)學(xué)理論中的概念有基本概念與合成概念之分,?;靖拍钍且恍┎欢x的抽象對象,一個(gè)新的合成概念由若干基本概念或這個(gè)理論中已有的合成概念來定義,。數(shù)學(xué)命題有對錯(cuò)之辯,、真假之分。真命題可分為基本命題與被證明的命題,?;久}是不證自明的命題,稱為公理,,它與人們的直覺與經(jīng)驗(yàn)一致,,被人們所接受。一個(gè)數(shù)學(xué)命題的證明是指從公理和已有的定理出發(fā),,使用邏輯推理規(guī)則,,把命題作為推理規(guī)則的邏輯結(jié)論推導(dǎo)出來。命題是由概念及子命題通過邏輯連接詞連接而成,,及所謂的謂詞邏輯,。以上方法就是所謂的公理化方法,最早來自于歐幾里德的《幾何原本》,,在數(shù)學(xué)理論中普遍采用,,后來又被推廣到力學(xué)、物理學(xué)甚至生物學(xué)等其他自然學(xué)科,。公理化方法實(shí)際是一種整理知識,,特別是數(shù)學(xué)知識的方法。通過許多數(shù)學(xué)家的努力,,用數(shù)理邏輯的語言和方法建立了一套關(guān)于公理系統(tǒng)的理論框架,,這就是所謂的形式化方法。 在人工智能領(lǐng)域中,,在知識表示與推理方面,,僅靠公理化方法和數(shù)理邏輯是不夠的,因此出現(xiàn)了許多新的理論與方法,,包括非經(jīng)典邏輯與開放邏輯等,非經(jīng)典邏輯的典型代表是模態(tài)邏輯。 模態(tài)邏輯(model logic)及其擴(kuò)展(包括時(shí)態(tài)邏輯,、認(rèn)知邏輯,、動(dòng)態(tài)邏輯、表述邏輯和行為邏輯等)已經(jīng)成為更適用于各種應(yīng)用領(lǐng)域的邏輯系統(tǒng),?;镜哪B(tài)邏輯的語言是在經(jīng)典邏輯語言的基礎(chǔ)上,通過引入兩個(gè)模態(tài)算子□(必然算子)和◇(可能算子)得到的,。與經(jīng)典邏輯不同,,模態(tài)邏輯公式的真值不是函數(shù)地依賴于其組成部分的真值。高效的模態(tài)推理方法和推理系統(tǒng)的建立,,是使用模態(tài)邏輯及其擴(kuò)展作為知識表示工具成功與否的關(guān)鍵,。近些年來,模態(tài)推理的研究雖然距離人們的期望還有一定距離,,但也得到了長足的發(fā)展,。如認(rèn)知邏輯已經(jīng)成為一種表示知識與信念的有力工具。表述邏輯是為表示概念和概念層次知識建立起來的邏輯語言,。表述邏輯有效推理方法的研究,,又推動(dòng)了常識問題表述和推理的研究。當(dāng)然,,沒有任何一種模態(tài)推理理論和方法具有通用的高效性,,而且不論是推理理論研究,還是具體的推理技術(shù)研究,,其系統(tǒng)復(fù)雜性都難于定量的分析,。 另一類是開放邏輯,我國的李未院士等在這方面做了大量的工作,。在解決了邏輯推理規(guī)則的可靠性和完全性問題之后,,公理化方法應(yīng)用的成功與否,關(guān)鍵在于如何挑選公理,,使之能夠刻畫問題的本質(zhì),,并使之與人們的認(rèn)識和時(shí)間一致。公理系統(tǒng)的形成是一個(gè)過程,,即公理化進(jìn)程,。他們在數(shù)理邏輯的公理化方法的基礎(chǔ)上,通過引進(jìn)新的概念,,刻畫公理化進(jìn)程的基本特征,,給出了公理化進(jìn)程的理論框架,進(jìn)而在某些特定的條件下給出了它的計(jì)算模型,。引進(jìn)的概念有現(xiàn)論,、新定律與事實(shí)反駁?,F(xiàn)論是指階段性理論或現(xiàn)階段的理論,它揭示了這個(gè)領(lǐng)域現(xiàn)階段知識之間的邏輯關(guān)系,,并使這些知識有清晰的邏輯結(jié)構(gòu),。我們可以將現(xiàn)論看著類似于認(rèn)知心理學(xué)中的“圖示”。隨著時(shí)間的推移,,當(dāng)某些現(xiàn)象不能從現(xiàn)論中得到滿意的解釋時(shí),,人們就不得不修正這個(gè)現(xiàn)論。這時(shí)出現(xiàn)兩種情況:一是人們發(fā)現(xiàn)它是現(xiàn)有理論所沒有涉及過的新現(xiàn)象,,于是概括出新的原理并將它加入到現(xiàn)有理論中去,,稱之為新定律,這個(gè)過程類似于認(rèn)知心理學(xué)中的“同化”,;二是現(xiàn)論所預(yù)言的現(xiàn)象沒有發(fā)生,,或者發(fā)生的是與之相矛盾的現(xiàn)象,即所謂的理論與實(shí)踐不符,,稱為否決性判定試驗(yàn),,或?qū)ΜF(xiàn)有理論的事實(shí)反駁,這個(gè)過程類似于認(rèn)知心理學(xué)中的“順應(yīng)”,。因此,,公理化進(jìn)程是一種典型的關(guān)于知識的整理和認(rèn)識的過程,它類似于一個(gè)人的“認(rèn)知過程”,。 六,、關(guān)于形象思維研究在思維科學(xué)領(lǐng)域,借助于邏輯學(xué),,關(guān)于抽象思維的研究已取得了不少進(jìn)展,,但對形象思維的研究相對薄弱。形象思維的研究主要包括記憶理論和認(rèn)知模型,。Paivio從信息編碼角度將長時(shí)記憶分為兩個(gè)系統(tǒng)——心象系統(tǒng)和言語系統(tǒng),。心象系統(tǒng)以心象代碼來存儲關(guān)于具體的客體和事件的信息;言語系統(tǒng)以言語代碼來存儲言語信息,。Kosslyn于1981年在心理掃描實(shí)驗(yàn)的基礎(chǔ)上提出了心象的計(jì)算理論,。他將心象的表征分為兩層:表層表征和深層表征,前者是指出現(xiàn)在視覺短時(shí)記憶中的類似圖畫的表征,;后者為存儲在長時(shí)記憶中的信息,。Glasgow于1992年在《認(rèn)知科學(xué)》上發(fā)表了一篇題為《可計(jì)算心象》的學(xué)術(shù)論文。她較為系統(tǒng)的闡述了基于心象的問題求解,,并提出了可計(jì)算心象的一種知識表達(dá)框架,,她把心象的表達(dá)分為3層:描述性表達(dá)(長時(shí)記憶)、視覺和空間表達(dá)(工作記憶的兩種形式),,描述性表達(dá)基于命題,,視覺和空間表達(dá)基于嵌套的符號矩陣,,并提出了心象表達(dá)的基于矩陣的形式化理論和基于矩陣的形象處理操作。她的研究工作具有突破性意義,,在人工智能界和認(rèn)知科學(xué)界引起了極大的反響,。 除此以外,,對于心象在計(jì)算機(jī)中的模擬和表征的研究,,還有許多其它的理論與方法:心象的傅立葉模式(認(rèn)為心象在人腦中是以傅立葉變換形式存儲的)、區(qū)域生長法(認(rèn)為心象在人腦中是由一些分割后的區(qū)域來表示的),、紋理表示理論(認(rèn)為心象是通過紋理分析來獲得和加以表征的),、形態(tài)學(xué)理論(認(rèn)為構(gòu)成視覺認(rèn)知基礎(chǔ)的形態(tài)是由更基本的點(diǎn)通過擴(kuò)張、生長,、侵蝕等形成)和形象信息模型(認(rèn)為視覺信息包括三部分:形狀,、色彩、質(zhì)感等視覺心象的性質(zhì),;構(gòu)成,、類比、相鄰等結(jié)構(gòu)信息,;與該心象所聯(lián)系的概念,、所激發(fā)的情感以及該心象所聯(lián)系的聽、嗅,、味,、觸、運(yùn)動(dòng)等其他種類的形象),。以上模型大部分只是一種理論框架或者已經(jīng)有些計(jì)算機(jī)模擬程序,。 七、基于事例的推理CBR方法同人類的日常推理活動(dòng)十分接近,,它來自于人類的認(rèn)知心理活動(dòng):推理者(指以推理方式求解問題的人)在求解一個(gè)新問題時(shí),,往往習(xí)慣于借鑒他(或她)以前對類似問題的處理經(jīng)驗(yàn)。當(dāng)新出現(xiàn)的問題是他以前處理過的問題的簡單重復(fù)時(shí),,他可以把處理舊問題的成功經(jīng)驗(yàn)直接用于求解該新問題,;而當(dāng)新問題是推理者從來沒有遇見過的問題時(shí),他也可以回憶起一個(gè)(或多個(gè))類似的舊問題,,通過類比得到重要的指導(dǎo)或提示,,加之一些規(guī)律性知識作為指導(dǎo),完成對新問題的解決,。當(dāng)然,,處理過的新問題又會被當(dāng)作經(jīng)驗(yàn)記下來,用以處理以后的問題,。 與傳統(tǒng)的基于規(guī)則的問題求解方法相比較,,CBR具有一些重要的優(yōu)點(diǎn),。CBR系統(tǒng)易于獲取知識,避免了傳統(tǒng)知識系統(tǒng)進(jìn)行知識獲取時(shí)的瓶頸問題,。知識庫的維護(hù)方便,,不需要領(lǐng)域?qū)<腋深A(yù)。CBR方法擴(kuò)大了解決問題的范圍,,可以得出創(chuàng)新的解答,,同時(shí)簡化了求解過程,節(jié)省了問題求解時(shí)間,,解的質(zhì)量也得到提高,。對于系統(tǒng)所得的結(jié)果易于給出解釋,并且易于被用戶接受,。CBR方法對于構(gòu)建高性能的專家系統(tǒng)是一種好方法,。 1994年,阿莫特(Aamodt)把CBR方法的發(fā)展趨勢概括為四個(gè)主要方面:與其他學(xué)習(xí)方法的集成,;與其他推理方法的集成,;被融合進(jìn)大規(guī)模并行處理;通過認(rèn)知科學(xué)的新進(jìn)展帶動(dòng)CBR方法的進(jìn)步,。近幾年,,人們發(fā)現(xiàn)CBR系統(tǒng)在知識管理方法有良好的性能,出現(xiàn)了一些以CBR方法進(jìn)行知識管理的研究工作,。 八,、關(guān)于機(jī)器學(xué)習(xí)關(guān)于機(jī)器學(xué)習(xí)的一般說法來自于Simon對學(xué)習(xí)的闡述:“如果一個(gè)系統(tǒng)能夠通過執(zhí)行某種過程而改進(jìn)它的性能,,這就是學(xué)習(xí)”,。機(jī)器學(xué)習(xí)研究的一個(gè)重要里程碑是1943年McCulloch與Pitts對神經(jīng)元模型(簡寫為MP模型)的研究。其意義在于首次發(fā)現(xiàn)了人類神經(jīng)元的工作方式,,并給出了其數(shù)學(xué)描述,。事實(shí)上計(jì)算機(jī)科學(xué)與控制理論均從這項(xiàng)研究中受到了啟示。 按照其受啟發(fā)的機(jī)理來分類,,機(jī)器學(xué)習(xí)可以分為基于分子生物學(xué)的機(jī)器學(xué)習(xí),、基于神經(jīng)生理學(xué)的機(jī)器學(xué)習(xí)以及基于認(rèn)知心理學(xué)的機(jī)器學(xué)習(xí)。而后者按照依據(jù)的心理學(xué)現(xiàn)象可以分為歸納機(jī)器學(xué)習(xí),、解釋機(jī)器學(xué)習(xí),、類比機(jī)器學(xué)習(xí)等。也可以根據(jù)被學(xué)習(xí)的對象(相當(dāng)于知識)是否可以表示為關(guān)系型數(shù)據(jù)庫形式,,將機(jī)器學(xué)習(xí)分為結(jié)構(gòu)化機(jī)器學(xué)習(xí)(相當(dāng)于良構(gòu)知識)與非結(jié)構(gòu)化機(jī)器學(xué)習(xí)(相當(dāng)于非良構(gòu)知識),。 根據(jù)數(shù)據(jù)的數(shù)學(xué)性質(zhì)與對機(jī)器學(xué)習(xí)不同的需求,結(jié)構(gòu)化機(jī)器學(xué)習(xí)可以分為基于符號的機(jī)器學(xué)習(xí)與基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí),它們的理論基礎(chǔ)分別為Rough Set(RS)理論與支持向量機(jī)(SVM),。對于非結(jié)構(gòu)化的機(jī)器學(xué)習(xí)的分類十分困難,,這與非線性問題中所遇到的問題類似。 在歷史上,,機(jī)器學(xué)習(xí)基本上是在經(jīng)驗(yàn)范疇內(nèi)進(jìn)行的,,隨意性相當(dāng)嚴(yán)重,其一,、機(jī)器學(xué)習(xí)往往受啟于某個(gè)自然科學(xué)的原理,特別是認(rèn)知心理學(xué)的原理,,認(rèn)知心理學(xué)研究中的隨意性也帶入了機(jī)器學(xué)習(xí)的研究之中,;其二,、對學(xué)習(xí)解的選擇涉及搜索策略,使用什么樣的搜索策略往往沒有一般的原則可循,;其三,、對學(xué)習(xí)結(jié)果的評價(jià)沒有可以描述的標(biāo)準(zhǔn)。 九,、關(guān)于知識本體論研究從古希臘人開始,,對于知識的研究與探索一直是人類追求的目標(biāo)。幾千年來的情況都是這樣的:哲學(xué)家研究有關(guān)知識的一般特性與規(guī)律,,而自然科學(xué)家孜孜不倦地獵取具體的知識,。20世紀(jì)中葉以后,這種研究格局發(fā)生了變化,。由于知識在人類文明中所起的作用越來越大,不僅是哲學(xué)家,、邏輯學(xué)家,、教育學(xué)家和心理學(xué)家,而且計(jì)算機(jī)科學(xué)家也在認(rèn)真地研究知識的一般特性與規(guī)律,。這是因?yàn)槿祟愐呀?jīng)進(jìn)入了信息化社會,,而且正在向知識化社會前進(jìn)。 蘇格拉底(Socrates)認(rèn)為,,知識的唯一功能是自我認(rèn)識,,即人的智力、道德和精神的生活成長,。畢達(dá)格拉斯(Pythagoras)認(rèn)為知識的目的是通過使用知識的人知道他想說什么和怎么說,從而使其行為更有效,,知識就是指邏輯,、語法和修辭。中國儒家則認(rèn)為,,知識是知道說什么,、怎么說以及出人頭地和俗世成功的途徑。對于道家來說,,知識是自我認(rèn)識和通向澄明的道路,。 教育類辭書中流行的知識定義是:“對事物屬性與聯(lián)系的認(rèn)識。表現(xiàn)為對事物的知覺,、表象,、概念、法則等心理形式”[7],。中國百科全書中的定義:“所謂知識,,就它所反映的內(nèi)容而言,是客觀事物的屬性和聯(lián)系的反映,,是客觀世界在人腦中主觀映象,。就它所反映活動(dòng)的形式而言,有時(shí)表現(xiàn)為主體對事物的感性知覺或表象,,屬于感性知識,,有時(shí)表現(xiàn)為關(guān)于事物的概念或規(guī)律,屬于理性知識,。”[8] 著名認(rèn)知心理學(xué)家皮亞杰曾提出區(qū)分兩類知識:一類是物理經(jīng)驗(yàn),,另一類是邏輯——數(shù)學(xué)經(jīng)驗(yàn)。前者可以說是來自外部世界,,是客觀事物及其聯(lián)系在人腦中的反映,;而后者是來自主體的動(dòng)作。皮亞杰的這一觀點(diǎn)主要在知識的來源上加深了人們對知識的認(rèn)識,。 現(xiàn)代認(rèn)知心理學(xué)家普遍認(rèn)為知識分兩大類,,一類為陳述性,指“個(gè)人具有有意識的提取線索,,因而能直接陳述的知識”,;另一類為程序性的,指“個(gè)人無有意識的提取線索,,因而其存在只能借助某種活動(dòng)形式間接推測出來的知識”,。前者是回答“是什么”問題的知識,后者是回答“怎么做”問題的知識,。這一觀點(diǎn)在知識的作用和知識的檢測方面加深了人們對知識的認(rèn)識,。根據(jù)自動(dòng)與受控維度,程序性知識可以分為受意識控制的程序性知識和自動(dòng)化的程序性知識。根據(jù)一般與特殊維度,,又可以區(qū)分為一般的程序性知識與特殊的程序性知識,。前者適用于許多不同的領(lǐng)域,后者適用于某一特殊的領(lǐng)域,。 知識工程的知識是泛指的,,包括不同領(lǐng)域的知識,如醫(yī)學(xué)的,、農(nóng)業(yè)的,、軍事的等;有不同性質(zhì)的,,如常識性知識,、經(jīng)驗(yàn)性知識、規(guī)律性知識等,;有不同目的的,,如用于診斷的、用于決策的,、用于規(guī)劃的等,。盡管目前已有各種各樣的知識表示和推理方法,研制出了各種不同的知識系統(tǒng),,但這些系統(tǒng)之間的知識難以相互共享,系統(tǒng)之間難以進(jìn)行互操作,。 本體論(Ontology)原本是一個(gè)哲學(xué)概念,,指關(guān)于存在及其本質(zhì)和規(guī)律的學(xué)說,后被用于研究實(shí)體存在性和實(shí)體存在的本質(zhì)等方面的通用理論,。計(jì)算機(jī)界借用這個(gè)理論,,把現(xiàn)實(shí)世界中某個(gè)領(lǐng)域抽象或概括成一組概念及概念間的關(guān)系,構(gòu)造出這個(gè)領(lǐng)域的本體,。本體論正逐步成為知識獲取以及表示,、規(guī)劃、進(jìn)程管理,、數(shù)據(jù)庫框架集成,、自然語言處理和企業(yè)模擬等研究領(lǐng)域共同關(guān)心的一個(gè)核心。 十,、廣義的知識工程學(xué)對于智能的模擬而言,,人類智能是人類在同大自然的斗爭中,經(jīng)過千百年的進(jìn)化所獲得的一種能力,,它來源于人腦的具有充分復(fù)雜性的神經(jīng)元網(wǎng)絡(luò),,具有主動(dòng)性、流動(dòng)性、普遍聯(lián)系性等特點(diǎn),。人類智能的模擬——機(jī)器智能,,是人類智能的產(chǎn)物,來源于計(jì)算機(jī)系統(tǒng),,這就決定了它只能解決客觀世界中能夠形式化的,、并存在具有合適復(fù)雜度的算法可解的問題。從人工智能的發(fā)展歷史來看,,其輝煌發(fā)展時(shí)期的兩個(gè)里程碑的突破為[2]: 一是人們利用符號表示和邏輯推理的方法,,通過計(jì)算機(jī)的啟發(fā)式編程,成功地建立了一種人類深思熟慮行為的智能模型,; 二是人們運(yùn)用同樣的模型,,成功地在計(jì)算機(jī)上建造了一系列實(shí)用的人造智能系統(tǒng)(專家系統(tǒng)),其性能可以和人類的同類智能相媲美,。 這兩項(xiàng)突破表明,,以邏輯為基礎(chǔ)的符號計(jì)算(處理)方法,無論在智能模擬上還是在智能系統(tǒng)建造上都同樣獲得了成功,。 知識工程的研究雖然已經(jīng)取得許多重要的成果,,但也存在著一些重大問題尚待解決,如對于千差萬別的客觀事物特別是對于人類的智能行為,,是難于用簡單的一種甚至幾種表示方法來完全描述的,。又如,盡管計(jì)算機(jī)在許多功能上大大超過人類(像運(yùn)算速度,、存貯量,、功能行為的一致性等等),但在知識的一些方面又是相當(dāng)?shù)臒o知,。 人們通常認(rèn)為,,智能是在客觀實(shí)際中解決某種問題的能力,而具備這種能力則至少需要如下幾方面的知識:(1)關(guān)于客觀世界的眾多背景知識,;(2)解決問題的一般策略知識,;(3)問題本身的專門知識;(4)把知識進(jìn)行分析,、選擇,、歸納、總結(jié)的一般方法的知識,。只有在計(jì)算機(jī)系統(tǒng)掌握了上述知識,,具有一定解決問題的能力之后,才認(rèn)為它具有了智能,。 從國際范圍來看,,人工智能的研究途徑主要有三條,。第一,生理學(xué)途徑,,采用仿生學(xué)的方法,,模擬動(dòng)物和人的感官以及大腦的結(jié)構(gòu)和機(jī)能,制成神經(jīng)元模型和腦模型,;第二,,心理學(xué)途徑,應(yīng)用實(shí)驗(yàn)心理學(xué)方法,,總結(jié)人們思維活動(dòng)的規(guī)律,,用電子計(jì)算機(jī)進(jìn)行心理模擬;第三,,工程技術(shù)途徑,,研究怎樣用電子計(jì)算機(jī)從功能上模擬人的智能行為。盡管目前第三種研究方法發(fā)展較快,,但它也從前兩種方法中吸收新的思想,,依靠新的啟示擴(kuò)大自己的成果。 從一個(gè)國家的角度看,,應(yīng)該把知識作為基礎(chǔ)設(shè)施來看待和發(fā)展,,應(yīng)該營造將科研、高校,、企業(yè)與知識機(jī)構(gòu)和廣大勞動(dòng)者緊密聯(lián)系在一起的社會網(wǎng)絡(luò),,通過這個(gè)網(wǎng)絡(luò)實(shí)現(xiàn)協(xié)同和互動(dòng),使知識得以生產(chǎn),、傳播,、擴(kuò)散,保證經(jīng)濟(jì)活動(dòng)各個(gè)環(huán)節(jié)都可以很容易地獲得和應(yīng)用所需要的知識,。國家的知識基礎(chǔ)設(shè)施由四部分組成[6]:1. 高素質(zhì)、高技能的人是載體,。這其中也分層次,,包括勞動(dòng)大軍整體素質(zhì)的提高。關(guān)鍵是每個(gè)人都能夠在學(xué)中干,,在干中學(xué),,終身學(xué)習(xí),不斷提高素質(zhì),。2.知識機(jī)構(gòu)是知識生產(chǎn),、擴(kuò)散和運(yùn)用的主體,包括企業(yè),、學(xué)校,、研究院所和中介服務(wù)。主體的關(guān)鍵在于相互的互動(dòng)作用和相互的聯(lián)系。3. 建立渠道,,以知識網(wǎng)絡(luò)(包括專業(yè)學(xué)會和其他正式或非正式的網(wǎng)絡(luò),,包括非政府組織及其他民間社團(tuán)組織組成的知識網(wǎng)絡(luò))來改變教育和知識的交換,影響偏僻地方的生活和文化,,使更多的人參與知識網(wǎng)絡(luò)學(xué)習(xí),,促進(jìn)各方面知識和信息的轉(zhuǎn)移。4. 電信基礎(chǔ)設(shè)施,,包括電視,、廣播,、通信,容易使大眾參與信息和知識的共享等等。而這種知識基礎(chǔ)設(shè)施的建設(shè)是同國家創(chuàng)新體制聯(lián)系在一起的,。而這個(gè)知識基礎(chǔ)設(shè)施的建設(shè),僅靠人工智能的研究是不夠的,,毫無疑問必須涉及到計(jì)算機(jī),、通訊、教育,、心理,、社會、經(jīng)濟(jì),、傳播等諸多學(xué)科,。 從知識經(jīng)濟(jì)學(xué)的角度研究知識是一種嶄新的范式。經(jīng)濟(jì)學(xué)理論的發(fā)展日益建構(gòu)在對知識問題的研究基礎(chǔ)上,。在西方古典和新古典的經(jīng)濟(jì)學(xué)理論中,,一個(gè)基本的假設(shè)就是技術(shù)和知識保持不變。進(jìn)入20世紀(jì)以來,,由于知識產(chǎn)業(yè)化和知識商品化過程的加劇,,相對于資本、勞動(dòng)力和土地等傳統(tǒng)的經(jīng)濟(jì)推動(dòng)因素而言,,體現(xiàn)于人力資本和技術(shù)中的知識的價(jià)值在不斷上升,,知識成為生產(chǎn)過程中最為重要的資源??萍歼M(jìn)步在經(jīng)濟(jì)增長中所占的比重越來越大,,經(jīng)濟(jì)增長對于技術(shù)、知識和人力資本的依賴程度越來越強(qiáng),;在這種背景下,,經(jīng)濟(jì)學(xué)家們逐漸把技術(shù)知識和技術(shù)變遷確立為一種經(jīng)濟(jì)系統(tǒng)的內(nèi)生變量和內(nèi)生過程。這時(shí)經(jīng)濟(jì)學(xué)的知識論成為分析經(jīng)濟(jì)現(xiàn)象的基本架構(gòu),。 知識社會學(xué)也是研究知識現(xiàn)象的重要的范式,。對知識經(jīng)濟(jì)的社會學(xué)研究包括兩個(gè)層次,,一是對知識經(jīng)濟(jì)這種社會現(xiàn)象的社會學(xué)研究,一是對知識經(jīng)濟(jì)中的知識和知識與經(jīng)濟(jì)互動(dòng)問題的研究,。知識經(jīng)濟(jì)的確立和發(fā)展為社會學(xué)對經(jīng)濟(jì)現(xiàn)象的研究提供了新的契機(jī),,也為知識社會學(xué)發(fā)展提供了應(yīng)用領(lǐng)域,從而成為社會學(xué)研究知識的核心,。 因此,,必須建立一個(gè)廣義的知識工程學(xué),它是“一門研究人類智能及人類知識的機(jī)理以及如何用機(jī)器模擬人的智能并促進(jìn)人類知識發(fā)展的學(xué)科”,。用機(jī)器模擬人的智能的意義不在于模擬本身,,而是在于幫助人類解決實(shí)際問題,同時(shí)發(fā)展人類知識,。 教育的根本目的是促進(jìn)人的發(fā)展,,同時(shí)也是促進(jìn)社會的發(fā)展與人類知識的發(fā)展。毫無疑問,,教育是知識的生產(chǎn),、傳播與擴(kuò)散的重要途徑,因而從教育的角度,,特別是教育技術(shù)的角度,,研究知識工程是必要的。另外,,知識工程的研究領(lǐng)域涉及多種學(xué)科,,對于教育技術(shù)學(xué)研究人員來說,他們具有教育學(xué),、心理學(xué),、信息科學(xué)與傳播學(xué)等多方面的知識背景,應(yīng)是知識工程研究的一支重要有生力量,。因此知識工程可以也應(yīng)該作為教育技術(shù)學(xué)的一個(gè)重要研究方向,。
結(jié)語對知識科學(xué)的研究不僅有重大的理論意義,也有重大的實(shí)際意義,。從戰(zhàn)略的高度講,,大力發(fā)展和推動(dòng)知識經(jīng)濟(jì)已成為我國的國策,成為我國經(jīng)濟(jì)在21世紀(jì)持續(xù)發(fā)展的一個(gè)關(guān)鍵,。知識經(jīng)濟(jì)是以知識為基礎(chǔ)的,隨著知識經(jīng)濟(jì)在當(dāng)代的突起和擴(kuò)張,,知識經(jīng)濟(jì)與當(dāng)代社會發(fā)展的互動(dòng)融合程度也日趨緊密,,而科學(xué)研究的基本目標(biāo)是促進(jìn)社會的發(fā)展。因此,,研究人類智能及人類知識的機(jī)理以及如何用機(jī)器模擬人的智能并促進(jìn)人類知識的發(fā)展(即知識工程學(xué)),,既符合社會發(fā)展的目標(biāo),,又體現(xiàn)社會的時(shí)代性特點(diǎn),建立這么一門學(xué)科是必要而且可行的,。教育技術(shù)作為一門以教育學(xué),、心理學(xué)、信息科學(xué)與傳播學(xué)等學(xué)科相互交叉的綜合性學(xué)科,,完全可以也應(yīng)該把知識工程作為一個(gè)重要研究方向,。 本文談到的知識工程內(nèi)容是筆者學(xué)習(xí)知識工程與人工智能的一些體會,并不是也不敢對知識工程研究作全面的綜述,,文中許多觀點(diǎn)來自陸汝鈐教授主編的《世紀(jì)之交的知識工程與知識科學(xué)》一書,,這是由國家自然科學(xué)基金委組織的“世紀(jì)科學(xué)論壇和戰(zhàn)略研討會——世紀(jì)之交的知識工程與知識科學(xué)”上發(fā)表的綜述性論文的匯編,在此對這些科學(xué)家的研究工作表示敬意和感謝,。
參考文獻(xiàn)[1] 陸汝鈐主編,《世紀(jì)之交的知識工程與知識科學(xué)》,,清華大學(xué)出版社,2001年 [2] 林崇德,,《學(xué)習(xí)與發(fā)展——中小學(xué)生心理能力發(fā)展與培養(yǎng)》,,北京師范大學(xué)出版社,1999年 [3] 皮連生主編,,《知識分類與目標(biāo)導(dǎo)向教學(xué)——理論與實(shí)踐》,,華東師范大學(xué)出版社,1998年 [4] 王永慶,,《人工智能:原理,、方法、應(yīng)用》,,西安交通大學(xué)出版社,,1994年 [5] M. W. Eysenck (1990), The Blackwell Dictionary of Cognitive Psychology [6] “科技部部長談知識基礎(chǔ)設(shè)施建設(shè)”,中國經(jīng)濟(jì)時(shí)報(bào) ,,http://www.qjst./kjdt /dt21-12/ dt21-1203-5.htm [7] 顧明遠(yuǎn)主編:《教育大詞典》第一卷,,上海教育出版社 [8] 董純才主編,《中國百科全書·教育卷》,,中國大百科全書出版社,,1985年版 [9] 郭強(qiáng),知識與社會的互動(dòng)機(jī)制:社會知識化進(jìn)程,,http://www./ guoq12.htm [10] 西安交通大學(xué)診斷與控制研究所編,,知識工程的應(yīng)用——從數(shù)據(jù)到知識,2000年8月http://www./ckddforum/zsgc.htm
|
|