知識工程學:一個新的重要研究領(lǐng)域
黃榮懷 (北京師范大學網(wǎng)絡(luò)教育實驗室 100875) 李茂國 (教育部高等教育司100816) 沙景榮 (北京師范大學網(wǎng)絡(luò)教育實驗室 100875)
摘要 知識工程是源于專家系統(tǒng)建造而形成的一個研究領(lǐng)域,目前已經(jīng)成為一個跨學科的綜合學科。本文簡要介紹了知識工程的概念,分析了知識工程主要研究領(lǐng)域,如軟計算、Agent、自然語言理解、邏輯與推理、形象思維研究、基于事例的推理、機器學習、知識本體論等的主要進展及存在的問題。最后提出廣義的知識工程學是“一門研究人類智能及人類知識的機理,以及如何用機器模擬人的智能并促進人類知識發(fā)展的學科”,也可以且應(yīng)該作為教育技術(shù)學的一個重要研究方向。 關(guān)鍵詞 知識工程 人工智能 教育技術(shù) 專家系統(tǒng) 一、知識工程概述1977年第五屆國際人工智能聯(lián)合會議上,美國斯坦福大學(Stanford University)計算機系教授費哥巴姆(Feigenbaum)作了關(guān)于“人工智能的藝術(shù)”(The Art of Artificial Intelligence)的講演,提出“知識工程”這一名稱,指出“知識工程是應(yīng)用人工智能的原理與方法,對那些需要專家知識才能解決的應(yīng)用難題提供求解的手段。恰當?shù)剡\用專家知識的獲取、表達和推理過程的構(gòu)成與解釋,是設(shè)計基于知識的系統(tǒng)的重要技術(shù)問題”[1]。 知識工程的發(fā)展從時間上劃分大體上經(jīng)歷了3個時期: 1. 大約從1965至1974年為實驗性系統(tǒng)時期。1965年費哥巴姆教授與其它科學家合作,研制出DENDRAL專家系統(tǒng)。這是一種推斷分子結(jié)構(gòu)的計算機程序,該系統(tǒng)貯存有非常豐富的化學知識,它所解決問題的能力達到專家水平,甚至在某些方面超過同行專家的能力,其中包括它的設(shè)計者。DENDRAL系統(tǒng)標志著“專家系統(tǒng)”的誕生。 2. 從1975至1980年為MYCIN時期。70年代中期MYCIN專家系統(tǒng)研制成功,這是一種用醫(yī)學診斷與治療感染性疾病計算機程序的“專家系統(tǒng)”。MYCIN專家系統(tǒng)是規(guī)范性計算機專家系統(tǒng)的代表,許多其它專家系統(tǒng)都是在MYCIN專家系統(tǒng)的基礎(chǔ)上研制而成的。MYCIN系統(tǒng)不但具有較高的性能,而且具有解釋功能和知識獲取功能,可以用英語與用戶對話,回答用戶提出的問題,還可以在專家指導(dǎo)下學習醫(yī)療知識,該系統(tǒng)還使用了知識庫的概念和不精確推理技術(shù)。MYCIN系統(tǒng)對計算機專家系統(tǒng)的理論和實踐,都有較大的貢獻。 3. 1980年以來為知識工程的“產(chǎn)品”在產(chǎn)業(yè)部門開始應(yīng)用的時期。知識工程的研究,目前在美國開展得較為活躍和深入,并且主要集中在斯坦福大學。 人工智能的研究表明,專家之所以成為專家,主要在于他們擁有大量的專門知識,特別是長時期地從實踐中總結(jié)和積累的經(jīng)驗技能知識。從知識工程的發(fā)展歷史可以看出,知識工程是伴隨“專家系統(tǒng)”建造的研究而產(chǎn)生的。實際上,知識工程的焦點就是知識。知識工程領(lǐng)域的主要研究方向主要包含知識獲取、知識表示和推理方法等,其研究目標是挖掘和抽取人類知識,用一定的形式表現(xiàn)這些知識,使之成為計算機可操作的對象,從而使計算機具有人類的一定智能。 人工智能的研究方向非常廣泛,本文對以下幾個典型的研究方向作簡要介紹和分析,以此說明如何使機器(主要指計算機)“具有”人類智能所面臨的困難及存在的問題: l 軟計算:模仿自然法則的計算方法 l 主體Agent:機器世界中有“思維”的個體 l 自然語言理解與機器翻譯:讓機器“懂得”人類語言 l 邏輯與推理:機器的“思維”機制 l 形象思維研究:讓機器具有“視覺認知” l 基于事例的推理:讓機器應(yīng)用“經(jīng)驗(知識)” l 機器學習:讓機器也能“學習” l 知識本體論:認識“知識”的本質(zhì) 要讓計算機“具有”人類智能,首先必須了解“人類智能”,“人類智能”離不開“人類知識”,因此必須研究“人類知識”的機理。另一方面,人工智能的最終目的還是為人類服務(wù),讓人類具有更多的“智能”,促進人類知識的發(fā)展,因此需要從教育、心理、傳播、社會、經(jīng)濟等不同的角度和維度來研究有關(guān)人類知識的問題。所以,筆者認為需要提出一個廣義的知識工程學的概念,它是“一門研究人類智能及人類知識的機理,以及如何用機器模擬人的智能并促進人類知識發(fā)展的學科”。 教育技術(shù)學作為一門涉及教育、心理、傳播、信息科學等的綜合性交叉學科,它不僅要研究教育中的“技術(shù)”問題,而且要利用其研究主體的特殊知識背景來研究知識發(fā)現(xiàn)、知識處理、知識傳播、知識擴散等問題。因此,教育技術(shù)學作為一個聯(lián)結(jié)教育、心理、傳播、信息科學等學科的重要紐帶,也可以且應(yīng)該把(廣義的)知識工程作為其一個重要的研究方向。 二、關(guān)于智能計算凡是仿照自然法則構(gòu)造的計算,均可稱為智能計算(Computational intelligence),有時也稱為軟計算(Soft computing)。它主要包括三個內(nèi)容:模仿人類處理方式引入的模糊計算(Fuzzy computing)、依據(jù)生物神經(jīng)網(wǎng)絡(luò)的工作規(guī)則引入的神經(jīng)計算(Neural computing)和模仿生物界的“優(yōu)勝劣汰”法則的遺傳算法和進化計算(Evolution computing)。 人工神經(jīng)網(wǎng)絡(luò)是模仿人類大腦的某些工作機制的一類計算模型。它始于1943年美國學者McCulloch和Pitts首先提出的一種神經(jīng)元的數(shù)學模型,即M-P模型。在20世紀40、50年代形成了第一次高潮。由于理論及技術(shù)兩方面的限制,60、70年代進入第一個低潮。到80年代中期,由于理論研究的進展,特別是有效學習算法(即下面要談到的機器學習)的提出,如BP算法等,神經(jīng)網(wǎng)絡(luò)研究開始復(fù)蘇,出現(xiàn)了第二次高潮。到目前,第二次浪潮似乎已經(jīng)退去。神經(jīng)網(wǎng)絡(luò)在模式識別方面有一些成功的應(yīng)用,包括用于分類、識別或優(yōu)化計算等。 遺傳算法是模擬自然界中按“優(yōu)勝劣汰”法則進行進化過程而設(shè)計的算法。Bagley和Rosengerg于1967年在他們的博士論文中首先提出了遺傳算法的概念。1975年Holland出版的專著奠定了遺傳算法的理論基礎(chǔ)。如今遺傳算法不但給出了清晰的算法描述,而且也建立了一些定量分析的結(jié)果,在眾多領(lǐng)域得到了廣泛的應(yīng)用,如用于控制(煤氣管道的控制)、規(guī)劃(生產(chǎn)任務(wù)規(guī)劃)、設(shè)計(通信網(wǎng)絡(luò)設(shè)計)、組合優(yōu)化(TSP問題、背包問題)以及圖像處理和信號處理等。 對于軟計算問題,目前主要的問題是算法的“可擴展性”和“可理解性”問題,即所給的算法對處理海量的數(shù)據(jù)是否有效,以及由所給的算法得來的規(guī)則,對人來說是否容易理解。 三、關(guān)于主體AgentAgent是Minsky在1986年出版的《思維的社會》一書中提出的,認為社會中的某些個體經(jīng)過協(xié)商之后可求得問題的解,這些個體就是Agent。Agent應(yīng)具有自主性、社會交互性、反應(yīng)能力和預(yù)動能力,能通過感知環(huán)境而做出動作。從Agent模型來看,有思考型Agent(如BDI表示和推理)、反映型Agent(不會推理,直接由感知到動作)和兩者混合型。 Agent理論最初是作為一種分布式智能模型被提出的,其研究方法有邏輯方法與經(jīng)濟學方法兩種。對Agent思維狀態(tài)的直觀描述涉及信念、愿望、目標、意圖、承諾、規(guī)劃等概念。 l 信念,屬于思維狀態(tài)的認知方面,描述了Agent對當前世界狀況以及為達到某種效果可能采取的行為路線的估計。 l 愿望,屬于思維狀態(tài)的感情方面,描述了Agent對未來世界狀況以及可能采取的行為路線的喜好。 l 目標,描述Agent的追求,實際是Agent從愿望中選擇的子集。 l 意圖,引導(dǎo)并監(jiān)督Agent的動作,屬于思維狀態(tài)的意向方面。 l 承諾,描述Agent對于所追求的意圖的堅持程度,并控制對意圖的重新考慮,實際表示從目標到意圖的轉(zhuǎn)換。 l 規(guī)劃,把意圖按特定結(jié)構(gòu)組合為規(guī)劃,它在意圖系統(tǒng)的實現(xiàn)中起重要作用。 關(guān)于Agent理論的地位仍有爭議,有的認為Agent理論用于具體實現(xiàn)Agent,有的認為Agent理論是用于知識表示方面的,還有的認為Agent理論應(yīng)是對認知科學和哲學中一些概念的形式化。目前Agent的成功案例包括有產(chǎn)品拍賣、軍事演習與機器人足球賽等。 四、關(guān)于自然語言理解與機器翻譯自然語言理解的研究起始于機器翻譯。早在1946年,英國的A. Donald Booth和美國的W. Weaver就開始了機器翻譯方面的研究。經(jīng)過50多年的研究,出現(xiàn)了許多的理論與方法,如基于對話的、實例的、知識的、詞匯的、神經(jīng)網(wǎng)絡(luò)的、原則的、規(guī)則的、統(tǒng)計(或語料庫)的等機器翻譯方法。但并不像市場上機器翻譯產(chǎn)品宣傳廣告講的那么成功,就是國際上研究時間最長、最好的SYSTRAN系統(tǒng),在英法機器翻譯過程中,1993年,對開放文本,達到流暢程度的譯準率只有54%,一般還可以用的譯準率達到74.3%。可以想象,英法這兩個同語系的語言的翻譯水平就僅如此,那么不同語系的漢外翻譯(如漢語譯成英語),要困難得多?,F(xiàn)今的機器翻譯還只能翻譯那些能想到的日常句子,即教科書句子。 信息檢索也是一個非常熱門的研究與開發(fā)領(lǐng)域,包括文本分類、文本主題識別、文本檢索與自然語言檢索、文本過濾、文本摘要、文本安排、文本信息獲取、文本自動書寫、文本挖掘等諸多領(lǐng)域。從網(wǎng)上信息檢索或搜索引擎的情況看,檢索的基本準確率只有10%~20%。 自然語言理解和信息檢索是語言信息研究的兩個重要部分。自然語言理解的基礎(chǔ)是現(xiàn)代語言學的研究。語言學既是一個民族的根本,又是知識的最好表現(xiàn)形式。但我國語言學的研究狀況并不樂觀,比如在漢語里面,到底應(yīng)該分成多少詞性,語言學界爭論不休,至今沒有一個定論。另外像漢語的基本句型、漢語的語義分類、漢語帶詞性標注語料庫等一系列基礎(chǔ)性的工作沒有開始或得不到足夠的重視。 關(guān)于我國語言信息處理研究,基礎(chǔ)研究仍然還是最重要的,包括提高分詞的精度,建設(shè)帶詞性、詞法搭配、句法和語義的國家級語料庫。關(guān)于研究方法,將更多的采用統(tǒng)計方法,特別是將統(tǒng)計與規(guī)則結(jié)合起來。一個總的趨勢是部分分析代替全分析、部分理解代替全理解,部分翻譯代替全翻譯。另一個值得注意的重要研究方向是,隨機語言模型的建模工作正在由基本的線性詞匯統(tǒng)計轉(zhuǎn)向結(jié)構(gòu)化的句法領(lǐng)域。根據(jù)語料統(tǒng)計信息建立一定的優(yōu)先評價機制,對輸入句子的分析結(jié)果進行概率計算,從而得到概率意義上的最優(yōu)分析結(jié)果。 五、關(guān)于邏輯與推理一個數(shù)學理論通常包括概念的界定、命題的陳述和定理的證明等三部分。數(shù)學理論中的概念有基本概念與合成概念之分。基本概念是一些不定義的抽象對象,一個新的合成概念由若干基本概念或這個理論中已有的合成概念來定義。數(shù)學命題有對錯之辯、真假之分。真命題可分為基本命題與被證明的命題。基本命題是不證自明的命題,稱為公理,它與人們的直覺與經(jīng)驗一致,被人們所接受。一個數(shù)學命題的證明是指從公理和已有的定理出發(fā),使用邏輯推理規(guī)則,把命題作為推理規(guī)則的邏輯結(jié)論推導(dǎo)出來。命題是由概念及子命題通過邏輯連接詞連接而成,及所謂的謂詞邏輯。以上方法就是所謂的公理化方法,最早來自于歐幾里德的《幾何原本》,在數(shù)學理論中普遍采用,后來又被推廣到力學、物理學甚至生物學等其他自然學科。公理化方法實際是一種整理知識,特別是數(shù)學知識的方法。通過許多數(shù)學家的努力,用數(shù)理邏輯的語言和方法建立了一套關(guān)于公理系統(tǒng)的理論框架,這就是所謂的形式化方法。 在人工智能領(lǐng)域中,在知識表示與推理方面,僅靠公理化方法和數(shù)理邏輯是不夠的,因此出現(xiàn)了許多新的理論與方法,包括非經(jīng)典邏輯與開放邏輯等,非經(jīng)典邏輯的典型代表是模態(tài)邏輯。 模態(tài)邏輯(model logic)及其擴展(包括時態(tài)邏輯、認知邏輯、動態(tài)邏輯、表述邏輯和行為邏輯等)已經(jīng)成為更適用于各種應(yīng)用領(lǐng)域的邏輯系統(tǒng)?;镜哪B(tài)邏輯的語言是在經(jīng)典邏輯語言的基礎(chǔ)上,通過引入兩個模態(tài)算子□(必然算子)和◇(可能算子)得到的。與經(jīng)典邏輯不同,模態(tài)邏輯公式的真值不是函數(shù)地依賴于其組成部分的真值。高效的模態(tài)推理方法和推理系統(tǒng)的建立,是使用模態(tài)邏輯及其擴展作為知識表示工具成功與否的關(guān)鍵。近些年來,模態(tài)推理的研究雖然距離人們的期望還有一定距離,但也得到了長足的發(fā)展。如認知邏輯已經(jīng)成為一種表示知識與信念的有力工具。表述邏輯是為表示概念和概念層次知識建立起來的邏輯語言。表述邏輯有效推理方法的研究,又推動了常識問題表述和推理的研究。當然,沒有任何一種模態(tài)推理理論和方法具有通用的高效性,而且不論是推理理論研究,還是具體的推理技術(shù)研究,其系統(tǒng)復(fù)雜性都難于定量的分析。 另一類是開放邏輯,我國的李未院士等在這方面做了大量的工作。在解決了邏輯推理規(guī)則的可靠性和完全性問題之后,公理化方法應(yīng)用的成功與否,關(guān)鍵在于如何挑選公理,使之能夠刻畫問題的本質(zhì),并使之與人們的認識和時間一致。公理系統(tǒng)的形成是一個過程,即公理化進程。他們在數(shù)理邏輯的公理化方法的基礎(chǔ)上,通過引進新的概念,刻畫公理化進程的基本特征,給出了公理化進程的理論框架,進而在某些特定的條件下給出了它的計算模型。引進的概念有現(xiàn)論、新定律與事實反駁?,F(xiàn)論是指階段性理論或現(xiàn)階段的理論,它揭示了這個領(lǐng)域現(xiàn)階段知識之間的邏輯關(guān)系,并使這些知識有清晰的邏輯結(jié)構(gòu)。我們可以將現(xiàn)論看著類似于認知心理學中的“圖示”。隨著時間的推移,當某些現(xiàn)象不能從現(xiàn)論中得到滿意的解釋時,人們就不得不修正這個現(xiàn)論。這時出現(xiàn)兩種情況:一是人們發(fā)現(xiàn)它是現(xiàn)有理論所沒有涉及過的新現(xiàn)象,于是概括出新的原理并將它加入到現(xiàn)有理論中去,稱之為新定律,這個過程類似于認知心理學中的“同化”;二是現(xiàn)論所預(yù)言的現(xiàn)象沒有發(fā)生,或者發(fā)生的是與之相矛盾的現(xiàn)象,即所謂的理論與實踐不符,稱為否決性判定試驗,或?qū)ΜF(xiàn)有理論的事實反駁,這個過程類似于認知心理學中的“順應(yīng)”。因此,公理化進程是一種典型的關(guān)于知識的整理和認識的過程,它類似于一個人的“認知過程”。 六、關(guān)于形象思維研究在思維科學領(lǐng)域,借助于邏輯學,關(guān)于抽象思維的研究已取得了不少進展,但對形象思維的研究相對薄弱。形象思維的研究主要包括記憶理論和認知模型。Paivio從信息編碼角度將長時記憶分為兩個系統(tǒng)——心象系統(tǒng)和言語系統(tǒng)。心象系統(tǒng)以心象代碼來存儲關(guān)于具體的客體和事件的信息;言語系統(tǒng)以言語代碼來存儲言語信息。Kosslyn于1981年在心理掃描實驗的基礎(chǔ)上提出了心象的計算理論。他將心象的表征分為兩層:表層表征和深層表征,前者是指出現(xiàn)在視覺短時記憶中的類似圖畫的表征;后者為存儲在長時記憶中的信息。Glasgow于1992年在《認知科學》上發(fā)表了一篇題為《可計算心象》的學術(shù)論文。她較為系統(tǒng)的闡述了基于心象的問題求解,并提出了可計算心象的一種知識表達框架,她把心象的表達分為3層:描述性表達(長時記憶)、視覺和空間表達(工作記憶的兩種形式),描述性表達基于命題,視覺和空間表達基于嵌套的符號矩陣,并提出了心象表達的基于矩陣的形式化理論和基于矩陣的形象處理操作。她的研究工作具有突破性意義,在人工智能界和認知科學界引起了極大的反響。 除此以外,對于心象在計算機中的模擬和表征的研究,還有許多其它的理論與方法:心象的傅立葉模式(認為心象在人腦中是以傅立葉變換形式存儲的)、區(qū)域生長法(認為心象在人腦中是由一些分割后的區(qū)域來表示的)、紋理表示理論(認為心象是通過紋理分析來獲得和加以表征的)、形態(tài)學理論(認為構(gòu)成視覺認知基礎(chǔ)的形態(tài)是由更基本的點通過擴張、生長、侵蝕等形成)和形象信息模型(認為視覺信息包括三部分:形狀、色彩、質(zhì)感等視覺心象的性質(zhì);構(gòu)成、類比、相鄰等結(jié)構(gòu)信息;與該心象所聯(lián)系的概念、所激發(fā)的情感以及該心象所聯(lián)系的聽、嗅、味、觸、運動等其他種類的形象)。以上模型大部分只是一種理論框架或者已經(jīng)有些計算機模擬程序。 七、基于事例的推理CBR方法同人類的日常推理活動十分接近,它來自于人類的認知心理活動:推理者(指以推理方式求解問題的人)在求解一個新問題時,往往習慣于借鑒他(或她)以前對類似問題的處理經(jīng)驗。當新出現(xiàn)的問題是他以前處理過的問題的簡單重復(fù)時,他可以把處理舊問題的成功經(jīng)驗直接用于求解該新問題;而當新問題是推理者從來沒有遇見過的問題時,他也可以回憶起一個(或多個)類似的舊問題,通過類比得到重要的指導(dǎo)或提示,加之一些規(guī)律性知識作為指導(dǎo),完成對新問題的解決。當然,處理過的新問題又會被當作經(jīng)驗記下來,用以處理以后的問題。 與傳統(tǒng)的基于規(guī)則的問題求解方法相比較,CBR具有一些重要的優(yōu)點。CBR系統(tǒng)易于獲取知識,避免了傳統(tǒng)知識系統(tǒng)進行知識獲取時的瓶頸問題。知識庫的維護方便,不需要領(lǐng)域?qū)<腋深A(yù)。CBR方法擴大了解決問題的范圍,可以得出創(chuàng)新的解答,同時簡化了求解過程,節(jié)省了問題求解時間,解的質(zhì)量也得到提高。對于系統(tǒng)所得的結(jié)果易于給出解釋,并且易于被用戶接受。CBR方法對于構(gòu)建高性能的專家系統(tǒng)是一種好方法。 1994年,阿莫特(Aamodt)把CBR方法的發(fā)展趨勢概括為四個主要方面:與其他學習方法的集成;與其他推理方法的集成;被融合進大規(guī)模并行處理;通過認知科學的新進展帶動CBR方法的進步。近幾年,人們發(fā)現(xiàn)CBR系統(tǒng)在知識管理方法有良好的性能,出現(xiàn)了一些以CBR方法進行知識管理的研究工作。 八、關(guān)于機器學習關(guān)于機器學習的一般說法來自于Simon對學習的闡述:“如果一個系統(tǒng)能夠通過執(zhí)行某種過程而改進它的性能,這就是學習”。機器學習研究的一個重要里程碑是1943年McCulloch與Pitts對神經(jīng)元模型(簡寫為MP模型)的研究。其意義在于首次發(fā)現(xiàn)了人類神經(jīng)元的工作方式,并給出了其數(shù)學描述。事實上計算機科學與控制理論均從這項研究中受到了啟示。 按照其受啟發(fā)的機理來分類,機器學習可以分為基于分子生物學的機器學習、基于神經(jīng)生理學的機器學習以及基于認知心理學的機器學習。而后者按照依據(jù)的心理學現(xiàn)象可以分為歸納機器學習、解釋機器學習、類比機器學習等。也可以根據(jù)被學習的對象(相當于知識)是否可以表示為關(guān)系型數(shù)據(jù)庫形式,將機器學習分為結(jié)構(gòu)化機器學習(相當于良構(gòu)知識)與非結(jié)構(gòu)化機器學習(相當于非良構(gòu)知識)。 根據(jù)數(shù)據(jù)的數(shù)學性質(zhì)與對機器學習不同的需求,結(jié)構(gòu)化機器學習可以分為基于符號的機器學習與基于統(tǒng)計的機器學習,它們的理論基礎(chǔ)分別為Rough Set(RS)理論與支持向量機(SVM)。對于非結(jié)構(gòu)化的機器學習的分類十分困難,這與非線性問題中所遇到的問題類似。 在歷史上,機器學習基本上是在經(jīng)驗范疇內(nèi)進行的,隨意性相當嚴重,其一、機器學習往往受啟于某個自然科學的原理,特別是認知心理學的原理,認知心理學研究中的隨意性也帶入了機器學習的研究之中;其二、對學習解的選擇涉及搜索策略,使用什么樣的搜索策略往往沒有一般的原則可循;其三、對學習結(jié)果的評價沒有可以描述的標準。 九、關(guān)于知識本體論研究從古希臘人開始,對于知識的研究與探索一直是人類追求的目標。幾千年來的情況都是這樣的:哲學家研究有關(guān)知識的一般特性與規(guī)律,而自然科學家孜孜不倦地獵取具體的知識。20世紀中葉以后,這種研究格局發(fā)生了變化。由于知識在人類文明中所起的作用越來越大,不僅是哲學家、邏輯學家、教育學家和心理學家,而且計算機科學家也在認真地研究知識的一般特性與規(guī)律。這是因為人類已經(jīng)進入了信息化社會,而且正在向知識化社會前進。 蘇格拉底(Socrates)認為,知識的唯一功能是自我認識,即人的智力、道德和精神的生活成長。畢達格拉斯(Pythagoras)認為知識的目的是通過使用知識的人知道他想說什么和怎么說,從而使其行為更有效,知識就是指邏輯、語法和修辭。中國儒家則認為,知識是知道說什么、怎么說以及出人頭地和俗世成功的途徑。對于道家來說,知識是自我認識和通向澄明的道路。 教育類辭書中流行的知識定義是:“對事物屬性與聯(lián)系的認識。表現(xiàn)為對事物的知覺、表象、概念、法則等心理形式”[7]。中國百科全書中的定義:“所謂知識,就它所反映的內(nèi)容而言,是客觀事物的屬性和聯(lián)系的反映,是客觀世界在人腦中主觀映象。就它所反映活動的形式而言,有時表現(xiàn)為主體對事物的感性知覺或表象,屬于感性知識,有時表現(xiàn)為關(guān)于事物的概念或規(guī)律,屬于理性知識。”[8] 著名認知心理學家皮亞杰曾提出區(qū)分兩類知識:一類是物理經(jīng)驗,另一類是邏輯——數(shù)學經(jīng)驗。前者可以說是來自外部世界,是客觀事物及其聯(lián)系在人腦中的反映;而后者是來自主體的動作。皮亞杰的這一觀點主要在知識的來源上加深了人們對知識的認識。 現(xiàn)代認知心理學家普遍認為知識分兩大類,一類為陳述性,指“個人具有有意識的提取線索,因而能直接陳述的知識”;另一類為程序性的,指“個人無有意識的提取線索,因而其存在只能借助某種活動形式間接推測出來的知識”。前者是回答“是什么”問題的知識,后者是回答“怎么做”問題的知識。這一觀點在知識的作用和知識的檢測方面加深了人們對知識的認識。根據(jù)自動與受控維度,程序性知識可以分為受意識控制的程序性知識和自動化的程序性知識。根據(jù)一般與特殊維度,又可以區(qū)分為一般的程序性知識與特殊的程序性知識。前者適用于許多不同的領(lǐng)域,后者適用于某一特殊的領(lǐng)域。 知識工程的知識是泛指的,包括不同領(lǐng)域的知識,如醫(yī)學的、農(nóng)業(yè)的、軍事的等;有不同性質(zhì)的,如常識性知識、經(jīng)驗性知識、規(guī)律性知識等;有不同目的的,如用于診斷的、用于決策的、用于規(guī)劃的等。盡管目前已有各種各樣的知識表示和推理方法,研制出了各種不同的知識系統(tǒng),但這些系統(tǒng)之間的知識難以相互共享,系統(tǒng)之間難以進行互操作。 本體論(Ontology)原本是一個哲學概念,指關(guān)于存在及其本質(zhì)和規(guī)律的學說,后被用于研究實體存在性和實體存在的本質(zhì)等方面的通用理論。計算機界借用這個理論,把現(xiàn)實世界中某個領(lǐng)域抽象或概括成一組概念及概念間的關(guān)系,構(gòu)造出這個領(lǐng)域的本體。本體論正逐步成為知識獲取以及表示、規(guī)劃、進程管理、數(shù)據(jù)庫框架集成、自然語言處理和企業(yè)模擬等研究領(lǐng)域共同關(guān)心的一個核心。 十、廣義的知識工程學對于智能的模擬而言,人類智能是人類在同大自然的斗爭中,經(jīng)過千百年的進化所獲得的一種能力,它來源于人腦的具有充分復(fù)雜性的神經(jīng)元網(wǎng)絡(luò),具有主動性、流動性、普遍聯(lián)系性等特點。人類智能的模擬——機器智能,是人類智能的產(chǎn)物,來源于計算機系統(tǒng),這就決定了它只能解決客觀世界中能夠形式化的、并存在具有合適復(fù)雜度的算法可解的問題。從人工智能的發(fā)展歷史來看,其輝煌發(fā)展時期的兩個里程碑的突破為[2]: 一是人們利用符號表示和邏輯推理的方法,通過計算機的啟發(fā)式編程,成功地建立了一種人類深思熟慮行為的智能模型; 二是人們運用同樣的模型,成功地在計算機上建造了一系列實用的人造智能系統(tǒng)(專家系統(tǒng)),其性能可以和人類的同類智能相媲美。 這兩項突破表明,以邏輯為基礎(chǔ)的符號計算(處理)方法,無論在智能模擬上還是在智能系統(tǒng)建造上都同樣獲得了成功。 知識工程的研究雖然已經(jīng)取得許多重要的成果,但也存在著一些重大問題尚待解決,如對于千差萬別的客觀事物特別是對于人類的智能行為,是難于用簡單的一種甚至幾種表示方法來完全描述的。又如,盡管計算機在許多功能上大大超過人類(像運算速度、存貯量、功能行為的一致性等等),但在知識的一些方面又是相當?shù)臒o知。 人們通常認為,智能是在客觀實際中解決某種問題的能力,而具備這種能力則至少需要如下幾方面的知識:(1)關(guān)于客觀世界的眾多背景知識;(2)解決問題的一般策略知識;(3)問題本身的專門知識;(4)把知識進行分析、選擇、歸納、總結(jié)的一般方法的知識。只有在計算機系統(tǒng)掌握了上述知識,具有一定解決問題的能力之后,才認為它具有了智能。 從國際范圍來看,人工智能的研究途徑主要有三條。第一,生理學途徑,采用仿生學的方法,模擬動物和人的感官以及大腦的結(jié)構(gòu)和機能,制成神經(jīng)元模型和腦模型;第二,心理學途徑,應(yīng)用實驗心理學方法,總結(jié)人們思維活動的規(guī)律,用電子計算機進行心理模擬;第三,工程技術(shù)途徑,研究怎樣用電子計算機從功能上模擬人的智能行為。盡管目前第三種研究方法發(fā)展較快,但它也從前兩種方法中吸收新的思想,依靠新的啟示擴大自己的成果。 從一個國家的角度看,應(yīng)該把知識作為基礎(chǔ)設(shè)施來看待和發(fā)展,應(yīng)該營造將科研、高校、企業(yè)與知識機構(gòu)和廣大勞動者緊密聯(lián)系在一起的社會網(wǎng)絡(luò),通過這個網(wǎng)絡(luò)實現(xiàn)協(xié)同和互動,使知識得以生產(chǎn)、傳播、擴散,保證經(jīng)濟活動各個環(huán)節(jié)都可以很容易地獲得和應(yīng)用所需要的知識。國家的知識基礎(chǔ)設(shè)施由四部分組成[6]:1. 高素質(zhì)、高技能的人是載體。這其中也分層次,包括勞動大軍整體素質(zhì)的提高。關(guān)鍵是每個人都能夠在學中干,在干中學,終身學習,不斷提高素質(zhì)。2.知識機構(gòu)是知識生產(chǎn)、擴散和運用的主體,包括企業(yè)、學校、研究院所和中介服務(wù)。主體的關(guān)鍵在于相互的互動作用和相互的聯(lián)系。3. 建立渠道,以知識網(wǎng)絡(luò)(包括專業(yè)學會和其他正式或非正式的網(wǎng)絡(luò),包括非政府組織及其他民間社團組織組成的知識網(wǎng)絡(luò))來改變教育和知識的交換,影響偏僻地方的生活和文化,使更多的人參與知識網(wǎng)絡(luò)學習,促進各方面知識和信息的轉(zhuǎn)移。4. 電信基礎(chǔ)設(shè)施,包括電視、廣播、通信,容易使大眾參與信息和知識的共享等等。而這種知識基礎(chǔ)設(shè)施的建設(shè)是同國家創(chuàng)新體制聯(lián)系在一起的。而這個知識基礎(chǔ)設(shè)施的建設(shè),僅靠人工智能的研究是不夠的,毫無疑問必須涉及到計算機、通訊、教育、心理、社會、經(jīng)濟、傳播等諸多學科。 從知識經(jīng)濟學的角度研究知識是一種嶄新的范式。經(jīng)濟學理論的發(fā)展日益建構(gòu)在對知識問題的研究基礎(chǔ)上。在西方古典和新古典的經(jīng)濟學理論中,一個基本的假設(shè)就是技術(shù)和知識保持不變。進入20世紀以來,由于知識產(chǎn)業(yè)化和知識商品化過程的加劇,相對于資本、勞動力和土地等傳統(tǒng)的經(jīng)濟推動因素而言,體現(xiàn)于人力資本和技術(shù)中的知識的價值在不斷上升,知識成為生產(chǎn)過程中最為重要的資源??萍歼M步在經(jīng)濟增長中所占的比重越來越大,經(jīng)濟增長對于技術(shù)、知識和人力資本的依賴程度越來越強;在這種背景下,經(jīng)濟學家們逐漸把技術(shù)知識和技術(shù)變遷確立為一種經(jīng)濟系統(tǒng)的內(nèi)生變量和內(nèi)生過程。這時經(jīng)濟學的知識論成為分析經(jīng)濟現(xiàn)象的基本架構(gòu)。 知識社會學也是研究知識現(xiàn)象的重要的范式。對知識經(jīng)濟的社會學研究包括兩個層次,一是對知識經(jīng)濟這種社會現(xiàn)象的社會學研究,一是對知識經(jīng)濟中的知識和知識與經(jīng)濟互動問題的研究。知識經(jīng)濟的確立和發(fā)展為社會學對經(jīng)濟現(xiàn)象的研究提供了新的契機,也為知識社會學發(fā)展提供了應(yīng)用領(lǐng)域,從而成為社會學研究知識的核心。 因此,必須建立一個廣義的知識工程學,它是“一門研究人類智能及人類知識的機理以及如何用機器模擬人的智能并促進人類知識發(fā)展的學科”。用機器模擬人的智能的意義不在于模擬本身,而是在于幫助人類解決實際問題,同時發(fā)展人類知識。 教育的根本目的是促進人的發(fā)展,同時也是促進社會的發(fā)展與人類知識的發(fā)展。毫無疑問,教育是知識的生產(chǎn)、傳播與擴散的重要途徑,因而從教育的角度,特別是教育技術(shù)的角度,研究知識工程是必要的。另外,知識工程的研究領(lǐng)域涉及多種學科,對于教育技術(shù)學研究人員來說,他們具有教育學、心理學、信息科學與傳播學等多方面的知識背景,應(yīng)是知識工程研究的一支重要有生力量。因此知識工程可以也應(yīng)該作為教育技術(shù)學的一個重要研究方向。
結(jié)語對知識科學的研究不僅有重大的理論意義,也有重大的實際意義。從戰(zhàn)略的高度講,大力發(fā)展和推動知識經(jīng)濟已成為我國的國策,成為我國經(jīng)濟在21世紀持續(xù)發(fā)展的一個關(guān)鍵。知識經(jīng)濟是以知識為基礎(chǔ)的,隨著知識經(jīng)濟在當代的突起和擴張,知識經(jīng)濟與當代社會發(fā)展的互動融合程度也日趨緊密,而科學研究的基本目標是促進社會的發(fā)展。因此,研究人類智能及人類知識的機理以及如何用機器模擬人的智能并促進人類知識的發(fā)展(即知識工程學),既符合社會發(fā)展的目標,又體現(xiàn)社會的時代性特點,建立這么一門學科是必要而且可行的。教育技術(shù)作為一門以教育學、心理學、信息科學與傳播學等學科相互交叉的綜合性學科,完全可以也應(yīng)該把知識工程作為一個重要研究方向。 本文談到的知識工程內(nèi)容是筆者學習知識工程與人工智能的一些體會,并不是也不敢對知識工程研究作全面的綜述,文中許多觀點來自陸汝鈐教授主編的《世紀之交的知識工程與知識科學》一書,這是由國家自然科學基金委組織的“世紀科學論壇和戰(zhàn)略研討會——世紀之交的知識工程與知識科學”上發(fā)表的綜述性論文的匯編,在此對這些科學家的研究工作表示敬意和感謝。
參考文獻[1] 陸汝鈐主編,《世紀之交的知識工程與知識科學》,清華大學出版社,2001年 [2] 林崇德,《學習與發(fā)展——中小學生心理能力發(fā)展與培養(yǎng)》,北京師范大學出版社,1999年 [3] 皮連生主編,《知識分類與目標導(dǎo)向教學——理論與實踐》,華東師范大學出版社,1998年 [4] 王永慶,《人工智能:原理、方法、應(yīng)用》,西安交通大學出版社,1994年 [5] M. W. Eysenck (1990), The Blackwell Dictionary of Cognitive Psychology [6] “科技部部長談知識基礎(chǔ)設(shè)施建設(shè)”,中國經(jīng)濟時報 ,http://www.qjst./kjdt /dt21-12/ dt21-1203-5.htm [7] 顧明遠主編:《教育大詞典》第一卷,上海教育出版社 [8] 董純才主編,《中國百科全書·教育卷》,中國大百科全書出版社,1985年版 [9] 郭強,知識與社會的互動機制:社會知識化進程,http://www./ guoq12.htm [10] 西安交通大學診斷與控制研究所編,知識工程的應(yīng)用——從數(shù)據(jù)到知識,2000年8月http://www./ckddforum/zsgc.htm
|
|