午夜视频在线网站,日韩视频精品在线,中文字幕精品一区二区三区在线,在线播放精品,1024你懂我懂的旧版人,欧美日韩一级黄色片,一区二区三区在线观看视频

分享

終于有人把知識圖譜講明白了

 liuaqbb 2021-02-23

導(dǎo)讀:知識圖譜的概念誕生于2012年,由Google公司首先提出。知識圖譜的提出是為了準(zhǔn)確地闡述人、事、物之間的關(guān)系,最早應(yīng)用于搜索引擎。知識圖譜是為了描述文本語義,在自然界建立實(shí)體關(guān)系的知識數(shù)據(jù)庫。一般情況下,我們可以使用關(guān)系圖來表示知識圖譜。

作者:劉宇 趙宏宇 劉書斌 孫明珠

來源:華章科技

終于有人把知識圖譜講明白了

01 什么是知識圖譜

我們可以從不同的視角去審視知識圖譜的概念。

  • Web視角下,知識圖譜如同簡單文本之間的超鏈接一樣,通過建立數(shù)據(jù)之間的語義鏈接,支持語義搜索。
  • 自然語言處理視角下,知識圖譜就是從文本中抽取語義和結(jié)構(gòu)化的數(shù)據(jù)。
  • 知識表示視角下,知識圖譜是采用計(jì)算機(jī)符號表示和處理知識的方法。
  • 人工智能視角下,知識圖譜是利用知識庫來輔助理解人類語言的工具。
  • 數(shù)據(jù)庫視角下,知識圖譜是利用圖的方式去存儲知識的方法。

目前,學(xué)術(shù)界還沒有給知識圖譜一個(gè)統(tǒng)一的定義。在谷歌發(fā)布的文檔中有明確的描述,知識圖譜是一種用圖模型來描述知識和建模世界萬物之間關(guān)聯(lián)關(guān)系的技術(shù)方法。

知識圖譜還是比較通用的語義知識的形式化描述框架,它用節(jié)點(diǎn)表示語義符號,用邊表示語義之間的關(guān)系,如圖3-1所示。在知識圖譜中,人、事、物通常被稱作實(shí)體或本體。

終于有人把知識圖譜講明白了

▲圖3-1 知識圖譜示例

知識圖譜的組成三要素包括:實(shí)體、關(guān)系和屬性。

  • 實(shí)體:又叫作本體(Ontology),指客觀存在并可相互區(qū)別的事物,可以是具體的人、事、物,也可以是抽象的概念或聯(lián)系。實(shí)體是知識圖譜中最基本的元素。
  • 關(guān)系:在知識圖譜中,邊表示知識圖譜中的關(guān)系,用來表示不同實(shí)體間的某種聯(lián)系。如圖3-1所示,圖靈和人工智能之間的關(guān)系,知識圖譜和谷歌之間的關(guān)系,谷歌和深度學(xué)習(xí)之間的關(guān)系。
  • 屬性:知識圖譜中的實(shí)體和關(guān)系都可以有各自的屬性,如圖3-2所示。
終于有人把知識圖譜講明白了

▲圖3-2 知識圖譜中的屬性

知識圖譜的構(gòu)建涉及知識建模、關(guān)系抽取、圖存儲、關(guān)系推理、實(shí)體融合等多方面技術(shù)。知識圖譜的應(yīng)用則體現(xiàn)在語義搜索、智能問答、語言理解、決策分析等多個(gè)領(lǐng)域。

02 知識圖譜的價(jià)值

知識圖譜最早應(yīng)用于搜索引擎,一方面通過推理實(shí)現(xiàn)概念檢索,另一方面以圖形化方式向用戶展示經(jīng)過分類整理的結(jié)構(gòu)化知識,從而使人們從人工過濾網(wǎng)頁尋找答案的模式中解脫出來,可應(yīng)用到智能問答、自然語言理解、推薦等方面。

知識圖譜的發(fā)展得益于Web技術(shù)的發(fā)展,受KR、NLP、Web以及AI等方面的影響。知識圖譜的價(jià)值歸根結(jié)底是為了讓AI變得更智慧。

1. 助力搜索

搜索的目的是在萬物互聯(lián)的網(wǎng)絡(luò)中,能夠使人們方便、快速地找到某一事物。目前,我們的搜索習(xí)慣和搜索行為仍然是以關(guān)鍵詞為搜索目的,知識圖譜的出現(xiàn)可以徹底改變這種搜索行為模式。

在知識圖譜還沒有應(yīng)用到搜索引擎上時(shí),搜索的流程是:從海量的URL中找出與查詢匹配度最高的URL,按照查詢結(jié)果把排序分值最高的一些結(jié)果返回給用戶。在整個(gè)過程中,搜索引擎可能并不需要知道用戶輸入的是什么,因?yàn)橄到y(tǒng)不具備推理能力,在精準(zhǔn)搜索方面也略顯不足。

而基于知識圖譜的搜索,除了能夠直接回答用戶的問題外,還具有一定的語義推理能力,大大提高了搜索的精確度。圖3-3所示是知識圖譜助力搜索示意圖。

終于有人把知識圖譜講明白了

▲圖3-3 知識圖譜助力搜索

2. 助力推薦

推薦技術(shù)和搜索技術(shù)非常相似,但是稍有區(qū)別。搜索技術(shù)采用信息拉取的方式,而推薦技術(shù)采用信息推送的方式,所以在推薦技術(shù)中有一些問題,比如冷啟動(dòng)和數(shù)據(jù)稀疏問題。

以電商推薦為例介紹知識圖譜在推薦上的應(yīng)用。假設(shè)我買了手機(jī),手機(jī)的強(qiáng)下位關(guān)系是手機(jī)殼,這樣系統(tǒng)就可以給我推薦手機(jī)殼,同時(shí)也可以推薦相似或互補(bǔ)的實(shí)體。圖3-4為知識圖譜助力推薦示意圖。

終于有人把知識圖譜講明白了

▲圖3-4 知識圖譜助力推薦

3. 助力問答

問答與對話系統(tǒng)一直是NLP在人工智能實(shí)現(xiàn)領(lǐng)域的關(guān)鍵標(biāo)志之一。知識圖譜相當(dāng)于是給問答與對話系統(tǒng)掛載了一個(gè)背景知識庫。

對于問答與對話系統(tǒng)或者聊天機(jī)器人來說,其除了需要實(shí)體知識圖譜和興趣知識圖譜等開放領(lǐng)域的稀疏大圖外,還需要針對機(jī)器人和用戶個(gè)性化的稠密小圖。同時(shí),知識圖譜是需要?jiǎng)討B(tài)更新的。圖3-5是知識圖譜助力問答示意圖。

終于有人把知識圖譜講明白了

▲圖3-5 知識圖譜助力問答

03 知識圖譜的架構(gòu)

知識圖譜的架構(gòu)涉及知識表示、知識獲取、知識處理和知識利用等多個(gè)方面。

一般情況下,知識圖譜構(gòu)建流程如下:首先確定知識表示模型,然后根據(jù)不同的數(shù)據(jù)來源選擇不同的知識獲取手段并導(dǎo)入相關(guān)的知識,接著利用知識推理、知識融合、知識挖掘等技術(shù)構(gòu)建相應(yīng)的知識圖譜,最后根據(jù)不同應(yīng)用場景設(shè)計(jì)知識圖譜的表現(xiàn)方式,比如:語義搜索、智能推薦、智能問答等。

從邏輯上,我們可以將知識圖譜劃分為兩個(gè)層次:數(shù)據(jù)層和模式層。數(shù)據(jù)層可以是以事實(shí)為單位存儲的數(shù)據(jù)庫,可以選用的圖數(shù)據(jù)庫有RDF4j、Virtuoso、Neo4j等三元組。

<實(shí)體,關(guān)系,實(shí)體>或者<實(shí)體,屬性,屬性值>可以作為基本的表達(dá)方式,存儲在圖數(shù)據(jù)庫中。模式層建立在數(shù)據(jù)層之上,是知識圖譜的核心。通常,通過本體庫來管理數(shù)據(jù)層,本體庫的概念相當(dāng)于對象中“類”的概念。借助本體庫,我們可以管理公理、規(guī)則和約束條件,規(guī)范實(shí)體、關(guān)系、屬性這些具體對象間的關(guān)系。

知識圖譜有自頂向下自底向上兩種構(gòu)建方式。自頂向下構(gòu)建是指借助百科類數(shù)據(jù)源,提取本體和模式信息,并加入知識庫中。自底向上構(gòu)建是指借助一定的技術(shù)手段,從公開的數(shù)據(jù)中提取資源,選擇其中置信度較高的信息,經(jīng)人工審核后,加入知識庫中。

在知識圖譜發(fā)展初期,多數(shù)企業(yè)和機(jī)構(gòu)采用自頂向下的方式構(gòu)建知識圖譜,目前大多企業(yè)采用自底向上的方式構(gòu)建知識圖譜。

知識圖譜的架構(gòu)如圖3-6所示。

終于有人把知識圖譜講明白了

▲圖3-6 知識圖譜的架構(gòu)

  • 知識源:包括結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。
  • 信息抽?。?/strong>就是從各種類型的數(shù)據(jù)源中提取實(shí)體、屬性以及實(shí)體間的相互關(guān)系,在此基礎(chǔ)上形成本體的知識表述。知識圖譜的構(gòu)建過程中存在大量的非結(jié)構(gòu)化或者是半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在知識圖譜的構(gòu)建過程中需要通過自然語言處理的方法進(jìn)行信息抽取。從這些數(shù)據(jù)中,我們可以提取出實(shí)體、關(guān)系和屬性。
  • 知識融合:主要工作是把結(jié)構(gòu)化的數(shù)據(jù)以及信息抽取提煉到的實(shí)體信息,甚至第三方知識庫進(jìn)行實(shí)體對齊和實(shí)體消歧。這一階段的輸出應(yīng)該是從各個(gè)數(shù)據(jù)源融合的各種本體信息。
  • 知識加工:知識加工階段如圖3-6所示,其中知識推理中重要的工作就是知識圖譜的補(bǔ)全。常用的知識圖譜的補(bǔ)全方法包括:基于本體推理的補(bǔ)全方法、相關(guān)的推理機(jī)制實(shí)現(xiàn)以及基于圖結(jié)構(gòu)和關(guān)系路徑特征的補(bǔ)全方法。

    本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多