靜網PWA視頻評論

基於知識圖譜分析的產業創新評估預測模型研究

2023年10月04日

- txt下載

基於知識圖譜分析的產業創新評估預測模型研究

作者:未知
〔摘 要〕[目的]知識圖譜分析的自動化程度與動態性能不高,一直是其運用於產業創新研究領域的主要障礙。[方法]為解決上述難題,提出了基於知識圖譜分析的產業創新預測模型;給出了該模型的框架結構、功能模塊以及運作流程,詳述了其中的關鍵算法;該模型通過灰色分圖算法對產業創新項目規划進行內容界定與可能性評估,通過知識圖譜生長衍化算法對產業創新未來趨勢進行預測。[結果]實測結果表明,該模型比既有的預測模型,具有更高的分圖收斂速度和圖譜覆蓋度,並具備較為精準的預測能力。
  〔關鍵詞〕情報處理;知識圖譜分析;產業創新;評估預測
  DOI:10.3969/j.issn.1008-0821.2018.06.021
  〔中圖分類號〕G203;F276 〔文獻標識碼〕A 〔文章編號〕1008-0821(2018)06-0138-06
  〔Abstract〕[Objective]The low automation and dynamic processing capability of knowledge graph analysis systems and models are major obstacles in the advance of industrial innovation evaluation and prediction applications.[Context]In order to deal them,a novel industrial innovation evaluation and prediction model was proposed based on knowledge graph analysis.And its frameworks,functional modules,and working flows were given as following.By a novel grey sub graph algorithm,the model made industrial innovation project planes content definition and possibility assessment.And a knowledge graph growth and evolution algorithm was used to predict the future trend of industrial innovation.[Results]Actual measurement results showed that the model had better sub-graph convergence rate,graph coverage,and prediction efficiency than the traditional does.
  〔Key words〕information processing;knowledge graph analysis;industrial innovation;evaluation and prediction
  知?R圖譜在圖書情報學界也被稱為知識域可視化或知識領域映射地圖,該技術能夠將知識資源及其載體有機地結合起來,並且通過對知識點(資源)與知識鏈(關係)構成的複雜網絡進行處理,來挖掘、分析和顯示這些要素之間的深層次關係。目前,知識圖譜及其相關算法已在眾多交叉領域得到了應用,其中產業創新管理工作中廣泛應用知識圖譜作為決策輔助工具與信息情報管理手段,並出現了一批新型的知識圖譜應用方法與技術,包括:王學東等研究人員提出了產業衍生的知識圖譜耦合機理,並對其應用前景進行了分析[1]。陳瑜等人基於知識圖譜構建了戰略性新興產業創新演進框架,證明了知識圖譜對於產業創新具有良好的描繪與仿真能力[2]。韓路等人研究了基於貝葉斯網的知識圖譜連結預測算法,為知識圖譜預測與評估工作打開了思路[3]。Ali Saleh S與Nader Nada等人總結了「信息資源―知識圖譜―信息應用」的研究路徑,並指出知識圖譜結合時間序列計算等技術,具有廣闊的管理應用前景[4-5]。Heiko Paulheim與Gaimei Lu等人對知識圖譜的分圖評估技術進行了研究,並證明知識圖譜分圖算法能夠使管理者從局部視圖出發獲取所需信息,避免信息過量等問題[6-7]。Robert R.Hoffman和Kevin T.Knudsen等人對上述研究結果進行了論證,並且將知識圖譜預測技術應用在區域經濟管理等工作中,取得了良好的效果[8-9]。Yi Tay與John W.Coffey等人對知識圖譜在產業創新項目評估與預測工作中的應用進行了研究,提出了分圖算法在知識圖譜演進中的框架與流程[10-11]。Cyrus F.Nouran、Jean-Louis Ermine以及Yu-Hui Tao等人在稅收管理創新等領域應用了知識圖譜預測技術,並取得了良好的效果[12-14]。Wayne G.Lutters與Byron Marshall等人研究了知識圖譜分圖與子圖演進的框架與算法,並通過數據仿真證明了其有效性和適用性,為知識圖譜的預測與評估應用打開了思路[15-16]。儘管上述研究取得了一定的理論與實踐進展,並證明了知識圖譜在產業創新管理中的應用價值,但在實際工作中發現上述研究成果還存在人工干預較多、預測與評估精度較差、覆蓋度較低等問題。基於這些問題,本研究提出了一種基於知識圖譜分析的產業創新評估預測模型IIKM(Industrial Innovation Knowledge Graph Analysis Model),並給出了其中的關鍵算法。
  1 組成結構與處理流程
  為避免重複建設,本模型的知識本體(對象結構)採用美國史丹福的開源知識圖譜資源庫Protégé進行表述;而評估預測模型的組成結構與知識圖譜處理流程,如圖1所示:
圖1 模型結構與處理流程
  1.1 模型組成結構
  IIKM模型主要包括以下4個功能單元:
  首先是預處理單元:該單元主要對基礎知識圖譜與檢索圖譜進行預處理,從而為後續工作提供數據支持。其中,首先對專家提出的產業創新信息進行預處理,主要是將其作為檢索內容進行梳理,劃定檢索範圍與主體框架,生成檢索圖譜;其次是對於基礎知識圖譜(下文中簡稱:基礎圖譜)初步處理,主要進行內容初篩、修剪奇異分枝、最終劃定可用的子圖,從而減少後續任務的檢索工作量。
  其次是分圖單元:該單元主要以檢索圖譜為依據,對基礎圖譜進行檢索,最終從基礎知識圖譜中檢索到與檢索知識圖譜高度關聯的局部關聯圖譜,從而發現基礎圖譜中高度匹配檢索要求的部分,即:初步的產業創新項目支撐現狀評估。
  再次是評估預測單元:該單元主要完成產業創新發展的預測與評估工作,其基本內容是對某項產業創新的局部關聯圖譜進行知識節點與知識鏈的發展預測,並通過既往的關聯知識圖譜發展,對其發展趨勢進行評估,其中的主要操作是:首先是預測與評價空間的構建;其次是預測與評價過程的收斂達成。
  最後是決策輔助單元:該單元主要將評估與預測結果反饋給專家,完成管理輔助決策任務,其中的反饋形式包括評估與預測報告、可視化報表、動態跟蹤報表等。
  1.2 處理流程
  IIKM模型的主要處理流程包括以下4個步驟:
  Step1:由預處理單元與評估專家互動,通過接收與整合評估專家提供的關於產業創新項目的資料,以文本解析的方式,提取檢索要求,生成檢索圖譜;隨後根據檢索圖譜,對基礎圖譜進行預處理,精簡和剝離後得到基礎圖譜的檢索對象子圖,從而節省處理開銷。
  Step2:由分圖單元執行子圖譜識別與檢索,首先提取檢索圖譜的特徵,其次以其特徵、知識節點與知識鏈為依據,在基礎圖譜中高度匹配檢索要求的部分,即:局部關聯圖譜。
  Step3:評估與預測:以局部關聯圖譜為基礎,結合當前知識圖譜的歷史發展序列(時間序列),對圖譜的未來發展進行評估與預測。
  Step4:?⑵攔烙朐げ飩峁?進行整合,以報表與報告的形式反饋給專家;專家對反饋信息進行修正,並提交給相關部門,並最終根據反饋信息對模型中的參數配置進行優化與調整。
  2 關鍵算法
  2.1 基於灰色分圖算法的局部關聯知識圖譜
  這部分算法的實質是通過灰色分圖子算法,即:首先將外部信息檢索要求製作成檢索知識圖譜;並以此為依據,從基礎知識圖譜中進行灰色模糊檢索,得到與檢索知識圖譜高度匹配的局部關聯圖譜。初始的檢索知識圖譜的建立步驟如下:
  Step3:知識圖譜快速收斂處理:實踐中發現,對圖譜包絡計算中的距離處理,如果全部採用歐氏距離,後續收斂效率較低;而無論基礎圖譜還是檢索圖譜,其距離均應在一套知識圖譜坐標系統中生成,因此本算法採用了統一的、灰色快速收斂距離生成算法,即:
  此時,基礎知識圖譜中符合上述分圖匹配特徵的知識圖譜元素均屬於符合匹配條件的子圖。至此,根據檢索知識圖譜的特徵矢量,可以得到符合條件的局部關聯知識圖譜,並用於後續的預測與評估工作中。
  2.2 評估預測算法
  基於知識圖譜分析的產業發展預測與評估工作的實質,是對2.1節中得到的某項產業的局部關聯圖譜進行知識節點與知識鏈的發展預測,並通過既往的關聯知識圖譜發展,對其發展趨勢進行生長衍化模擬。如上文所述,在該算法的實現過程中,有兩個關鍵點:首先是預測與評價空間的構建;其次是預測與評價過程的收斂達成。下文將在算法描述的同時,論述這兩個關鍵點的達成方法:
  首先進行預測與評價空間的構建:
  Step2:預測關鍵特徵自動篩選:由於預測及評價使用的熵值是必須通過預測與評價空間(矩陣)進行,因此,當對某個具有b個評價及預測關鍵特徵(同時具有m個專家建議評估參數)的空間進行特徵自動篩選時,可以構建評價與預測空間,有:
  其次,由於產業創新項目預測與評估工作是在專家評判框架內推進的,必須在預測與評估過程中引入人工干預變量,基於2.2節第一部分「預測與評價空間構建」所得到的預測與評估邊界,本研究設計的預測與評估詳細算法如下:
  3 實驗結果與分析
  IIKM模型的效能在實際應用中得到了驗證。2017年10月10日至20日間,××省經信委對未來產業創新項目的可行性進行考察。目前較為通用的方法是,基於已構建完成的省產業知識圖譜數據,採用專家評判法與自動預測分析模型相結合,對各個項目進行考察,相關的軟硬體環境以及關鍵步驟如下:
  硬體環境採用了聯想System x3850 X6伺服器,其CPU為Xeon E7-4809,為適應知識圖譜模型的海量數據處理需求,存儲系統加強到32GB內存和20T外存(硬碟)。
  軟體環境的作業系統平台採用了Windows Server2008,資料庫平台採用了Oracle 12C,圖譜生成工具採用了美國搜索技術公司的VantagePoint。
  數據環境根據美國史丹福的開源知識圖譜資源庫Protégé標準進行搭建。其中,知識節點與知識鏈以圖譜元素形式存儲在Oracle資料庫中,Protégé庫作為資料庫存儲與VantagePoint分析工具之間的格式轉換通道。目前的省產業知識圖譜的數據量為知識節點19 723個,知識鏈94 723條(其中57%以上的知識鏈中關聯5個以上的節點),需要依此為基礎數據,對6個產業創新項目(其圖譜知識節點數量為200~400;知識鏈數量不超過2 000)進行發展預測與可行性研究。而對應的數據處理步驟為:
  Step1:基礎知識圖譜導入,即以Protégé為通道,將Oracle資料庫中存儲的數據導入VantagePoint分析工具中備用。
Step2:通過預測模型,即IIKM模型與KGDM(Knowledge Graph Detection Model)模型,分別對專家提出的產業創新要素信息進行預處理,主要是將其作為檢索內容進行梳理,劃定檢索範圍與主體框架,生成檢索圖譜。
  Step3:IIKM模型與KGDM模型分別根據自身模型生成的檢索圖譜,對導入VantagePoint分析工具中的基礎知識圖譜進行產業創新預測,並輸出預測的知識圖譜,導入VantagePoint工具中進行繪製,並提交給專家。
  基於上述需求、軟硬體環境以及數據處理步驟,××經信委通過IIKM模型與KGDM模型進行圖譜數據分析預處理,並進行了平行對比實驗。實驗過程是由14名產業創新研究專家組成的兩個考察小組分別對兩種模型進行了預測分析應用,而後兩個考察小組交換預測模型,對同一任務進行處理,完成後將得到的4組結果按模型進行匯總和整理:最終得到的3種主要實驗結果(圖譜覆蓋度、預測準確度,專家綜合評價指標)如圖2所示:
  IIKM模型與KGDM模型得到了2組預測結果,如圖2所示;2組預測結果的圖譜覆蓋度差別較大,體現了性能上的較大差異。圖2中,圖譜覆蓋度可以定義為:在全局知識圖譜中,通過一定的預測或發現模型處理,生成的局部知識圖譜,其信息量(知識節點與知識鏈)占實際所需信息量(完整的局部關聯知識圖譜)的比例。而由圖2可知,在5個產業創新項目的圖譜覆蓋度方面IIKM模型均具有較為明顯的優勢,說明其對局部關聯知識圖譜的挖掘效果較好,發展預測與態勢評估能力較強。
  如圖3所示;2組結果的預測準確度差別較大,體現了性能上的較大差異。其中,預測準確度可以定義為:在全局知識圖譜中,通過一定的預測或發現模型處理,生成的局部知識圖譜中實際被採納的信息量(完整的局部關聯知識圖譜),占到實際所需信息量的比例。而由圖3可知,在5個產業創新項目的預測精確度方面IIKM模型均具有較為明顯的優勢,說明其能較為準確地把握和預測局部關聯知識圖譜的發展趨勢與當前態勢,能夠節省較多的人工開銷與系統計算資源開銷。
  評分?Y果進行累計,待5次任務完成後,計算總的平均分。最終的專家評分結果顯示,IIKM模型在人機效能與實用性等方面,大大超過了KGDM模型,能夠較好地為知識圖譜用戶服務,具有良好的推廣前景。
  4 總結與未來工作
  基於知識圖譜分析的產業創新預測模型在實際應用中取得了較好的效果,體現出較高的實用價值與推廣前景。為適應我國萬眾創新的良好形式與產業升級大環境,還需要對該模型進行下列幾方面的優化:1)是知識圖譜與產業創新預測模型的普適化改造,從而為更廣泛、內容更複雜的領域提供服務;2)是研究收斂速度更快的預測與評估算法,從而提高產業創新預測工作的效率;3)是擴展知識圖譜的信息來源,並研究知識圖譜更新的自動化方法,從而進一步降低人工干預帶來的工作量,並減少主觀干涉帶來的不良影響。
  參考文獻
  [1]王學東,汪園.基於專利視角的武漢市信息技術產業創新現狀研究[J].現代情報,2017,37(9):144-149.
  [2]陳瑜,謝富紀,於曉宇.基於知識圖譜的戰略性新興產業創新研究演進分析[J].上海管理科學,2015,37(4):1-7.
  [3]韓路,尹子都,王鈺傑,等.基於貝葉斯網的知識圖譜連結預測[J].計算機科學與技術,2017,11(5):742-751.
  [4]Ali Saleh S.Balaid,Masoumeh Zibarzani,Mohd Zaidi Abd Rozan.A Comprehensive Review of Knowledge Mapping Techniques[J].Journal of Information Systems Research and Innovation,2015,2(12):58-63.
  [5]Nader Nada,Mohamed Kholief,Mahmoud Ghanem.Dynamic Knowledge Management Toolkit[J].Journal of Information Management,2017,12(4):192-199.
  [6]Heiko Paulheim.Knowledge Graph Refinement:A Survey of Approaches and Evaluation Methods[J].Journal of Information Science,2016,35(10):235-257.
  [7]Gaimei Lu,Danhua Su.Knowledge Mapping Analysis of Finance Research[J].American Journal of Industrial and Business Management,2015,5(1):686-698.
  [8]Robert R.Hoffman,John W.Coffey,Kenneth M.Ford.STORM_LK:A Human-Centered Knowledge Model For Weather Forecasting[J].Journal of Knowledge Management,2016,35(8):542-537.
  [9]Kevin T.Knudsen,Mark Blackburn.A Knowledge and Analytics-Based Framework and Model for Forecasting Program Schedule Performance[J].Procedia Computer Science,2016,5(7):319-326.
[10]Yi Tay,Luu Anh Tuan,Minh C.Phan.Multi-Task Neural Network for Non-discrete Prediction in Knowledge Graphs[J].Journal of Knowledge Management,2017,1(8):99-108.
  [11]John W.Coffey.Concept Mapping and Knowledge Modeling:A Multi-Disciplinary Educational,Informational,and Communication Technology[J].Journal of Information & Knowledge Science,2016,5(2):50-56.
  [12]Cyrus F.Nouran.Agent Computing,KB for Intelligent Forecasting,and Model Discovery for Knowledge Management[J].Journal of Information Processing Technology,2017,3(5):15-28.
  [13]Jean-Louis Ermine,Imed Boughzala,Thierno Tounkara.Critical Knowledge Map as a Decision Tool for Knowledge Transfer Actions[J].Journal of Knowledge Management,2014,4(2):129-140.
  [14]Yu-Hui Tao,Yu-Lung Wu,Jih-Kun Li.A Taxonomy of Knowledge Maps in Business Application[J].Journal of Management Information Systems,2017,3(1):12-37.
  [15]Wayne G.Lutters,Mark S.Ackerman,James Boster,et al.Mapping Knowledge Networks in Organizations:Creating a Knowledge Mapping Instrument[J].Journal of Management Information Systems,2017,3(5):42-61.
  [16]Byron Marshall,Hsinchun Chen,Therani Madhusudan.Matching Knowledge Elements in Concept Maps using a Similarity Flooding Algorithm[J].Journal of Decision Support Systems,2015,11(7):212-224.
  (?任編輯:孫國雷)

收藏

相關推薦

清純唯美圖片大全

字典網 - 試題庫 - 元問答 - 简体 - 頂部

Copyright © cnj8 All Rights Reserved.