最好看的2019中文大全,国产精品亚洲一区二区入口,国产日韩91,V片免费看

· 國家檔案局主管· 中國檔案雜志社主辦1951年創刊歡迎來到中國檔案網 !2025年08月20日    星期三

學術科研

港航工程項目檔案知識智能服務

作者:楊晶晶 來源:中國檔案 發表時間:2017-05-05 分享到:

港口航道勘察設計工程項目隨海外項目、合資業務、水文測量、工程總包、監理檢測、設計咨詢等業務的拓展,其單位全宗內產生的電子文件逐漸向多層次、多樣化以及多類型發展,與此同時,用戶對于蘊含在電子文件內容中的知識需求日益增長。本文主要根據港航勘察設計工程項目歸檔電子文件的內容結構及其描述特點,構建基于文獻主體內容的勘察設計項目檔案知識倉庫和知識網絡,實現檔案知識的主動服務及智能服務,發掘檔案知識的潛在價值。

港航工程項目建港條件復雜、建設形式各異,碼頭按照貨種劃分有集裝箱、散貨、液體化工、礦石、原油、滾裝、郵輪等類型,在具體工程的勘察測量、設計施工及竣工中又需要水工結構設計、勘察、平面、裝卸工藝、土建結構、通信控制、道路堆場各專業的協同工作,生成了結構體系化、內容多元化的項目檔案數據資源,并且在項目建設階段主要產生了申請報告、初步設計報告、方案、工程可行性研究報告、規格書、論證報告、規劃書、設計圖紙和竣工文件等。同時,檔案管理系統存儲服務器上儲存了大規模相應的亟待梳理的結構化數據和非結構化數據。在基礎檔案管理系統數字化管理基本實現的前提下,知識需求增長對檔案數據開發利用提出兩個問題:第一是“如何將每份電子文件內容中的數值、圖表、圖紙、事實、概念甚至一個創新點作為知識單元”,第二是“通過何種手段將知識的控制單位從文件深入到文件所含的數字、公式、原理、事實、結論等最小的獨立的知識單元”。以這兩個問題為出發點,建設港航工程項目檔案知識數據庫、實施檔案知識標引鏈接、構建規范的檔案知識網絡,從而提供獨立于原始文獻的檔案智能服務,就成為拓展港航建設項目檔案服務形式、踐行檔案智能服務理念的落腳點。

基于內容的數值型檔案知識整合

數值型知識是指描述某個事件或者某客觀事實的有關數據值方面屬性的知識單元,在港航建設行業可能涉及的數值型知識主要有時間、規模、指標、數量、長度、高程、重量、溫度、速度及百分比等。基于檔案內容的數值型知識開發體現為一標引、二關聯和三建庫。一標引指對工程項目建設過程中涉及數據屬性的關鍵詞進行標引。以某個原油碼頭為例,涉及的數據關鍵詞主要有碼頭30萬噸級、長度502米、年通過能力1800萬噸、88米跨人行鋼橋。二關聯指通過對數值語句群體的抽取、篩選過濾及排重等實現數值型知識的挖掘及知識的關聯建設,構建數據、工程項目、設計參與人之間的關系體系。三建庫指將經過標引的檔案知識及其關聯關系存儲在數據庫中,形成檔案知識倉庫。

首先,統一數據源是以港航工程項目檔案管理系統服務器中存儲的全部文件的數據內容作為數據源基礎,其中包括工程建設過程中從工程可行性研究、初步設計到施工竣工形成的電子文件及圖紙檔案。其次,統一檢索系統是指在建立基于全文內容的電子文件檢索系統的基礎上,制定檔案數值型知識的自動抽取決策,提高主體抽取規則的置信度。具體實施方式為鍵入查詢條件,通過查詢標引過的檔案知識實現匹配結果的規律性返回。最后,由點到面的檔案知識推送指的是將檢索結果(工程項目、港址港區、設計人員等數據要素)向與其相關的檔案知識發散,實現由點到面的檔案數據推送。

設計圖紙中的檔案知識整合

圖紙檔案知識的特點為核心度高、價值度高以及隱性程度高,同時這也體現出圖紙檔案知識整合開發的必要性。第一,圖紙檔案知識的核心度高可以解釋為港航項目檔案的主要組成部分為檔案管理系統中存儲的設計圖紙,并且圖紙的電子文件是港航項目檔案中利用率最高的檔案,其主體性和高利用性代表了其在港航項目檔案中的核心地位。第二,圖紙檔案知識的價值度高可以理解為項目的圖紙檔案不僅是港航企業永久保存的檔案資源,而且是價值最大的檔案資源,對其重視程度代表了圖紙檔案知識整體的高度價值屬性。第三,圖紙檔案知識的隱性程度高,其主要原因在于圖紙檔案知識體系的松散性,其高度的隱性化也正與其高價值緊密依存。圖紙檔案知識作為港航企業最為核心、價值度最高的檔案資源,如何對其中包含的隱性知識實施描述,實現知識的顯性化處理分析并建立檔案數據關聯是使這些核心檔案發揮最大價值的重中之重。

圖紙檔案知識的整合主要包括基于要素的檢索、精細化圖紙檔案知識服務以及圖紙檔案知識庫的建立。首先,基于要素的檢索是通過從文件中自動抽取的圖紙以及其對應的題名、屬性、來源、內容、相關圖紙和設計人員等要素實現基于圖紙內容的檢索。其次,通過推送性和屬性類別的遞次性實現圖紙檔案知識的精細化服務。推送性顯示了檔案數據由被動服務向主動服務的轉變,顯示了檔案知識從靜止到主動向用戶推送的轉換。屬性類別的遞次性是指通過對檔案知識類別的細化分類及屬性劃分,將不同屬性類別的檔案知識賦予其特有標簽,例如通過碼頭結構、圖紙類型、建筑結構、海岸地貌、基礎形式、所在港區等屬性區分圖紙類項。圖紙檔案知識在新的屬性設置下能夠為用戶提供更為精細化、準確化和定制化的檔案數據,在知識智能查詢前提下,用戶可以通過集裝箱碼頭、重力式結構、輻射狀沙洲等標簽獲取更加專業、準確的港航知識。

勘察設計圖表中的檔案知識整合

港航建設勘察設計工作中會生成大量的圖表類檔案文件。例如,一份勘察報告(科技檔案)所涉及的表格主要包括:工作量統計表、物理力學性質指標、鉆孔數據一覽表、地基承載力特征值、土工試驗成果表、地基土液化判別成果表、地下水穩定水位、十字板剪切試驗成果、各主要土層不同壓力段下沉降計算參數、各土層超固結比OCR值統計成果表、地基土評價一覽表、抗剪強度統計表等。

蘊含在電子檔案中的圖表知識,具有獨立于整體文獻的特殊價值。檔案管理者通過對圖表檔案知識所含的名稱、地區、時間、內容、來源及人員等數據信息的提取標引,運用屬性劃分的方法對表格文檔分門別類并進行相關信息提取,同時利用數據技術實現檔案信息整合發布。體現在利用層面即用戶可以按照檔案內圖表表名中的某個關鍵詞或檔案內圖表所含的內容檢索查詢有關電子圖表。

港航工程項目檔案概念檢索

項目檔案概念檢索主要包括描述提取、導航鏈接和知識創新。第一步描述提取是指檔案管理者按照知識類別從港航工程項目檔案知識內容中依次提取出知識對象,進行描述、存儲及知識鏈接后,將若干篇檔案文獻中獲得的知識單元導入倉庫。第二步在相關的檔案知識概念與內容、內容與內容、結構與內容之間進行導航鏈接,將檔案中挖掘的知識概念通過點與點的關系導航構建檔案知識概念網絡式布局。第三步對檔案知識概念網絡分析研究后,檔案知識的組織結構由等級式轉向網絡式,新知識產生、知識創新得以實現。檔案知識概念拓展后產生的新知識主要有檔案知識單元的內外因、原理、結構組成、概念揭示、實踐方法、主要應用、對比等。例如,對港航建設項目檔案中“碼頭結構”這一概念進行知識歸納整合,檔案管理者對不同結構碼頭的條件、適用、方法、原因、特點、屬性等進行知識組織及知識整合,依次將基于多級鏈接知識的組織結構由等級結構轉向網絡結構,建立一個知識豐富的可理解的檔案概念知識庫。檔案概念知識庫可以反映其所在檔案數據知識概念及兩兩之間的關聯關系,從而使獨立于原始文獻的檔案知識發現及知識創新得以實現,基于復合概念關聯度的檢索結果計算得以實現。

檔案管理者進行港航工程項目檔案數據整合分析、建設檔案知識元系統,其效益性主要體現為三個“高效”。第一個“高效”是指“查詢高效”,結合檢索技術實施檔案知識整合能夠不斷完善檔案知識庫的同義描述元素集合、分類樹以及關系表的增量化管理,能夠及時研究檢索結果處理方式,從而保證用戶檢索請求的知識查全率和查準率。第二個“高效”是指“集中高效”,檔案知識推送服務的宗旨就是對分散的檔案知識數據進行集中分析挖掘,準確、快速地形成關聯規則約束下的各類整合后的信息和知識,系統具有良好的可擴展性。第三個“高效”是指“智能高效”,港航工程項目檔案知識的智能化服務手段可以帶來用戶滿意度優化、生產優化、經營優化和決策優化。

作者單位:中交第一航務工程勘察設計院有限公司