2.2.1 KDD*過程模型
基于雙庫協同機制的KDD*結構模型用于處理結構化數據挖掘問題,它區別于固有的KDD模型。在論證了數據子類結構的可達范疇與挖掘知識庫的推理范疇之間的等價關系的基礎上,它通過啟發型協調器從知識庫中發現知識短缺,啟動挖掘進程使機器自身主動聚焦,得到假設規則;并通過維護型協調器實時地到知識庫中對應位置查找重復、冗余、矛盾等情況進行知識庫的實時維護。該項內容已獲國家發明專利《一種基于雙庫協同機制的KDD*方法及系統》(ZL 01145080.0)(見附件 )。
下面通過KDD*結構模型與經典的KDD結構模型的對比做典型說明:
KDD結構模型旨在為KDD提供宏觀指導和工程化方法。目前,國內外學者已提出了若干模型,如Brachman等于1996年提出一種實用的KDD過程視圖,該視圖強調的是過程的交互性;NCR、SPSS、DaimlerChrysler和OHRA于1997年開始了KDD結構模型工業標準的制定工作,并在1999年推出了CRISP-DM的KDD結構模型工業標準的1.0版。這其中,Fayyad等提出的多階段模型以其通用性而被廣泛接受。這一模型如圖4所示:

圖4 Fayyad等提出的經典的KDD結構模型
基于雙庫協同原理(機制),我們提出了全新的KDD*結構模型,其總體結構如圖5所示:

圖5 KDD*系統總體結構圖
與Fayyad等提出的結構模型相比,KDD*有如下特征:
1) KDD*有機地溝通與融合了KDD*新發現的知識與基礎知識庫中固有的知識,使它們成為一個有機的整體;即實現了“用戶的先驗知識與先前發現的知識可以耦合到發現過程中”。
2) 在知識發現過程中,KDD*對于冗余性的、重復性的、不相容的信息做出了實時處理(即知識庫的實時維護),有效地減少了由于過程積累而造成的問題的復雜性,同時為新舊知識的融合與合成提供了先決條件;實現了“知識與數據庫同步進化”。
3) KDD*改變與優化了知識發現的過程與運行機制,實現了“多源頭”聚焦與減少評價量。
4) KDD*強化了知識發現的智能化程度,提高了認知自主性(這將是今后相當長的一階段內保持的研究基調),較有效地克服領域專家的自身局限性,實現了“采用領域知識輔助初始發現的聚焦”。
5) 作為KDD*的核心技術—雙庫協同機制的研究,揭示了在知識發現過程中,在一定的建庫原則下,知識庫與數據庫間的對應關系;為實現“限制性的搜索”而減小搜索空間、提高發掘效率提供了有效的技術方法。
上一頁 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] 下一頁
|