2.3 新技術方法
這里所論的技術方法主要包括:數據挖掘算法、數據預處理方法、知識表示方法、知識評價方法、知識優化方法等。
按照知識發現的發展歷程,我們來展開對相應的技法的描述如下所示:
由理論基礎、內在認知機理和新結構模型派生出十種新技術方法。即:1) 源于KDD*的挖掘關聯規則的Maradbcm算法;2) 基于遺傳算法與梯度下降法聚類算法;3) 基于事實與規則的KDK*歸納發現新算法;4) 源于KD(D&K)的關聯規則的自動評價系統方法;5) 基于小波神經網絡的混沌模式的挖掘算法;6) 因果關聯規則的挖掘算法;7) 源于DFSSM的Web文本分類挖掘算法;8) 源于DFSSM的Web文本聚類挖掘算法;9) 圖象信息挖掘算法(相似模式等);10)源于KD(D&K)的分布式數據庫(水平、垂直分片)關聯規則挖掘算法。這些用于處理結構化數據、非結構和半結構化數據和知識庫的知識發現的新技法,經與原有技法的大量的實驗對比,均表現出較大的優勢,并在不同程度上解決了一些固有的問題;其表現出來的高效性和可擴展性是由KDTICM這一新理論決定的。
新技術方法的新穎性與先進性:限于篇幅限制,下面僅給出四個例子加以說明。
2.3.1源于KDD*的挖掘關聯規則的Maradbcm算法(以下簡稱M算法)
基于雙庫協同機制和KDD*模型,我們提出了一種全新的挖掘關聯規則的M算法,其主要步驟如下:
數據預處理:這里主要是用戶選擇真實數據庫,對真實數據庫中的連續屬性進行離散化,形成發掘數據庫(n個表,table1,table2,…,tablen)
調用啟發協調算法的步驟
x=2
for every riÎKx
求取intensity(ri)
if intensity(ri)
delete ri from Kx
else
KDD_process(rx) //激發KDD進程進行定向挖掘
x:=x+1
求取
從中產生Kx
if Kx¹f
for every riÎKx
求取intensity(ri)
if intensity(ri)i在可達矩陣中所對應的元素等于1 then
delete ri from Kx
else
KDD_process(rx) //激發KDD進程進行定向挖掘
轉步驟10)
顯示新產生的規則
結束
procedure KDD_process(rx:array of Integer)
execSQL() // 執行SQL語句進行定向搜索
calculate support(ri), confidence(ri), LS(ri)
if support(ri)>minSup and confidence(ri)>minCon and LS(ri)>minLS then
interruptive_coordinator(ri) // 調用維護型協調器,進行重復、冗余、矛盾、從屬、循環等的處理
該項內容已獲國家發明專利《一種基于雙庫協同機制的KDD*方法及系統》(ZL 01145080.0)(見附件 )。
上一頁 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] 下一頁
|