淺析數據挖掘中的分類算法

作者:何峽峰時間:2015-12-16 13:47:03  來源:www.6scc.cn  閱讀次數:5579次 ]
【文章摘要】
分類算法在數據挖掘中的應用,可以避免出現傳統數據挖掘弊端,同時提高挖掘數據的應用有效性。本文結合具體實例,分析數據挖掘中的分裂算法。
【關鍵詞】
數據挖掘;分類算法;應用
針對數據挖掘中,應用分類算法,可以解決數據量大、計算復雜性高問題,提升數據挖掘的速率。可以在數據挖掘織中,引入分類算法內容,并可以結合實際的數據挖掘情況,再去選擇合適的分類算法,有效分析數據信息,使數據挖掘工作更加實用性,以下本篇對此做具體分析。
1 數據挖掘中的不同分類算法
1.1 分類訓練算法
針對分類算法中,分類訓練算法就是針對訓練樣本多的樣本,其中大多為非支持數據信息, 占用了計算和內存上的大量資源, 在每次的優化過程中, 通過迭代方式排除非支持數據信息,只保留當前支持數據信息, 節省計算時間與內存空間。數據挖掘中,采用分類算法,可以隨機選擇較少樣本作初始樣本集,在問題求解后從結果內去掉非支持數據信息, 再根據訓練結果對剩余樣本數據進行檢驗, 然后再將不符合優化條件的一部分樣本與數據合并,使其成為新的訓練樣本集, 重新訓練, 直到獲得最優訓練結果。
1.2 分類決策算法
分類決策算法中,應用決策樹作為預測模型,決策樹代表的是對象屬性同對象值間映射關系。決策樹中每個節點表示某個對象,而決策樹每個分叉路徑,則代表決策樹中的某個可能屬性值,而決策樹中的每個葉結點,則對應從決策樹根節點到該葉節點中,所有經歷的路徑對象值。在決策樹中不僅有單一輸出,還包含有復數輸出,可以建立獨立決策樹,這樣就可以處理不同輸出。
1.3 SLIQ 分類算法
SLIQ 分類算法對分類決策樹算法進行改進,采用“預排序”、“廣度優先”兩種技術。可以在決策樹的每個結點上,都對數據集進行排序,并且為需要進行訓練集的數據,在每個的屬性上創建出一個屬性列表,給每個元組類別上創建類別列表, 利用數據庫保存類別列表,有效提升算法計算速度。
2 分類算法在數據挖掘中的應用實例分析
2.1 應用分類算法實例一
應用分類算法可以挖掘出有用的煤礦瓦斯控制信息,對改善企業的發展進度產生積極影響。首先可以先建立決策樹, 然后再根據在瓦斯監測中的數據特點, 將狀態維作為本次的分類類別。取正常狀態維是P 類( 正例) , 報警狀態維是Q 類( 反例) ,然后建立相應的決策樹進行數據挖掘。如下圖1 中所示:
在本次所建立的決策樹中,包括甲烷傳感器、傳感器以及風速傳感器,對每個維成員的數據信息進行增益率計算, 將傳感器最大信息增益率維當做一個決策屬性的節點, 在通過為屬性的取值來建立本節點的分支。要求分類面能將兩類樣本點分開,并且保證兩分類空隙最大。對于其d 維空間中的線性判別函數,若是一般形式為,則分類面方程就是,然后在將判別函數進行歸一化,確保兩類樣本滿足,分類面樣本都正確分類
。
兩類樣本的分類空隙間隔大小為:
最優分類面表示成約束優化問題,求函數最小值
可以定義函數Lagrange :
基于決策樹的數據挖掘里面瓦斯濃度維,計算出信息的增益率, 以此來作為決策樹中的根結點,提高數據挖掘的效益。
2.2 應用分類算法實例二
針對校園教學系統,對其數據進行數據挖掘,應用分類算法進行數據挖掘,首先,就是應該確定出需要解決的一些目標問題,并設置數據挖掘模型。對于其數據挖掘步驟如下圖2 所示:
分類是已知一共有多少類, 并明確知道該類的特點, 然后把未知的按一定規則分到某一個類中;分類可以多可以少, 當然數據量大才能很好地說明分類算法的優異. 但實際上分類算法在確定某些規則后, 你可以只有一個未知的數據也可以把它分到某一個類別當中。
class CAdodc : public CWnd
{protected: DECLARE_DYNCREATE ( CAdodc)
public: CLSID const& GetClsid()
{
s t a t i c C L S I D c o n s t c l s i d = { 0x67397aa3, 0x7fb1, 0x11d0, { 0xb1, 0x48, 0x0, 0xa0, 0xc9, 0x22, 0xe8, 0x20 }
};
return clsid;
}
virtual BOOL Create( LPCTSTR lpsz ClassName,
L P C T S T R l p s z WindowName, DWORD dwStyle,
const RECT& rect,
CWnd* pParentWnd, UINT nID,
C C r e a t e C o n t e x t * pContext = NULL)
{ return Create Control ( GetClsid(), lpszWindowName,
dwStyle, rect, pParentWnd, nID); }
BOOL Create (
LPCTSTR lpsz WindowName, DWORD dwStyle,
const RECT& rect,
CWnd* pParentWnd, UINT nID,
CFile* pPersist = NULL,
BOOL bStorage = FALSE,
B S T R b s t r L i c K e y = NULL)
{ return CreateControl( GetClsid(), lpsz Window Name, dwStyle, rect, p Parent Wnd, nID,
p P e r s i s t , b S t o r a g e , bstrLicKey); }
在分類算法中,還可以可以應用模糊分類的方法,對U 之中國的單因素Ui(i=1,2,…,m),可以對其進行單因素的評價,然后可以根據因素ui 來確定處事物的評價等級,計算出vj(j=1,2,…,n) 隸屬度, 可以得到ri=(ril,ri2,…,rin) 向量,從而得到評價矩陣:
R 作為因素集U 以及評價集V 的模糊關系,可以用(ui,vj)=rij 來表示因素u。還可以進行模糊變換實現綜合評價:
= A × = ( a 1 , a 2 , a 3 , … ,an)× = (bi1,bi2,bi3,bi4)
其中,bik= (aij ∧ rijk) (i=1,2,3 ; k=1,2,3,4)
3 結語
綜上所述,針對數據挖掘中,應用分類算法,不僅可以提升數據挖掘中算法運行效率,還可以在數據挖掘中動態調用不同分類算法,使數據挖掘工作可以在穩定、高效環境中進行,對數據進行分類,大大提高數據挖掘中算法的性能與效率,發揮實際應用價值。
【參考文獻】
[1] 甘楊蘭, 趙梅, 牛森等. 基于云仿真環境數據挖掘的服務分類方法[J]. 計算機仿真,2014,31(10):460- 465.
[2] 李學明, 楊陽, 秦東霞等. 基于頻繁閉項集的新關聯分類算法ACCF[J]. 電子科技大學學報,2012,41(1):104-109.
[3] 覃梅. 數據挖掘分類算法在信用卡風險管理中的應用[J]. 現代計算機(專業版),2013,(13):13-16.

本站論文資源均為來自網絡轉載,免費提供給廣大作者參考,不進行任何贏利,如有版權問題,請聯系管理員刪除! 快速論文發表網(www.6scc.cn)本中心和國內數百家期刊雜志社有良好的合作關系,可以幫客戶代發論文投稿.

投稿郵箱:ksfbw@126.com
客服Q  Q: 論文發表在線咨詢82702382
聯系電話:15295038833

本站論文資源均為來自網絡轉載,免費提供給廣大作者參考,不進行任何贏利,如有版權問題,請聯系管理員刪除!

廣告推薦

文章評論

共有 0 位網友發表了評論

閱讀排行

推薦文章

最新文章

主站蜘蛛池模板: 93精91精品国产综合久久香蕉| 国产日韩欧美综合| 亚洲AV人无码综合在线观看 | 欧美日韩国产综合一区二区三区| 国产成人综合久久综合| 色综合天天综合婷婷伊人| 色视频综合无码一区二区三区| 天天做天天爱天天爽综合网| 国产色综合久久无码有码| 久久综合久久综合久久综合| 一本久道久久综合狠狠爱| 国产欧美日韩综合精品二区| 久久综合九色综合97_久久久| 五月丁香综合缴情六月小说| 国产成人综合亚洲亚洲国产第一页| 青青青国产色视频在线观看国产亚洲欧洲国产综合 | 亚洲综合色在线观看亚洲| 亚洲va欧美va国产综合| HEYZO无码综合国产精品| 欧美精品国产日韩综合在线| 亚洲国产成人久久综合碰碰动漫3d | 色欲久久久天天天综合网| 精品综合久久久久久888蜜芽| 综合在线视频精品专区| 日韩亚洲欧美久久久www综合网| 欧美日韩国产综合新一区| 五月天婷五月天综合网在线 | 亚洲精品第一综合99久久| 伊人久久大香线蕉综合热线| 青青热久久综合网伊人| 国产成人亚洲综合色影视| 婷婷五月综合色视频| 久久婷婷五月综合国产尤物app | 一本色道久久综合狠狠躁| 综合无码一区二区三区| 亚洲综合偷自成人网第页色 | 亚洲成a人v欧美综合天堂 | 久久99国产综合精品免费| heyzo专区无码综合| 欧美日韩国产色综合一二三四 | 亚洲香蕉网久久综合影视|