久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

數(shù)據(jù)挖掘

 求是1025 2023-03-31 發(fā)布于山東

數(shù)據(jù)庫中知識發(fā)現(xiàn)(knowledge discovery in database)是指將未加工的數(shù)據(jù)轉(zhuǎn)換為有用信息的整個過程,,此過程包括一系列轉(zhuǎn)換步驟,從數(shù)據(jù)的預(yù)處理到數(shù)據(jù)挖掘結(jié)果的后處理,。數(shù)據(jù)挖掘技術(shù)可以用來探查大型數(shù)據(jù)庫,,發(fā)現(xiàn)先前未知的有用模式。數(shù)據(jù)挖掘還可以預(yù)測未來觀測結(jié)果,。

數(shù)據(jù)挖掘利用了來自如下領(lǐng)域的思想:①統(tǒng)計學(xué)的抽樣,、估計和假設(shè)檢驗。②人工智能,、模式識別和機(jī)器學(xué)習(xí)的搜索算法,、建模技術(shù)和學(xué)習(xí)理論。③最優(yōu)化,、進(jìn)化計算,、信息論、信號處理,、可視化和信息檢索等領(lǐng)域的思想,。

通常,數(shù)據(jù)挖掘任務(wù)分為兩大類:①預(yù)測任務(wù),。這些任務(wù)的目標(biāo)是根據(jù)其他屬性的值,,預(yù)測特定屬性的值。②描述任務(wù),。此任務(wù)的目標(biāo)是導(dǎo)出概括數(shù)據(jù)中潛在聯(lián)系的模式(相關(guān),、趨勢、聚類,、軌跡和異常),。本質(zhì)上,,描述性數(shù)據(jù)挖掘任務(wù)通常是探查性的,,并且常常需要后處理技術(shù)驗證和解釋結(jié)果。其中,,預(yù)測建模涉及以自變量函數(shù)的方式為因變量建立模型,。有兩類預(yù)測建模任務(wù):一個是分類,用于預(yù)測離散的因變量,;另一個是回歸,,用于預(yù)測連續(xù)的因變量。

關(guān)聯(lián)分析,、聚類分析和異常檢測是實現(xiàn)數(shù)據(jù)挖掘任務(wù)的方法,。關(guān)聯(lián)分析用來發(fā)現(xiàn)描述數(shù)據(jù)中強(qiáng)關(guān)聯(lián)特征的模式。所發(fā)現(xiàn)的模式通常蘊含規(guī)則或特征子集的形式表示。由于搜索空間是指數(shù)規(guī)模的,,關(guān)聯(lián)分析的目標(biāo)是以有效的方式提取最有趣的模式,。聚類分析旨在發(fā)現(xiàn)緊密相關(guān)的觀測值組群,使得與屬于不同簇的觀測值相比,,屬于同一簇的觀測值相互之間盡可能類似,。異常檢測的任務(wù)是識別其特征顯著不同于其他數(shù)據(jù)的觀測值。這樣的觀測值稱為異常點或離群點,。異常檢測算法的目標(biāo)是發(fā)現(xiàn)真正的異常點,,而避免錯誤地將正常的對象標(biāo)注為異常點。

數(shù)據(jù)挖掘主要算法有決策樹算法(如C4.5和CART算法),、K均值聚類算法,、支持向量機(jī)、Apriori關(guān)聯(lián)算法,、EM最大期望算法,、連接分析算法(如PageRank算法)、AdaBoost迭代算法,、k鄰近算法,、樸素貝葉斯算法等。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息,,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請點擊一鍵舉報,。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多