數據的預處理一般包括哪些步驟

【數據的預處理一般包括哪些步驟】1、墓于粗糙集理論的約簡方法粗糙集理論是一種研究不精確、不確定性知識的數學工具 。
2、基于概念樹的數據濃縮方法在數據庫中 , 許多屬性都是可以進行數據歸類,各屬性值和概念依據抽象程度不同可以構成一個層次結構,概念的這種層次結構通常稱為概念樹 。
3、信息論思想和普化知識發現 特征知識和分類知識是普化知識的兩種主要形式,其算法基本上可以分為兩類:數據立方方法和面向屬性歸納方法 。
4、基于統計分析的屬性選取方法 我們可以采用統計分析中的一些算法來進行特征屬性的選?。熱韁鞒煞址治?、著c交毓櫸治觥⒐慘蛩嗇P頭治齙日廡┓椒ǖ墓餐卣魘?,用少量的特征元組去描述高維的原始知識基 。
5、遺傳算法是一種基于生物進化論和分子遺傳學的全局隨機搜索算法 。遺傳算法的基本思想是:將問題的可能解按某種形式進行編碼,形成染色體 。再根據預定的評價函數對每個染色體計算適應值 。通過遺傳算法來搜尋出更重要的變量組合 。

    推薦閱讀