資料探勘(Data Mining)是一種從大量數據中發現潛在知識和模式的過程。通常包括數據庫的預處理、模型的構建和模型的評估等過程。資料探勘的目的是從海量的數據中發現有用的信息,並據此做出決策或預測。
三種主要的分析型式是:
分類(Classification):該分析型式的目的是根據已知的標籤或類別,將數據分類到特定的類別中。該分析型式的預期成效是能夠在新數據中準確地分類出屬於哪一類別。
聚類(Clustering):該分析型式的目的是將數據根據它們之間的相似性或距離分組到不同的群組中,並且使同一群組中的數據彼此相似。該分析型式的預期成效是能夠發現數據之間的內在結構,以及從群組中發現有用的信息。
預測(Prediction):該分析型式的目的是根據過去的數據,預測未來可能發生的事件或趨勢。該分析型式的預期成效是能夠幫助使用者做出有根據的決策,並減少風險。