阿摩線上測驗 登入

申論題資訊

試卷:111年 - 111 高等考試_三級_資訊處理:資料庫應用#109770
科目:公職◆資料庫應用
年份:111年
排序:0

題組內容

四、機器學習(Machine Learning)主要任務可區分為監督式學習(Supervised ,監督式學習包括分 Learning)與非監督式學習(Unsupervised Learning) 類(Classification)與迴歸(Regression) ,非監督式學習最常用的是分群 (Clustering)。

申論題內容

(一)分類與迴歸要預測的值最主要的差異為何?

詳解 (共 1 筆)

詳解 提供者:hchungw
分類(Classification)與迴歸(Regression)預測值的主要差異
1. 預測值的性質
分類(Classification):
離散值:分類問題的預測值是離散的標籤或類別。目標是將輸入數據分配到預定的類別中。
範例:分類問題的常見範例包括垃圾郵件檢測(郵件是垃圾郵件或非垃圾郵件)、圖像識別(圖像中的對象是貓還是狗)、醫療診斷(病人是患有某種疾病還是沒有患病)等。
迴歸(Regression):
連續值:迴歸問題的預測值是連續的數值。目標是根據輸入數據預測一個實數值。
範例:迴歸問題的常見範例包括房價預測(根據房屋特徵預測價格)、股票市場預測(根據歷史數據預測股票價格)、溫度預測(根據氣象數據預測未來的溫度)等。
2. 輸出範圍
分類(Classification):
有限範圍:分類的輸出是有限的幾個可能類別中的一個。每個輸入樣本都被分配到一個特定的類別,這些類別是事先定義好的。
例子:二元分類(例如,二進制結果:0 或 1)、多類分類(例如,多個標籤:貓、狗、鳥)。
迴歸(Regression):
無限範圍:迴歸的輸出是一個連續的數值,範圍理論上是無限的。輸出可以是任何實數。
例子:預測房屋價格可以是任何正數,預測氣溫可以是任何合理範圍內的實數。
3. 評估方法
分類(Classification):
常見評估指標:準確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1 分數(F1 Score)、ROC-AUC 曲線(Receiver Operating Characteristic - Area Under Curve)。
混淆矩陣:常用於可視化分類器的性能,展示真實標籤和預測標籤之間的關係。
迴歸(Regression):
常見評估指標:均方誤差(Mean Squared Error, MSE)、平均絕對誤差(Mean Absolute Error, MAE)、R 方(R-squared)。
殘差分析:分析預測值與實際值之間的殘差分佈,評估迴歸模型的性能。
總結
分類:預測離散值,即將數據分配到預定的類別中。輸出是有限的幾個類別之一。
迴歸:預測連續值,即根據數據預測實數。輸出是一個無限範圍內的連續數值。
這是分類與迴歸在機器學習中的主要差異,它們適用於不同的問題和數據類型,並使用不同的評估方法來衡量模型性能。