8.下列何者是「強化學習」的特點?
(A)需預先標註所有資料
(B)透過正負反饋學習
(C)僅用於圖像辨識
(D)不需與環境互動
答案:登入後查看
統計: A(12), B(145), C(2), D(4), E(0) #3841129
統計: A(12), B(145), C(2), D(4), E(0) #3841129
詳解 (共 2 筆)
#7326878
強化學習的核心
• 原理: 強化學習就像「訓練寵物」。當 AI(Agent)做出正確動作時,環境會給予 「獎勵 (Reward)」;做出錯誤動作時則給予 「懲罰 (Penalty)」。
• 目標: AI 並不是學習特定的正確答案,而是透過不斷與環境互動,學習如何採取一系列動作來獲得 「最大累積獎勵」。
強化學習核心四要素:
• 代理人 (Agent): 學習的主體(AI)。
• 環境 (Environment): AI 運作的場所。
• 動作 (Action): AI 採取的行為。
• 獎勵 (Reward): 來自環境的正負回饋。
• 學習方式: 試錯法 (Trial and Error)。
• 關鍵字: 獎勵最大化、動態決策、AlphaGo。
• 代理人 (Agent): 學習的主體(AI)。
• 環境 (Environment): AI 運作的場所。
• 動作 (Action): AI 採取的行為。
• 獎勵 (Reward): 來自環境的正負回饋。
• 學習方式: 試錯法 (Trial and Error)。
• 關鍵字: 獎勵最大化、動態決策、AlphaGo。
1
0