31.機器學習有一種方法是透過與環境的互動來學習,在這個過程中根據演算法嘗試的結果給予回饋值(正回饋或負回饋),通過不斷地與環
境互動並根據回饋調整行動,直到學習出越來越有效率的策略。請問以上敘述指的是哪一種學習方法?
(A)監督式學習(Supervised Learning)
(B)非監督式學習 (Unsupervised Learing)
(C)強化式學習 (Reinforcement Learning)
(D)自我學習(Self Learning)
答案:登入後查看
統計: A(9), B(6), C(66), D(9), E(0) #3247026
統計: A(9), B(6), C(66), D(9), E(0) #3247026
詳解 (共 2 筆)
#6342780
**強化式學習(Reinforcement Learning)**是一種機器學習方法,其中代理人(Agent)在環境中進行行動,並根據這些行動獲得回饋(獎勳或懲罰),以學習制定最佳策略。代理人透過試探和錯誤的方式,逐步學習如何在特定情境下做出最有利的決策。Zendesk
-
監督式學習(Supervised Learning):在這種方法中,模型在帶有標籤的資料上進行訓練,學習從輸入到已知輸出的映射關係。
-
非監督式學習(Unsupervised Learning):此方法處理未標籤的資料,旨在發現資料中的隱藏模式或結構,例如群集分析。Amazon Web Services, Inc.
-
自我學習(Self Learning):這通常指模型在沒有明確標籤的情況下,自行從資料中學習,但通常需要某種形式的監督或指導。All About DataScience+1Medium+1
0
0