12. 某電商平台導入 CLIP(Contrastive Language-Image Pre-training)模型,讓使用 者能直接輸入文字描述來搜尋商品圖片。請問 CLIP 模型是透過哪一種方式來衡量文字描述與圖片之間的相符程度?
(A)餘弦相似度(Cosine Similarity),計算文字與圖片在向量空間中的方向相似 程度;
(B)BLEU 分數,衡量文字描述與圖片標題之間的詞彙重疊程度;
(C)交叉熵損失(Cross-Entropy Loss),用於衡量模型預測機率與實際標籤之間的 差異;
(D)F1 分數(F1 Score),綜合評估搜尋結果的精確率與召回率

答案:登入後查看
統計: A(1), B(0), C(0), D(0), E(0) #3923246