45. 下列哪一個資料集專門設計用於測試大型語言模型在多領域、多任務 語言理解中,涵蓋人文、科學與社會科學等領域,而非專門用於數學推 理或中文專業知識?
(A)MMLU;
(B)GSM8K;
(C)MATH;
(D)C-Eval
答案:登入後查看
統計: A(0), B(0), C(0), D(1), E(0) #3870649
統計: A(0), B(0), C(0), D(1), E(0) #3870649