44. VGG16 層數深且結構規則,由多層卷積、池化及全連接層組成。了解各層的輸入/輸出維度、參數量及記憶體需求,有助於掌握 CNN 模型的組成邏輯 與實作技巧。根據 VGG16 的模型架構,下列敘述何者正確? (A)AdaptiveAvgPool2d 的輸出會被攤平後傳入第一個全連接層;由於前一層池化輸出空間為 4×4,所以第一個線性層的輸入維度是 512×4×4 =8192; (B)Linear-33(第一個全連接層)報出的 102,764,544 參數只包含權重, 偏差(bias)沒有算在內; (C)根據列出的「Estimated Total Size (MB) = 624.98」,表示訓練此模 型只需大約 625MB 的 GPU 記憶體(包含所有 optimizer state 與梯度),所 以一張 1 GB 的 GPU 就足夠訓練; (D) VGG16 包含 13 層卷積層(conv)與 3 層全連接層(FC),總參數數目約為 138,357,544(約 138.36M)