3. 經過網路爬蟲收集的網頁資料（如新聞網頁 HTML 格式資料）為半結構化的內容，經過解析器取得各式重要資訊，並透過詮釋資料（Metadata）結構化這些內容，這樣的過程與下列何者較為相符？
(A) 資料擴增
(B) 資料組織
(C) 資訊分類
(D) 模型預測

答案：登入後查看
統計： A(3), B(39), C(3), D(3), E(0) #3156372

詳解 (共 1 筆)

hchungw

B1 · 2025/03/13

#6330645

解析題目與選項：

當我們透過網路爬蟲（Web Crawling）取得半結構化的資料（例如 HTML 格式的新聞內容），接著使用解析器（Parser）來提取關鍵資訊，並透過詮釋資料（Metadata）來結構化這些內容，這個過程的核心目的是整理與組織數據，使其更易於後續使用（如分析、存取或搜尋）。

選項分析：

(A) 資料擴增（Data Augmentation） ❌
→ 資料擴增通常用於機器學習和深度學習領域，指的是透過增加或變換現有數據來提升模型的泛化能力。例如，在圖像識別任務中，會透過旋轉、翻轉、調整亮度等方式來擴增訓練數據。這與本題的數據解析和結構化無關。

(B) 資料組織（Data Organization） ✅ (正確答案)
→ 資料組織是指將原始、雜亂或半結構化的數據整理成有結構的形式，例如存入資料庫或轉換為結構化數據，以便進一步分析或應用。本題描述的過程正是在做這件事，因此這是最符合的選項。

(C) 資訊分類（Information Classification） ❌
→ 資訊分類通常是指將已經結構化的資料進行分類，例如新聞分類（政治、娛樂、體育等），或者將電子郵件標記為垃圾郵件或正常郵件。題目描述的過程並不完全是資訊分類，而是更基礎的數據組織。

(D) 模型預測（Model Prediction） ❌
→ 模型預測是指使用機器學習模型來預測未來事件或分類新數據，例如股票價格預測、疾病診斷、垃圾郵件分類等。本題並未涉及任何模型訓練或推理，因此不相關。

詳解 (共 1 筆)

解析題目與選項：

選項分析：

相關試題

相關試卷