3. 經過網路爬蟲收集的網頁資料(如新聞網頁 HTML 格式資料)為半結
構化的內容,經過解析器取得各式重要資訊,並透過詮釋資料(Metadata)
結構化這些內容,這樣的過程與下列何者較為相符?
(A) 資料擴增
(B) 資料組織
(C) 資訊分類
(D) 模型預測
答案:登入後查看
統計: A(3), B(37), C(3), D(3), E(0) #3156372
統計: A(3), B(37), C(3), D(3), E(0) #3156372
詳解 (共 1 筆)
#6330645
解析題目與選項:
當我們透過網路爬蟲(Web Crawling)取得半結構化的資料(例如 HTML 格式的新聞內容),接著使用解析器(Parser)來提取關鍵資訊,並透過詮釋資料(Metadata)來結構化這些內容,這個過程的核心目的是整理與組織數據,使其更易於後續使用(如分析、存取或搜尋)。
選項分析:
(A) 資料擴增(Data Augmentation) ❌
→ 資料擴增通常用於機器學習和深度學習領域,指的是透過增加或變換現有數據來提升模型的泛化能力。例如,在圖像識別任務中,會透過旋轉、翻轉、調整亮度等方式來擴增訓練數據。這與本題的數據解析和結構化無關。
(B) 資料組織(Data Organization) ✅ (正確答案)
→ 資料組織是指將原始、雜亂或半結構化的數據整理成有結構的形式,例如存入資料庫或轉換為結構化數據,以便進一步分析或應用。本題描述的過程正是在做這件事,因此這是最符合的選項。
(C) 資訊分類(Information Classification) ❌
→ 資訊分類通常是指將已經結構化的資料進行分類,例如新聞分類(政治、娛樂、體育等),或者將電子郵件標記為垃圾郵件或正常郵件。題目描述的過程並不完全是資訊分類,而是更基礎的數據組織。
(D) 模型預測(Model Prediction) ❌
→ 模型預測是指使用機器學習模型來預測未來事件或分類新數據,例如股票價格預測、疾病診斷、垃圾郵件分類等。本題並未涉及任何模型訓練或推理,因此不相關。
0
0