3. 經過網路爬蟲收集的網頁資料(如新聞網頁 HTML 格式資料)為半結 構化的內容,經過解析器取得各式重要資訊,並透過詮釋資料(Metadata) 結構化這些內容,這樣的過程與下列何者較為相符?
(A) 資料擴增
(B) 資料組織
(C) 資訊分類
(D) 模型預測

答案:登入後查看
統計: A(3), B(37), C(3), D(3), E(0) #3156372

詳解 (共 1 筆)

#6330645

解析題目與選項:

當我們透過網路爬蟲(Web Crawling)取得半結構化的資料(例如 HTML 格式的新聞內容),接著使用解析器(Parser)來提取關鍵資訊,並透過詮釋資料(Metadata)結構化這些內容,這個過程的核心目的是整理與組織數據,使其更易於後續使用(如分析、存取或搜尋)

選項分析:

(A) 資料擴增(Data Augmentation)
→ 資料擴增通常用於機器學習和深度學習領域,指的是透過增加或變換現有數據來提升模型的泛化能力。例如,在圖像識別任務中,會透過旋轉、翻轉、調整亮度等方式來擴增訓練數據。這與本題的數據解析和結構化無關。

(B) 資料組織(Data Organization)(正確答案)
資料組織是指將原始、雜亂或半結構化的數據整理成有結構的形式,例如存入資料庫或轉換為結構化數據,以便進一步分析或應用。本題描述的過程正是在做這件事,因此這是最符合的選項。

(C) 資訊分類(Information Classification)
→ 資訊分類通常是指將已經結構化的資料進行分類,例如新聞分類(政治、娛樂、體育等),或者將電子郵件標記為垃圾郵件或正常郵件。題目描述的過程並不完全是資訊分類,而是更基礎的數據組織

(D) 模型預測(Model Prediction)
→ 模型預測是指使用機器學習模型來預測未來事件或分類新數據,例如股票價格預測、疾病診斷、垃圾郵件分類等。本題並未涉及任何模型訓練或推理,因此不相關。

0
0