一、Metadata 的建置有助於提升資訊檢索的精確率 , 試說明國際通用Metadata 格式 Dublin Core 的 15 項核心元素和簡要著錄原則。 (25 分)
DC 核心集依功能性質大致可分為三類:內容(Content)、智慧財產(Intellectual Property)與實體(Instantiation)。
標題 (Title):資源的正式名稱。
主題與關鍵字 (Subject):資源內容的主題。通常建議使用受控詞表(如主題詞表)。
內容描述 (Description):資源內容的簡短摘要、說明。
來源 (Source):現有資源所衍生或參考的原始資源(如:從某書掃描而來的圖片)。
語言 (Language):資源內容所使用的語言。
相關資源 (Relation):此資源與其他資源的關聯(如:屬於某叢書的一部分)。
涵蓋範圍 (Coverage):資源在時空上的範圍(如:地理位置或特定年代)。
創作者 (Creator):對資源內容負主要責任的實體(如:作者、藝術家)。
其他參與者 (Contributor):對資源有貢獻但非主要負責者(如:編者、插畫家)。
出版者 (Publisher):使資源可供公眾使用之實體。
權利管理 (Rights):關於資源的使用權限、版權聲明等。
日期 (Date):與資源生命週期相關的重要日期(如:出版日期)。
類型 (Type):資源的性質或類型(如:影像、文字、軟體)。
格式 (Format):資源的物理呈現或數位表現(如:PDF、JPEG、15 cm)。
識別碼 (Identifier):資源的唯一代碼(如:ISBN、DOI、URL)。
在建置 DC 時,應遵循以下四項核心原則(又稱 DCMI 著錄原則):
簡單性 (Simplicity): 元素定義簡單明瞭,旨在讓非專業人員(非編目員)也能快速上手進行著錄。
元素皆為選用 (Optional): 15 項元素並非強制全部填寫。建置者可根據資料特性,僅挑選有意義的元素進行記錄。
元素皆可重複 (Repeatable): 同一個元素可視需求多次出現。例如:一本書有兩位作者,則可出現兩次 Creator。
元素皆可擴充 (Extensible): 允許使用「修飾詞」(Qualifiers)來細分元素(即所謂的 Qualified DC),例如將 Date 細分為 Date Created 或 Date Issued。
一對一原則 (One-to-One Principle): 每一份 Metadata 只描述一個實體。例如:數位化後的照片,應分別有描述「原始照片」與「數位圖檔」的兩套 Metadata。
「D 核心集」指的是 Dublin Core(都柏林核心集)。
你問的重點是:它的「簡要著錄原則」是什麼?
我用考試版一句話+白話解釋+條列重點幫你一次記起來。
Dublin Core 核心集係以「簡要、通用、易於建立與交換」為原則,僅提供最基本的詮釋資料,以降低著錄成本並促進跨系統資源分享。
這一句非常適合申論或選擇題的「概念題」。
? D 核心集的想法就是:
「不要把資料寫得很複雜,只要寫到『看得懂、找得到、能交換』就好。」
它不是給專業編目員「精雕細琢」用的,
而是給 各種人、各種系統、各種網路資源都能用。
只用 最基本、最必要的欄位
不追求像 MARC 那樣精細
避免過度專業化
? 例如:
不要求一定要權威檔、不強制標準標點
不限定資料類型
書、期刊、圖片、影片、網站都能用
不限定語言、文化、領域
? 所以才能成為「跨領域、跨系統」的詮釋資料標準
非圖資背景的人也能填
適合網路環境
促進資料交換(Metadata sharing)
? 這就是為什麼常用在:
數位典藏
機構典藏
網路資源描述
| 項目 | Dublin Core | MARC |
|---|---|---|
| 著錄深度 | 簡要 | 詳細 |
| 使用者 | 一般人也可 | 專業編目員 |
| 欄位數 | 15 個核心元素 | 上百欄位 |
| 目的 | 描述+交換 | 精確控制 |
? 出現下列詞,幾乎就是 D 核心集:
簡要著錄
最低成本
跨系統
跨領域
通用性
資源探索(Resource Discovery)
D 核心集不是要你寫「完美的書目」,
而是寫「夠用、找得到、大家都看得懂的資料」。
如果你要,我也可以幫你整理成
?「Dublin Core 15 個元素+記憶口訣」
? 或「D 核心集 vs MARC vs MODS 考試比較表」
你現在的程度,其實已經是「差臨門一腳」的狀態了。
好,這個一定要背,而且背法要夠快、夠穩,我幫你整理成
? 正式版清單+超好記口訣+考試小提醒。
| # | 英文元素 | 中文常見譯名 |
|---|---|---|
| 1 | Title | 題名 |
| 2 | Creator | 創作者 |
| 3 | Subject | 主題 |
| 4 | Description | 描述 |
| 5 | Publisher | 出版者 |
| 6 | Contributor | 貢獻者 |
| 7 | Date | 日期 |
| 8 | Type | 資源類型 |
| 9 | Format | 格式 |
| 10 | Identifier | 識別碼 |
| 11 | Source | 來源 |
| 12 | Language | 語言 |
| 13 | Relation | 關聯 |
| 14 | Coverage | 涵蓋範圍 |
| 15 | Rights | 權利 |
? 順序本身就很重要(很多考題會打亂順序要你選)
「題創主描出貢日,型格識源語關涵權」
拆開來看:
題 → Title
創 → Creator
主 → Subject
描 → Description
出 → Publisher
貢 → Contributor
日 → Date
型 → Type
格 → Format
識 → Identifier
源 → Source
語 → Language
關 → Relation
涵 → Coverage
權 → Rights
? 念三次就會黏住
T C S D P C D T F I S L R C R
Two Clever Students Do Publish Cool Data To Find Interesting Sources Like Rare Cultural Rights
不用每個字對得很精準,
? 重點是順序感
? 小心混入:
Audience
Provenance
Access rights
(這些是 Qualified DC,不是核心 15 個)
✔ Title
✔ Creator
✔ Subject
✔ Description
✔ Identifier
Dublin Core 由 15 個基本元素組成,以簡要、通用與可交換為原則,廣泛應用於網路與數位資源之描述。