阿摩線上測驗
登入
首頁
>
資料探勘技術
> 108年 - 108 一般警察特種考試_二等_刑事警察人員犯罪分析組:資料探勘技術(包括資料庫管理與運用、線上交易處理【OLTP】、資料倉儲【Data Warehouse】、資料探勘【Data Mining】)#77047
108年 - 108 一般警察特種考試_二等_刑事警察人員犯罪分析組:資料探勘技術(包括資料庫管理與運用、線上交易處理【OLTP】、資料倉儲【Data Warehouse】、資料探勘【Data Mining】)#77047
科目:
資料探勘技術 |
年份:
108年 |
選擇題數:
0 |
申論題數:
13
試卷資訊
所屬科目:
資料探勘技術
選擇題 (0)
申論題 (13)
⑴請以屬性封閉性(Closure)的概念,找出 R 的所有候選鍵(Candidate Key)(6 分)
⑵請證明 R 不滿足 Boyce-Codd 正規化(BCNF)。 (3 分)
⑶請試圖將 R 分割,並先找出你分割出來每一表格的所有候選鍵,再證 明分割出來的每一表格均滿足 BCNF,且同時證明你的分割滿足 lossless(無損)join 特性。(12 分)
⑷你是否會建議你上述的分割?為什麼?(4 分)
⑴請先解釋何謂支持度(Support) 、信心度(Confidence)的概念。 (6 分)
⑵假設支持度最低門檻是 0.05、信心度最低門檻是 0.7,請指出上述那 些是 Large-1、Large-2 的項目集合(Item-set);並找出所有只包含 2 個項目集合的強(Strong)關聯規則。(14 分)
⑶在尋找關聯規則時,有個重要的反單調(Anti-monotonicity)特性可減 低運算成本,請先說明何謂此特性?再請以上述例子來說明應如何運 用此特性。(5 分)
三、假設我們對某種犯罪資料要進行研究,資料庫收集了 4,000 筆個人的心 理、行為、參與社群等詳細資料,其中 1,900 人實際有過該犯罪事實, 2,100 人則無該犯罪事實。使用兩種方法來做集群(Cluster)分析。α 方 法可分出 1,400 位犯罪人,但其中 100 位未有犯罪事實,但被錯誤歸為 此犯罪群;此外有 600 位實際有過犯罪事實,卻未被歸為此群。β 方法 可分出 1,600 位犯罪人,但其中 200 位未有犯罪事實,但被錯誤歸為此 犯罪群;此外有 500 位實際有過犯罪事實,卻未被歸為此群。請問應如 何評估此兩方法的優劣?你會建議選擇那個方法?為什麼?(25 分)
⑴何謂主題導向(Subject-Oriented)?此處的主題是什麼?(3 分)
⑵在為它建立模型時,有所謂的事實表格、維度表格,請舉例說明。 (3 分)
⑶ 資 料 倉 儲 操 作 上 有 「 向 上 擷 取 」( Roll-Up ) 及 「 向 下 探 究 」 (Drill-Down)功能,這與維度設計有何關係?(3 分)
⑷請依此背景,設計出星型模式(Star Schema)(8 分)
⑸請依此背景,設計出雪花模式(Snowflake Schema)(8 分)