所屬科目:巨量資料概論
1.類神經網路中的激活函數(Activation Function)主要作用為下列何者? (A)決定網路的輸入維度 (B)簡化網路結構 (C)將輸入轉換為非線性輸出 (D)增加網路的權重數量
2.在深度學習中,卷積神經網絡(CNN)最常被應用於什麼領域? (A)文字生成 (B)圖像處理 (C)時間序列分析 (D)強化學習
3.下列哪一項技術是深度學習中最常用來訓練類神經網路的算法? (A)梯度下降算法 (B) K-最近鄰居算法 (C)支持向量機 (D)遺傳算法
4.在深度學習中,反向傳播(Backpropagation)的主要作用為下列何者? (A)增加神經網絡的層數 (B)優化權重以減少損失函數的誤差 (C)提供更多訓練數據 (D)減少網路的輸出層節點數
5.下列有關深度學習敘述何者正確? (A)人工智慧是深度學習之一種分類 (B)機器學習是深度學習的一個分支 (C)深度學習主要是從資料分類,進行預測 (D)深度學習希望把資料透過多個處理層中的線性或非線性轉換,自動抽取出足以代表資料特 性的特徵
6.在類神經網路(Neural Network)分類器中,一個 sigmoid node 的輸出數值是下列何者? (A)沒有限制,可以是任何實數 (B)介於 0 與 1 之間 (C)沒有限制,可以是任何整數 (D)介於–1 與 1 之間
7.某一分析家利用n= 500個家庭的隨機樣本,估計家庭平均月收入的90 %信賴區間為60000 Ç µ Ç 80000 。若分析家想以 99 %信賴係數取代,則信賴區間會? (A)變窄且會有一較大的錯誤風險 (B)變寬且會有一較大的錯誤風險 (C)變窄且會有一較小的錯誤風險 (D)變寬且會有一較小的錯誤風險
8.下列何種是用戶端與伺服器之間進行檔案傳輸的協定? (A) HTTP(Hyper Text Transfer Protocol) (B) SMTP(Simple Mail Transfer Protocol) (C) FTP(File Transfer Protocol) (D) PPP(Point to Point Protocol)
9.有關防火牆 DMZ(全稱 Demilitarized Zone)網路的規劃,下列何者正確? (A) DMZ 是內部網路,重要伺服器所在的網段(B) DMZ 是外部公開的網路 (C) DMZ 可存取內部網路 (D) DMZ 位於內部與外部網路之間
10.資訊隱碼攻擊(SQL Injection Attack)通常是利用 SQL 語言的什麼機制,來引發對資料庫系統的 攻擊? (A)以註解(Comments)規避安全驗證 (B)在 HAVING 子句(Having clause)中設定資料過濾條件 (C)以省略 WHERE 子句的卡氏乘積(Cartesian product)擴展資料組合 (D)以 SELECT 子句中之 DISTINCT 功能整併資料
11.下列何者與 SQL Injection 防禦方法無關? (A)預置敘述(Prepared Statement) (B)參數化查詢(Parameterized Query) (C)輸入驗證(Input Validation) (D)禁用 JavaScript
12.一家汽車噴漆公司根據歷史數據發現,每部車噴漆所需時間在 45 至 90 分鐘之間呈現均勻分 配。請問 1 部車噴漆所需時間不超過 1 小時的機率為何? (A) 0.255 (B) 0.333 (C) 0.49 (D) 0.665
13.設 A、B、C 為樣本空間 S 之三事件,且 A、B、C 為獨立事件,已知 P( A )=0.4,P( B )=0.4, P( C )=0.2,求 P((A ∪ B) ∩ C)之值為何? (A) 0.032 (B) 0.072 (C) 0.128 (D) 0.288
14.已知組裝某機器的零件,所需時間具有平均數為 14 分鐘的指數分配。求組裝該零件所需時間 不超過 7 分鐘的機率為何? (A) 1-e-0.5 (B) 1-e-2 (C) 2-e-2 (D) 2-e-1
15.有 4 組數字 G1=(7,9,9,7,5)、G2=(7,6,5,6,7)、G3=(6,6,6,6,6)、G4=(3,4,5,4,3),請問哪一組資料的 標準差最大? (A) G1 (B)G2 (C)G3 (D)G4
16.下列選項何者不是 Big Data 之應用技術? (A) Google 用以指引 Web(index Web)之技術 (B) Facebook 用以建立社交圖(build social graph)之技術 (C) Netflix 用以推薦電影(recommend movies)之技術 (D)比特幣(Bitcoin)用以預防盜竊及保證匿名之技術
17.下列有關巨量資料所定義的 3V 特性,何者有誤? (A)差異(Variation) (B)多樣化(Variety) (C)超大容量(Volume) (D)高流速(Velocity)
18.下列何者是巨量資料領域的資料倉儲系統? (A) HIVE (B) RDBMS (C) HDFS (D) Spark
19.巨量資料分析資料時,下列何者不是最常用的資料檔案格式來源? (A) CSV (B) XML (C) JSON (D) TIF
20.下列何者不是屬於 NoSQL 類型的資料儲存? (A) MongoDB (B) CouchDB (C) Redis (D) MySQL
21.某位數據分析師試圖自海量數據中提取潛在且有價值之資訊,此作法稱為下列何者? (A)資料探勘 (B)資料加密 (C)資料維護 (D)資料查詢
22.在巨量資料時代中,互聯網上所流動的網路行為資料可被用來從事許多極具價值之商業課題分析,試問下列哪一個工具無法用來捕捉網路流量? (A) Google Analytics (B)百度統計 (C) Google 趨勢 (D)微軟 Power BI
23.下列哪一選項不屬於「巨量資料」領域中所稱的資料型態特性? (A)結構化資料 (B)非結構化資料 (C)半結構化資料 (D)去識別化資料
24.試問 apriori 關連法則演算法中,哪兩項門檻值異動最為顯著影響資料探勘法則之數量? (A)支持度、信賴度 (B)廣泛度、強弱度 (C)精密度、準確度 (D)清晰度、複雜度
25.下列資料何者為結構化資料(Structured Data)? (A)客戶交易資料表 (B)照片分享資料 (C)影音上傳資料 (D)社群討論文章資料
26.關於 ETL 三個步驟的正確英文全名,下列何者正確? (A) Extraction, Transport, Loading (B) Extraction, Transform, Loading (C) Export, Transform, Loading (D) Extraction, Transform, Lifting
27.關於資料標準化,下列敘述何者有誤? (A)標準化可消除變數之間的尺度差異問題 (B)資料標準化作業發生在資料模型建立後 (C)標準化可將各變數的資料範圍予以調整 (D)標準化可用來降低變數之間的變異程度
28.請問下列何者等於 1 個 EB(Exabyte)? (A) 1024 PB(Petabyte) (B) 1024 TB(Terabyte) (C) 1024 GB(Gigabyte) (D) 1024 ZB(Zettabyte)
29. GB、PB、TB、EB 為 4 種電腦容量的單位,若依容量由大至小的排序,下列何者正確? (A) PB>TB>EB>GB (B) EB>PB>TB>GB (C) PB>EB>GB>TB (D) TB>EB>GB>PB
30.關於 Python 語言的特性,下列敘述何者有誤? (A)支援多種作業系統 (B)具備資料分析與視覺化繪圖能力 (C)屬於一種常見的編譯式程式語言 (D)可免費使用
31.關於 Python 變數管理,下列敘述何者有誤? (A)變數不須宣告資料型態 (B)變數不須事先宣告 (C)變數不須先建立和給值而直接使用 (D)變數可以使用 del 釋放資源
32.在 python 中,「arr = [i for i in range(15)]」,則「arr」中最大值為何? (A) 13 (B) 14 (C) 15 (D) 16
33.訓練機器時有提供已標記資料的,是指下列哪一種機器學習? (A)非監督式學習 (B)遷移學習 (C)強化學習 (D)監督式學習
34.下列哪一個選項是正確的 Python 列表(List)定義? (A) list = {1, 2, 3, 4} (B) list = [1, 2, 3, 4] (C) list = (1, 2, 3, 4) (D) list = <1, 2, 3, 4>
35.下列哪一個選項是正確的 Python if 條件語法? (A) if x = 5: (B) if (x = = 5) (C) if x = = 5: (D) if x = = 5 then:
36.下列何者為網域名稱系統 DNS(Domain Name System)之功能? (A)用於暫存先前存取過的資料 (B)將完整網域名稱轉換為其所對應的 IP 位址 (C)解讀網域名稱所在地區及網頁內容 (D)檢查兩端連線狀態是否正常
37.下列哪一種屬於分散式能源的典型例子? (A)大型燃煤發電廠 (B)太陽能屋頂系統 (C)核電廠 (D)大型水力發電站
38.分散式能源最顯著的優點為下列何者? (A)需要大量土地 (B)可以實現集中控制 (C)提高供電可靠性 (D)不依賴可再生能源
39.下列哪一種能源通常不被視為分散式能源? (A)小型風力發電 (B)太陽能電池板 (C)家用備用發電機 (D)核能發電站
40.下列何種資料格式經常被定義為半結構化資料(Semi-structured Data)? (A) JSON 檔案 (B)影音(Video)檔案 (C)關聯式資料庫中的表格(Table)資料 (D) Email 內文文字
41.在巨量資料分析專案中,下列何者比較無助於提升分類模型準確度(Accuracy)? (A)增加或減少模型參數(Parameters)以提升或降低模型複雜度 (B)進行更進一步的特徵工程(Feature Engineering) (C)使用交叉驗證(Cross-Validation) (D)取得與使用有更多變數/特徵(Variables/Features)的訓練資料
42.如何降低模型過適(Overfitting)問題? (A)降低資料量 (B)在目標函數中加入參數正則化(Regularization)項 (C)對資料作正規化(Normalization)前處理 (D)使用測試資料建模
43.資料視覺化是資料處理中一項重要工作,通常資料視覺化需要使用到下列何種方法? (A)資料維度降維 (B)建立分類模型 (C)建立迴歸模型 (D)調整模型參數
44.分散式能源通常位於什麼位置? (A)電網的中心發電廠 (B)用戶端或靠近負載中心 (C)海洋離岸設施 (D)廣大的農業用地上
45.下列哪一項技術能幫助整合分散式能源進入電網? (A)智慧電網 (B)傳統燃煤發電技術 (C)水力發電 (D)蓄熱系統
46.智慧電網透過下列哪一項建設,讓使用者可以了解家中電量,且配電端亦可了解電量使用情 況,進而針對發電與配電之間做良好的調度? (A)智慧型電表基礎建設(AMI) (B)網路電表(Netmeter) (C)智慧型電表(Smartmeter) (D)電力線通信(PLC)
47.智慧電網的通訊層不包含下列哪一項? (A)家庭區域網路(HAN) (B)個人區域網路(PAN) (C)智慧型電表基礎建設(AMI) (D)廣域網路(WAN)
48.為降低尖峰負載時段超載停電風險,將尖峰時段電價費率(每度電單價)提高,離峰時段的費率 降低,引導用戶轉移部分負載至離峰時段,這種電能管理策略稱為下列何者? (A)需量競價 (B)時間電價 (C)可停電力 (D)表燈用戶彈性電價
49.需量反應(Demand Response)計劃的主要目的是下列何者? (A)提高電網的負載 (B)減少可再生能源的使用 (C)優化能源消耗,平衡供需 (D)提高電力價格
50.下列哪一項是需量反應計劃中最常見的實施方法? (A)增加燃煤發電 (B)鼓勵用戶在尖峰時段減少用電 (C)減少電價以增加用電需求 (D)投資新建電廠