阿摩線上測驗
登入
首頁
>
國營事業◆1.統計學 2.巨量資料概論
>
113年 - 113 經濟部所屬事業機構_新進職員甄試試題_統計資訊:1.統計學 2.巨量資料概論#136987
> 試題詳解
37. Apache Spark 在巨量資料環境中的主要用途為何?
(A)資料清理
(B)即時與批次處理
(C)機器學習模型訓練
(D)資料視覺化
答案:
登入後查看
統計:
尚無統計資料
相關試題
38. 何謂交叉驗證(Cross-Validation)?(A)將資料集隨機分為訓練集和測試集(B)將資料集按照特徵分為訓練集和測試集(C)將資料集按照時間順序分為訓練集和測試集(D)將資料集多次隨機分為訓練集和測試集,取平均結果
#3804276
39. 有關自然語言處理(NLP)之步驟,下列何者正確?(A)斷詞→詞性標記→相依剖析 (B)斷詞→相依剖析→詞性標記(C)相依剖析→詞性標記→斷詞 (D)相依剖析→斷詞→詞性標記
#3804277
40. 在機器學習演算法中,下列何者最能避免過度配適(Overfitting)?(A)決策樹 (B)隨機森林 (C)羅吉斯迴歸 (D) K-means演算法
#3804278
41. 在Hadoop中,HDFS的資料冗餘機制為何?(A)資料壓縮 (B)資料複製 (C)資料分片 (D)資料加密
#3804279
複選題42. 假設使用半導體晶圓資料,良率資料之反應值以二元類別表示,請問上述情境最適合使用何種分析技巧? (A)羅吉斯迴歸 (B)決策樹 (C)階層式聚類分析 (D)主成分分析
#3804280
43. 在資料進行機器學習的過程中,正規化(Regularization)係指下列何者?(A)一種降低資料維度的技術(B)一種平衡類別分佈的方法(C)一種改善模型可解釋性的方式(D)一種透過在損失函數中添加懲罰防止過度配適的技術
#3804281
44. 下列何種機器學習技術適合偵測大型資料集中的異常值(Anomalies)?(A) Apriori演算法 (B)隔離森林(Isolation Forest)(C)線性迴歸(Linear Regression) (D)神經網路(Neural Networks)
#3804282
45. 下列何種神經網路架構最適合分析序列資料,如時間序列或自然語言?(A)生成對抗網路(GAN) (B)卷積神經網路(CNN)(C)前饋神經網路(FNN) (D)循環神經網路(RNN)
#3804283
46. 下列何者為使用機器學習時須注意之事項?(A)確保模型訓練時間足夠長 (B)模型的複雜度越高越好(C)需要有過去資料且資料充足 (D)模型的性能與模型的可解釋性無關
#3804284
47. 有關支持向量機(Support Vector Machine)中的「核技巧」(Kernel Trick),其作用為下列何者?(A)處理高維資料 (B)減少支持向量的數量(C)提高支持向量機的計算速度 (D)將非線性可分的資料轉換為線性可分的資料
#3804285
相關試卷
113年 - 113 經濟部所屬事業機構_新進職員甄試試題_統計資訊:1.統計學 2.巨量資料概論#136987
2024 年 · #136987
112年 - 112 經濟部所屬事業機構_新進職員甄試_統計資訊:1.統計學 2.巨量資料概論#116948
2023 年 · #116948
111年 - 111 經濟部所屬事業機構_新進職員甄試_統計資訊:1.統計學 2.巨量資料概論#111345
2022 年 · #111345
110年 - 110 經濟部所屬事業機構_新進職員甄試_統計資訊:1.統計學 2.巨量資料概論#103701
2021 年 · #103701
109年 - 109 經濟部所屬事業機構_新進職員甄試_統計資訊:1.統計學、2.巨量資料概論#92857
2020 年 · #92857
108年 - 108 經濟部所屬事業機構_新進職員甄試_統計資訊:1.統計學 2.巨量資料概論#80775
2019 年 · #80775
107年 - 107 經濟部所屬事業機構_新進職員甄試 _統計資訊:1.統計學 2.巨量資料概論#92213
2018 年 · #92213
106年 - 106 經濟部所屬事業機構_新進職員甄試_統計資訊:1.統計學#71742
2017 年 · #71742
106年 - 106 經濟部所屬事業機構_新進職員甄試_統計資訊:2.巨量資料概論#71719
2017 年 · #71719
105年 - 105 經濟部所屬事業機構_新進職員甄試_統計資訊:1.統計學 2.巨量資料概論#60313
2016 年 · #60313