阿摩線上測驗
登入
首頁
>
iPAS◆資料處理與分析概論◆初級
>
109年 - 109-2 初級巨量資料分析師能力鑑定試題:資料處理與分析概論#119179
> 試題詳解
3. 關於遺缺值(missing value)的處理方式,下列何者較「不」恰當?
(A) 將有遺缺值的那筆樣本刪去
(B) 使用平均值來填補遺缺值
(C) 使用 k 近鄰演算法來填補遺缺值
(D) 將有遺缺值的那個欄位刪去
答案:
登入後查看
統計:
A(1), B(0), C(0), D(10), E(0) #3219287
詳解 (共 1 筆)
MoAI - 您的AI助手
B1 · 2025/10/26
#6971279
1. 題目解析 本題主要是考察對於遺缺值...
(共 847 字,隱藏中)
前往觀看
0
0
相關試題
1. 在分析資料前,通常需要先清理資料。當數字與文字混合在一起時, 但我們僅需要提取出數字時,若以逐筆資料提取十分曠日廢時,在 Python 語法中的套件 re 可以處理大部分的此類問題,例如語法: re.findall(pattern, string),當 pattern = '\d',可以提取出 string 中所有單一數字;pattern = '\d\d',可以提取出 string 中所有 2 個相連數字;pattern = '\d+',可以提取出 string 中所有任意相連個數的數字。請問當 string = '王大明手機號碼:0912334567,地址...'時,下列何者語法無法提取出0912334567? (A) re.findall('\d+', string) (B) re.findall('\d\d\d\d\d\d\d\d\d', string) (C) re.findall('\d\d+', string) (D) re.findall('\d\d\d\d\d\d+', string)
#3219285
2. 下列何者「不」是資料前處理該進行的程序? (A) 資料清理(data cleaning) (B) 資料轉換(data transform) (C) 屬性挑選(feature selection) (D) 資料建模(data modeling)
#3219286
4. 關於資料具有離群值(outlier),進行資料標準化時,下列敘述何者較 為適合? (A) 可採用 Z-分數法(Z-score) (B) 可採用最小最大正規化法(min-max normalization) (C) 可採用穩健縮放法(robust scaler) (D) 可採用最大絕對值縮放法(maximum absolute scaler)
#3219288
5. 參考附圖,Python 語言中,關於使用 numpy 套件處理遺缺值(missing value),下列敘述何者「不」正確?(A) np.nan 執行結果為 nan (B) np.isnan(np.nan)執行結果為 True (C) np.NaN 執行結果為 NaN (D) np.isnan(np.NaN)執行結果為 True
#3219289
6. 關於資料彙總(data aggregation),下列敘述何者最為正確? (A) 可降低資料尺度、資料偏斜性對於模型的不良影響 (B) 是運用推論統計學,比較兩筆樣本的差異 (C) 是以摘要的形式收集或呈現資訊的任何過程 (D) 是統整不同連續屬性間的數值分佈
#3219290
7. 參考附圖,R 語言中,關於 aggregate 資料群組計算,下列敘述何者「不」 正確? (A) aggregate 執行結果有 8 筆資料 (B) aggregate 函數中的 breaks 表示對 breaks 欄位進行計算 (C) 本題 aggregate 函數功能是計算各群組的平均值 (D) aggregate 函數的「.」表示除了 breaks 以外的所有欄位為群組欄位
#3219291
8. 下列何種圖形常用於視覺化年齡與收入的關係? (A) 散佈圖(scatter plot) (B) 甘特圖(Gantt chart) (C) 流程圖(flow chart) (D) 樹狀圖(tree diagram)
#3219292
9. R 語言中,下列何者為專門在處理群組與摘要的函數? (A) spread() (B) sort() (C) gather() (D) aggregate()
#3219293
10. R 語言中,關於資料排序,下列敘述何者「不」正確? (A) order()回傳排序後的觀測值編號 (B) sort()回傳排序後的字串值或數值 (C) rank()回傳每個元素的排名值 (D) permute()回傳排序後的字串值或數值
#3219294
11. 下列何者「不」是屬性挑選(feature selection)的特性? (A) 降低計算時間 (B) 提高資料維度 (C) 降低模型複雜度 (D) 增加模型穩定性
#3219295
相關試卷
113年 - 113-1 巨量資料分析師能力鑑定初級試題:資料處理與分析概論#122978
2024 年 · #122978
112年 - 112 初級巨量資料分析師能力鑑定考試02:資料處理與分析概論#116824
2023 年 · #116824
111年 - 111 巨量資料分析師能力鑑定考試02:資料處理與分析概論#114287
2022 年 · #114287
110年 - 110-1 初級巨量資料分析師能力鑑定考試02:資料處理與分析概論#119175
2021 年 · #119175
110年 - 110-2 初級巨量資料分析師能力鑑定考試02:資料處理與分析概論#119174
2021 年 · #119174
109年 - 109-2 初級巨量資料分析師能力鑑定試題:資料處理與分析概論#119179
2020 年 · #119179
109年 - 109 初級巨量資料分析師能力鑑定試題:資料處理與分析概論#119176
2020 年 · #119176
108年 - 108 初級巨量資料分析師能力鑑定試題:資料處理與分析概論#119181
2019 年 · #119181