所屬科目:【阿摩】未分類題庫
1.在 Python 語言中,已知「t = ('1', '2', '3', '4', '999', 'a', 'bbb', '0', 'c')」,則 print(min(t), max(t))輸出結果為何? (A) 0 c (B) a bbb (C) a c (D) 1 999
2.在Python語言中,假設 t值是2,執行完指令 d = (t+1) if ++t < 2 else (t-2),下列何者為 print(++d) 的結果? (A) 0 (B) 1 (C) 2 (D) 3
3.在 Python 語言中,假設 t 值是 list(range(6)),執行完指令 d = [len(t)*a**2 for a in t if a % 2 == 0], 下列何者為 print(d)的結果? (A) [0, 1, 8] (B) [0, 8, 24] (C) [0, 24, 96] (D) [0, 24, 128]
4.在 Python 語言中,已知「t = np.arange(8).reshape(2, 4)」,則 print(t.ndim, t.sum(axis=0), t.sum(axis=1))輸出結果為何? (A) 1 [ 2 4 6 8] [ 6 33] (B) 2 [ 4 6 8 12] [ 4 22](C) 2 [ 4 6 8 10] [ 6 22](D) 2 [ 4 6 12 14] [ 8 24]
5.在 Python 語言中,print(np.eye(2, 3))輸出結果為何? (A)(B)(C)(D)
6.哪一個著名的測試被設計來判斷機器是否能展現出與人類無異的智慧行為?(A) Turing Test (B) Turing Machine (C) Turing Award (D) AlphaGo Master
7.在 Python 語言中,下列哪一項不是 sklearn 提供用於迴歸分析的函數?(A) Ridge (B) LinearDiscriminantAnalysis(C) ElasticNetCV (D) LASSO
8. Prophet 模型是哪家公司發佈的開放原始碼時序預測工具?(A) Microsoft (B) Oracle (C) Facebook (D) OpenAI
9.在 Python 的 Pandas 函式庫中,通常用來表示數值資料遺缺的值是下列何者?(A) 0 (B) NA (C) NaN (D) None
10.下列 NLP 基礎步驟中,哪一項操作必須在斷詞(Tokenization)之後才能進行?(A)專有名詞提取(NER) (B)文本向量化(Vectorization)(C)斷句(Segmentation) (D)原始數據清洗(Cleaning)
11.下列何者最適合訓練電腦下圍棋等動態重複地互動的問題?(A)監督式學習 (B)強化學習 (C)半監督式學習 (D)非監督式學習
12.在自然語言處理中,Word2Vec 模型主要用於完成下列哪一項任務?(A)情感分析(Sentiment Analysis) (B)文本分類(Text Classification)(C)機器翻譯(Machine Translation) (D)詞嵌入編碼(Word Embedding)
13.主成份分析(PCA)屬於下列哪一種類型的機器學習方法?(A)強化學習 (B)監督式學習 (C)半監督式學習 (D)非監督式學習
14.巨量資料的「高速(Velocity)」特性,主要強調下列哪一項要素?(A)資料來源格式必須相同 (B)資料處理與產生的速度(C)資料總量必須達到 Terabytes (D)資料能夠被快速視覺化
15.在 R 語言中,計算平均的函數為何?(A) sd() (B) mean() (C) var() (D) quantile()
16.「薪資」資料集中的觀察值(單位千元),依遞增順序顯示為:26, 30, 32, 36, 36, 41, 45, 49, 49,88。哪一個數值最有可能是離群值(Outlier),對平均數產生顯著影響?(A) 26 (B) 36 (C) 49 (D) 88
17.在處理二元分類問題的深度學習模型中,輸出層通常使用哪一種激活函數將輸出壓縮到 0 到 1 之間? (A) ReLU (B) Sigmoid (C) Softmax (D) Tanh
18.在機器學習工作流程中,最初將數據集劃分為訓練集與測試集的目的為何?(A)減少資料前處理所需的時間 (B)避免模型在測試集上出現過擬合(C)評估模型對從未見過數據的泛化能力 (D)確保模型在訓練集上有最高的準確率
19.在資料前處理的步驟中,處理資料集中的缺失值(Missing Values)屬於下列哪一類工作?(A)資料清洗(Data Cleaning) (B)模型訓練(Model Training)(C)特徵縮放(Feature Scaling) (D)模型部署(Model Deployment)
20.使用單熱編碼(One-Hot Encoding)的主要目的為何?(A)處理資料集中的遺失值 (B)將數值資料縮放到 0 到 1 之間(C)減少資料的維度以避免過擬合 (D)確保模型不誤解名目型類別的順序性
21.為了在 Web 瀏覽器上傳輸信用卡資料時提供加密保護,最關鍵的網路協定為何?(A) FTP (B) HTTP (C) HTTPS (D) TCP/IP
22.當 A、B 的共變異數(Covariance) Cov[A, B]=17 時,請問 Cov[A+33, B+17]之值為何?(A) 3 (B) 17 (C) 33 (D) 50
23.在資料探勘中,找出資料庫中物件之間隱藏的有趣關係,例如「購買尿布的人也傾向購買啤酒」的技術稱為下列何者?(A)決策樹分類 (B)離群值偵測 (C)序列模式分析 (D)關聯規則探勘
24.面對巨量資料中的非結構化和半結構化數據,下列哪一種資料庫技術更具彈性?(A)非關聯式資料庫(NoSQL) (B)關聯式資料庫(RDBMS)(C) SQL 語言 (D)資料倉儲(Data Warehouse)
25.與敘述統計相反,旨在從樣本的數據推論或預測母體特徵的統計方法稱為下列何者? (A)非參數統計 (B)貝氏統計 (C)應用統計 (D)推論統計
26.下列哪一種集成演算法屬於提升法,其特點是依序訓練弱學習器並聚焦於前一個模型預測錯誤的樣本? (A) AdaBoost (B) K-Means Clustering (C) K-Nearest Neighbor(KNN) (D) Principal Component Analysis(PCA)
27.在機器學習中,模型的訓練過程旨在最小化哪個核心元件?(A)數據的維度 (B)模型的複雜度(C)損失函數(Loss Function) (D)相關係數(Correlation Coefficient)
28.哪一種技術是透過在模型的損失函數中加入懲罰項,來限制模型複雜度並有效對抗過擬合?(A) k-fold 交叉驗證 (B)正則化(Regularization)(C)特徵縮放(Feature Scaling) (D)決策邊界(Decision Boundary)
29.隨機森林(Random Forest)透過結合多棵決策樹,主要解決了單棵決策樹的哪個問題?(A)訓練時間過長 (B)高偏差(High Bias)(C)處理類別變數的困難 (D)高方差(High Variance)
30.生成對抗網路(GAN)的核心架構係由哪兩個相互競爭的網路組成?(A)生成器(Generator)和判別器(Discriminator) (B)排序器(Sequencer)和解析器(Parser)(C)編碼器(Encoder)和解碼器(Decoder) (D)訓練器(Trainer)和驗證器(Validator)
31.在大型語言模型(LLM)等生成式 AI 應用中,模型產生聽起來合理但事實上錯誤或虛構的資訊。此問題被稱為下列何者?(A)知識蒸餾 (B)數據洩漏 (C)災難性遺忘 (D)幻覺
32.下列何種演算法「屬於」非監督式學習的範疇?(A)羅吉斯迴歸(Logistic Regression) (B) K-Means 演算法(C) Support Vector Machine(SVM) (D) Decision Tree(決策樹)
33.深度學習(Deep Learning)與傳統的機器學習方法相比,其名稱中的「深度」主要指的是下列何者? (A)模型的訓練速度更快 (B)模型所使用的數據量更大 (C)模型架構中具有多個隱藏層 (D)模型能夠處理的任務難度更高
34. 下列哪一位電腦科學家提出「Artificial Intelligence」這個詞彙,並被譽為「人工智慧之父」?(A)艾倫·圖靈 (B)約翰·麥卡錫 (C)傑弗里·辛頓 (D)楊立昆
35.網路爬蟲在訪問網站之前,會檢查網站根目錄下的哪個檔案來獲取網站允許爬取或禁止爬取的規則? (A) robots.txt (B) index.html (C) htaccess (D) sitemap.xml
36.傳統的垂直擴充(Scale-up)方式對於處理巨量資料有何主要限制?(A)成本較低廉 (B)處理速度較快(C)無法提供資料備援 (D)擴展性受到單一機器硬體規格的物理限制
37.下列哪一種深度學習神經網路模型最適合用來處理影像辨識?(A) CNN 卷積神經網路 (B) GAN 生成對抗網路(C) RNN 遞歸神經網路 (D) Transformer 模型
38. AGI(通用人工智慧)與當前 Narrow AI 之間最關鍵的區別在於 AGI 具備什麼能力?(A)更快的計算速度 (B)執行複雜數學運算的能力(C)處理更大規模數據集的能力 (D)進行跨領域知識遷移和常識推理的能力
39.MongoDB 等文件型 NoSQL 資料庫,通常使用哪種格式來儲存數據,使其在 Python 或 JavaScript 等環境中非常容易處理? (A) XML (B) CSV (C) SQL (D) JSON
40.橫向擴充(Scale-out)的分散式架構除了提高效能外,還能透過將資料和計算分佈在多個節點上,提供哪一項重要的優勢? (A)降低開發難度 (B)簡化數據治理 (C)確保高可用性和容錯性 (D)減少數據的非結構化程度
41.在圖像處理中,使用 GAN 生成新且逼真的訓練樣本來擴大現有數據集,指的是下列哪一種技術? (A)數據清理(Data Cleaning) (B)數據正規化(Data Normalization) (C)數據增強(Data Augmentation) (D)特徵提取(Feature Extraction)
42.在生成式 AI 領域,用於大規模自然語言處理(如 GPT 模型)的關鍵深度學習架構為下列何者?(A) Transformer (B) RNN (C) CNN (D) Autoencoder
43.在監督式學習中,如果目標變數是離散的類別標籤(如「是/否」、「黃/綠/紫」),則該任務稱為下列何者? (A)聚類(Clustering) (B)迴歸(Regression) (C)分類(Classification) (D)維度縮減(Dimensionality Reduction)
44.集群分析(K-means Clustering)演算法的目標是最小化下列哪一項指標?(A)每個集群的數據點數量 (B)數據點之間的相關係數(C)各集群中心點之間的距離 (D)數據點到其所屬集群中心點的平方距離總和
45.在機器學習中,如果一個模型在訓練集和測試集上的表現都很差(錯誤率高),通常表示模型發生了何種情況? (A)過擬合(Overfitting) (B)欠擬合(Underfitting) (C)數據洩漏(Data Leakage) (D)模型具有高方差(High Variance)
46.允許不同軟體系統(如客戶端與伺服器)之間進行資料交換和功能調用的機制為何?(A)演算法(Algorithm) (B)應用程式介面(API)(C)資料倉儲(Data Warehouse) (D)雲端運算(Cloud Computing)
47.下列哪一種查詢語言專門用於管理和查詢結構化資料庫(如關聯式資料庫)?(A) SQL (B) XML (C) HTML (D) JSON
48.在 k-fold 交叉驗證中,資料集會被平均分 k 個子集,其中有多少個子集會被用作測試集?(A) 1 個 (B) k/2 個 (C) k-1 個 (D) k 個
49.強化學習(RL)的學習方式與人類的哪一種機制最為相似?(A)觀察與模仿(Observation) (B)監督與指導(Supervision)(C)試誤與獎懲(Trial-and-Error) (D)分組與聚類(Clustering)
50.決策樹(Decision Tree)在分類任務中,用來衡量節點分裂前後數據集混亂程度的指標為何?(A)均方誤差(MSE) (B) F1 分數(F1 Score)(C)羅吉斯損失(Logistic Loss) (D)資訊增益(Information Gain)