Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy - Đề 02 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Bạn đang xây dựng một hệ thống phát hiện gian lận thẻ tín dụng. Dữ liệu huấn luyện của bạn chứa thông tin giao dịch và nhãn cho biết giao dịch nào là gian lận. Loại bài toán học máy nào phù hợp nhất cho tình huống này?
- A. Hồi quy (Regression)
- B. Phân loại (Classification)
- C. Phân cụm (Clustering)
- D. Giảm chiều dữ liệu (Dimensionality Reduction)
Câu 2: Trong thuật toán K-Means Clustering, điều gì xảy ra trong mỗi lần lặp (iteration)?
- A. Các cụm được xác định trước và điểm dữ liệu được gán vào các cụm này.
- B. Thuật toán tìm kiếm cụm có mật độ điểm dữ liệu cao nhất.
- C. Điểm dữ liệu được gán lại vào các cụm dựa trên khoảng cách đến trọng tâm cụm gần nhất và trọng tâm cụm được cập nhật.
- D. Mô hình cây quyết định được xây dựng để phân chia dữ liệu thành các cụm.
Câu 3: Phương pháp đánh giá mô hình học máy nào sau đây giúp ước tính khả năng tổng quát hóa của mô hình trên dữ liệu mới bằng cách chia dữ liệu thành nhiều phần và huấn luyện/kiểm tra mô hình trên các phần khác nhau?
- A. Đánh giá trên tập huấn luyện (Training set evaluation)
- B. Đánh giá trên tập kiểm tra duy nhất (Hold-out validation)
- C. Ma trận nhầm lẫn (Confusion matrix)
- D. Kiểm định chéo (Cross-validation)
Câu 4: Điều gì KHÔNG phải là một lợi ích của việc sử dụng kỹ thuật giảm chiều dữ liệu (dimensionality reduction) như PCA (Principal Component Analysis)?
- A. Giảm độ phức tạp tính toán của mô hình
- B. Giúp trực quan hóa dữ liệu nhiều chiều
- C. Đảm bảo giữ lại hoàn toàn 100% thông tin gốc của dữ liệu
- D. Giảm nguy cơ overfitting cho mô hình
Câu 5: Hàm kích hoạt ReLU (Rectified Linear Unit) thường được sử dụng trong mạng nơ-ron sâu (Deep Neural Networks) vì lý do chính nào?
- A. Giảm thiểu vấn đề vanishing gradient và tính toán hiệu quả
- B. Đảm bảo đầu ra của neuron luôn nằm trong khoảng [0, 1]
- C. Tạo ra tính phi tuyến tính yếu hơn so với sigmoid
- D. Tăng độ phức tạp của mạng nơ-ron
Câu 6: Trong học máy không giám sát (Unsupervised Learning), thuật toán nào sau đây thường được sử dụng để giảm số chiều của dữ liệu đồng thời cố gắng giữ lại cấu trúc thông tin quan trọng nhất?
- A. K-Nearest Neighbors (KNN)
- B. Principal Component Analysis (PCA)
- C. Support Vector Machine (SVM)
- D. Naive Bayes
Câu 7: Bạn muốn dự đoán giá nhà dựa trên các đặc trưng như diện tích, số phòng ngủ, vị trí,... Mô hình hồi quy tuyến tính (Linear Regression) sẽ tối ưu hóa hàm mất mát (loss function) nào sau đây?
- A. Cross-Entropy Loss
- B. Hinge Loss
- C. Mean Squared Error (MSE)
- D. Absolute Error
Câu 8: Trong ngữ cảnh của học máy, "feature engineering" (kỹ thuật đặc trưng) đề cập đến quá trình nào?
- A. Chọn thuật toán học máy phù hợp nhất cho bài toán
- B. Tối ưu hóa siêu tham số (hyperparameters) của mô hình
- C. Đánh giá hiệu suất của mô hình trên tập kiểm tra
- D. Chọn lọc, biến đổi và tạo ra các đặc trưng phù hợp từ dữ liệu thô
Câu 9: Điều gì xảy ra khi bạn tăng giá trị của tham số "k" trong thuật toán K-Nearest Neighbors (KNN)?
- A. Mô hình trở nên phức tạp hơn và dễ bị overfitting hơn.
- B. Mô hình trở nên đơn giản hơn, biên quyết định mượt mà hơn và ít nhạy cảm với nhiễu.
- C. Thời gian huấn luyện mô hình giảm đáng kể.
- D. Độ chính xác của mô hình luôn tăng lên.
Câu 10: Trong học sâu, kỹ thuật "dropout" được sử dụng để giải quyết vấn đề nào?
- A. Overfitting (quá khớp)
- B. Underfitting (thiếu khớp)
- C. Vanishing gradient (gradient biến mất)
- D. Exploding gradient (gradient bùng nổ)
Câu 11: Mô hình học máy nào sau đây có thể được sử dụng cho cả bài toán phân loại (classification) và hồi quy (regression)?
- A. Logistic Regression
- B. K-Means Clustering
- C. Decision Tree
- D. Principal Component Analysis (PCA)
Câu 12: Trong thuật toán Support Vector Machine (SVM), "kernel trick" (mẹo kernel) cho phép chúng ta làm gì?
- A. Giảm số lượng support vectors cần thiết
- B. Tăng tốc độ huấn luyện mô hình SVM
- C. Trực quan hóa dữ liệu trong không gian chiều cao
- D. Giải quyết bài toán phân loại phi tuyến tính bằng cách ánh xạ dữ liệu vào không gian đặc trưng chiều cao
Câu 13: Độ đo "Recall" (Độ nhớ lại) trong đánh giá mô hình phân loại được tính bằng công thức nào?
- A. TP / (TP + FP)
- B. TP / (TP + FN)
- C. TN / (TN + FP)
- D. TN / (TN + FN)
Câu 14: Phương pháp "Gradient Descent" (Độ dốc giảm dần) được sử dụng để làm gì trong huấn luyện mô hình học máy?
- A. Đánh giá hiệu suất của mô hình
- B. Chọn đặc trưng (features) quan trọng nhất
- C. Tối ưu hóa tham số của mô hình để giảm thiểu hàm mất mát
- D. Chia dữ liệu thành tập huấn luyện và tập kiểm tra
Câu 15: "Bias-Variance tradeoff" (Đánh đổi Bias-Variance) trong học máy mô tả sự cân bằng giữa điều gì?
- A. Độ chính xác trên tập huấn luyện và độ chính xác trên tập kiểm tra
- B. Thời gian huấn luyện và độ phức tạp của mô hình
- C. Precision và Recall
- D. Bias (sai lệch) và Variance (phương sai) của mô hình
Câu 16: Mô hình "Random Forest" hoạt động dựa trên nguyên tắc "ensemble learning" (học tập kết hợp) nào?
- A. Boosting
- B. Bagging
- C. Stacking
- D. Blending
Câu 17: Trong bài toán phân loại đa lớp (multi-class classification), độ đo đánh giá nào sau đây thường được sử dụng?
- A. Accuracy (Độ chính xác)
- B. AUC-ROC
- C. F1-score (chỉ áp dụng tốt nhất cho binary)
- D. Precision (chỉ đo lường cho lớp dương)
Câu 18: Kỹ thuật "Batch Normalization" (Chuẩn hóa theo lô) trong mạng nơ-ron sâu giúp giải quyết vấn đề nào trong quá trình huấn luyện?
- A. Overfitting
- B. Underfitting
- C. Internal Covariate Shift
- D. Vanishing Gradient
Câu 19: Trong học tăng cường (Reinforcement Learning), "reward function" (hàm phần thưởng) có vai trò gì?
- A. Đánh giá hiệu suất của tác nhân
- B. Xác định trạng thái hiện tại của môi trường
- C. Chọn hành động tiếp theo cho tác nhân
- D. Định nghĩa mục tiêu và cung cấp tín hiệu phản hồi cho tác nhân
Câu 20: Thuật toán nào sau đây thuộc loại học có giám sát (Supervised Learning)?
- A. K-Means Clustering
- B. Support Vector Machine (SVM)
- C. Principal Component Analysis (PCA)
- D. Apriori Algorithm
Câu 21: Cho một mô hình phân loại nhị phân, ma trận nhầm lẫn (confusion matrix) cho thấy có 100 True Positives, 20 False Positives, 10 False Negatives và 870 True Negatives. Độ chính xác (Accuracy) của mô hình là bao nhiêu?
- A. 87%
- B. 90%
- C. 97%
- D. 99%
Câu 22: Trong mạng nơ-ron tích chập (Convolutional Neural Networks - CNNs), lớp "convolutional layer" (lớp tích chập) có chức năng chính là gì?
- A. Giảm chiều dữ liệu
- B. Phân loại đối tượng
- C. Tăng tính phi tuyến tính
- D. Trích xuất đặc trưng cục bộ từ dữ liệu đầu vào
Câu 23: Khi nào thì sử dụng F1-score thay vì Accuracy để đánh giá mô hình phân loại?
- A. Khi dữ liệu có nhiều chiều
- B. Khi dữ liệu bị mất cân bằng lớp
- C. Khi mô hình có độ phức tạp cao
- D. Khi cần đánh giá tốc độ dự đoán của mô hình
Câu 24: Kỹ thuật "Early Stopping" (Dừng sớm) trong huấn luyện mạng nơ-ron được sử dụng để làm gì?
- A. Ngăn chặn overfitting bằng cách dừng huấn luyện khi hiệu suất trên tập validation không cải thiện
- B. Tăng tốc độ huấn luyện mô hình
- C. Cải thiện độ chính xác trên tập huấn luyện
- D. Giảm số lượng tham số của mô hình
Câu 25: Trong thuật toán Naive Bayes, giả định "naive" (ngây thơ) đề cập đến điều gì?
- A. Dữ liệu huấn luyện phải được chuẩn hóa
- B. Mô hình phải được huấn luyện trên dữ liệu lớn
- C. Các đặc trưng là độc lập có điều kiện với nhau khi biết lớp
- D. Thuật toán chỉ hoạt động tốt với dữ liệu văn bản
Câu 26: Mô hình học máy nào sau đây thường được sử dụng cho bài toán phát hiện dị thường (anomaly detection)?
- A. Linear Regression
- B. Logistic Regression
- C. K-Means Clustering
- D. Isolation Forest
Câu 27: Trong kiến trúc mạng nơ-ron tuần hoàn (Recurrent Neural Networks - RNNs), tại sao chúng phù hợp với dữ liệu chuỗi thời gian (time series data) hoặc dữ liệu tuần tự (sequential data)?
- A. RNNs có thể xử lý dữ liệu ảnh tốt hơn CNNs
- B. RNNs có cơ chế bộ nhớ để xử lý thông tin tuần tự qua các bước thời gian
- C. RNNs có thể giảm chiều dữ liệu hiệu quả
- D. RNNs có thể trích xuất đặc trưng cục bộ tốt hơn
Câu 28: Phương pháp "Boosting" trong ensemble learning (học tập kết hợp) khác với "Bagging" như thế nào?
- A. Boosting tạo ra các mô hình đơn giản hơn Bagging
- B. Boosting chỉ sử dụng cây quyết định, còn Bagging có thể sử dụng nhiều loại mô hình khác nhau
- C. Boosting huấn luyện các mô hình tuần tự, tập trung sửa lỗi của mô hình trước; Bagging huấn luyện song song và độc lập
- D. Boosting thường cho độ chính xác thấp hơn Bagging
Câu 29: Trong học máy, "Regularization" (Chính quy hóa) là kỹ thuật được sử dụng để làm gì?
- A. Giảm overfitting bằng cách hạn chế độ phức tạp của mô hình
- B. Tăng tốc độ huấn luyện mô hình
- C. Cải thiện độ chính xác trên tập huấn luyện
- D. Chọn đặc trưng quan trọng nhất
Câu 30: Đường cong ROC (Receiver Operating Characteristic) và giá trị AUC (Area Under the Curve) thường được sử dụng để đánh giá mô hình nào?
- A. Mô hình hồi quy (Regression models)
- B. Mô hình phân loại nhị phân (Binary classification models)
- C. Mô hình phân cụm (Clustering models)
- D. Mô hình giảm chiều dữ liệu (Dimensionality reduction models)