Bài Tập, Đề Thi Trắc Nghiệm Online – Môn Học Máy – Đề 05

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Môn Học Máy

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy - Đề 05

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy - Đề 05 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong bài toán phân loại email spam, mô hình học máy dự đoán một email là "spam". Tuy nhiên, email đó thực tế là "không spam". Lỗi này được gọi là gì?

  • A. Lỗi False Negative (Âm tính giả)
  • B. Lỗi False Positive (Dương tính giả)
  • C. Lỗi True Positive (Dương tính thật)
  • D. Lỗi True Negative (Âm tính thật)

Câu 2: Để đánh giá hiệu suất của mô hình hồi quy dự đoán giá nhà, thước đo nào sau đây phù hợp nhất để thể hiện độ lệch trung bình giữa giá dự đoán và giá thực tế, đồng thời ít nhạy cảm hơn với các giá trị ngoại lệ?

  • A. RMSE (Root Mean Squared Error)
  • B. MSE (Mean Squared Error)
  • C. MAE (Mean Absolute Error)
  • D. R-squared (Hệ số xác định)

Câu 3: Kỹ thuật nào sau đây giúp giảm thiểu hiện tượng overfitting trong mô hình cây quyết định bằng cách xây dựng nhiều cây trên các tập dữ liệu con ngẫu nhiên và tổng hợp kết quả dự đoán?

  • A. L1 Regularization (LASSO)
  • B. L2 Regularization (Ridge)
  • C. Gradient Boosting
  • D. Random Forest

Câu 4: Trong một dự án phân tích cảm xúc văn bản, bạn nhận thấy mô hình của mình hoạt động rất tốt trên tập dữ liệu huấn luyện nhưng kém hơn đáng kể trên tập dữ liệu kiểm tra. Hiện tượng này cho thấy điều gì?

  • A. Mô hình đang bị overfitting (quá khớp)
  • B. Mô hình đang bị underfitting (thiếu khớp)
  • C. Dữ liệu huấn luyện và kiểm tra quá khác biệt
  • D. Mô hình cần được huấn luyện với nhiều dữ liệu hơn

Câu 5: Cho bài toán phân loại ảnh mèo và chó. Độ chính xác (accuracy) của mô hình là 95%. Phát biểu nào sau đây không chắc chắn đúng?

  • A. Mô hình dự đoán đúng 95% số ảnh trong tập dữ liệu kiểm tra.
  • B. Tỷ lệ dự đoán đúng trên tổng số dự đoán là 95%.
  • C. Mô hình phân loại đúng 95% số ảnh mèo và 95% số ảnh chó.
  • D. Sai số của mô hình là 5%.

Câu 6: Trong thuật toán K-means clustering, điều gì xảy ra trong mỗi lần lặp (iteration)?

  • A. Các điểm dữ liệu được gán ngẫu nhiên vào các clusters.
  • B. Các centroids được cập nhật và các điểm dữ liệu được gán lại vào clusters gần nhất.
  • C. Số lượng clusters (K) được tự động điều chỉnh.
  • D. Thuật toán dừng lại khi đạt đến số lần lặp tối đa.

Câu 7: Để xử lý dữ liệu thuộc tính phân loại (categorical features) trong mô hình học máy, phương pháp nào sau đây chuyển đổi mỗi giá trị duy nhất của thuộc tính thành một vector nhị phân?

  • A. Label Encoding
  • B. Ordinal Encoding
  • C. One-Hot Encoding
  • D. Frequency Encoding

Câu 8: Hàm kích hoạt ReLU (Rectified Linear Unit) trong mạng neural có ưu điểm gì so với hàm sigmoid hoặc tanh?

  • A. Giảm thiểu vấn đề vanishing gradient (mất đạo hàm) trong mạng neural sâu.
  • B. Luôn cho đầu ra trong khoảng từ 0 đến 1, dễ dàng diễn giải xác suất.
  • C. Là hàm tuyến tính, giúp mô hình đơn giản và dễ huấn luyện hơn.
  • D. Có đạo hàm liên tục và trơn tru, giúp tối ưu hóa dễ dàng hơn.

Câu 9: Trong học tăng cường (Reinforcement Learning), thành phần nào chịu trách nhiệm lựa chọn hành động trong môi trường?

  • A. Môi trường (Environment)
  • B. Tác nhân (Agent)
  • C. Phần thưởng (Reward)
  • D. Chính sách (Policy)

Câu 10: Để giảm chiều dữ liệu (dimensionality reduction) và loại bỏ các thuộc tính ít quan trọng, phương pháp nào sau đây tìm kiếm một tập hợp các thuộc tính mới là tổ hợp tuyến tính của các thuộc tính ban đầu, sao cho phương sai được giữ lại là lớn nhất?

  • A. LASSO Regression
  • B. Ridge Regression
  • C. PCA (Principal Component Analysis)
  • D. Feature Selection bằng độ quan trọng của thuộc tính (Feature Importance)

Câu 11: Giả sử bạn có một mô hình phân loại nhị phân và ngưỡng quyết định mặc định là 0.5. Nếu bạn muốn tăng độ nhạy (recall) của mô hình, bạn nên điều chỉnh ngưỡng quyết định như thế nào?

  • A. Tăng ngưỡng quyết định lên cao hơn 0.5
  • B. Giảm ngưỡng quyết định xuống thấp hơn 0.5
  • C. Giữ nguyên ngưỡng quyết định ở 0.5
  • D. Không có mối quan hệ giữa ngưỡng quyết định và độ nhạy (recall)

Câu 12: Trong ngữ cảnh của mô hình học máy, "bias" (độ chệch) và "variance" (phương sai) thể hiện điều gì?

  • A. Bias và Variance đều thể hiện độ chính xác của mô hình trên dữ liệu huấn luyện.
  • B. Bias thể hiện khả năng tổng quát hóa, Variance thể hiện độ phức tạp của mô hình.
  • C. Bias thể hiện lỗi ngẫu nhiên, Variance thể hiện lỗi hệ thống.
  • D. Bias thể hiện sai số hệ thống, Variance thể hiện độ nhạy với dữ liệu huấn luyện.

Câu 13: Mô hình nào sau đây thường được sử dụng cho bài toán phát hiện dị thường (anomaly detection) trong dữ liệu?

  • A. Linear Regression
  • B. Logistic Regression
  • C. Isolation Forest
  • D. K-Nearest Neighbors (KNN)

Câu 14: Trong quá trình tiền xử lý dữ liệu, kỹ thuật "scaling" (tỷ lệ hóa) dữ liệu nhằm mục đích gì?

  • A. Đưa các thuộc tính về cùng một dải giá trị để tránh ảnh hưởng của sự khác biệt về đơn vị đo lường.
  • B. Loại bỏ các giá trị ngoại lệ (outliers) trong dữ liệu.
  • C. Chuyển đổi dữ liệu phân loại thành dữ liệu số.
  • D. Giảm số chiều của dữ liệu.

Câu 15: Phương pháp "Gradient Descent" được sử dụng để làm gì trong huấn luyện mô hình học máy?

  • A. Đánh giá hiệu suất của mô hình.
  • B. Tối ưu hóa các tham số của mô hình để giảm thiểu hàm mất mát.
  • C. Chia dữ liệu thành tập huấn luyện và tập kiểm tra.
  • D. Chọn lựa các thuộc tính quan trọng nhất cho mô hình.

Câu 16: Trong mạng neural tích chập (CNN), lớp "pooling" (gộp nhóm) có vai trò gì?

  • A. Tăng số lượng kênh màu của ảnh đầu vào.
  • B. Thêm các lớp kết nối đầy đủ (fully connected layers) vào mạng.
  • C. Giảm chiều không gian của feature maps và tăng tính bất biến vị trí.
  • D. Áp dụng hàm kích hoạt phi tuyến tính.

Câu 17: Khi nào thì nên sử dụng phương pháp "cross-validation" (kiểm định chéo) trong quá trình phát triển mô hình học máy?

  • A. Để đánh giá khách quan hiệu suất của mô hình và lựa chọn siêu tham số.
  • B. Để tăng kích thước tập dữ liệu huấn luyện.
  • C. Để giảm thời gian huấn luyện mô hình.
  • D. Để trực quan hóa dữ liệu đầu vào.

Câu 18: Trong thuật toán SVM (Support Vector Machine), "kernel trick" (hàm nhân) cho phép mô hình làm gì?

  • A. Tăng tốc độ huấn luyện mô hình SVM.
  • B. Giải quyết bài toán phân loại phi tuyến tính bằng cách ánh xạ dữ liệu sang không gian chiều cao hơn.
  • C. Giảm số lượng support vectors cần thiết.
  • D. Cải thiện khả năng xử lý dữ liệu nhiễu của SVM.

Câu 19: Mô hình học máy nào sau đây phù hợp nhất cho bài toán dự đoán chuỗi thời gian (time series forecasting) có tính chất tuần tự và phụ thuộc thời gian?

  • A. Decision Tree
  • B. Naive Bayes
  • C. Support Vector Machine (SVM)
  • D. LSTM (Long Short-Term Memory)

Câu 20: Trong ngữ cảnh của học máy giải thích được (explainable AI - XAI), phương pháp nào sau đây giúp hiểu được đóng góp của từng thuộc tính đầu vào vào dự đoán của mô hình?

  • A. PCA (Principal Component Analysis)
  • B. K-means Clustering
  • C. SHAP (SHapley Additive exPlanations)
  • D. Cross-validation

Câu 21: Trong học không giám sát (unsupervised learning), thuật toán DBSCAN (Density-Based Spatial Clustering of Applications with Noise) có ưu điểm gì so với K-means?

  • A. DBSCAN nhanh hơn K-means đối với dữ liệu lớn.
  • B. DBSCAN không yêu cầu xác định trước số lượng clusters và có thể phát hiện clusters có hình dạng bất kỳ.
  • C. DBSCAN luôn cho kết quả phân cụm tốt hơn K-means.
  • D. DBSCAN dễ dàng cài đặt và sử dụng hơn K-means.

Câu 22: Khi triển khai mô hình học máy trong thực tế, vấn đề "concept drift" (trôi khái niệm) đề cập đến hiện tượng gì?

  • A. Sự thay đổi trong phân phối dữ liệu đầu vào.
  • B. Sự thay đổi trong thuật toán học máy được sử dụng.
  • C. Sự cố phần cứng hoặc phần mềm trong hệ thống triển khai.
  • D. Sự thay đổi theo thời gian trong mối quan hệ giữa các thuộc tính đầu vào và đầu ra.

Câu 23: Để xử lý dữ liệu văn bản trong NLP (Natural Language Processing), kỹ thuật nào sau đây chuyển đổi văn bản thành các vector số bằng cách đếm tần suất xuất hiện của mỗi từ trong từng văn bản?

  • A. Word Embedding (ví dụ: Word2Vec, GloVe)
  • B. Bag-of-Words (BoW) / TF-IDF
  • C. Sequence-to-Sequence Models
  • D. Recurrent Neural Networks (RNNs)

Câu 24: Trong mô hình Logistic Regression, hàm mất mát (loss function) thường được sử dụng là gì?

  • A. Mean Squared Error (MSE)
  • B. Mean Absolute Error (MAE)
  • C. Cross-entropy Loss (Log Loss)
  • D. Hinge Loss

Câu 25: Khi huấn luyện mô hình mạng neural, "batch size" (kích thước lô) ảnh hưởng đến quá trình huấn luyện như thế nào?

  • A. Batch size nhỏ có thể dẫn đến huấn luyện chậm hơn nhưng có thể giúp mô hình thoát khỏi local minima tốt hơn.
  • B. Batch size lớn luôn giúp mô hình hội tụ nhanh hơn và đạt độ chính xác cao hơn.
  • C. Batch size không ảnh hưởng đến quá trình huấn luyện mô hình.
  • D. Batch size chỉ ảnh hưởng đến bộ nhớ sử dụng trong quá trình huấn luyện.

Câu 26: Trong học máy công bằng (fair machine learning), "disparate impact" (tác động khác biệt) đề cập đến vấn đề gì?

  • A. Sự khác biệt về hiệu suất mô hình giữa dữ liệu huấn luyện và dữ liệu kiểm tra.
  • B. Sự khác biệt trong cách mô hình được giải thích cho các nhóm người khác nhau.
  • C. Sự khác biệt về chất lượng dữ liệu giữa các nhóm nhân khẩu học.
  • D. Mô hình đưa ra kết quả bất lợi cho một nhóm nhân khẩu học nhạy cảm một cách không cân xứng.

Câu 27: Phương pháp "transfer learning" (học chuyển giao) mang lại lợi ích gì trong học máy?

  • A. Tăng độ phức tạp của mô hình.
  • B. Cho phép tận dụng kiến thức đã học từ một bài toán liên quan để cải thiện hiệu suất trên bài toán mới, đặc biệt khi dữ liệu hạn chế.
  • C. Giảm hiện tượng overfitting.
  • D. Tự động lựa chọn thuật toán học máy phù hợp nhất.

Câu 28: Trong kiến trúc Transformer, cơ chế "self-attention" (tự chú ý) cho phép mô hình làm gì?

  • A. Tăng tốc độ huấn luyện mô hình Transformer.
  • B. Giảm số lượng tham số trong mô hình Transformer.
  • C. Tập trung vào các phần khác nhau của chuỗi đầu vào khi xử lý mỗi vị trí, nắm bắt quan hệ giữa các từ trong câu.
  • D. Thay thế các lớp RNN trong mô hình Transformer.

Câu 29: Để đảm bảo tính riêng tư của dữ liệu trong học máy, kỹ thuật nào sau đây thêm nhiễu ngẫu nhiên vào dữ liệu trong khi vẫn duy trì các đặc tính thống kê tổng thể?

  • A. Federated Learning
  • B. Homomorphic Encryption
  • C. Secure Multi-party Computation (MPC)
  • D. Differential Privacy (DP)

Câu 30: Trong học máy, "regularization" (chính quy hóa) là kỹ thuật được sử dụng để giải quyết vấn đề gì?

  • A. Overfitting (quá khớp)
  • B. Underfitting (thiếu khớp)
  • C. Dữ liệu bị thiếu (missing data)
  • D. Dữ liệu không cân bằng (imbalanced data)

1 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 1: Trong bài toán phân loại email spam, mô hình học máy dự đoán một email là 'spam'. Tuy nhiên, email đó thực tế là 'không spam'. Lỗi này được gọi là gì?

2 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 2: Để đánh giá hiệu suất của mô hình hồi quy dự đoán giá nhà, thước đo nào sau đây phù hợp nhất để thể hiện độ lệch trung bình giữa giá dự đoán và giá thực tế, đồng thời ít nhạy cảm hơn với các giá trị ngoại lệ?

3 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 3: Kỹ thuật nào sau đây giúp giảm thiểu hiện tượng overfitting trong mô hình cây quyết định bằng cách xây dựng nhiều cây trên các tập dữ liệu con ngẫu nhiên và tổng hợp kết quả dự đoán?

4 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 4: Trong một dự án phân tích cảm xúc văn bản, bạn nhận thấy mô hình của mình hoạt động rất tốt trên tập dữ liệu huấn luyện nhưng kém hơn đáng kể trên tập dữ liệu kiểm tra. Hiện tượng này cho thấy điều gì?

5 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 5: Cho bài toán phân loại ảnh mèo và chó. Độ chính xác (accuracy) của mô hình là 95%. Phát biểu nào sau đây *không chắc chắn* đúng?

6 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 6: Trong thuật toán K-means clustering, điều gì xảy ra trong mỗi lần lặp (iteration)?

7 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 7: Để xử lý dữ liệu thuộc tính phân loại (categorical features) trong mô hình học máy, phương pháp nào sau đây chuyển đổi mỗi giá trị duy nhất của thuộc tính thành một vector nhị phân?

8 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 8: Hàm kích hoạt ReLU (Rectified Linear Unit) trong mạng neural có ưu điểm gì so với hàm sigmoid hoặc tanh?

9 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 9: Trong học tăng cường (Reinforcement Learning), thành phần nào chịu trách nhiệm lựa chọn hành động trong môi trường?

10 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 10: Để giảm chiều dữ liệu (dimensionality reduction) và loại bỏ các thuộc tính ít quan trọng, phương pháp nào sau đây tìm kiếm một tập hợp các thuộc tính mới là tổ hợp tuyến tính của các thuộc tính ban đầu, sao cho phương sai được giữ lại là lớn nhất?

11 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 11: Giả sử bạn có một mô hình phân loại nhị phân và ngưỡng quyết định mặc định là 0.5. Nếu bạn muốn tăng độ nhạy (recall) của mô hình, bạn nên điều chỉnh ngưỡng quyết định như thế nào?

12 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 12: Trong ngữ cảnh của mô hình học máy, 'bias' (độ chệch) và 'variance' (phương sai) thể hiện điều gì?

13 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 13: Mô hình nào sau đây thường được sử dụng cho bài toán phát hiện dị thường (anomaly detection) trong dữ liệu?

14 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 14: Trong quá trình tiền xử lý dữ liệu, kỹ thuật 'scaling' (tỷ lệ hóa) dữ liệu nhằm mục đích gì?

15 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 15: Phương pháp 'Gradient Descent' được sử dụng để làm gì trong huấn luyện mô hình học máy?

16 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 16: Trong mạng neural tích chập (CNN), lớp 'pooling' (gộp nhóm) có vai trò gì?

17 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 17: Khi nào thì nên sử dụng phương pháp 'cross-validation' (kiểm định chéo) trong quá trình phát triển mô hình học máy?

18 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 18: Trong thuật toán SVM (Support Vector Machine), 'kernel trick' (hàm nhân) cho phép mô hình làm gì?

19 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 19: Mô hình học máy nào sau đây phù hợp nhất cho bài toán dự đoán chuỗi thời gian (time series forecasting) có tính chất tuần tự và phụ thuộc thời gian?

20 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 20: Trong ngữ cảnh của học máy giải thích được (explainable AI - XAI), phương pháp nào sau đây giúp hiểu được đóng góp của từng thuộc tính đầu vào vào dự đoán của mô hình?

21 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 21: Trong học không giám sát (unsupervised learning), thuật toán DBSCAN (Density-Based Spatial Clustering of Applications with Noise) có ưu điểm gì so với K-means?

22 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 22: Khi triển khai mô hình học máy trong thực tế, vấn đề 'concept drift' (trôi khái niệm) đề cập đến hiện tượng gì?

23 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 23: Để xử lý dữ liệu văn bản trong NLP (Natural Language Processing), kỹ thuật nào sau đây chuyển đổi văn bản thành các vector số bằng cách đếm tần suất xuất hiện của mỗi từ trong từng văn bản?

24 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 24: Trong mô hình Logistic Regression, hàm mất mát (loss function) thường được sử dụng là gì?

25 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 25: Khi huấn luyện mô hình mạng neural, 'batch size' (kích thước lô) ảnh hưởng đến quá trình huấn luyện như thế nào?

26 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 26: Trong học máy công bằng (fair machine learning), 'disparate impact' (tác động khác biệt) đề cập đến vấn đề gì?

27 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 27: Phương pháp 'transfer learning' (học chuyển giao) mang lại lợi ích gì trong học máy?

28 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 28: Trong kiến trúc Transformer, cơ chế 'self-attention' (tự chú ý) cho phép mô hình làm gì?

29 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 29: Để đảm bảo tính riêng tư của dữ liệu trong học máy, kỹ thuật nào sau đây thêm nhiễu ngẫu nhiên vào dữ liệu trong khi vẫn duy trì các đặc tính thống kê tổng thể?

30 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 5

Câu 30: Trong học máy, 'regularization' (chính quy hóa) là kỹ thuật được sử dụng để giải quyết vấn đề gì?

Xem kết quả