Bài Tập, Đề Thi Trắc Nghiệm Online – Môn Học Máy – Đề 09

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Môn Học Máy

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy - Đề 09

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy - Đề 09 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong các bài toán phân loại (classification) sử dụng học máy, độ đo nào sau đây thường được ưu tiên lựa chọn để đánh giá hiệu suất mô hình khi tập dữ liệu có sự mất cân bằng lớn giữa các lớp (imbalanced dataset)?

  • A. Độ chính xác (Accuracy)
  • B. Độ chính xác (Precision)
  • C. ĐộRecall (Recall)
  • D. F1-score

Câu 2: Xét bài toán dự đoán khả năng khách hàng rời bỏ dịch vụ (customer churn prediction). Mô hình học máy nào sau đây không phù hợp để trực tiếp xác định tầm quan trọng của từng yếu tố (ví dụ: mức độ sử dụng dịch vụ, thời gian sử dụng) đối với quyết định rời bỏ của khách hàng?

  • A. Hồi quy Logistic (Logistic Regression)
  • B. Cây quyết định (Decision Tree)
  • C. Mạng nơ-ron sâu (Deep Neural Network)
  • D. Rừng ngẫu nhiên (Random Forest)

Câu 3: Kỹ thuật регуляризация (Regularization) được sử dụng trong học máy với mục đích chính là gì?

  • A. Tăng tốc độ huấn luyện mô hình
  • B. Giảm hiện tượng quá khớp (overfitting)
  • C. Cải thiện độ chính xác trên tập huấn luyện
  • D. Tăng cường khả năng diễn giải của mô hình

Câu 4: Trong quy trình xây dựng mô hình học máy, bước nào sau đây thường không được thực hiện trước khi chia dữ liệu thành tập huấn luyện và tập kiểm tra?

  • A. Xử lý giá trị thiếu (missing values)
  • B. Mã hóa biến категориальные (categorical encoding)
  • C. Chuẩn hóa đặc trưng (feature scaling)
  • D. Đánh giá hiệu suất mô hình trên tập kiểm tra

Câu 5: Phương pháp học tăng cường (Reinforcement Learning) khác biệt cơ bản so với học có giám sát (Supervised Learning) ở điểm nào?

  • A. Học tăng cường sử dụng ít dữ liệu hơn
  • B. Học tăng cường luôn cho kết quả chính xác hơn
  • C. Học tăng cường học thông qua tương tác với môi trường và phần thưởng
  • D. Học tăng cường chỉ áp dụng cho bài toán phân loại

Câu 6: Thuật toán K-Means Clustering thuộc loại học máy nào?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học bán giám sát (Semi-supervised Learning)
  • D. Học tăng cường (Reinforcement Learning)

Câu 7: Trong mạng nơ-ron tích chập (Convolutional Neural Network - CNN), lớp tích chập (Convolutional layer) có vai trò chính là gì?

  • A. Trích xuất đặc trưng từ dữ liệu đầu vào
  • B. Giảm chiều dữ liệu
  • C. Phân loại dữ liệu
  • D. Tăng cường tính phi tuyến

Câu 8: Phương pháp giảm chiều dữ liệu (dimensionality reduction) nào sau đây là phương pháp tuyến tính?

  • A. t-SNE (t-distributed Stochastic Neighbor Embedding)
  • B. PCA (Principal Component Analysis)
  • C. UMAP (Uniform Manifold Approximation and Projection)
  • D. Autoencoder

Câu 9: Trong mô hình cây quyết định (Decision Tree), tiêu chí phân tách nút (splitting criterion) Gini impurity được sử dụng để làm gì?

  • A. Đo độ chính xác của mô hình
  • B. Kiểm soát độ phức tạp của cây
  • C. Chọn thuộc tính và điểm phân tách tốt nhất để chia nút
  • D. Xử lý dữ liệu bị thiếu

Câu 10: Khi nào nên sử dụng phương pháp đánh giá mô hình Cross-validation thay vì chỉ chia dữ liệu thành một tập huấn luyện và một tập kiểm tra duy nhất?

  • A. Khi tập dữ liệu rất lớn
  • B. Khi muốn đánh giá mô hình một cách khách quan và ổn định hơn, đặc biệt với dữ liệu nhỏ
  • C. Khi mô hình huấn luyện rất nhanh
  • D. Khi chỉ quan tâm đến hiệu suất trên tập huấn luyện

Câu 11: Trong bài toán hồi quy (regression), độ đo lỗi nào sau đây ít nhạy cảm nhất với các giá trị ngoại lai (outliers)?

  • A. MSE (Mean Squared Error)
  • B. RMSE (Root Mean Squared Error)
  • C. MAE (Mean Absolute Error)
  • D. R-squared

Câu 12: Kỹ thuật “one-hot encoding” thường được sử dụng để xử lý loại dữ liệu nào?

  • A. Dữ liệu số liên tục (continuous numerical data)
  • B. Dữ liệu категориальные (categorical data)
  • C. Dữ liệu văn bản (text data)
  • D. Dữ liệu thời gian (time series data)

Câu 13: Trong học sâu, hàm kích hoạt ReLU (Rectified Linear Unit) có ưu điểm gì so với hàm sigmoid hoặc tanh?

  • A. Luôn cho đầu ra nằm trong khoảng [0, 1]
  • B. Tính toán đạo hàm phức tạp hơn
  • C. Khử được hiện tượng dead ReLU
  • D. Giảm thiểu vấn đề gradient vanishing trong mạng sâu

Câu 14: Phương pháp “Gradient Descent” được sử dụng để làm gì trong huấn luyện mô hình học máy?

  • A. Tối ưu hóa tham số mô hình để giảm thiểu hàm mất mát
  • B. Đánh giá hiệu suất mô hình
  • C. Chọn đặc trưng quan trọng nhất
  • D. Chia dữ liệu thành các cụm

Câu 15: Khi mô hình học máy có hiện tượng “underfitting”, giải pháp nào sau đây có thể không hiệu quả?

  • A. Tăng độ phức tạp của mô hình
  • B. Thêm nhiều đặc trưng (features) hơn
  • C. Tăng cường регуляризация (regularization)
  • D. Huấn luyện mô hình lâu hơn

Câu 16: Trong thuật toán Random Forest, kỹ thuật “bootstrap aggregating” (bagging) được sử dụng như thế nào?

  • A. Để chọn ngẫu nhiên các đặc trưng cho mỗi cây
  • B. Để tạo ra nhiều tập dữ liệu huấn luyện con bằng cách lấy mẫu có hoàn lại
  • C. Để kết hợp dự đoán của các cây quyết định bằng cách lấy trung bình
  • D. Để giảm chiều dữ liệu trước khi huấn luyện cây

Câu 17: Mục đích chính của việc sử dụng “batch normalization” trong mạng nơ-ron sâu là gì?

  • A. Tăng tốc độ suy luận (inference) của mô hình
  • B. Giảm số lượng tham số của mô hình
  • C. Ổn định quá trình huấn luyện và cho phép sử dụng learning rate cao hơn
  • D. Cải thiện khả năng diễn giải của mô hình

Câu 18: Trong bài toán phân loại đa lớp (multi-class classification), hàm mất mát nào sau đây thường được sử dụng?

  • A. Mean Squared Error (MSE)
  • B. Mean Absolute Error (MAE)
  • C. Binary Cross-entropy
  • D. Categorical Cross-entropy

Câu 19: Phương pháp “early stopping” được sử dụng để giải quyết vấn đề gì trong quá trình huấn luyện mô hình học máy?

  • A. Quá khớp (overfitting)
  • B. Dữ liệu bị thiếu (missing data)
  • C. Underfitting
  • D. Mất cân bằng dữ liệu (imbalanced data)

Câu 20: Trong mô hình Support Vector Machine (SVM), “kernel trick” cho phép làm gì?

  • A. Tăng tốc độ huấn luyện SVM
  • B. Giảm số lượng chiều dữ liệu
  • C. Xử lý dữ liệu phi tuyến tính bằng cách ánh xạ dữ liệu sang không gian chiều cao hơn
  • D. Chọn siêu tham số tốt nhất cho SVM

Câu 21: Thuật toán nào sau đây thường được sử dụng để giảm chiều dữ liệu và đồng thời giữ lại cấu trúc lân cận của dữ liệu?

  • A. PCA (Principal Component Analysis)
  • B. t-SNE (t-distributed Stochastic Neighbor Embedding)
  • C. K-Means Clustering
  • D. Linear Regression

Câu 22: Trong mạng nơ-ron hồi quy (Recurrent Neural Network - RNN), cơ chế “attention” giúp giải quyết vấn đề gì?

  • A. Tăng tốc độ huấn luyện RNN
  • B. Giảm số lượng tham số của RNN
  • C. Khắc phục hiện tượng vanishing gradient trong RNN
  • D. Giúp mô hình tập trung vào các phần quan trọng của chuỗi đầu vào, đặc biệt chuỗi dài

Câu 23: Phương pháp “Ensemble Learning” hoạt động dựa trên nguyên tắc nào?

  • A. Chia nhỏ tập dữ liệu huấn luyện
  • B. Tăng độ phức tạp của mô hình
  • C. Kết hợp dự đoán của nhiều mô hình yếu để tạo ra mô hình mạnh hơn
  • D. Giảm chiều dữ liệu đầu vào

Câu 24: Trong lĩnh vực xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP), kỹ thuật “word embedding” (ví dụ: Word2Vec, GloVe) được sử dụng để làm gì?

  • A. Biểu diễn từ ngữ thành vector số để máy tính có thể hiểu và xử lý
  • B. Loại bỏ từ dừng (stop words) trong văn bản
  • C. Phân tích cú pháp câu
  • D. Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác

Câu 25: Khi xây dựng mô hình học máy, điều gì xảy ra nếu chúng ta sử dụng tập kiểm tra (test set) để tinh chỉnh siêu tham số (hyperparameters)?

  • A. Mô hình sẽ có hiệu suất tốt hơn trên tập kiểm tra
  • B. Đánh giá hiệu suất mô hình trên tập kiểm tra sẽ không còn khách quan
  • C. Quá trình huấn luyện mô hình sẽ nhanh hơn
  • D. Không có ảnh hưởng gì đáng kể

Câu 26: Trong kiến trúc Transformer, cơ chế “self-attention” có vai trò chính là gì?

  • A. Tăng tốc độ tính toán trong Transformer
  • B. Giảm số lượng tham số của Transformer
  • C. Học mối quan hệ giữa các từ trong cùng một câu
  • D. Xử lý dữ liệu tuần tự theo thời gian

Câu 27: Phương pháp “boosting” (ví dụ: AdaBoost, Gradient Boosting) khác biệt so với “bagging” (ví dụ: Random Forest) ở điểm nào?

  • A. Boosting tạo ra các mô hình đa dạng hơn Bagging
  • B. Boosting dễ bị overfitting hơn Bagging
  • C. Boosting huấn luyện các mô hình song song, Bagging tuần tự
  • D. Boosting huấn luyện các mô hình tuần tự, tập trung vào sửa lỗi của mô hình trước, Bagging huấn luyện song song, độc lập

Câu 28: Trong bài toán phát hiện gian lận (fraud detection), độ đo nào sau đây thường quan trọng hơn độ chính xác (accuracy)?

  • A. Độ chính xác (Accuracy)
  • B. Độ Recall (Recall) hoặc F1-score
  • C. ĐộPrecision (Precision)
  • D. AUC-ROC

Câu 29: Kỹ thuật “data augmentation” thường được sử dụng để cải thiện hiệu suất mô hình học máy trong trường hợp nào?

  • A. Khi dữ liệu có nhiều giá trị thiếu
  • B. Khi mô hình bị underfitting
  • C. Khi dữ liệu huấn luyện hạn chế và muốn cải thiện khả năng tổng quát hóa
  • D. Khi muốn giảm chiều dữ liệu

Câu 30: Trong ngữ cảnh học máy giải thích được (Explainable AI - XAI), phương pháp SHAP (SHapley Additive exPlanations) được sử dụng để làm gì?

  • A. Đánh giá độ quan trọng của đặc trưng trên toàn bộ tập dữ liệu
  • B. Chọn đặc trưng quan trọng nhất để huấn luyện mô hình
  • C. Tối ưu hóa siêu tham số của mô hình
  • D. Giải thích lý do đưa ra một dự đoán cụ thể của mô hình cho từng instance

1 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 1: Trong các bài toán phân loại (classification) sử dụng học máy, độ đo nào sau đây thường được ưu tiên lựa chọn để đánh giá hiệu suất mô hình khi tập dữ liệu có sự mất cân bằng lớn giữa các lớp (imbalanced dataset)?

2 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 2: Xét bài toán dự đoán khả năng khách hàng rời bỏ dịch vụ (customer churn prediction). Mô hình học máy nào sau đây *không* phù hợp để trực tiếp xác định tầm quan trọng của từng yếu tố (ví dụ: mức độ sử dụng dịch vụ, thời gian sử dụng) đối với quyết định rời bỏ của khách hàng?

3 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 3: Kỹ thuật регуляризация (Regularization) được sử dụng trong học máy với mục đích chính là gì?

4 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 4: Trong quy trình xây dựng mô hình học máy, bước nào sau đây thường *không* được thực hiện trước khi chia dữ liệu thành tập huấn luyện và tập kiểm tra?

5 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 5: Phương pháp học tăng cường (Reinforcement Learning) khác biệt cơ bản so với học có giám sát (Supervised Learning) ở điểm nào?

6 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 6: Thuật toán K-Means Clustering thuộc loại học máy nào?

7 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 7: Trong mạng nơ-ron tích chập (Convolutional Neural Network - CNN), lớp tích chập (Convolutional layer) có vai trò chính là gì?

8 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 8: Phương pháp giảm chiều dữ liệu (dimensionality reduction) nào sau đây là phương pháp *tuyến tính*?

9 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 9: Trong mô hình cây quyết định (Decision Tree), tiêu chí phân tách nút (splitting criterion) Gini impurity được sử dụng để làm gì?

10 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 10: Khi nào nên sử dụng phương pháp đánh giá mô hình Cross-validation thay vì chỉ chia dữ liệu thành một tập huấn luyện và một tập kiểm tra duy nhất?

11 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 11: Trong bài toán hồi quy (regression), độ đo lỗi nào sau đây ít nhạy cảm nhất với các giá trị ngoại lai (outliers)?

12 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 12: Kỹ thuật “one-hot encoding” thường được sử dụng để xử lý loại dữ liệu nào?

13 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 13: Trong học sâu, hàm kích hoạt ReLU (Rectified Linear Unit) có ưu điểm gì so với hàm sigmoid hoặc tanh?

14 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 14: Phương pháp “Gradient Descent” được sử dụng để làm gì trong huấn luyện mô hình học máy?

15 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 15: Khi mô hình học máy có hiện tượng “underfitting”, giải pháp nào sau đây có thể *không* hiệu quả?

16 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 16: Trong thuật toán Random Forest, kỹ thuật “bootstrap aggregating” (bagging) được sử dụng như thế nào?

17 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 17: Mục đích chính của việc sử dụng “batch normalization” trong mạng nơ-ron sâu là gì?

18 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 18: Trong bài toán phân loại đa lớp (multi-class classification), hàm mất mát nào sau đây thường được sử dụng?

19 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 19: Phương pháp “early stopping” được sử dụng để giải quyết vấn đề gì trong quá trình huấn luyện mô hình học máy?

20 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 20: Trong mô hình Support Vector Machine (SVM), “kernel trick” cho phép làm gì?

21 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 21: Thuật toán nào sau đây thường được sử dụng để giảm chiều dữ liệu và đồng thời giữ lại cấu trúc lân cận của dữ liệu?

22 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 22: Trong mạng nơ-ron hồi quy (Recurrent Neural Network - RNN), cơ chế “attention” giúp giải quyết vấn đề gì?

23 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 23: Phương pháp “Ensemble Learning” hoạt động dựa trên nguyên tắc nào?

24 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 24: Trong lĩnh vực xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP), kỹ thuật “word embedding” (ví dụ: Word2Vec, GloVe) được sử dụng để làm gì?

25 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 25: Khi xây dựng mô hình học máy, điều gì xảy ra nếu chúng ta sử dụng tập kiểm tra (test set) để tinh chỉnh siêu tham số (hyperparameters)?

26 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 26: Trong kiến trúc Transformer, cơ chế “self-attention” có vai trò chính là gì?

27 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 27: Phương pháp “boosting” (ví dụ: AdaBoost, Gradient Boosting) khác biệt so với “bagging” (ví dụ: Random Forest) ở điểm nào?

28 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 28: Trong bài toán phát hiện gian lận (fraud detection), độ đo nào sau đây thường quan trọng hơn độ chính xác (accuracy)?

29 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 29: Kỹ thuật “data augmentation” thường được sử dụng để cải thiện hiệu suất mô hình học máy trong trường hợp nào?

30 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 9

Câu 30: Trong ngữ cảnh học máy giải thích được (Explainable AI - XAI), phương pháp SHAP (SHapley Additive exPlanations) được sử dụng để làm gì?

Xem kết quả