Bài Tập, Đề Thi Trắc Nghiệm Online – Môn Học Máy – Đề 02

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Môn Học Máy

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy - Đề 02

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy - Đề 02 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Bạn đang xây dựng một hệ thống phát hiện gian lận thẻ tín dụng. Dữ liệu huấn luyện của bạn chứa thông tin giao dịch và nhãn cho biết giao dịch nào là gian lận. Loại bài toán học máy nào phù hợp nhất cho tình huống này?

  • A. Hồi quy (Regression)
  • B. Phân loại (Classification)
  • C. Phân cụm (Clustering)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 2: Trong thuật toán K-Means Clustering, điều gì xảy ra trong mỗi lần lặp (iteration)?

  • A. Các cụm được xác định trước và điểm dữ liệu được gán vào các cụm này.
  • B. Thuật toán tìm kiếm cụm có mật độ điểm dữ liệu cao nhất.
  • C. Điểm dữ liệu được gán lại vào các cụm dựa trên khoảng cách đến trọng tâm cụm gần nhất và trọng tâm cụm được cập nhật.
  • D. Mô hình cây quyết định được xây dựng để phân chia dữ liệu thành các cụm.

Câu 3: Phương pháp đánh giá mô hình học máy nào sau đây giúp ước tính khả năng tổng quát hóa của mô hình trên dữ liệu mới bằng cách chia dữ liệu thành nhiều phần và huấn luyện/kiểm tra mô hình trên các phần khác nhau?

  • A. Đánh giá trên tập huấn luyện (Training set evaluation)
  • B. Đánh giá trên tập kiểm tra duy nhất (Hold-out validation)
  • C. Ma trận nhầm lẫn (Confusion matrix)
  • D. Kiểm định chéo (Cross-validation)

Câu 4: Điều gì KHÔNG phải là một lợi ích của việc sử dụng kỹ thuật giảm chiều dữ liệu (dimensionality reduction) như PCA (Principal Component Analysis)?

  • A. Giảm độ phức tạp tính toán của mô hình
  • B. Giúp trực quan hóa dữ liệu nhiều chiều
  • C. Đảm bảo giữ lại hoàn toàn 100% thông tin gốc của dữ liệu
  • D. Giảm nguy cơ overfitting cho mô hình

Câu 5: Hàm kích hoạt ReLU (Rectified Linear Unit) thường được sử dụng trong mạng nơ-ron sâu (Deep Neural Networks) vì lý do chính nào?

  • A. Giảm thiểu vấn đề vanishing gradient và tính toán hiệu quả
  • B. Đảm bảo đầu ra của neuron luôn nằm trong khoảng [0, 1]
  • C. Tạo ra tính phi tuyến tính yếu hơn so với sigmoid
  • D. Tăng độ phức tạp của mạng nơ-ron

Câu 6: Trong học máy không giám sát (Unsupervised Learning), thuật toán nào sau đây thường được sử dụng để giảm số chiều của dữ liệu đồng thời cố gắng giữ lại cấu trúc thông tin quan trọng nhất?

  • A. K-Nearest Neighbors (KNN)
  • B. Principal Component Analysis (PCA)
  • C. Support Vector Machine (SVM)
  • D. Naive Bayes

Câu 7: Bạn muốn dự đoán giá nhà dựa trên các đặc trưng như diện tích, số phòng ngủ, vị trí,... Mô hình hồi quy tuyến tính (Linear Regression) sẽ tối ưu hóa hàm mất mát (loss function) nào sau đây?

  • A. Cross-Entropy Loss
  • B. Hinge Loss
  • C. Mean Squared Error (MSE)
  • D. Absolute Error

Câu 8: Trong ngữ cảnh của học máy, "feature engineering" (kỹ thuật đặc trưng) đề cập đến quá trình nào?

  • A. Chọn thuật toán học máy phù hợp nhất cho bài toán
  • B. Tối ưu hóa siêu tham số (hyperparameters) của mô hình
  • C. Đánh giá hiệu suất của mô hình trên tập kiểm tra
  • D. Chọn lọc, biến đổi và tạo ra các đặc trưng phù hợp từ dữ liệu thô

Câu 9: Điều gì xảy ra khi bạn tăng giá trị của tham số "k" trong thuật toán K-Nearest Neighbors (KNN)?

  • A. Mô hình trở nên phức tạp hơn và dễ bị overfitting hơn.
  • B. Mô hình trở nên đơn giản hơn, biên quyết định mượt mà hơn và ít nhạy cảm với nhiễu.
  • C. Thời gian huấn luyện mô hình giảm đáng kể.
  • D. Độ chính xác của mô hình luôn tăng lên.

Câu 10: Trong học sâu, kỹ thuật "dropout" được sử dụng để giải quyết vấn đề nào?

  • A. Overfitting (quá khớp)
  • B. Underfitting (thiếu khớp)
  • C. Vanishing gradient (gradient biến mất)
  • D. Exploding gradient (gradient bùng nổ)

Câu 11: Mô hình học máy nào sau đây có thể được sử dụng cho cả bài toán phân loại (classification) và hồi quy (regression)?

  • A. Logistic Regression
  • B. K-Means Clustering
  • C. Decision Tree
  • D. Principal Component Analysis (PCA)

Câu 12: Trong thuật toán Support Vector Machine (SVM), "kernel trick" (mẹo kernel) cho phép chúng ta làm gì?

  • A. Giảm số lượng support vectors cần thiết
  • B. Tăng tốc độ huấn luyện mô hình SVM
  • C. Trực quan hóa dữ liệu trong không gian chiều cao
  • D. Giải quyết bài toán phân loại phi tuyến tính bằng cách ánh xạ dữ liệu vào không gian đặc trưng chiều cao

Câu 13: Độ đo "Recall" (Độ nhớ lại) trong đánh giá mô hình phân loại được tính bằng công thức nào?

  • A. TP / (TP + FP)
  • B. TP / (TP + FN)
  • C. TN / (TN + FP)
  • D. TN / (TN + FN)

Câu 14: Phương pháp "Gradient Descent" (Độ dốc giảm dần) được sử dụng để làm gì trong huấn luyện mô hình học máy?

  • A. Đánh giá hiệu suất của mô hình
  • B. Chọn đặc trưng (features) quan trọng nhất
  • C. Tối ưu hóa tham số của mô hình để giảm thiểu hàm mất mát
  • D. Chia dữ liệu thành tập huấn luyện và tập kiểm tra

Câu 15: "Bias-Variance tradeoff" (Đánh đổi Bias-Variance) trong học máy mô tả sự cân bằng giữa điều gì?

  • A. Độ chính xác trên tập huấn luyện và độ chính xác trên tập kiểm tra
  • B. Thời gian huấn luyện và độ phức tạp của mô hình
  • C. Precision và Recall
  • D. Bias (sai lệch) và Variance (phương sai) của mô hình

Câu 16: Mô hình "Random Forest" hoạt động dựa trên nguyên tắc "ensemble learning" (học tập kết hợp) nào?

  • A. Boosting
  • B. Bagging
  • C. Stacking
  • D. Blending

Câu 17: Trong bài toán phân loại đa lớp (multi-class classification), độ đo đánh giá nào sau đây thường được sử dụng?

  • A. Accuracy (Độ chính xác)
  • B. AUC-ROC
  • C. F1-score (chỉ áp dụng tốt nhất cho binary)
  • D. Precision (chỉ đo lường cho lớp dương)

Câu 18: Kỹ thuật "Batch Normalization" (Chuẩn hóa theo lô) trong mạng nơ-ron sâu giúp giải quyết vấn đề nào trong quá trình huấn luyện?

  • A. Overfitting
  • B. Underfitting
  • C. Internal Covariate Shift
  • D. Vanishing Gradient

Câu 19: Trong học tăng cường (Reinforcement Learning), "reward function" (hàm phần thưởng) có vai trò gì?

  • A. Đánh giá hiệu suất của tác nhân
  • B. Xác định trạng thái hiện tại của môi trường
  • C. Chọn hành động tiếp theo cho tác nhân
  • D. Định nghĩa mục tiêu và cung cấp tín hiệu phản hồi cho tác nhân

Câu 20: Thuật toán nào sau đây thuộc loại học có giám sát (Supervised Learning)?

  • A. K-Means Clustering
  • B. Support Vector Machine (SVM)
  • C. Principal Component Analysis (PCA)
  • D. Apriori Algorithm

Câu 21: Cho một mô hình phân loại nhị phân, ma trận nhầm lẫn (confusion matrix) cho thấy có 100 True Positives, 20 False Positives, 10 False Negatives và 870 True Negatives. Độ chính xác (Accuracy) của mô hình là bao nhiêu?

  • A. 87%
  • B. 90%
  • C. 97%
  • D. 99%

Câu 22: Trong mạng nơ-ron tích chập (Convolutional Neural Networks - CNNs), lớp "convolutional layer" (lớp tích chập) có chức năng chính là gì?

  • A. Giảm chiều dữ liệu
  • B. Phân loại đối tượng
  • C. Tăng tính phi tuyến tính
  • D. Trích xuất đặc trưng cục bộ từ dữ liệu đầu vào

Câu 23: Khi nào thì sử dụng F1-score thay vì Accuracy để đánh giá mô hình phân loại?

  • A. Khi dữ liệu có nhiều chiều
  • B. Khi dữ liệu bị mất cân bằng lớp
  • C. Khi mô hình có độ phức tạp cao
  • D. Khi cần đánh giá tốc độ dự đoán của mô hình

Câu 24: Kỹ thuật "Early Stopping" (Dừng sớm) trong huấn luyện mạng nơ-ron được sử dụng để làm gì?

  • A. Ngăn chặn overfitting bằng cách dừng huấn luyện khi hiệu suất trên tập validation không cải thiện
  • B. Tăng tốc độ huấn luyện mô hình
  • C. Cải thiện độ chính xác trên tập huấn luyện
  • D. Giảm số lượng tham số của mô hình

Câu 25: Trong thuật toán Naive Bayes, giả định "naive" (ngây thơ) đề cập đến điều gì?

  • A. Dữ liệu huấn luyện phải được chuẩn hóa
  • B. Mô hình phải được huấn luyện trên dữ liệu lớn
  • C. Các đặc trưng là độc lập có điều kiện với nhau khi biết lớp
  • D. Thuật toán chỉ hoạt động tốt với dữ liệu văn bản

Câu 26: Mô hình học máy nào sau đây thường được sử dụng cho bài toán phát hiện dị thường (anomaly detection)?

  • A. Linear Regression
  • B. Logistic Regression
  • C. K-Means Clustering
  • D. Isolation Forest

Câu 27: Trong kiến trúc mạng nơ-ron tuần hoàn (Recurrent Neural Networks - RNNs), tại sao chúng phù hợp với dữ liệu chuỗi thời gian (time series data) hoặc dữ liệu tuần tự (sequential data)?

  • A. RNNs có thể xử lý dữ liệu ảnh tốt hơn CNNs
  • B. RNNs có cơ chế bộ nhớ để xử lý thông tin tuần tự qua các bước thời gian
  • C. RNNs có thể giảm chiều dữ liệu hiệu quả
  • D. RNNs có thể trích xuất đặc trưng cục bộ tốt hơn

Câu 28: Phương pháp "Boosting" trong ensemble learning (học tập kết hợp) khác với "Bagging" như thế nào?

  • A. Boosting tạo ra các mô hình đơn giản hơn Bagging
  • B. Boosting chỉ sử dụng cây quyết định, còn Bagging có thể sử dụng nhiều loại mô hình khác nhau
  • C. Boosting huấn luyện các mô hình tuần tự, tập trung sửa lỗi của mô hình trước; Bagging huấn luyện song song và độc lập
  • D. Boosting thường cho độ chính xác thấp hơn Bagging

Câu 29: Trong học máy, "Regularization" (Chính quy hóa) là kỹ thuật được sử dụng để làm gì?

  • A. Giảm overfitting bằng cách hạn chế độ phức tạp của mô hình
  • B. Tăng tốc độ huấn luyện mô hình
  • C. Cải thiện độ chính xác trên tập huấn luyện
  • D. Chọn đặc trưng quan trọng nhất

Câu 30: Đường cong ROC (Receiver Operating Characteristic) và giá trị AUC (Area Under the Curve) thường được sử dụng để đánh giá mô hình nào?

  • A. Mô hình hồi quy (Regression models)
  • B. Mô hình phân loại nhị phân (Binary classification models)
  • C. Mô hình phân cụm (Clustering models)
  • D. Mô hình giảm chiều dữ liệu (Dimensionality reduction models)

1 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 1: Bạn đang xây dựng một hệ thống phát hiện gian lận thẻ tín dụng. Dữ liệu huấn luyện của bạn chứa thông tin giao dịch và nhãn cho biết giao dịch nào là gian lận. Loại bài toán học máy nào phù hợp nhất cho tình huống này?

2 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 2: Trong thuật toán K-Means Clustering, điều gì xảy ra trong mỗi lần lặp (iteration)?

3 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 3: Phương pháp đánh giá mô hình học máy nào sau đây giúp ước tính khả năng tổng quát hóa của mô hình trên dữ liệu mới bằng cách chia dữ liệu thành nhiều phần và huấn luyện/kiểm tra mô hình trên các phần khác nhau?

4 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 4: Điều gì KHÔNG phải là một lợi ích của việc sử dụng kỹ thuật giảm chiều dữ liệu (dimensionality reduction) như PCA (Principal Component Analysis)?

5 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 5: Hàm kích hoạt ReLU (Rectified Linear Unit) thường được sử dụng trong mạng nơ-ron sâu (Deep Neural Networks) vì lý do chính nào?

6 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 6: Trong học máy không giám sát (Unsupervised Learning), thuật toán nào sau đây thường được sử dụng để giảm số chiều của dữ liệu đồng thời cố gắng giữ lại cấu trúc thông tin quan trọng nhất?

7 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 7: Bạn muốn dự đoán giá nhà dựa trên các đặc trưng như diện tích, số phòng ngủ, vị trí,... Mô hình hồi quy tuyến tính (Linear Regression) sẽ tối ưu hóa hàm mất mát (loss function) nào sau đây?

8 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 8: Trong ngữ cảnh của học máy, 'feature engineering' (kỹ thuật đặc trưng) đề cập đến quá trình nào?

9 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 9: Điều gì xảy ra khi bạn tăng giá trị của tham số 'k' trong thuật toán K-Nearest Neighbors (KNN)?

10 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 10: Trong học sâu, kỹ thuật 'dropout' được sử dụng để giải quyết vấn đề nào?

11 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 11: Mô hình học máy nào sau đây có thể được sử dụng cho cả bài toán phân loại (classification) và hồi quy (regression)?

12 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 12: Trong thuật toán Support Vector Machine (SVM), 'kernel trick' (mẹo kernel) cho phép chúng ta làm gì?

13 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 13: Độ đo 'Recall' (Độ nhớ lại) trong đánh giá mô hình phân loại được tính bằng công thức nào?

14 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 14: Phương pháp 'Gradient Descent' (Độ dốc giảm dần) được sử dụng để làm gì trong huấn luyện mô hình học máy?

15 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 15: 'Bias-Variance tradeoff' (Đánh đổi Bias-Variance) trong học máy mô tả sự cân bằng giữa điều gì?

16 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 16: Mô hình 'Random Forest' hoạt động dựa trên nguyên tắc 'ensemble learning' (học tập kết hợp) nào?

17 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 17: Trong bài toán phân loại đa lớp (multi-class classification), độ đo đánh giá nào sau đây thường được sử dụng?

18 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 18: Kỹ thuật 'Batch Normalization' (Chuẩn hóa theo lô) trong mạng nơ-ron sâu giúp giải quyết vấn đề nào trong quá trình huấn luyện?

19 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 19: Trong học tăng cường (Reinforcement Learning), 'reward function' (hàm phần thưởng) có vai trò gì?

20 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 20: Thuật toán nào sau đây thuộc loại học có giám sát (Supervised Learning)?

21 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 21: Cho một mô hình phân loại nhị phân, ma trận nhầm lẫn (confusion matrix) cho thấy có 100 True Positives, 20 False Positives, 10 False Negatives và 870 True Negatives. Độ chính xác (Accuracy) của mô hình là bao nhiêu?

22 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 22: Trong mạng nơ-ron tích chập (Convolutional Neural Networks - CNNs), lớp 'convolutional layer' (lớp tích chập) có chức năng chính là gì?

23 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 23: Khi nào thì sử dụng F1-score thay vì Accuracy để đánh giá mô hình phân loại?

24 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 24: Kỹ thuật 'Early Stopping' (Dừng sớm) trong huấn luyện mạng nơ-ron được sử dụng để làm gì?

25 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 25: Trong thuật toán Naive Bayes, giả định 'naive' (ngây thơ) đề cập đến điều gì?

26 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 26: Mô hình học máy nào sau đây thường được sử dụng cho bài toán phát hiện dị thường (anomaly detection)?

27 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 27: Trong kiến trúc mạng nơ-ron tuần hoàn (Recurrent Neural Networks - RNNs), tại sao chúng phù hợp với dữ liệu chuỗi thời gian (time series data) hoặc dữ liệu tuần tự (sequential data)?

28 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 28: Phương pháp 'Boosting' trong ensemble learning (học tập kết hợp) khác với 'Bagging' như thế nào?

29 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 29: Trong học máy, 'Regularization' (Chính quy hóa) là kỹ thuật được sử dụng để làm gì?

30 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 2

Câu 30: Đường cong ROC (Receiver Operating Characteristic) và giá trị AUC (Area Under the Curve) thường được sử dụng để đánh giá mô hình nào?

Xem kết quả