Bài Tập, Đề Thi Trắc Nghiệm Online – Môn Học Máy – Đề 04

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Môn Học Máy

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy - Đề 04

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy - Đề 04 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Bạn có một tập dữ liệu lớn về đánh giá phim, mỗi đánh giá được gán nhãn "tích cực" hoặc "tiêu cực". Bạn muốn xây dựng một hệ thống tự động phân loại cảm xúc của đánh giá phim mới. Phương pháp học máy nào sau đây phù hợp nhất cho nhiệm vụ này?

  • A. Học có giám sát (Supervised learning)
  • B. Học không giám sát (Unsupervised learning)
  • C. Học tăng cường (Reinforcement learning)
  • D. Học bán giám sát (Semi-supervised learning)

Câu 2: Trong quá trình huấn luyện mô hình phân loại ảnh, bạn nhận thấy rằng mô hình đạt độ chính xác rất cao trên tập huấn luyện nhưng lại hoạt động kém trên tập kiểm tra. Hiện tượng này được gọi là gì và giải pháp nào sau đây có thể giúp khắc phục?

  • A. Underfitting; Tăng độ phức tạp của mô hình
  • B. Bias cao; Thu thập thêm dữ liệu huấn luyện
  • C. Overfitting; Áp dụng kỹ thuật chính quy hóa (Regularization)
  • D. Variance thấp; Giảm kích thước tập dữ liệu huấn luyện

Câu 3: Bạn cần nhóm các bài viết tin tức trực tuyến thành các chủ đề khác nhau (ví dụ: thể thao, chính trị, kinh tế) mà không có bất kỳ nhãn chủ đề nào được cung cấp trước. Thuật toán học máy nào sau đây phù hợp nhất?

  • A. Hồi quy tuyến tính (Linear Regression)
  • B. K-means Clustering
  • C. Cây quyết định (Decision Tree)
  • D. Mạng nơ-ron tích chập (Convolutional Neural Network)

Câu 4: Để đánh giá hiệu suất của mô hình phân loại nhị phân, bạn muốn đo lường tỷ lệ dự đoán dương tính chính xác trong số tất cả các trường hợp thực tế là dương tính. Metric đánh giá nào sau đây phù hợp nhất?

  • A. Độ chính xác (Accuracy)
  • B. Precision (Độ chính xác dương)
  • C. F1-score
  • D. Recall (Độ phủ)

Câu 5: Trong mạng nơ-ron sâu, hàm kích hoạt (activation function) có vai trò gì?

  • A. Giới thiệu tính phi tuyến vào mô hình
  • B. Giảm thiểu hiện tượng overfitting
  • C. Tối ưu hóa tốc độ huấn luyện
  • D. Chuẩn hóa dữ liệu đầu vào

Câu 6: Kỹ thuật "cross-validation" (kiểm định chéo) được sử dụng để làm gì trong học máy?

  • A. Tăng kích thước tập dữ liệu huấn luyện
  • B. Đánh giá hiệu suất mô hình một cách tổng quát và khách quan
  • C. Tối ưu hóa siêu tham số của mô hình
  • D. Giảm thiểu thời gian huấn luyện mô hình

Câu 7: Trong thuật toán "Gradient Descent", mục tiêu chính là gì?

  • A. Tăng độ chính xác của mô hình trên tập huấn luyện
  • B. Giảm độ phức tạp của mô hình
  • C. Tìm giá trị tham số tối ưu hóa hàm mất mát
  • D. Chuẩn hóa dữ liệu đầu vào

Câu 8: "Feature engineering" (kỹ thuật đặc trưng) đóng vai trò quan trọng như thế nào trong quy trình học máy?

  • A. Giảm thiểu thời gian huấn luyện mô hình
  • B. Đảm bảo tính công bằng của mô hình
  • C. Tăng khả năng giải thích của mô hình
  • D. Cải thiện hiệu suất và độ chính xác của mô hình

Câu 9: Mô hình "Random Forest" hoạt động dựa trên nguyên tắc nào?

  • A. Một cây quyết định duy nhất
  • B. Tập hợp nhiều cây quyết định
  • C. Mạng nơ-ron sâu
  • D. Thuật toán hồi quy tuyến tính

Câu 10: Trong học tăng cường (Reinforcement Learning), "agent" học hỏi thông qua yếu tố nào?

  • A. Dữ liệu gán nhãn
  • B. Dữ liệu không gán nhãn
  • C. Phần thưởng và phạt từ môi trường
  • D. Ví dụ từ chuyên gia

Câu 11: Khi nào thì mô hình học máy được coi là có "bias" (sai lệch) cao?

  • A. Khi mô hình quá đơn giản và không khớp với dữ liệu
  • B. Khi mô hình quá phức tạp và overfitting dữ liệu
  • C. Khi dữ liệu huấn luyện bị nhiễu
  • D. Khi thuật toán tối ưu hóa không hội tụ

Câu 12: Trong xử lý ngôn ngữ tự nhiên (NLP), "word embedding" (biểu diễn từ) giúp ích gì?

  • A. Tăng tốc độ xử lý văn bản
  • B. Biểu diễn từ dưới dạng vector số học, nắm bắt ngữ nghĩa
  • C. Loại bỏ từ dừng (stop words) khỏi văn bản
  • D. Phân tích cú pháp câu

Câu 13: "Principal Component Analysis (PCA)" là kỹ thuật dùng để làm gì?

  • A. Tăng chiều dữ liệu
  • B. Phân loại dữ liệu
  • C. Giảm chiều dữ liệu
  • D. Tạo dữ liệu tổng hợp

Câu 14: Khi lựa chọn giữa mô hình "bias" cao và mô hình "variance" cao, sự lựa chọn nào phù hợp hơn nếu bạn có rất nhiều dữ liệu huấn luyện?

  • A. Mô hình bias cao, vì nó ít bị overfitting hơn
  • B. Mô hình bias cao, vì nó huấn luyện nhanh hơn
  • C. Không có sự khác biệt, cả hai đều phù hợp
  • D. Mô hình variance cao, vì nó có thể học được nhiều mẫu hơn từ dữ liệu lớn

Câu 15: Trong mạng nơ-ron tích chập (CNN), lớp "convolutional layer" (lớp tích chập) có chức năng chính là gì?

  • A. Trích xuất đặc trưng từ dữ liệu đầu vào
  • B. Giảm chiều dữ liệu
  • C. Phân loại dữ liệu
  • D. Tăng cường tính phi tuyến

Câu 16: Thuật toán "Support Vector Machine (SVM)" hoạt động tốt nhất trong loại bài toán nào?

  • A. Hồi quy tuyến tính
  • B. Phân loại
  • C. Phân cụm
  • D. Giảm chiều dữ liệu

Câu 17: "Regularization" (chính quy hóa) là kỹ thuật được sử dụng để giải quyết vấn đề nào trong học máy?

  • A. Underfitting
  • B. Bias cao
  • C. Overfitting
  • D. Variance thấp

Câu 18: "Ensemble methods" (phương pháp học tập kết hợp) như "Bagging" và "Boosting" có ưu điểm chính là gì?

  • A. Giảm thời gian huấn luyện
  • B. Tăng khả năng giải thích mô hình
  • C. Đơn giản hóa mô hình
  • D. Cải thiện độ chính xác và độ ổn định của dự đoán

Câu 19: Trong học sâu, "batch normalization" (chuẩn hóa theo lô) giúp giải quyết vấn đề gì?

  • A. Gradient vanishing/exploding
  • B. Overfitting
  • C. Underfitting
  • D. Bias cao

Câu 20: Mô hình "Recurrent Neural Network (RNN)" đặc biệt phù hợp với loại dữ liệu nào?

  • A. Dữ liệu dạng bảng
  • B. Dữ liệu tuần tự (chuỗi thời gian, văn bản)
  • C. Dữ liệu hình ảnh
  • D. Dữ liệu rời rạc

Câu 21: Trong học máy, "hyperparameter tuning" (điều chỉnh siêu tham số) là quá trình làm gì?

  • A. Huấn luyện mô hình trên tập dữ liệu lớn
  • B. Chọn thuật toán học máy phù hợp nhất
  • C. Tìm bộ giá trị siêu tham số tối ưu cho mô hình
  • D. Chuẩn hóa dữ liệu đầu vào

Câu 22: Sự khác biệt chính giữa "supervised learning" và "unsupervised learning" là gì?

  • A. Tốc độ huấn luyện
  • B. Sự có mặt của nhãn trong dữ liệu huấn luyện
  • C. Độ phức tạp của mô hình
  • D. Loại thuật toán sử dụng

Câu 23: "Precision" và "Recall" thường được sử dụng cùng nhau trong đánh giá mô hình phân loại để làm gì?

  • A. Tính độ chính xác tổng thể của mô hình
  • B. Đánh giá tốc độ dự đoán của mô hình
  • C. Xác định độ phức tạp của mô hình
  • D. Đánh giá hiệu suất phân loại dương tính một cách toàn diện (trade-off)

Câu 24: Trong ngữ cảnh của "clustering", "inertia" (quán tính) là gì và nó được sử dụng để đánh giá điều gì?

  • A. Tổng khoảng cách từ mỗi điểm đến centroid gần nhất; đánh giá chất lượng phân cụm
  • B. Số lượng cụm tối ưu trong dữ liệu; đánh giá độ phức tạp dữ liệu
  • C. Thời gian cần thiết để thuật toán hội tụ; đánh giá hiệu suất thuật toán
  • D. Độ chính xác của phân cụm so với nhãn thực tế; đánh giá độ chính xác

Câu 25: Phương pháp "dropout" trong mạng nơ-ron thường được áp dụng ở giai đoạn nào và với mục đích gì?

  • A. Giai đoạn tiền xử lý dữ liệu; tăng tốc độ huấn luyện
  • B. Giai đoạn huấn luyện; giảm overfitting
  • C. Giai đoạn đánh giá mô hình; cải thiện độ chính xác
  • D. Giai đoạn triển khai mô hình; giảm kích thước mô hình

Câu 26: Trong học máy, "bias-variance tradeoff" (đánh đổi bias-variance) mô tả mối quan hệ giữa những yếu tố nào?

  • A. Độ chính xác và tốc độ huấn luyện
  • B. Độ phức tạp mô hình và kích thước dữ liệu
  • C. Bias (sai lệch) và Variance (phương sai) của mô hình
  • D. Dữ liệu huấn luyện và dữ liệu kiểm tra

Câu 27: "Convolutional Neural Networks (CNNs)" thường được sử dụng hiệu quả nhất cho loại dữ liệu nào?

  • A. Dữ liệu văn bản
  • B. Dữ liệu chuỗi thời gian
  • C. Dữ liệu dạng bảng
  • D. Dữ liệu hình ảnh và video

Câu 28: Trong thuật toán K-Nearest Neighbors (KNN), tham số "K" đại diện cho điều gì?

  • A. Số lượng cụm trong dữ liệu
  • B. Số lượng láng giềng gần nhất được xem xét
  • C. Số chiều của dữ liệu
  • D. Số lần lặp thuật toán

Câu 29: "F1-score" là một metric đánh giá tổng hợp dựa trên những metric nào?

  • A. Accuracy và Precision
  • B. Accuracy và Recall
  • C. Precision và Recall
  • D. Sensitivity và Specificity

Câu 30: Trong ngữ cảnh của "dimensionality reduction" (giảm chiều dữ liệu), mục tiêu chính là gì?

  • A. Giảm số lượng biến đầu vào trong dữ liệu
  • B. Tăng độ chính xác của mô hình
  • C. Tăng kích thước tập dữ liệu
  • D. Cải thiện khả năng giải thích của mô hình (luôn luôn)

1 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 1: Bạn có một tập dữ liệu lớn về đánh giá phim, mỗi đánh giá được gán nhãn 'tích cực' hoặc 'tiêu cực'. Bạn muốn xây dựng một hệ thống tự động phân loại cảm xúc của đánh giá phim mới. Phương pháp học máy nào sau đây phù hợp nhất cho nhiệm vụ này?

2 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 2: Trong quá trình huấn luyện mô hình phân loại ảnh, bạn nhận thấy rằng mô hình đạt độ chính xác rất cao trên tập huấn luyện nhưng lại hoạt động kém trên tập kiểm tra. Hiện tượng này được gọi là gì và giải pháp nào sau đây có thể giúp khắc phục?

3 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 3: Bạn cần nhóm các bài viết tin tức trực tuyến thành các chủ đề khác nhau (ví dụ: thể thao, chính trị, kinh tế) mà không có bất kỳ nhãn chủ đề nào được cung cấp trước. Thuật toán học máy nào sau đây phù hợp nhất?

4 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 4: Để đánh giá hiệu suất của mô hình phân loại nhị phân, bạn muốn đo lường tỷ lệ dự đoán dương tính chính xác trong số tất cả các trường hợp thực tế là dương tính. Metric đánh giá nào sau đây phù hợp nhất?

5 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 5: Trong mạng nơ-ron sâu, hàm kích hoạt (activation function) có vai trò gì?

6 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 6: Kỹ thuật 'cross-validation' (kiểm định chéo) được sử dụng để làm gì trong học máy?

7 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 7: Trong thuật toán 'Gradient Descent', mục tiêu chính là gì?

8 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 8: 'Feature engineering' (kỹ thuật đặc trưng) đóng vai trò quan trọng như thế nào trong quy trình học máy?

9 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 9: Mô hình 'Random Forest' hoạt động dựa trên nguyên tắc nào?

10 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 10: Trong học tăng cường (Reinforcement Learning), 'agent' học hỏi thông qua yếu tố nào?

11 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 11: Khi nào thì mô hình học máy được coi là có 'bias' (sai lệch) cao?

12 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 12: Trong xử lý ngôn ngữ tự nhiên (NLP), 'word embedding' (biểu diễn từ) giúp ích gì?

13 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 13: 'Principal Component Analysis (PCA)' là kỹ thuật dùng để làm gì?

14 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 14: Khi lựa chọn giữa mô hình 'bias' cao và mô hình 'variance' cao, sự lựa chọn nào phù hợp hơn nếu bạn có rất nhiều dữ liệu huấn luyện?

15 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 15: Trong mạng nơ-ron tích chập (CNN), lớp 'convolutional layer' (lớp tích chập) có chức năng chính là gì?

16 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 16: Thuật toán 'Support Vector Machine (SVM)' hoạt động tốt nhất trong loại bài toán nào?

17 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 17: 'Regularization' (chính quy hóa) là kỹ thuật được sử dụng để giải quyết vấn đề nào trong học máy?

18 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 18: 'Ensemble methods' (phương pháp học tập kết hợp) như 'Bagging' và 'Boosting' có ưu điểm chính là gì?

19 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 19: Trong học sâu, 'batch normalization' (chuẩn hóa theo lô) giúp giải quyết vấn đề gì?

20 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 20: Mô hình 'Recurrent Neural Network (RNN)' đặc biệt phù hợp với loại dữ liệu nào?

21 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 21: Trong học máy, 'hyperparameter tuning' (điều chỉnh siêu tham số) là quá trình làm gì?

22 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 22: Sự khác biệt chính giữa 'supervised learning' và 'unsupervised learning' là gì?

23 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 23: 'Precision' và 'Recall' thường được sử dụng cùng nhau trong đánh giá mô hình phân loại để làm gì?

24 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 24: Trong ngữ cảnh của 'clustering', 'inertia' (quán tính) là gì và nó được sử dụng để đánh giá điều gì?

25 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 25: Phương pháp 'dropout' trong mạng nơ-ron thường được áp dụng ở giai đoạn nào và với mục đích gì?

26 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 26: Trong học máy, 'bias-variance tradeoff' (đánh đổi bias-variance) mô tả mối quan hệ giữa những yếu tố nào?

27 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 27: 'Convolutional Neural Networks (CNNs)' thường được sử dụng hiệu quả nhất cho loại dữ liệu nào?

28 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 28: Trong thuật toán K-Nearest Neighbors (KNN), tham số 'K' đại diện cho điều gì?

29 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 29: 'F1-score' là một metric đánh giá tổng hợp dựa trên những metric nào?

30 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Học Máy

Tags: Bộ đề 4

Câu 30: Trong ngữ cảnh của 'dimensionality reduction' (giảm chiều dữ liệu), mục tiêu chính là gì?

Xem kết quả