Trắc nghiệm Tin học 12 Cánh diều Bài 1: Giới thiệu về học máy - Đề 08 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Trong lĩnh vực Trí tuệ nhân tạo (AI), Học máy (Machine Learning - ML) được xem là một nhánh quan trọng. Phát biểu nào sau đây mô tả đúng nhất vai trò của Học máy?
- A. Giúp máy tính thực hiện các phép tính số học phức tạp với tốc độ cao.
- B. Cho phép máy tính tự động tạo ra các phần cứng mới hiệu quả hơn.
- C. Là công cụ chính để xây dựng các hệ điều hành máy tính.
- D. Cung cấp khả năng cho máy tính học hỏi và cải thiện hiệu suất từ dữ liệu mà không cần lập trình tường minh cho từng nhiệm vụ cụ thể.
Câu 2: Một công ty muốn xây dựng hệ thống tự động phân loại email gửi đến thành các danh mục như "Hộp thư đến", "Quảng cáo", "Xã hội", "Cập nhật". Hệ thống này sẽ học cách phân loại dựa trên các email đã được người dùng đánh dấu trước đó. Đây là ví dụ điển hình của loại bài toán học máy nào?
- A. Bài toán phân loại (Classification).
- B. Bài toán hồi quy (Regression).
- C. Bài toán phân cụm (Clustering).
- D. Bài toán giảm chiều dữ liệu (Dimensionality Reduction).
Câu 3: Trong quy trình xây dựng một mô hình học máy, sau khi đã thu thập và làm sạch dữ liệu, bước tiếp theo quan trọng nhất để chuẩn bị dữ liệu cho thuật toán học máy là gì?
- A. Trực quan hóa kết quả dự đoán cuối cùng.
- B. Đánh giá hiệu suất của mô hình.
- C. Trích xuất và lựa chọn các đặc trưng (features) phù hợp từ dữ liệu thô.
- D. Triển khai mô hình lên môi trường sản phẩm.
Câu 4: Loại học máy nào yêu cầu dữ liệu huấn luyện phải đi kèm với "nhãn" (label) hoặc "đầu ra" (output) tương ứng cho mỗi mẫu dữ liệu đầu vào?
- A. Học không giám sát (Unsupervised Learning).
- B. Học có giám sát (Supervised Learning).
- C. Học tăng cường (Reinforcement Learning).
- D. Học sâu (Deep Learning).
Câu 5: Một nhà bán lẻ trực tuyến thu thập dữ liệu về hành vi mua sắm của khách hàng (sản phẩm đã xem, đã mua, thời gian truy cập...). Họ muốn sử dụng học máy để tự động nhóm các khách hàng có sở thích và hành vi tương tự nhau lại thành các phân khúc (segment) để phục vụ mục đích tiếp thị cá nhân hóa. Loại bài toán học máy nào phù hợp nhất với mục tiêu này?
- A. Hồi quy tuyến tính (Linear Regression).
- B. Phân loại nhị phân (Binary Classification).
- C. Phân cụm (Clustering).
- D. Nhận dạng thực thể (Named Entity Recognition).
Câu 6: Giả sử bạn đang xây dựng một mô hình học máy để dự đoán giá của một căn nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí... Dữ liệu huấn luyện của bạn bao gồm các căn nhà đã bán và giá thực tế của chúng. Đây là ví dụ của bài toán học máy thuộc loại nào?
- A. Phân loại (Classification).
- B. Hồi quy (Regression).
- C. Phân cụm (Clustering).
- D. Phát hiện ngoại lai (Anomaly Detection).
Câu 7: Trong quy trình học máy, bước "Đánh giá mô hình" (Model Evaluation) có mục đích chính là gì?
- A. Xác định mức độ chính xác và hiệu quả của mô hình trên dữ liệu mới, chưa từng thấy.
- B. Thu thập thêm dữ liệu để cải thiện mô hình.
- C. Làm sạch và xử lý dữ liệu đầu vào.
- D. Triển khai mô hình vào môi trường thực tế để người dùng sử dụng.
Câu 8: Học không giám sát (Unsupervised Learning) khác với học có giám sát (Supervised Learning) chủ yếu ở điểm nào?
- A. Tốc độ xử lý dữ liệu.
- B. Độ phức tạp của thuật toán sử dụng.
- C. Việc có cần sử dụng máy tính hay không.
- D. Sự có mặt của nhãn (label) trong dữ liệu huấn luyện.
Câu 9: Một ứng dụng di động sử dụng học máy để phân tích hình ảnh do người dùng chụp và xác định đó là loài hoa gì. Đây là ví dụ của ứng dụng học máy thuộc lĩnh vực nào?
- A. Nhận dạng hình ảnh (Image Recognition).
- B. Nhận dạng tiếng nói (Speech Recognition).
- C. Xử lý ngôn ngữ tự nhiên (Natural Language Processing).
- D. Hệ thống gợi ý (Recommendation Systems).
Câu 10: Tại sao bước "Chuẩn bị dữ liệu" (Data Preparation) lại cực kỳ quan trọng trong quy trình học máy, đôi khi chiếm phần lớn thời gian của toàn bộ dự án?
- A. Vì bước này giúp triển khai mô hình nhanh hơn.
- B. Vì chất lượng dữ liệu đầu vào ảnh hưởng trực tiếp và đáng kể đến hiệu suất của mô hình học máy.
- C. Vì đây là bước duy nhất cần sự can thiệp của con người.
- D. Vì nó giúp giảm thiểu chi phí tính toán cho quá trình huấn luyện.
Câu 11: Trong học máy, "mô hình" (model) được tạo ra từ quá trình huấn luyện có vai trò gì?
- A. Là tập hợp dữ liệu gốc ban đầu.
- B. Là thuật toán được sử dụng để huấn luyện.
- C. Là biểu diễn trừu tượng của mối quan hệ trong dữ liệu, có khả năng đưa ra dự đoán hoặc quyết định trên dữ liệu mới.
- D. Là giao diện người dùng của ứng dụng học máy.
Câu 12: Một ngân hàng muốn sử dụng học máy để phân tích dữ liệu giao dịch và phát hiện các giao dịch bất thường, có khả năng là gian lận. Dữ liệu lịch sử không có nhãn rõ ràng về "gian lận" hay "không gian lận" cho tất cả giao dịch. Loại học máy nào phù hợp nhất cho bài toán này?
- A. Học không giám sát (Unsupervised Learning), cụ thể là phát hiện ngoại lai (Anomaly Detection).
- B. Học có giám sát (Supervised Learning), cụ thể là phân loại (Classification).
- C. Học tăng cường (Reinforcement Learning).
- D. Hồi quy (Regression).
Câu 13: Hệ thống gợi ý sản phẩm trên các trang thương mại điện tử (ví dụ: "Khách hàng mua sản phẩm X thường mua thêm sản phẩm Y") là một ứng dụng phổ biến của học máy. Ứng dụng này dựa trên việc tìm kiếm mối quan hệ hoặc mẫu trong dữ liệu hành vi người dùng. Đây là ví dụ về việc áp dụng loại học máy nào?
- A. Hồi quy (Regression).
- B. Phân loại (Classification).
- C. Học tăng cường (Reinforcement Learning).
- D. Học không giám sát (Unsupervised Learning), cụ thể là phân tích luật kết hợp hoặc phân cụm khách hàng.
Câu 14: Phát biểu nào sau đây là SAI khi nói về mối quan hệ giữa Trí tuệ nhân tạo (AI) và Học máy (ML)?
- A. Học máy là một tập con của Trí tuệ nhân tạo.
- B. Học máy là một trong những cách tiếp cận chính để xây dựng các hệ thống AI.
- C. Trí tuệ nhân tạo là một tập con của Học máy.
- D. Mục tiêu của AI là tạo ra các hệ thống có khả năng thực hiện các nhiệm vụ đòi hỏi trí thông minh của con người, và ML là một công cụ giúp đạt được mục tiêu đó.
Câu 15: Trong bài toán phân loại, mục tiêu của mô hình học máy là gì?
- A. Dự đoán hoặc gán một danh mục (lớp) cụ thể cho mỗi mẫu dữ liệu đầu vào.
- B. Dự đoán một giá trị liên tục (số thực) cho mỗi mẫu dữ liệu đầu vào.
- C. Tìm kiếm cấu trúc ẩn và nhóm các mẫu dữ liệu tương tự nhau.
- D. Giảm số lượng thuộc tính (chiều) của dữ liệu.
Câu 16: Khi xây dựng một mô hình học máy, việc chia dữ liệu sẵn có thành tập huấn luyện (training set) và tập kiểm tra (test set) có mục đích chính là gì?
- A. Để tăng tốc độ huấn luyện mô hình.
- B. Để đánh giá khả năng tổng quát hóa của mô hình trên dữ liệu chưa từng thấy, tránh tình trạng học thuộc (overfitting).
- C. Để đảm bảo dữ liệu huấn luyện và kiểm tra hoàn toàn giống nhau.
- D. Để loại bỏ dữ liệu nhiễu khỏi tập huấn luyện.
Câu 17: Một bác sĩ muốn sử dụng học máy để hỗ trợ chẩn đoán bệnh dựa trên kết quả xét nghiệm và triệu chứng của bệnh nhân. Bác sĩ có sẵn một lượng lớn dữ liệu lịch sử của các bệnh nhân đã được chẩn đoán xác định bệnh (hoặc không bệnh). Loại dữ liệu này phù hợp nhất với phương pháp học máy nào?
- A. Học có giám sát (Supervised Learning).
- B. Học không giám sát (Unsupervised Learning).
- C. Học tăng cường (Reinforcement Learning).
- D. Cả ba phương pháp trên đều phù hợp như nhau.
Câu 18: Trong học máy, khái niệm "đặc trưng" (feature) của dữ liệu đề cập đến điều gì?
- A. Kết quả dự đoán cuối cùng của mô hình.
- B. Thuật toán được sử dụng để huấn luyện mô hình.
- C. Các thuộc tính hoặc đặc điểm riêng biệt của mỗi mẫu dữ liệu được sử dụng làm đầu vào cho mô hình.
- D. Lỗi mà mô hình mắc phải trong quá trình dự đoán.
Câu 19: Bài toán nào sau đây KHÔNG phải là ví dụ điển hình của bài toán hồi quy (Regression)?
- A. Dự đoán doanh số bán hàng của một sản phẩm trong tháng tới.
- B. Ước lượng mức tiêu thụ điện năng của một tòa nhà dựa trên thời tiết.
- C. Dự đoán tuổi thọ của một thiết bị dựa trên dữ liệu sử dụng.
- D. Xác định xem một email là thư rác hay không phải thư rác.
Câu 20: Khi một mô hình học máy hoạt động rất tốt trên tập dữ liệu huấn luyện nhưng lại kém hiệu quả trên tập dữ liệu kiểm tra (chưa từng thấy), hiện tượng này được gọi là gì?
- A. Học thuộc (Overfitting).
- B. Thiếu dữ liệu (Underfitting).
- C. Quá trình chuẩn hóa (Normalization).
- D. Phân cụm (Clustering).
Câu 21: Ứng dụng nhận dạng tiếng nói (Speech Recognition), cho phép máy tính hiểu và chuyển đổi lời nói thành văn bản, thuộc lĩnh vực nào của học máy?
- A. Nhận dạng hình ảnh.
- B. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP).
- C. Thị giác máy tính (Computer Vision).
- D. Phân tích dữ liệu cấu trúc (Structured Data Analysis).
Câu 22: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn về các loài thực vật khác nhau. Dữ liệu này chỉ bao gồm các đặc điểm vật lý của thực vật (chiều cao, màu sắc lá, hình dạng hoa...) mà không có thông tin về tên loài. Anh ấy muốn sử dụng học máy để tự động nhóm các loài thực vật có đặc điểm tương tự nhau lại. Anh ấy nên sử dụng phương pháp học máy nào?
- A. Học có giám sát (Supervised Learning).
- B. Học không giám sát (Unsupervised Learning).
- C. Học tăng cường (Reinforcement Learning).
- D. Hồi quy (Regression).
Câu 23: Trong quy trình học máy, bước nào diễn ra sau khi mô hình đã được xây dựng và đánh giá là đạt yêu cầu?
- A. Thu thập thêm dữ liệu.
- B. Làm sạch dữ liệu ban đầu.
- C. Huấn luyện lại mô hình từ đầu.
- D. Triển khai mô hình vào ứng dụng thực tế để sử dụng (Deployment).
Câu 24: Bài toán dự đoán xem một khối u có phải là ác tính hay không dựa trên kết quả xét nghiệm và hình ảnh y tế, khi có sẵn dữ liệu lịch sử của các khối u đã được phân loại bởi chuyên gia, thuộc loại bài toán học máy nào?
- A. Phân loại nhị phân (Binary Classification).
- B. Hồi quy (Regression).
- C. Phân cụm (Clustering).
- D. Giảm chiều dữ liệu (Dimensionality Reduction).
Câu 25: Một trong những thách thức lớn nhất khi xây dựng mô hình học máy là gì?
- A. Tìm kiếm các thuật toán học máy mới.
- B. Việc viết mã chương trình cho thuật toán.
- C. Thu thập, làm sạch và chuẩn bị dữ liệu chất lượng cao.
- D. Triển khai mô hình lên đám mây.
Câu 26: Hệ thống nhận dạng chữ viết tay (Handwriting Recognition), cho phép máy tính chuyển đổi chữ viết tay thành văn bản số, là một ứng dụng điển hình của học máy trong lĩnh vực nào?
- A. Thị giác máy tính (Computer Vision).
- B. Nhận dạng tiếng nói (Speech Recognition).
- C. Hệ thống gợi ý (Recommendation Systems).
- D. Phân tích cảm xúc (Sentiment Analysis).
Câu 27: Trong học có giám sát, "nhãn" (label) trong dữ liệu huấn luyện có vai trò gì?
- A. Là các đặc trưng (features) của dữ liệu đầu vào.
- B. Là thuật toán mà mô hình sử dụng.
- C. Là lỗi dự đoán của mô hình.
- D. Là kết quả đầu ra mong muốn hoặc danh mục đúng cho mỗi mẫu dữ liệu, giúp mô hình học cách dự đoán.
Câu 28: Một nhà khoa học dữ liệu đang phân tích một tập dữ liệu về các bài báo khoa học. Anh ấy muốn tìm cách tóm tắt nội dung chính của từng bài báo hoặc nhóm các bài báo có chủ đề tương tự nhau một cách tự động. Anh ấy có thể sử dụng kỹ thuật học máy nào trong lĩnh vực Xử lý ngôn ngữ tự nhiên (NLP)?
- A. Hồi quy tuyến tính (Linear Regression).
- B. Phân loại hình ảnh (Image Classification).
- C. Phân tích chủ đề (Topic Modeling) hoặc tóm tắt văn bản (Text Summarization).
- D. Nhận dạng tiếng nói (Speech Recognition).
Câu 29: Mục tiêu của bài toán giảm chiều dữ liệu (Dimensionality Reduction) trong học máy là gì?
- A. Tăng số lượng đặc trưng của dữ liệu.
- B. Giảm số lượng đặc trưng của dữ liệu trong khi vẫn giữ lại càng nhiều thông tin quan trọng càng tốt.
- C. Gán nhãn cho dữ liệu không có nhãn.
- D. Phân loại dữ liệu vào các danh mục.
Câu 30: Phát biểu nào sau đây mô tả đúng nhất về cách học máy khác biệt với lập trình truyền thống (traditional programming)?
- A. Học máy yêu cầu ít dữ liệu hơn lập trình truyền thống.
- B. Trong lập trình truyền thống, máy tính tự động viết code dựa trên dữ liệu.
- C. Học máy không cần thuật toán, chỉ cần dữ liệu.
- D. Trong lập trình truyền thống, lập trình viên viết các quy tắc tường minh để máy tính thực hiện nhiệm vụ; trong học máy, máy tính học các quy tắc hoặc mẫu từ dữ liệu để thực hiện nhiệm vụ.