Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 08
Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 08 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Trong Khoa học dữ liệu, vai trò cốt lõi nào của máy tính cho phép xử lý và phân tích các tập dữ liệu có kích thước vượt quá khả năng xử lý thủ công?
- A. Khả năng tạo ra dữ liệu mới
- B. Năng lực tính toán và xử lý dữ liệu lớn
- C. Chỉ đơn thuần là thiết bị lưu trữ
- D. Cung cấp giao diện người dùng thân thiện
Câu 2: Một công ty thương mại điện tử thu thập hàng tỉ lượt truy cập trang web mỗi ngày. Thách thức lớn nhất khi phân tích dữ liệu này để hiểu hành vi khách hàng theo thời gian thực (real-time) thường liên quan đến đặc điểm nào của dữ liệu lớn?
- A. Khối lượng (Volume)
- B. Đa dạng (Variety)
- C. Tốc độ (Velocity)
- D. Độ tin cậy (Veracity)
Câu 3: Khi một nhà khoa học dữ liệu bắt đầu một dự án, bước đầu tiên và quan trọng nhất là xác định rõ câu hỏi hoặc mục tiêu kinh doanh cần giải quyết. Giai đoạn này trong quy trình Khoa học dữ liệu được gọi là gì?
- A. Xác định vấn đề
- B. Thu thập dữ liệu
- C. Chuẩn bị dữ liệu
- D. Xây dựng mô hình
Câu 4: Một tập dữ liệu bao gồm các loại thông tin khác nhau như văn bản từ bình luận khách hàng, hình ảnh sản phẩm, dữ liệu bán hàng dạng số và video quảng cáo. Đặc điểm nào của dữ liệu lớn được thể hiện rõ nhất trong trường hợp này?
- A. Tốc độ (Velocity)
- B. Khối lượng (Volume)
- C. Độ tin cậy (Veracity)
- D. Đa dạng (Variety)
Câu 5: Thuật toán xử lý song song (Parallel Processing) được sử dụng rộng rãi trong xử lý dữ liệu lớn vì nó mang lại lợi ích chính nào?
- A. Giảm thiểu khối lượng dữ liệu cần xử lý
- B. Tăng tốc độ xử lý bằng cách phân chia công việc
- C. Tự động hóa hoàn toàn quy trình thu thập dữ liệu
- D. Chỉ áp dụng cho dữ liệu có cấu trúc
Câu 6: Trước khi xây dựng mô hình dự đoán giá nhà, một nhà khoa học dữ liệu cần kiểm tra các giá trị bị thiếu, loại bỏ các bản ghi trùng lặp và chuẩn hóa định dạng các trường dữ liệu. Các hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?
- A. Xác định vấn đề
- B. Thu thập dữ liệu
- C. Chuẩn bị dữ liệu
- D. Đánh giá mô hình
Câu 7: Máy tính cung cấp khả năng mở rộng (Scalability) như thế nào để đáp ứng nhu cầu xử lý dữ liệu ngày càng tăng trong Khoa học dữ liệu?
- A. Có thể kết hợp nhiều máy tính thành hệ thống hoặc sử dụng điện toán đám mây
- B. Chỉ cần nâng cấp bộ xử lý của một máy tính duy nhất
- C. Giảm kích thước dữ liệu đầu vào
- D. Tự động tạo ra dữ liệu tổng hợp
Câu 8: Sau khi mô hình học máy đã được xây dựng và đánh giá là hiệu quả, bước tiếp theo là đưa mô hình đó vào sử dụng trong môi trường thực tế, ví dụ như tích hợp vào ứng dụng di động hoặc hệ thống website. Giai đoạn này được gọi là gì trong quy trình Khoa học dữ liệu?
- A. Thu thập dữ liệu
- B. Chuẩn bị dữ liệu
- C. Xây dựng mô hình
- D. Triển khai
Câu 9: Đặc điểm nào của dữ liệu lớn liên quan đến sự không chắc chắn hoặc không chính xác của dữ liệu do nguồn gốc khác nhau hoặc lỗi thu thập?
- A. Độ tin cậy (Veracity)
- B. Tốc độ (Velocity)
- C. Khối lượng (Volume)
- D. Đa dạng (Variety)
Câu 10: Một thuật toán được thiết kế để tự động phân loại email thành thư rác hoặc không phải thư rác dựa trên nội dung của chúng. Việc sử dụng thuật toán này thể hiện ưu điểm nào của máy tính và thuật toán trong xử lý dữ liệu?
- A. Tăng khối lượng dữ liệu
- B. Giảm tốc độ xử lý
- C. Tự động hóa quy trình
- D. Chỉ lưu trữ dữ liệu
Câu 11: Trong giai đoạn nào của quy trình Khoa học dữ liệu, các nhà khoa học dữ liệu sử dụng các kỹ thuật thống kê và trực quan hóa để khám phá các mẫu, xu hướng và mối quan hệ trong dữ liệu?
- A. Xác định vấn đề
- B. Chuẩn bị dữ liệu (thường bao gồm khám phá dữ liệu)
- C. Xây dựng mô hình
- D. Triển khai
Câu 12: Thuật toán học máy (Machine Learning) đóng vai trò gì trong quy trình Khoa học dữ liệu?
- A. Giúp máy tính học hỏi từ dữ liệu để đưa ra dự đoán hoặc quyết định
- B. Chỉ dùng để thu thập dữ liệu từ các nguồn khác nhau
- C. Giúp xác định vấn đề cần giải quyết
- D. Đảm bảo an toàn cho dữ liệu được lưu trữ
Câu 13: Việc sử dụng máy tính trong Khoa học dữ liệu giúp tiết kiệm đáng kể thời gian và chi phí so với các phương pháp thủ công hoặc truyền thống, chủ yếu nhờ vào khả năng nào?
- A. Giảm số lượng dữ liệu cần phân tích
- B. Loại bỏ hoàn toàn nhu cầu về con người
- C. Tạo ra dữ liệu chất lượng cao hơn một cách tự động
- D. Tăng tốc độ xử lý và tự động hóa các tác vụ lặp lại
Câu 14: Đặc điểm nào của dữ liệu lớn đề cập đến việc dữ liệu có thể có nhiều định dạng khác nhau, từ có cấu trúc (ví dụ: cơ sở dữ liệu) đến bán cấu trúc (ví dụ: XML, JSON) và phi cấu trúc (ví dụ: văn bản, hình ảnh, video)?
- A. Khối lượng (Volume)
- B. Đa dạng (Variety)
- C. Tốc độ (Velocity)
- D. Giá trị (Value)
Câu 15: Trong quy trình Khoa học dữ liệu, sau khi mô hình đã được triển khai, cần liên tục giám sát và đánh giá hiệu suất của nó trong môi trường thực tế. Giai đoạn này thuộc về bước nào trong quy trình?
- A. Đánh giá và Triển khai (sau khi triển khai vẫn cần đánh giá liên tục)
- B. Xây dựng mô hình
- C. Chuẩn bị dữ liệu
- D. Thu thập dữ liệu
Câu 16: Một hệ thống khuyến nghị sản phẩm trên website thương mại điện tử sử dụng lịch sử mua sắm của người dùng để gợi ý các sản phẩm phù hợp. Đây là một ví dụ điển hình về việc áp dụng giai đoạn nào của quy trình Khoa học dữ liệu vào thực tế?
- A. Thu thập dữ liệu
- B. Chuẩn bị dữ liệu
- C. Xây dựng mô hình
- D. Triển khai
Câu 17: Yếu tố nào không phải là một trong những "V" truyền thống thường được sử dụng để mô tả dữ liệu lớn?
- A. Volume (Khối lượng)
- B. Velocity (Tốc độ)
- C. Visualization (Trực quan hóa)
- D. Variety (Đa dạng)
Câu 18: Khi xử lý một tập dữ liệu lớn, việc chia nhỏ dữ liệu thành các phần nhỏ hơn và xử lý độc lập trên nhiều máy tính hoặc lõi xử lý khác nhau, sau đó tổng hợp kết quả, là ứng dụng của nguyên tắc thuật toán nào?
- A. Xử lý song song
- B. Xử lý tuần tự
- C. Thuật toán tìm kiếm nhị phân
- D. Thuật toán sắp xếp nổi bọt
Câu 19: Khả năng nào của máy tính là nền tảng cho việc thực hiện các thuật toán học máy phức tạp, đòi hỏi hàng tỷ phép tính để huấn luyện mô hình trên các tập dữ liệu khổng lồ?
- A. Khả năng hiển thị đồ họa
- B. Năng lực tính toán cao (High computational power)
- C. Kích thước màn hình lớn
- D. Kết nối internet tốc độ thấp
Câu 20: Một nhà khoa học dữ liệu đang làm việc với dữ liệu khảo sát khách hàng. Anh ta nhận thấy có nhiều câu trả lời không đầy đủ hoặc mâu thuẫn. Hoạt động làm sạch dữ liệu này nhằm mục đích cải thiện đặc điểm nào của dữ liệu, liên quan đến "V" thứ năm (ngoài 4 V truyền thống)?
- A. Tốc độ (Velocity)
- B. Khối lượng (Volume)
- C. Giá trị (Value) và Độ tin cậy (Veracity)
- D. Đa dạng (Variety)
Câu 21: Giả sử bạn là một nhà khoa học dữ liệu được giao nhiệm vụ dự đoán doanh số bán hàng quý tới của một cửa hàng. Sau khi thu thập và làm sạch dữ liệu lịch sử bán hàng, bước tiếp theo bạn sẽ thực hiện là gì trong quy trình Khoa học dữ liệu?
- A. Triển khai mô hình
- B. Xây dựng mô hình dự đoán
- C. Xác định lại vấn đề ban đầu
- D. Chỉ báo cáo số liệu thô
Câu 22: Thuật toán nào thường được sử dụng để phân tích dữ liệu theo thời gian thực, cho phép đưa ra quyết định hoặc phản ứng ngay lập tức dựa trên dữ liệu mới đến?
- A. Thuật toán xử lý dòng dữ liệu (Stream Processing)
- B. Thuật toán xử lý hàng loạt (Batch Processing)
- C. Thuật toán sắp xếp nhanh (Quick Sort)
- D. Thuật toán nén dữ liệu
Câu 23: Việc lưu trữ an toàn và hiệu quả các tập dữ liệu lớn, đôi khi có chứa thông tin nhạy cảm, là một thách thức quan trọng trong Khoa học dữ liệu. Vai trò nào của máy tính đóng góp trực tiếp vào việc giải quyết thách thức này?
- A. Khả năng xử lý đồ họa
- B. Tốc độ tính toán
- C. Khả năng tự động hóa
- D. Năng lực lưu trữ và các công nghệ bảo mật tích hợp
Câu 24: Phân tích một sơ đồ quy trình Khoa học dữ liệu, bạn thấy một mũi tên chỉ từ "Xây dựng mô hình" đến "Đánh giá mô hình". Hoạt động chính diễn ra ở giai đoạn "Đánh giá mô hình" là gì?
- A. Thu thập thêm dữ liệu mới
- B. Kiểm tra hiệu suất của mô hình trên dữ liệu chưa từng thấy
- C. Làm sạch dữ liệu đầu vào
- D. Xác định mục tiêu kinh doanh
Câu 25: Một công ty muốn sử dụng Khoa học dữ liệu để phân khúc khách hàng dựa trên hành vi mua sắm của họ. Họ thu thập dữ liệu về các giao dịch trong 5 năm qua. Đặc điểm nào của dữ liệu lớn được thể hiện qua việc thu thập dữ liệu trong một khoảng thời gian dài, dẫn đến tập dữ liệu rất lớn?
- A. Khối lượng (Volume)
- B. Tốc độ (Velocity)
- C. Đa dạng (Variety)
- D. Độ tin cậy (Veracity)
Câu 26: Việc sử dụng các thuật toán tự động hóa trong quy trình Khoa học dữ liệu mang lại lợi ích gì cho các nhà khoa học dữ liệu?
- A. Giảm khả năng mở rộng của hệ thống
- B. Yêu cầu nhiều công việc thủ công hơn
- C. Giảm thiểu các tác vụ lặp đi lặp lại, cho phép tập trung vào phân tích chuyên sâu
- D. Chỉ áp dụng cho việc trực quan hóa dữ liệu
Câu 27: Một thuật toán được sử dụng để tìm ra các nhóm khách hàng có hành vi tương tự nhau trong một tập dữ liệu lớn (ví dụ: phân khúc thị trường). Đây là một ví dụ về việc áp dụng thuật toán trong giai đoạn nào của quy trình Khoa học dữ liệu?
- A. Thu thập dữ liệu
- B. Xây dựng mô hình (phân cụm là một kỹ thuật mô hình hóa)
- C. Triển khai
- D. Đánh giá mô hình
Câu 28: So sánh giữa xử lý dữ liệu thủ công và xử lý bằng máy tính trong Khoa học dữ liệu, ưu điểm rõ rệt nhất của việc sử dụng máy tính là gì?
- A. Độ chính xác luôn tuyệt đối 100%
- B. Không cần bất kỳ sự giám sát nào của con người
- C. Chỉ xử lý được dữ liệu có cấu trúc
- D. Tốc độ xử lý vượt trội và khả năng xử lý khối lượng dữ liệu khổng lồ
Câu 29: Khi một mô hình dự đoán giá nhà được triển khai và sử dụng, việc liên tục thu thập dữ liệu giá nhà mới, dữ liệu thị trường, v.v., để cập nhật mô hình và đảm bảo nó vẫn chính xác theo thời gian, là hoạt động của giai đoạn nào trong quy trình Khoa học dữ liệu?
- A. Thu thập dữ liệu và Đánh giá/Giám sát (quy trình lặp lại)
- B. Chỉ Triển khai
- C. Chỉ Chuẩn bị dữ liệu
- D. Chỉ Xây dựng mô hình
Câu 30: Một trong những lợi ích kinh tế chính của việc áp dụng Khoa học dữ liệu với sự hỗ trợ của máy tính và thuật toán là gì?
- A. Tăng chi phí vận hành do cần nhiều máy móc
- B. Tối ưu hóa hoạt động, đưa ra quyết định dựa trên dữ liệu, tạo lợi thế cạnh tranh
- C. Giảm khả năng hiểu biết về khách hàng
- D. Chỉ áp dụng cho các công ty công nghệ lớn