15+ Đề Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Đề 01

Đề 02

Đề 03

Đề 04

Đề 05

Đề 06

Đề 07

Đề 08

Đề 09

Đề 10

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 01

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 01 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong lĩnh vực Khoa học Dữ liệu, máy tính đóng vai trò thiết yếu nào sau đây?

A. Thay thế hoàn toàn con người trong việc ra quyết định.
B. Cung cấp khả năng tính toán và xử lý lượng lớn dữ liệu.
C. Giới hạn khả năng truy cập và chia sẻ thông tin.
D. Đơn giản hóa các thuật toán phức tạp.

Câu 2: Quy trình Khoa học Dữ liệu thường bắt đầu với giai đoạn nào để xác định rõ mục tiêu và phạm vi nghiên cứu?

A. Phân tích dữ liệu.
B. Xây dựng mô hình.
C. Xác định bài toán/vấn đề.
D. Trực quan hóa dữ liệu.

Câu 3: Giai đoạn "Chuẩn bị dữ liệu" trong Khoa học Dữ liệu bao gồm công việc quan trọng nào để đảm bảo chất lượng dữ liệu?

A. Làm sạch và chuyển đổi dữ liệu.
B. Thu thập dữ liệu từ nhiều nguồn.
C. Chọn thuật toán phân tích dữ liệu.
D. Đánh giá mô hình dữ liệu.

Câu 4: Đâu là đặc điểm KHÔNG thuộc về "Dữ liệu lớn" (Big Data) trong bối cảnh Khoa học Dữ liệu?

A. Khối lượng dữ liệu khổng lồ (Volume).
B. Tốc độ tạo và xử lý nhanh (Velocity).
C. Sự đa dạng về loại hình dữ liệu (Variety).
D. Kích thước tệp tin nhỏ (File Size).

Câu 5: Máy tính giúp tối ưu hóa quá trình xử lý "Dữ liệu lớn" bằng cách nào để đạt hiệu quả cao nhất?

A. Giảm độ phức tạp của dữ liệu.
B. Cho phép xử lý dữ liệu gần như tức thời (theo thời gian thực).
C. Thay đổi định dạng dữ liệu gốc.
D. Lưu trữ dữ liệu phân tán.

Câu 6: Thuật toán "song song" đóng vai trò quan trọng như thế nào trong việc xử lý "Dữ liệu lớn"?

A. Tăng độ chính xác của dữ liệu.
B. Đơn giản hóa cấu trúc dữ liệu.
C. Giảm thời gian và chi phí xử lý dữ liệu.
D. Cải thiện khả năng lưu trữ dữ liệu.

Câu 7: Lợi ích chính của việc sử dụng máy tính trong Khoa học Dữ liệu là gì, đặc biệt khi làm việc với lượng dữ liệu lớn?

A. Giảm thiểu nhu cầu về dữ liệu.
B. Tăng tốc độ xử lý và phân tích dữ liệu.
C. Tạo ra các loại dữ liệu mới.
D. Giảm kích thước vật lý của dữ liệu.

Câu 8: Trong quy trình Khoa học Dữ liệu, giai đoạn "Xây dựng mô hình" chủ yếu tập trung vào hoạt động nào?

A. Lựa chọn và áp dụng mô hình học máy phù hợp.
B. Thu thập dữ liệu đầu vào cho mô hình.
C. Đánh giá hiệu suất của mô hình.
D. Triển khai mô hình vào thực tế.

Câu 9: Khả năng "mở rộng" của máy tính có ý nghĩa gì trong bối cảnh xử lý "Dữ liệu lớn"?

A. Khả năng giảm kích thước dữ liệu.
B. Khả năng xử lý dữ liệu trên thiết bị di động.
C. Khả năng tăng cường sức mạnh xử lý khi dữ liệu tăng lên.
D. Khả năng bảo mật dữ liệu tốt hơn.

Câu 10: Thuật toán "tự động hóa" mang lại lợi ích gì trong quy trình xử lý dữ liệu?

A. Tăng độ phức tạp của quy trình.
B. Yêu cầu sự can thiệp thủ công nhiều hơn.
C. Giảm khả năng phân tích dữ liệu.
D. Giảm sự phụ thuộc vào công việc thủ công, tăng tốc độ xử lý.

Câu 11: Điều gì KHÔNG phải là vai trò của máy tính trong Khoa học Dữ liệu?

A. Thực hiện các phép tính phức tạp.
B. Lưu trữ lượng lớn thông tin dữ liệu.
C. Xác định giá trị đạo đức của dữ liệu.
D. Hỗ trợ trực quan hóa dữ liệu.

Câu 12: Trong quy trình Khoa học Dữ liệu, sau khi xây dựng mô hình, bước tiếp theo quan trọng nhất là gì?

A. Thu thập thêm dữ liệu.
B. Đánh giá và kiểm thử mô hình.
C. Chuẩn bị dữ liệu mới.
D. Xác định vấn đề mới.

Câu 13: "Độ tin cậy" (Veracity) là một đặc điểm quan trọng của "Dữ liệu lớn", nó đề cập đến khía cạnh nào?

A. Sự đa dạng của các nguồn dữ liệu.
B. Tốc độ truyền tải dữ liệu.
C. Khả năng mở rộng của hệ thống dữ liệu.
D. Tính chính xác và đáng tin cậy của dữ liệu.

Câu 14: Loại thuật toán nào giúp máy tính thực hiện các công việc lặp đi lặp lại một cách nhanh chóng và chính xác trong Khoa học Dữ liệu?

A. Thuật toán tự động hóa.
B. Thuật toán phân tích.
C. Thuật toán dự đoán.
D. Thuật toán thống kê.

Câu 15: Điều gì thể hiện "khả năng mở rộng" của máy tính trong việc xử lý dữ liệu lớn trong một hệ thống?

A. Giảm kích thước bộ nhớ lưu trữ.
B. Dễ dàng thêm tài nguyên (như bộ nhớ, CPU) khi cần.
C. Tăng tốc độ xử lý của một CPU đơn lẻ.
D. Giảm số lượng kết nối mạng.

Câu 16: Trong Khoa học Dữ liệu, việc "trực quan hóa dữ liệu" đóng vai trò như thế nào?

A. Tăng độ chính xác của dữ liệu.
B. Giảm dung lượng lưu trữ dữ liệu.
C. Giúp nhận diện mẫu và hiểu dữ liệu dễ dàng hơn.
D. Thay thế bước phân tích dữ liệu.

Câu 17: Yếu tố "Giá trị" (Value) trong "Dữ liệu lớn" đề cập đến điều gì?

A. Khả năng tạo ra thông tin hữu ích và quyết định từ dữ liệu.
B. Kích thước của tập dữ liệu.
C. Tốc độ thu thập dữ liệu.
D. Sự đa dạng về nguồn gốc dữ liệu.

Câu 18: Thuật toán "xử lý theo thời gian thực" đặc biệt quan trọng trong ứng dụng nào của Khoa học Dữ liệu?

A. Lưu trữ dữ liệu lịch sử.
B. Phân tích xu hướng dài hạn.
C. Xây dựng mô hình dự đoán.
D. Hệ thống giám sát và cảnh báo sự cố ngay lập tức.

Câu 19: Điều gì là thách thức lớn nhất khi xử lý "Dữ liệu lớn" mà máy tính và thuật toán phải đối mặt?

A. Sự thiếu hụt thuật toán.
B. Khối lượng dữ liệu quá lớn và phức tạp.
C. Chi phí phần mềm phân tích dữ liệu.
D. Sự hạn chế về kết nối mạng.

Câu 20: Để đảm bảo tính "đa dạng" của dữ liệu trong Khoa học Dữ liệu, chúng ta cần làm gì?

A. Giảm số lượng dữ liệu thu thập.
B. Chỉ sử dụng một loại định dạng dữ liệu.
C. Thu thập dữ liệu từ nhiều nguồn và loại khác nhau.
D. Tập trung vào dữ liệu có cấu trúc.

Câu 21: Trong Khoa học Dữ liệu, thuật ngữ "siêu dữ liệu" (metadata) dùng để chỉ điều gì?

A. Dữ liệu đã được xử lý và phân tích.
B. Dữ liệu mô tả thông tin về dữ liệu khác.
C. Dữ liệu có kích thước lớn.
D. Dữ liệu không có cấu trúc.

Câu 22: Quy trình "thu thập dữ liệu" trong Khoa học Dữ liệu thường bao gồm các phương pháp nào?

A. Khảo sát, cảm biến, và dữ liệu từ mạng xã hội.
B. Xây dựng mô hình học máy và đánh giá.
C. Làm sạch và chuyển đổi dữ liệu.
D. Trực quan hóa và báo cáo dữ liệu.

Câu 23: "Khoa học Dữ liệu" khác biệt với "Thống kê truyền thống" chủ yếu ở điểm nào?

A. Khoa học Dữ liệu không sử dụng máy tính.
B. Thống kê truyền thống xử lý dữ liệu theo thời gian thực.
C. Khoa học Dữ liệu chỉ tập trung vào dữ liệu có cấu trúc.
D. Khoa học Dữ liệu xử lý dữ liệu lớn và đa dạng hơn.

Câu 24: Để bảo mật dữ liệu lớn, máy tính và thuật toán có thể sử dụng phương pháp nào?

A. Tăng tốc độ xử lý dữ liệu.
B. Mã hóa dữ liệu và kiểm soát truy cập.
C. Nén dữ liệu để giảm kích thước.
D. Phân tích dữ liệu theo thời gian thực.

Câu 25: Trong Khoa học Dữ liệu, thuật toán "phân cụm" (clustering) thường được sử dụng để làm gì?

A. Dự đoán giá trị tương lai.
B. Phân loại dữ liệu vào các danh mục định trước.
C. Tìm các nhóm dữ liệu có đặc điểm tương đồng.
D. Đánh giá mối quan hệ nhân quả giữa các biến số.

Câu 26: Ứng dụng của Khoa học Dữ liệu trong lĩnh vực Y tế có thể giúp ích gì?

A. Giảm chi phí phần cứng máy tính.
B. Tăng số lượng bệnh viện.
C. Thay thế bác sĩ bằng máy móc.
D. Cải thiện chẩn đoán bệnh và phát triển phương pháp điều trị mới.

Câu 27: "Học máy" (Machine Learning) đóng vai trò như thế nào trong Khoa học Dữ liệu?

A. Là công cụ chính để phân tích và rút trích tri thức từ dữ liệu.
B. Thay thế hoàn toàn quy trình Khoa học Dữ liệu.
C. Chỉ được sử dụng trong giai đoạn trực quan hóa dữ liệu.
D. Không liên quan đến việc xử lý dữ liệu lớn.

Câu 28: Trong Khoa học Dữ liệu, việc "làm sạch dữ liệu" (data cleaning) nhằm mục đích gì?

A. Tăng kích thước của tập dữ liệu.
B. Cải thiện chất lượng và độ chính xác của dữ liệu.
C. Giảm tốc độ xử lý dữ liệu.
D. Thay đổi định dạng gốc của dữ liệu.

Câu 29: "Điện toán đám mây" (Cloud Computing) hỗ trợ Khoa học Dữ liệu như thế nào trong việc xử lý dữ liệu lớn?

A. Giảm khả năng bảo mật dữ liệu.
B. Tăng chi phí đầu tư phần cứng.
C. Cung cấp tài nguyên tính toán và lưu trữ linh hoạt, mở rộng.
D. Giới hạn khả năng truy cập dữ liệu.

Câu 30: Đạo đức trong Khoa học Dữ liệu bao gồm trách nhiệm nào liên quan đến việc sử dụng dữ liệu cá nhân?

A. Tự do sử dụng dữ liệu cho mọi mục đích.
B. Chia sẻ dữ liệu cá nhân công khai để tăng tính minh bạch.
C. Thu thập càng nhiều dữ liệu cá nhân càng tốt.
D. Bảo vệ quyền riêng tư và sử dụng dữ liệu một cách có trách nhiệm.

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 1: Trong lĩnh vực Khoa học Dữ liệu, máy tính đóng vai trò thiết yếu nào sau đây?

Thay thế hoàn toàn con người trong việc ra quyết định.

Cung cấp khả năng tính toán và xử lý lượng lớn dữ liệu.

Giới hạn khả năng truy cập và chia sẻ thông tin.

Đơn giản hóa các thuật toán phức tạp.

Câu hỏi tập trung vào vai trò cốt lõi của máy tính trong Khoa học Dữ liệu, nhấn mạnh khả năng xử lý dữ liệu lớn.

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 2: Quy trình Khoa học Dữ liệu thường bắt đầu với giai đoạn nào để xác định rõ mục tiêu và phạm vi nghiên cứu?

Phân tích dữ liệu.

Xây dựng mô hình.

Xác định bài toán/vấn đề.

Trực quan hóa dữ liệu.

Câu hỏi kiểm tra bước đầu tiên và quan trọng nhất của quy trình Khoa học Dữ liệu, đó là xác định vấn đề.

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 3: Giai đoạn 'Chuẩn bị dữ liệu' trong Khoa học Dữ liệu bao gồm công việc quan trọng nào để đảm bảo chất lượng dữ liệu?

Làm sạch và chuyển đổi dữ liệu.

Thu thập dữ liệu từ nhiều nguồn.

Chọn thuật toán phân tích dữ liệu.

Đánh giá mô hình dữ liệu.

Câu hỏi tập trung vào giai đoạn chuẩn bị dữ liệu, đặc biệt là việc làm sạch và chuyển đổi dữ liệu để sẵn sàng cho phân tích.

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 4: Đâu là đặc điểm KHÔNG thuộc về 'Dữ liệu lớn' (Big Data) trong bối cảnh Khoa học Dữ liệu?

Khối lượng dữ liệu khổng lồ (Volume).

Tốc độ tạo và xử lý nhanh (Velocity).

Sự đa dạng về loại hình dữ liệu (Variety).

Kích thước tệp tin nhỏ (File Size).

Câu hỏi kiểm tra kiến thức về các đặc điểm cốt lõi của Dữ liệu lớn, và loại trừ yếu tố không phù hợp.

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 5: Máy tính giúp tối ưu hóa quá trình xử lý 'Dữ liệu lớn' bằng cách nào để đạt hiệu quả cao nhất?

Giảm độ phức tạp của dữ liệu.

Cho phép xử lý dữ liệu gần như tức thời (theo thời gian thực).

Thay đổi định dạng dữ liệu gốc.

Lưu trữ dữ liệu phân tán.

Câu hỏi tập trung vào cách máy tính tối ưu hóa xử lý dữ liệu lớn, nhấn mạnh khả năng xử lý theo thời gian thực.

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 6: Thuật toán 'song song' đóng vai trò quan trọng như thế nào trong việc xử lý 'Dữ liệu lớn'?

Tăng độ chính xác của dữ liệu.

Đơn giản hóa cấu trúc dữ liệu.

Giảm thời gian và chi phí xử lý dữ liệu.

Cải thiện khả năng lưu trữ dữ liệu.

Câu hỏi về lợi ích của thuật toán xử lý song song trong việc tăng tốc độ và giảm chi phí xử lý dữ liệu.

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 7: Lợi ích chính của việc sử dụng máy tính trong Khoa học Dữ liệu là gì, đặc biệt khi làm việc với lượng dữ liệu lớn?

Giảm thiểu nhu cầu về dữ liệu.

Tăng tốc độ xử lý và phân tích dữ liệu.

Tạo ra các loại dữ liệu mới.

Giảm kích thước vật lý của dữ liệu.

Câu hỏi kiểm tra lợi ích cốt lõi của máy tính trong Khoa học Dữ liệu, tập trung vào tốc độ xử lý.

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 8: Trong quy trình Khoa học Dữ liệu, giai đoạn 'Xây dựng mô hình' chủ yếu tập trung vào hoạt động nào?

Lựa chọn và áp dụng mô hình học máy phù hợp.

Thu thập dữ liệu đầu vào cho mô hình.

Đánh giá hiệu suất của mô hình.

Triển khai mô hình vào thực tế.

Câu hỏi về mục tiêu chính của giai đoạn xây dựng mô hình trong quy trình Khoa học Dữ liệu.

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 9: Khả năng 'mở rộng' của máy tính có ý nghĩa gì trong bối cảnh xử lý 'Dữ liệu lớn'?

Khả năng giảm kích thước dữ liệu.

Khả năng xử lý dữ liệu trên thiết bị di động.

Khả năng tăng cường sức mạnh xử lý khi dữ liệu tăng lên.

Khả năng bảo mật dữ liệu tốt hơn.

Câu hỏi kiểm tra sự hiểu biết về khả năng mở rộng của máy tính và tầm quan trọng của nó trong xử lý dữ liệu lớn.

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 10: Thuật toán 'tự động hóa' mang lại lợi ích gì trong quy trình xử lý dữ liệu?

Tăng độ phức tạp của quy trình.

Yêu cầu sự can thiệp thủ công nhiều hơn.

Giảm khả năng phân tích dữ liệu.

Giảm sự phụ thuộc vào công việc thủ công, tăng tốc độ xử lý.

Câu hỏi tập trung vào lợi ích của tự động hóa thuật toán trong việc giảm sự can thiệp thủ công và tăng hiệu quả.

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 11: Điều gì KHÔNG phải là vai trò của máy tính trong Khoa học Dữ liệu?

Thực hiện các phép tính phức tạp.

Lưu trữ lượng lớn thông tin dữ liệu.

Xác định giá trị đạo đức của dữ liệu.

Hỗ trợ trực quan hóa dữ liệu.

Câu hỏi kiểm tra sự hiểu biết về vai trò của máy tính bằng cách tìm ra lựa chọn không phù hợp.

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 12: Trong quy trình Khoa học Dữ liệu, sau khi xây dựng mô hình, bước tiếp theo quan trọng nhất là gì?

Thu thập thêm dữ liệu.

Đánh giá và kiểm thử mô hình.

Chuẩn bị dữ liệu mới.

Xác định vấn đề mới.

Câu hỏi về bước tiếp theo sau xây dựng mô hình, đó là đánh giá để đảm bảo mô hình hoạt động tốt.

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 13: 'Độ tin cậy' (Veracity) là một đặc điểm quan trọng của 'Dữ liệu lớn', nó đề cập đến khía cạnh nào?

Sự đa dạng của các nguồn dữ liệu.

Tốc độ truyền tải dữ liệu.

Khả năng mở rộng của hệ thống dữ liệu.

Tính chính xác và đáng tin cậy của dữ liệu.

Câu hỏi tập trung vào đặc điểm 'Độ tin cậy' của Dữ liệu lớn, liên quan đến chất lượng và độ chính xác.

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 14: Loại thuật toán nào giúp máy tính thực hiện các công việc lặp đi lặp lại một cách nhanh chóng và chính xác trong Khoa học Dữ liệu?

Thuật toán tự động hóa.

Thuật toán phân tích.

Thuật toán dự đoán.

Thuật toán thống kê.

Câu hỏi về loại thuật toán giúp máy tính tự động hóa các tác vụ lặp đi lặp lại.

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 15: Điều gì thể hiện 'khả năng mở rộng' của máy tính trong việc xử lý dữ liệu lớn trong một hệ thống?

Giảm kích thước bộ nhớ lưu trữ.

Dễ dàng thêm tài nguyên (như bộ nhớ, CPU) khi cần.

Tăng tốc độ xử lý của một CPU đơn lẻ.

Giảm số lượng kết nối mạng.

Câu hỏi kiểm tra sự hiểu biết về 'khả năng mở rộng' và cách nó được thể hiện trong hệ thống máy tính.

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 16: Trong Khoa học Dữ liệu, việc 'trực quan hóa dữ liệu' đóng vai trò như thế nào?

Tăng độ chính xác của dữ liệu.

Giảm dung lượng lưu trữ dữ liệu.

Giúp nhận diện mẫu và hiểu dữ liệu dễ dàng hơn.

Thay thế bước phân tích dữ liệu.

Câu hỏi về vai trò của trực quan hóa dữ liệu trong việc giúp con người hiểu và nhận diện thông tin từ dữ liệu.

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 17: Yếu tố 'Giá trị' (Value) trong 'Dữ liệu lớn' đề cập đến điều gì?

Khả năng tạo ra thông tin hữu ích và quyết định từ dữ liệu.

Kích thước của tập dữ liệu.

Tốc độ thu thập dữ liệu.

Sự đa dạng về nguồn gốc dữ liệu.

Câu hỏi về đặc điểm 'Giá trị' của Dữ liệu lớn, liên quan đến thông tin hữu ích và quyết định.

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 18: Thuật toán 'xử lý theo thời gian thực' đặc biệt quan trọng trong ứng dụng nào của Khoa học Dữ liệu?

Lưu trữ dữ liệu lịch sử.

Phân tích xu hướng dài hạn.

Xây dựng mô hình dự đoán.

Hệ thống giám sát và cảnh báo sự cố ngay lập tức.

Câu hỏi về ứng dụng thực tế của thuật toán xử lý theo thời gian thực, nhấn mạnh các tình huống cần phản ứng nhanh.

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 19: Điều gì là thách thức lớn nhất khi xử lý 'Dữ liệu lớn' mà máy tính và thuật toán phải đối mặt?

Sự thiếu hụt thuật toán.

Khối lượng dữ liệu quá lớn và phức tạp.

Chi phí phần mềm phân tích dữ liệu.

Sự hạn chế về kết nối mạng.

Câu hỏi về thách thức cốt lõi khi làm việc với Dữ liệu lớn, đó là khối lượng và độ phức tạp.

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 20: Để đảm bảo tính 'đa dạng' của dữ liệu trong Khoa học Dữ liệu, chúng ta cần làm gì?

Giảm số lượng dữ liệu thu thập.

Chỉ sử dụng một loại định dạng dữ liệu.

Thu thập dữ liệu từ nhiều nguồn và loại khác nhau.

Tập trung vào dữ liệu có cấu trúc.

Câu hỏi về cách đảm bảo tính đa dạng của dữ liệu, đó là thu thập từ nhiều nguồn khác nhau.

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 21: Trong Khoa học Dữ liệu, thuật ngữ 'siêu dữ liệu' (metadata) dùng để chỉ điều gì?

Dữ liệu đã được xử lý và phân tích.

Dữ liệu mô tả thông tin về dữ liệu khác.

Dữ liệu có kích thước lớn.

Dữ liệu không có cấu trúc.

Câu hỏi kiểm tra kiến thức về 'siêu dữ liệu', đó là dữ liệu mô tả dữ liệu khác.

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 22: Quy trình 'thu thập dữ liệu' trong Khoa học Dữ liệu thường bao gồm các phương pháp nào?

Khảo sát, cảm biến, và dữ liệu từ mạng xã hội.

Xây dựng mô hình học máy và đánh giá.

Làm sạch và chuyển đổi dữ liệu.

Trực quan hóa và báo cáo dữ liệu.

Câu hỏi về các phương pháp phổ biến trong giai đoạn thu thập dữ liệu.

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 23: 'Khoa học Dữ liệu' khác biệt với 'Thống kê truyền thống' chủ yếu ở điểm nào?

Khoa học Dữ liệu không sử dụng máy tính.

Thống kê truyền thống xử lý dữ liệu theo thời gian thực.

Khoa học Dữ liệu chỉ tập trung vào dữ liệu có cấu trúc.

Khoa học Dữ liệu xử lý dữ liệu lớn và đa dạng hơn.

Câu hỏi so sánh Khoa học Dữ liệu với Thống kê truyền thống, tập trung vào quy mô và loại dữ liệu.

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 24: Để bảo mật dữ liệu lớn, máy tính và thuật toán có thể sử dụng phương pháp nào?

Tăng tốc độ xử lý dữ liệu.

Mã hóa dữ liệu và kiểm soát truy cập.

Nén dữ liệu để giảm kích thước.

Phân tích dữ liệu theo thời gian thực.

Câu hỏi về phương pháp bảo mật dữ liệu, đặc biệt là mã hóa dữ liệu.

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 25: Trong Khoa học Dữ liệu, thuật toán 'phân cụm' (clustering) thường được sử dụng để làm gì?

Dự đoán giá trị tương lai.

Phân loại dữ liệu vào các danh mục định trước.

Tìm các nhóm dữ liệu có đặc điểm tương đồng.

Đánh giá mối quan hệ nhân quả giữa các biến số.

Câu hỏi về ứng dụng của thuật toán phân cụm, đó là tìm nhóm dữ liệu tương tự.

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 26: Ứng dụng của Khoa học Dữ liệu trong lĩnh vực Y tế có thể giúp ích gì?

Giảm chi phí phần cứng máy tính.

Tăng số lượng bệnh viện.

Thay thế bác sĩ bằng máy móc.

Cải thiện chẩn đoán bệnh và phát triển phương pháp điều trị mới.

Câu hỏi về ứng dụng của Khoa học Dữ liệu trong Y tế, tập trung vào cải thiện chẩn đoán và điều trị.

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 27: 'Học máy' (Machine Learning) đóng vai trò như thế nào trong Khoa học Dữ liệu?

Là công cụ chính để phân tích và rút trích tri thức từ dữ liệu.

Thay thế hoàn toàn quy trình Khoa học Dữ liệu.

Chỉ được sử dụng trong giai đoạn trực quan hóa dữ liệu.

Không liên quan đến việc xử lý dữ liệu lớn.

Câu hỏi về vai trò của Học máy, đó là công cụ quan trọng để phân tích và rút trích thông tin từ dữ liệu.

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 28: Trong Khoa học Dữ liệu, việc 'làm sạch dữ liệu' (data cleaning) nhằm mục đích gì?

Tăng kích thước của tập dữ liệu.

Cải thiện chất lượng và độ chính xác của dữ liệu.

Giảm tốc độ xử lý dữ liệu.

Thay đổi định dạng gốc của dữ liệu.

Câu hỏi về mục đích của làm sạch dữ liệu, đó là cải thiện chất lượng và độ chính xác của dữ liệu.

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 29: 'Điện toán đám mây' (Cloud Computing) hỗ trợ Khoa học Dữ liệu như thế nào trong việc xử lý dữ liệu lớn?

Giảm khả năng bảo mật dữ liệu.

Tăng chi phí đầu tư phần cứng.

Cung cấp tài nguyên tính toán và lưu trữ linh hoạt, mở rộng.

Giới hạn khả năng truy cập dữ liệu.

Câu hỏi về vai trò của Điện toán đám mây trong việc cung cấp tài nguyên tính toán và lưu trữ cho Khoa học Dữ liệu.

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 30: Đạo đức trong Khoa học Dữ liệu bao gồm trách nhiệm nào liên quan đến việc sử dụng dữ liệu cá nhân?

Tự do sử dụng dữ liệu cho mọi mục đích.

Chia sẻ dữ liệu cá nhân công khai để tăng tính minh bạch.

Thu thập càng nhiều dữ liệu cá nhân càng tốt.

Bảo vệ quyền riêng tư và sử dụng dữ liệu một cách có trách nhiệm.

Xem kết quả

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Nhận kết quả

Xảy ra lỗi

Bước 1: Vào google.com rồi gõ từ khóa:
Copy nhanh thanh-tim-kiem

Bước 2: Trong kết quả tìm kiếm Google, hãy tìm website giống hình bên dưới

Nếu trang 1 không có hãy tìm ở trang 2, 3, 4... nhé trang-google

Bước 3:

Cuộn xuống cuối bài viết rồi bấm vào nút GIỐNG HÌNH DƯỚI và chờ 1 lát để lấy mã:

luot-xem

Nếu tìm không thấy mã bạn có thể Đổi nhiệm vụ để lấy mã khác.

Câu hỏi về khía cạnh đạo đức trong Khoa học Dữ liệu, tập trung vào bảo vệ quyền riêng tư và sử dụng dữ liệu có trách nhiệm.

By Wordpress Quiz plugin

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 02

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 02 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong bối cảnh Khoa học Dữ liệu, máy tính đóng vai trò trung tâm như thế nào trong việc xử lý lượng dữ liệu khổng lồ và phức tạp?

A. Cung cấp năng lực tính toán và khả năng lưu trữ để phân tích và khai thác thông tin từ dữ liệu quy mô lớn.
B. Đảm bảo an toàn và bảo mật tuyệt đối cho dữ liệu trong quá trình thu thập và xử lý.
C. Thay thế hoàn toàn vai trò của con người trong việc đưa ra quyết định dựa trên dữ liệu.
D. Giảm thiểu tối đa lượng dữ liệu cần thiết để đưa ra các phân tích và dự đoán chính xác.

Câu 2: Quy trình Khoa học Dữ liệu thường bắt đầu với giai đoạn nào, nhằm xác định rõ mục tiêu và phạm vi của dự án phân tích?

A. Thu thập và tiền xử lý dữ liệu
B. Xây dựng và đánh giá mô hình
C. Xác định vấn đề và mục tiêu nghiên cứu
D. Triển khai và giám sát mô hình trong thực tế

Câu 3: Trong giai đoạn chuẩn bị dữ liệu của quy trình Khoa học Dữ liệu, công việc nào sau đây đóng vai trò quan trọng trong việc đảm bảo chất lượng và tính sẵn sàng của dữ liệu cho các bước phân tích tiếp theo?

A. Lựa chọn thuật toán học máy phù hợp nhất
B. Làm sạch dữ liệu, xử lý giá trị khuyết thiếu và chuyển đổi định dạng dữ liệu
C. Xây dựng mô hình trực quan hóa dữ liệu để khám phá ban đầu
D. Đánh giá hiệu suất của mô hình trên tập dữ liệu kiểm thử

Câu 4: "Vận tốc" (Velocity) là một trong những đặc trưng của Dữ liệu Lớn (Big Data). Yếu tố "Vận tốc" thể hiện điều gì về dữ liệu?

A. Sự đa dạng về loại và nguồn gốc của dữ liệu.
B. Khối lượng dữ liệu cực lớn được tạo ra và lưu trữ.
C. Độ tin cậy và chính xác của dữ liệu.
D. Tốc độ dữ liệu được tạo ra, thu thập và xử lý.

Câu 5: Trong xử lý Dữ liệu Lớn, máy tính giúp tối ưu hóa quá trình nào sau đây, đặc biệt quan trọng trong các ứng dụng yêu cầu phản hồi nhanh chóng như giám sát hệ thống hoặc giao dịch tài chính?

A. Xử lý dữ liệu theo thời gian thực (Real-time processing)
B. Lưu trữ dữ liệu một cách an toàn và hiệu quả
C. Trực quan hóa dữ liệu để dễ dàng nhận biết xu hướng
D. Tự động hóa quy trình thu thập dữ liệu từ nhiều nguồn

Câu 6: Thuật toán xử lý song song (Parallel Processing) mang lại lợi ích gì chính trong việc xử lý Dữ liệu Lớn?

A. Tăng cường khả năng bảo mật cho dữ liệu.
B. Giảm thời gian xử lý dữ liệu bằng cách chia nhỏ công việc và thực hiện đồng thời.
C. Cải thiện độ chính xác của kết quả phân tích dữ liệu.
D. Đơn giản hóa quy trình thu thập dữ liệu từ các nguồn khác nhau.

Câu 7: Một trong những lợi ích quan trọng nhất của việc ứng dụng máy tính trong Khoa học Dữ liệu là gì?

A. Giảm thiểu sự phụ thuộc vào thuật toán.
B. Tạo ra dữ liệu hoàn toàn mới từ thông tin có sẵn.
C. Tăng tốc độ xử lý dữ liệu, giúp đưa ra quyết định nhanh chóng và hiệu quả hơn.
D. Thay thế hoàn toàn con người trong quá trình phân tích và ra quyết định.

Câu 8: Trong quy trình Khoa học Dữ liệu, giai đoạn "Xây dựng mô hình" tập trung vào hoạt động chính nào?

A. Xác định vấn đề kinh doanh cần giải quyết.
B. Thu thập dữ liệu từ các nguồn khác nhau.
C. Làm sạch và chuẩn hóa dữ liệu.
D. Lựa chọn và huấn luyện mô hình học máy phù hợp với dữ liệu và mục tiêu.

Câu 9: Khả năng mở rộng (Scalability) của máy tính đóng vai trò như thế nào trong việc xử lý dữ liệu quy mô lớn trong Khoa học Dữ liệu?

A. Giảm thiểu chi phí đầu tư vào phần cứng máy tính.
B. Cho phép hệ thống xử lý lượng dữ liệu tăng lên mà không giảm hiệu suất.
C. Đảm bảo tính bảo mật tuyệt đối cho dữ liệu.
D. Đơn giản hóa việc phát triển thuật toán phân tích dữ liệu.

Câu 10: Thuật toán tự động hóa (Automation) mang lại lợi ích nào sau đây trong quá trình xử lý dữ liệu?

A. Tăng độ phức tạp của quy trình xử lý dữ liệu.
B. Giảm khả năng kiểm soát của con người đối với dữ liệu.
C. Giảm sự phụ thuộc vào công việc thủ công, tăng tốc độ và hiệu quả.
D. Tạo ra dữ liệu mới và đa dạng hơn.

Câu 11: Điều gì KHÔNG phải là một yếu tố chính cấu thành nên khái niệm "Dữ liệu Lớn" (Big Data)?

A. Khối lượng (Volume)
B. Vận tốc (Velocity)
C. Đa dạng (Variety)
D. Bảo mật (Security)

Câu 12: Trong Khoa học Dữ liệu, việc trực quan hóa dữ liệu (Data Visualization) đóng vai trò quan trọng như thế nào?

A. Giúp con người dễ dàng nhận diện xu hướng, mẫu hình và thông tin chi tiết ẩn sâu trong dữ liệu.
B. Thay thế hoàn toàn các phương pháp phân tích thống kê truyền thống.
C. Đảm bảo tính chính xác tuyệt đối của dữ liệu.
D. Giảm thiểu dung lượng lưu trữ dữ liệu.

Câu 13: Để xử lý hiệu quả Dữ liệu Lớn, các hệ thống máy tính thường được thiết kế với khả năng gì đặc biệt về mặt phần cứng?

A. Khả năng kết nối mạng tốc độ cao.
B. Khả năng lưu trữ lớn và năng lực tính toán mạnh mẽ.
C. Giao diện người dùng thân thiện.
D. Tiết kiệm năng lượng tiêu thụ.

Câu 14: Ứng dụng nào sau đây thể hiện rõ nhất vai trò của Khoa học Dữ liệu trong việc cải thiện trải nghiệm và dịch vụ cho người dùng?

A. Phát triển hệ điều hành máy tính mới.
B. Nghiên cứu về vật liệu bán dẫn.
C. Hệ thống gợi ý sản phẩm cá nhân hóa trên các trang thương mại điện tử.
D. Tự động hóa quy trình sản xuất trong nhà máy.

Câu 15: Trong bối cảnh Khoa học Dữ liệu, thuật ngữ "mô hình học máy" (Machine Learning Model) dùng để chỉ điều gì?

A. Một loại ngôn ngữ lập trình mới.
B. Một phương pháp lưu trữ dữ liệu hiệu quả.
C. Một công cụ trực quan hóa dữ liệu.
D. Một chương trình máy tính được huấn luyện để nhận diện mẫu hình và đưa ra dự đoán hoặc quyết định dựa trên dữ liệu.

Câu 16: Bước "Đánh giá mô hình" trong quy trình Khoa học Dữ liệu nhằm mục đích chính là gì?

A. Thu thập thêm dữ liệu để cải thiện mô hình.
B. Xác định hiệu suất và độ tin cậy của mô hình trước khi triển khai.
C. Lựa chọn thuật toán học máy phù hợp nhất.
D. Trực quan hóa kết quả dự đoán của mô hình.

Câu 17: Đạo đức dữ liệu (Data Ethics) trở nên ngày càng quan trọng trong Khoa học Dữ liệu, đặc biệt khi xử lý dữ liệu cá nhân. Vấn đề đạo đức nào cần được quan tâm hàng đầu?

A. Bảo vệ quyền riêng tư và dữ liệu cá nhân của người dùng.
B. Tối ưu hóa hiệu suất của thuật toán học máy.
C. Tăng cường khả năng trực quan hóa dữ liệu.
D. Đảm bảo tính sẵn sàng của dữ liệu mọi lúc mọi nơi.

Câu 18: Điện toán đám mây (Cloud Computing) mang lại lợi ích gì cho các dự án Khoa học Dữ liệu, đặc biệt là khi làm việc với Dữ liệu Lớn?

A. Giảm độ phức tạp của thuật toán học máy.
B. Tăng cường khả năng bảo mật dữ liệu tuyệt đối.
C. Cung cấp khả năng mở rộng linh hoạt và tài nguyên tính toán mạnh mẽ theo yêu cầu.
D. Đơn giản hóa quy trình thu thập dữ liệu từ các nguồn khác nhau.

Câu 19: Trong Khoa học Dữ liệu, thuật toán đóng vai trò như "bộ não" của quá trình phân tích. Vậy vai trò chính xác của thuật toán là gì?

A. Lưu trữ và quản lý dữ liệu một cách hiệu quả.
B. Trực quan hóa dữ liệu để dễ dàng nhận biết xu hướng.
C. Thu thập dữ liệu từ nhiều nguồn khác nhau.
D. Thực hiện các bước xử lý, phân tích và khai thác thông tin từ dữ liệu theo một quy trình logic.

Câu 20: Để đảm bảo tính "đáng tin cậy" (Veracity) của Dữ liệu Lớn, cần chú trọng đến yếu tố nào sau đây trong quá trình thu thập và xử lý dữ liệu?

A. Khả năng xử lý dữ liệu với tốc độ cao.
B. Kiểm soát chất lượng dữ liệu và xác minh nguồn gốc thông tin.
C. Sự đa dạng về loại hình và định dạng dữ liệu.
D. Dung lượng lưu trữ dữ liệu khổng lồ.

Câu 21: Hãy xem xét tình huống: Một công ty thương mại điện tử muốn dự đoán khả năng khách hàng hủy đơn hàng sau khi đặt. Loại thuật toán học máy nào phù hợp nhất để giải quyết vấn đề này?

A. Thuật toán phân cụm (Clustering)
B. Thuật toán hồi quy tuyến tính (Linear Regression)
C. Thuật toán phân loại (Classification)
D. Thuật toán giảm chiều dữ liệu (Dimensionality Reduction)

Câu 22: Giả sử bạn có một tập dữ liệu lớn về thông tin khách hàng và hành vi mua sắm. Bạn muốn phân nhóm khách hàng thành các phân khúc khác nhau dựa trên đặc điểm chung để có chiến lược marketing phù hợp. Kỹ thuật Khoa học Dữ liệu nào sẽ hữu ích nhất?

A. Phân cụm dữ liệu (Data Clustering)
B. Hồi quy dữ liệu (Data Regression)
C. Phân loại dữ liệu (Data Classification)
D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 23: Một nhà khoa học dữ liệu muốn khám phá mối quan hệ giữa các biến số trong một tập dữ liệu lớn để hiểu rõ hơn về cấu trúc dữ liệu và các yếu tố ảnh hưởng lẫn nhau. Phương pháp phân tích nào phù hợp?

A. Phân tích mô tả (Descriptive Analysis)
B. Phân tích dự đoán (Predictive Analysis)
C. Phân tích quy chuẩn (Prescriptive Analysis)
D. Phân tích tương quan (Correlation Analysis)

Câu 24: Trong quá trình xây dựng mô hình học máy, việc chia dữ liệu thành tập huấn luyện (training set) và tập kiểm thử (testing set) có mục đích gì?

A. Tăng kích thước của tập dữ liệu huấn luyện.
B. Đánh giá khả năng tổng quát hóa của mô hình trên dữ liệu mới, chưa từng được sử dụng trong quá trình huấn luyện.
C. Giảm thời gian huấn luyện mô hình.
D. Đảm bảo tính bảo mật của dữ liệu kiểm thử.

Câu 25: Khi một mô hình học máy hoạt động quá tốt trên dữ liệu huấn luyện nhưng lại kém hiệu quả trên dữ liệu kiểm thử, hiện tượng này được gọi là gì?

A. Thiếu khớp (Underfitting)
B. Dữ liệu bị nhiễu (Data Noise)
C. Quá khớp (Overfitting)
D. Rò rỉ dữ liệu (Data Leakage)

Câu 26: Để khắc phục hiện tượng "quá khớp" (overfitting) của mô hình học máy, biện pháp nào sau đây thường được áp dụng?

A. Sử dụng kỹ thuật регуляризация (Regularization) hoặc giảm độ phức tạp của mô hình.
B. Tăng kích thước của tập dữ liệu huấn luyện một cách đáng kể.
C. Chỉ sử dụng dữ liệu kiểm thử để huấn luyện mô hình.
D. Loại bỏ hoàn toàn dữ liệu nhiễu khỏi tập dữ liệu.

Câu 27: Trong Khoa học Dữ liệu, việc lựa chọn thuật toán phù hợp phụ thuộc vào yếu tố nào quan trọng nhất?

A. Sự phổ biến của thuật toán đó trong cộng đồng khoa học.
B. Đặc điểm của dữ liệu và mục tiêu cụ thể của bài toán cần giải quyết.
C. Khả năng dễ dàng cài đặt và sử dụng của thuật toán.
D. Yêu cầu về phần cứng và tài nguyên tính toán của thuật toán.

Câu 28: Một hệ thống khuyến nghị sản phẩm (Recommendation System) sử dụng Khoa học Dữ liệu hoạt động dựa trên nguyên tắc nào?

A. Phân tích cú pháp ngôn ngữ tự nhiên để hiểu yêu cầu của người dùng.
B. Sử dụng trí tuệ nhân tạo để tự động tạo ra sản phẩm mới.
C. Phân tích dữ liệu về hành vi và sở thích của người dùng để dự đoán và gợi ý sản phẩm phù hợp.
D. Tối ưu hóa quy trình thanh toán và vận chuyển sản phẩm.

Câu 29: Trong lĩnh vực Khoa học Dữ liệu, "API" (Application Programming Interface) được sử dụng để làm gì?

A. Lưu trữ và quản lý dữ liệu lớn trên đám mây.
B. Trực quan hóa dữ liệu dưới dạng đồ thị và biểu đồ.
C. Huấn luyện các mô hình học máy phức tạp.
D. Kết nối và trao đổi dữ liệu giữa các hệ thống và ứng dụng khác nhau.

Câu 30: Hãy so sánh giữa "Khoa học Dữ liệu" và "Thống kê học". Điểm khác biệt chính giữa hai lĩnh vực này là gì?

A. Thống kê học tập trung vào dữ liệu định tính, trong khi Khoa học Dữ liệu tập trung vào dữ liệu định lượng.
B. Khoa học Dữ liệu có phạm vi rộng hơn, bao gồm cả các kỹ năng về máy tính và lập trình, ngoài các phương pháp thống kê.
C. Thống kê học chỉ sử dụng các phương pháp toán học truyền thống, còn Khoa học Dữ liệu sử dụng trí tuệ nhân tạo.
D. Khoa học Dữ liệu chỉ áp dụng trong lĩnh vực kinh doanh, còn Thống kê học áp dụng trong mọi lĩnh vực.

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 1: Trong bối cảnh Khoa học Dữ liệu, máy tính đóng vai trò trung tâm như thế nào trong việc xử lý lượng dữ liệu khổng lồ và phức tạp?

Cung cấp năng lực tính toán và khả năng lưu trữ để phân tích và khai thác thông tin từ dữ liệu quy mô lớn.

Đảm bảo an toàn và bảo mật tuyệt đối cho dữ liệu trong quá trình thu thập và xử lý.

Thay thế hoàn toàn vai trò của con người trong việc đưa ra quyết định dựa trên dữ liệu.

Giảm thiểu tối đa lượng dữ liệu cần thiết để đưa ra các phân tích và dự đoán chính xác.

Câu hỏi tập trung vào vai trò cốt lõi của máy tính trong Khoa học Dữ liệu, đặc biệt là khả năng xử lý dữ liệu lớn và phức tạp. Các phương án nhiễu tập trung vào các vai trò thứ yếu hoặc không chính xác.

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 2: Quy trình Khoa học Dữ liệu thường bắt đầu với giai đoạn nào, nhằm xác định rõ mục tiêu và phạm vi của dự án phân tích?

Thu thập và tiền xử lý dữ liệu

Xây dựng và đánh giá mô hình

Xác định vấn đề và mục tiêu nghiên cứu

Triển khai và giám sát mô hình trong thực tế

Câu hỏi kiểm tra kiến thức về quy trình Khoa học Dữ liệu, nhấn mạnh bước khởi đầu quan trọng là xác định vấn đề. Các phương án nhiễu là các giai đoạn khác trong quy trình, nhưng không phải bước đầu tiên.

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Lựa chọn thuật toán học máy phù hợp nhất

Làm sạch dữ liệu, xử lý giá trị khuyết thiếu và chuyển đổi định dạng dữ liệu

Xây dựng mô hình trực quan hóa dữ liệu để khám phá ban đầu

Đánh giá hiệu suất của mô hình trên tập dữ liệu kiểm thử

Câu hỏi tập trung vào giai đoạn chuẩn bị dữ liệu, đặc biệt là các hoạt động làm sạch và chuyển đổi dữ liệu. Các phương án nhiễu là các hoạt động liên quan đến giai đoạn khác hoặc không phải là công việc chính trong chuẩn bị dữ liệu.

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 4: 'Vận tốc' (Velocity) là một trong những đặc trưng của Dữ liệu Lớn (Big Data). Yếu tố 'Vận tốc' thể hiện điều gì về dữ liệu?

Sự đa dạng về loại và nguồn gốc của dữ liệu.

Khối lượng dữ liệu cực lớn được tạo ra và lưu trữ.

Độ tin cậy và chính xác của dữ liệu.

Tốc độ dữ liệu được tạo ra, thu thập và xử lý.

Câu hỏi kiểm tra sự hiểu biết về đặc trưng 'Vận tốc' của Dữ liệu Lớn. Các phương án nhiễu mô tả các đặc trưng khác hoặc hiểu sai về 'Vận tốc'.

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Xử lý dữ liệu theo thời gian thực (Real-time processing)

Lưu trữ dữ liệu một cách an toàn và hiệu quả

Trực quan hóa dữ liệu để dễ dàng nhận biết xu hướng

Tự động hóa quy trình thu thập dữ liệu từ nhiều nguồn

Câu hỏi tập trung vào khả năng xử lý theo thời gian thực của máy tính trong bối cảnh Dữ liệu Lớn. Các phương án nhiễu mô tả các khả năng khác của máy tính nhưng không phải là tối ưu hóa chính trong tình huống này.

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 6: Thuật toán xử lý song song (Parallel Processing) mang lại lợi ích gì chính trong việc xử lý Dữ liệu Lớn?

Tăng cường khả năng bảo mật cho dữ liệu.

Giảm thời gian xử lý dữ liệu bằng cách chia nhỏ công việc và thực hiện đồng thời.

Cải thiện độ chính xác của kết quả phân tích dữ liệu.

Đơn giản hóa quy trình thu thập dữ liệu từ các nguồn khác nhau.

Câu hỏi kiểm tra kiến thức về thuật toán xử lý song song và lợi ích của nó. Các phương án nhiễu mô tả các lợi ích khác hoặc không phải là lợi ích chính của xử lý song song.

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 7: Một trong những lợi ích quan trọng nhất của việc ứng dụng máy tính trong Khoa học Dữ liệu là gì?

Giảm thiểu sự phụ thuộc vào thuật toán.

Tạo ra dữ liệu hoàn toàn mới từ thông tin có sẵn.

Tăng tốc độ xử lý dữ liệu, giúp đưa ra quyết định nhanh chóng và hiệu quả hơn.

Thay thế hoàn toàn con người trong quá trình phân tích và ra quyết định.

Câu hỏi tổng quát về lợi ích của máy tính trong Khoa học Dữ liệu. Các phương án nhiễu mô tả các lợi ích khác nhưng không phải là 'quan trọng nhất' hoặc không chính xác.

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 8: Trong quy trình Khoa học Dữ liệu, giai đoạn 'Xây dựng mô hình' tập trung vào hoạt động chính nào?

Xác định vấn đề kinh doanh cần giải quyết.

Thu thập dữ liệu từ các nguồn khác nhau.

Làm sạch và chuẩn hóa dữ liệu.

Lựa chọn và huấn luyện mô hình học máy phù hợp với dữ liệu và mục tiêu.

Câu hỏi tập trung vào giai đoạn 'Xây dựng mô hình' và hoạt động cốt lõi của giai đoạn này. Các phương án nhiễu mô tả các hoạt động thuộc giai đoạn khác hoặc không phải hoạt động chính trong xây dựng mô hình.

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 9: Khả năng mở rộng (Scalability) của máy tính đóng vai trò như thế nào trong việc xử lý dữ liệu quy mô lớn trong Khoa học Dữ liệu?

Giảm thiểu chi phí đầu tư vào phần cứng máy tính.

Cho phép hệ thống xử lý lượng dữ liệu tăng lên mà không giảm hiệu suất.

Đảm bảo tính bảo mật tuyệt đối cho dữ liệu.

Đơn giản hóa việc phát triển thuật toán phân tích dữ liệu.

Câu hỏi kiểm tra sự hiểu biết về khả năng mở rộng của máy tính và vai trò của nó trong Dữ liệu Lớn. Các phương án nhiễu mô tả các vai trò khác hoặc hiểu sai về 'khả năng mở rộng'.

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 10: Thuật toán tự động hóa (Automation) mang lại lợi ích nào sau đây trong quá trình xử lý dữ liệu?

Tăng độ phức tạp của quy trình xử lý dữ liệu.

Giảm khả năng kiểm soát của con người đối với dữ liệu.

Giảm sự phụ thuộc vào công việc thủ công, tăng tốc độ và hiệu quả.

Tạo ra dữ liệu mới và đa dạng hơn.

Câu hỏi kiểm tra kiến thức về thuật toán tự động hóa và lợi ích của nó. Các phương án nhiễu mô tả các lợi ích khác hoặc không phải là lợi ích chính của tự động hóa.

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 11: Điều gì KHÔNG phải là một yếu tố chính cấu thành nên khái niệm 'Dữ liệu Lớn' (Big Data)?

Khối lượng (Volume)

Vận tốc (Velocity)

Đa dạng (Variety)

Bảo mật (Security)

Câu hỏi kiểm tra kiến thức về các đặc điểm của Big Data, yêu cầu xác định yếu tố KHÔNG thuộc về. Các phương án nhiễu bao gồm các đặc điểm chính và một yếu tố không liên quan.

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 12: Trong Khoa học Dữ liệu, việc trực quan hóa dữ liệu (Data Visualization) đóng vai trò quan trọng như thế nào?

Giúp con người dễ dàng nhận diện xu hướng, mẫu hình và thông tin chi tiết ẩn sâu trong dữ liệu.

Thay thế hoàn toàn các phương pháp phân tích thống kê truyền thống.

Đảm bảo tính chính xác tuyệt đối của dữ liệu.

Giảm thiểu dung lượng lưu trữ dữ liệu.

Câu hỏi về vai trò của trực quan hóa dữ liệu trong Khoa học Dữ liệu. Các phương án nhiễu mô tả các vai trò khác hoặc hiểu sai về tầm quan trọng của trực quan hóa.

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 13: Để xử lý hiệu quả Dữ liệu Lớn, các hệ thống máy tính thường được thiết kế với khả năng gì đặc biệt về mặt phần cứng?

Khả năng kết nối mạng tốc độ cao.

Khả năng lưu trữ lớn và năng lực tính toán mạnh mẽ.

Giao diện người dùng thân thiện.

Tiết kiệm năng lượng tiêu thụ.

Câu hỏi về yêu cầu phần cứng để xử lý Dữ liệu Lớn, tập trung vào khả năng lưu trữ và tính toán. Các phương án nhiễu mô tả các khía cạnh khác của máy tính nhưng không phải là khả năng phần cứng chính liên quan đến Dữ liệu Lớn.

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 14: Ứng dụng nào sau đây thể hiện rõ nhất vai trò của Khoa học Dữ liệu trong việc cải thiện trải nghiệm và dịch vụ cho người dùng?

Phát triển hệ điều hành máy tính mới.

Nghiên cứu về vật liệu bán dẫn.

Hệ thống gợi ý sản phẩm cá nhân hóa trên các trang thương mại điện tử.

Tự động hóa quy trình sản xuất trong nhà máy.

Câu hỏi về ứng dụng của Khoa học Dữ liệu, tập trung vào cải thiện trải nghiệm người dùng. Các phương án nhiễu mô tả các ứng dụng khác nhưng không phải là ví dụ điển hình về cải thiện trải nghiệm người dùng.

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 15: Trong bối cảnh Khoa học Dữ liệu, thuật ngữ 'mô hình học máy' (Machine Learning Model) dùng để chỉ điều gì?

Một loại ngôn ngữ lập trình mới.

Một phương pháp lưu trữ dữ liệu hiệu quả.

Một công cụ trực quan hóa dữ liệu.

Một chương trình máy tính được huấn luyện để nhận diện mẫu hình và đưa ra dự đoán hoặc quyết định dựa trên dữ liệu.

Câu hỏi định nghĩa về 'mô hình học máy'. Các phương án nhiễu mô tả các khái niệm liên quan nhưng không phải là định nghĩa chính xác của mô hình học máy.

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 16: Bước 'Đánh giá mô hình' trong quy trình Khoa học Dữ liệu nhằm mục đích chính là gì?

Thu thập thêm dữ liệu để cải thiện mô hình.

Xác định hiệu suất và độ tin cậy của mô hình trước khi triển khai.

Lựa chọn thuật toán học máy phù hợp nhất.

Trực quan hóa kết quả dự đoán của mô hình.

Câu hỏi về mục đích của giai đoạn 'Đánh giá mô hình'. Các phương án nhiễu mô tả các mục đích khác hoặc không phải là mục đích chính của đánh giá mô hình.

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Bảo vệ quyền riêng tư và dữ liệu cá nhân của người dùng.

Tối ưu hóa hiệu suất của thuật toán học máy.

Tăng cường khả năng trực quan hóa dữ liệu.

Đảm bảo tính sẵn sàng của dữ liệu mọi lúc mọi nơi.

Câu hỏi về đạo đức dữ liệu, đặc biệt là vấn đề hàng đầu khi xử lý dữ liệu cá nhân. Các phương án nhiễu mô tả các vấn đề khác nhưng không phải là 'hàng đầu' trong bối cảnh đạo đức dữ liệu.

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 18: Điện toán đám mây (Cloud Computing) mang lại lợi ích gì cho các dự án Khoa học Dữ liệu, đặc biệt là khi làm việc với Dữ liệu Lớn?

Giảm độ phức tạp của thuật toán học máy.

Tăng cường khả năng bảo mật dữ liệu tuyệt đối.

Cung cấp khả năng mở rộng linh hoạt và tài nguyên tính toán mạnh mẽ theo yêu cầu.

Đơn giản hóa quy trình thu thập dữ liệu từ các nguồn khác nhau.

Câu hỏi về lợi ích của điện toán đám mây trong Khoa học Dữ liệu và Dữ liệu Lớn. Các phương án nhiễu mô tả các lợi ích khác hoặc không phải là lợi ích chính của điện toán đám mây trong bối cảnh này.

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 19: Trong Khoa học Dữ liệu, thuật toán đóng vai trò như 'bộ não' của quá trình phân tích. Vậy vai trò chính xác của thuật toán là gì?

Lưu trữ và quản lý dữ liệu một cách hiệu quả.

Trực quan hóa dữ liệu để dễ dàng nhận biết xu hướng.

Thu thập dữ liệu từ nhiều nguồn khác nhau.

Thực hiện các bước xử lý, phân tích và khai thác thông tin từ dữ liệu theo một quy trình logic.

Câu hỏi về vai trò của thuật toán trong Khoa học Dữ liệu. Các phương án nhiễu mô tả các vai trò khác hoặc hiểu sai về vai trò chính của thuật toán.

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 20: Để đảm bảo tính 'đáng tin cậy' (Veracity) của Dữ liệu Lớn, cần chú trọng đến yếu tố nào sau đây trong quá trình thu thập và xử lý dữ liệu?

Khả năng xử lý dữ liệu với tốc độ cao.

Kiểm soát chất lượng dữ liệu và xác minh nguồn gốc thông tin.

Sự đa dạng về loại hình và định dạng dữ liệu.

Dung lượng lưu trữ dữ liệu khổng lồ.

Câu hỏi về đặc trưng 'đáng tin cậy' của Dữ liệu Lớn và yếu tố cần chú trọng để đảm bảo tính đáng tin cậy. Các phương án nhiễu mô tả các yếu tố khác hoặc không liên quan đến tính đáng tin cậy.

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Thuật toán phân cụm (Clustering)

Thuật toán hồi quy tuyến tính (Linear Regression)

Thuật toán phân loại (Classification)

Thuật toán giảm chiều dữ liệu (Dimensionality Reduction)

Câu hỏi tình huống về lựa chọn thuật toán học máy phù hợp cho bài toán dự đoán khả năng hủy đơn hàng (phân loại nhị phân). Các phương án nhiễu bao gồm các loại thuật toán khác, một số không phù hợp với bài toán phân loại.

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Phân cụm dữ liệu (Data Clustering)

Hồi quy dữ liệu (Data Regression)

Phân loại dữ liệu (Data Classification)

Giảm chiều dữ liệu (Dimensionality Reduction)

Câu hỏi tình huống về phân khúc khách hàng, yêu cầu lựa chọn kỹ thuật Khoa học Dữ liệu phù hợp (phân cụm). Các phương án nhiễu bao gồm các kỹ thuật khác, một số không phù hợp với bài toán phân nhóm.

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Phân tích mô tả (Descriptive Analysis)

Phân tích dự đoán (Predictive Analysis)

Phân tích quy chuẩn (Prescriptive Analysis)

Phân tích tương quan (Correlation Analysis)

Câu hỏi về khám phá mối quan hệ giữa các biến số, yêu cầu chọn phương pháp phân tích phù hợp (phân tích tương quan). Các phương án nhiễu mô tả các phương pháp khác hoặc không phải là phương pháp chính để khám phá mối quan hệ biến số.

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 24: Trong quá trình xây dựng mô hình học máy, việc chia dữ liệu thành tập huấn luyện (training set) và tập kiểm thử (testing set) có mục đích gì?

Tăng kích thước của tập dữ liệu huấn luyện.

Đánh giá khả năng tổng quát hóa của mô hình trên dữ liệu mới, chưa từng được sử dụng trong quá trình huấn luyện.

Giảm thời gian huấn luyện mô hình.

Đảm bảo tính bảo mật của dữ liệu kiểm thử.

Câu hỏi về mục đích của việc chia dữ liệu thành tập huấn luyện và kiểm thử. Các phương án nhiễu mô tả các mục đích khác hoặc hiểu sai về mục đích chính của việc chia tập dữ liệu.

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Thiếu khớp (Underfitting)

Dữ liệu bị nhiễu (Data Noise)

Quá khớp (Overfitting)

Rò rỉ dữ liệu (Data Leakage)

Câu hỏi về hiện tượng 'quá khớp' (overfitting) trong học máy. Các phương án nhiễu mô tả các hiện tượng khác hoặc hiểu sai về 'quá khớp'.

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 26: Để khắc phục hiện tượng 'quá khớp' (overfitting) của mô hình học máy, biện pháp nào sau đây thường được áp dụng?

Sử dụng kỹ thuật регуляризация (Regularization) hoặc giảm độ phức tạp của mô hình.

Tăng kích thước của tập dữ liệu huấn luyện một cách đáng kể.

Chỉ sử dụng dữ liệu kiểm thử để huấn luyện mô hình.

Loại bỏ hoàn toàn dữ liệu nhiễu khỏi tập dữ liệu.

Câu hỏi về biện pháp khắc phục 'quá khớp'. Các phương án nhiễu mô tả các biện pháp khác hoặc không phải là biện pháp chính để giảm 'quá khớp'.

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 27: Trong Khoa học Dữ liệu, việc lựa chọn thuật toán phù hợp phụ thuộc vào yếu tố nào quan trọng nhất?

Sự phổ biến của thuật toán đó trong cộng đồng khoa học.

Đặc điểm của dữ liệu và mục tiêu cụ thể của bài toán cần giải quyết.

Khả năng dễ dàng cài đặt và sử dụng của thuật toán.

Yêu cầu về phần cứng và tài nguyên tính toán của thuật toán.

Câu hỏi về yếu tố quan trọng nhất khi lựa chọn thuật toán. Các phương án nhiễu mô tả các yếu tố khác nhưng không phải là yếu tố 'quan trọng nhất'.

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 28: Một hệ thống khuyến nghị sản phẩm (Recommendation System) sử dụng Khoa học Dữ liệu hoạt động dựa trên nguyên tắc nào?

Phân tích cú pháp ngôn ngữ tự nhiên để hiểu yêu cầu của người dùng.

Sử dụng trí tuệ nhân tạo để tự động tạo ra sản phẩm mới.

Phân tích dữ liệu về hành vi và sở thích của người dùng để dự đoán và gợi ý sản phẩm phù hợp.

Tối ưu hóa quy trình thanh toán và vận chuyển sản phẩm.

Câu hỏi về nguyên tắc hoạt động của hệ thống khuyến nghị. Các phương án nhiễu mô tả các nguyên tắc khác hoặc không phải là nguyên tắc chính của hệ thống khuyến nghị.

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 29: Trong lĩnh vực Khoa học Dữ liệu, 'API' (Application Programming Interface) được sử dụng để làm gì?

Lưu trữ và quản lý dữ liệu lớn trên đám mây.

Trực quan hóa dữ liệu dưới dạng đồ thị và biểu đồ.

Huấn luyện các mô hình học máy phức tạp.

Kết nối và trao đổi dữ liệu giữa các hệ thống và ứng dụng khác nhau.

Câu hỏi về mục đích sử dụng của API trong Khoa học Dữ liệu. Các phương án nhiễu mô tả các mục đích khác hoặc hiểu sai về mục đích chính của API.

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 30: Hãy so sánh giữa 'Khoa học Dữ liệu' và 'Thống kê học'. Điểm khác biệt chính giữa hai lĩnh vực này là gì?

Thống kê học tập trung vào dữ liệu định tính, trong khi Khoa học Dữ liệu tập trung vào dữ liệu định lượng.

Khoa học Dữ liệu có phạm vi rộng hơn, bao gồm cả các kỹ năng về máy tính và lập trình, ngoài các phương pháp thống kê.

Thống kê học chỉ sử dụng các phương pháp toán học truyền thống, còn Khoa học Dữ liệu sử dụng trí tuệ nhân tạo.

Khoa học Dữ liệu chỉ áp dụng trong lĩnh vực kinh doanh, còn Thống kê học áp dụng trong mọi lĩnh vực.

Xem kết quả

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Nhận kết quả

Xảy ra lỗi

Bước 1: Vào google.com rồi gõ từ khóa:
Copy nhanh thanh-tim-kiem

Bước 2: Trong kết quả tìm kiếm Google, hãy tìm website giống hình bên dưới

Nếu trang 1 không có hãy tìm ở trang 2, 3, 4... nhé trang-google

Bước 3:

Cuộn xuống cuối bài viết rồi bấm vào nút GIỐNG HÌNH DƯỚI và chờ 1 lát để lấy mã:

luot-xem

Nếu tìm không thấy mã bạn có thể Đổi nhiệm vụ để lấy mã khác.

Câu hỏi so sánh Khoa học Dữ liệu và Thống kê học, yêu cầu xác định điểm khác biệt chính. Các phương án nhiễu mô tả các điểm tương đồng hoặc khác biệt không chính xác.

By Wordpress Quiz plugin

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 03

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 03 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong bối cảnh Khoa học dữ liệu, vai trò chính của máy tính vượt trội so với các công cụ xử lý truyền thống (như bảng tính đơn giản) là gì?

A. Cung cấp năng lực tính toán và lưu trữ cho khối lượng dữ liệu lớn và phức tạp.
B. Tự động tạo ra các câu hỏi nghiên cứu mới.
C. Loại bỏ hoàn toàn nhu cầu về kiến thức chuyên môn của con người.
D. Chỉ dùng để hiển thị kết quả phân tích cuối cùng.

Câu 2: Thuật toán trong Khoa học dữ liệu được hiểu là gì?

A. Một tập hợp các dữ liệu thô chưa được xử lý.
B. Phần cứng máy tính dùng để lưu trữ dữ liệu.
C. Một chuỗi các bước hoặc quy tắc được xác định rõ ràng để giải quyết một vấn đề hoặc thực hiện một nhiệm vụ trên dữ liệu.
D. Giao diện người dùng của phần mềm phân tích dữ liệu.

Câu 3: Giai đoạn đầu tiên và quan trọng nhất trong quy trình Khoa học dữ liệu là gì?

A. Xây dựng mô hình học máy phức tạp nhất có thể.
B. Xác định rõ ràng bài toán hoặc mục tiêu cần giải quyết dựa trên dữ liệu.
C. Thu thập tất cả dữ liệu có thể tìm thấy mà không cần chọn lọc.
D. Trực quan hóa dữ liệu bằng biểu đồ đẹp mắt.

Câu 4: Một công ty thương mại điện tử thu thập hàng tỷ bản ghi về hành vi duyệt web, lịch sử mua hàng và thông tin cá nhân của khách hàng mỗi ngày. Đặc điểm nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua khối lượng và tốc độ thu thập này?

A. Tính đa dạng (Variety)
B. Tính xác thực (Veracity)
C. Tính giá trị (Value)
D. Tính khối lượng (Volume) và Tính tốc độ (Velocity)

Câu 5: Thuật toán xử lý song song (Parallel Processing) mang lại lợi ích gì đáng kể trong việc xử lý dữ liệu lớn?

A. Giảm đáng kể thời gian xử lý bằng cách chia nhỏ tác vụ trên nhiều bộ xử lý.
B. Tăng tính đa dạng của dữ liệu đầu vào.
C. Chỉ áp dụng cho dữ liệu có cấu trúc đơn giản.
D. Giảm nhu cầu về phần cứng máy tính.

Câu 6: Trong quy trình Khoa học dữ liệu, giai đoạn "Chuẩn bị dữ liệu" (Data Preparation) bao gồm những công việc chính nào?

A. Chỉ thu thập dữ liệu từ các nguồn khác nhau.
B. Chỉ xây dựng mô hình dự đoán.
C. Làm sạch dữ liệu (xử lý thiếu, nhiễu), biến đổi dữ liệu, và tích hợp dữ liệu từ nhiều nguồn.
D. Chỉ trình bày kết quả cuối cùng cho người dùng.

Câu 7: Tại sao khả năng mở rộng (Scalability) của hệ thống máy tính lại quan trọng đối với Khoa học dữ liệu?

A. Chỉ giúp giảm chi phí đầu tư ban đầu.
B. Chỉ cần thiết khi dữ liệu có cấu trúc.
C. Không liên quan đến khối lượng dữ liệu.
D. Cho phép hệ thống xử lý hiệu quả khi khối lượng dữ liệu và độ phức tạp tính toán tăng lên.

Câu 8: Khi một thuật toán học máy được áp dụng để phân loại hình ảnh, nó đang thực hiện nhiệm vụ gì trong quy trình Khoa học dữ liệu?

A. Xây dựng mô hình (Model Building).
B. Thu thập dữ liệu (Data Collection).
C. Đánh giá mô hình (Model Evaluation).
D. Triển khai mô hình (Model Deployment).

Câu 9: Đặc điểm "Tính đa dạng" (Variety) của Dữ liệu lớn đề cập đến điều gì?

A. Dữ liệu luôn có cùng định dạng và cấu trúc.
B. Sự tồn tại của nhiều loại định dạng dữ liệu khác nhau (có cấu trúc, bán cấu trúc, phi cấu trúc).
C. Tốc độ thay đổi của dữ liệu.
D. Khối lượng dữ liệu được tạo ra mỗi giây.

Câu 10: Vai trò của thuật toán tự động hóa trong Khoa học dữ liệu là gì?

A. Chỉ giúp thu thập dữ liệu nhanh hơn.
B. Chỉ thay thế hoàn toàn con người trong mọi công đoạn.
C. Giúp thực hiện lặp đi lặp lại các tác vụ xử lý dữ liệu hoặc xây dựng mô hình một cách hiệu quả và giảm thiểu lỗi thủ công.
D. Chỉ dùng để trình bày kết quả.

Câu 11: Một nhà khoa học dữ liệu đang sử dụng các biểu đồ và đồ thị để khám phá xu hướng và các điểm bất thường trong tập dữ liệu bán hàng. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

A. Phân tích khám phá dữ liệu (Exploratory Data Analysis - EDA) hoặc Chuẩn bị dữ liệu.
B. Xác định vấn đề.
C. Triển khai mô hình.
D. Đánh giá mô hình.

Câu 12: Tại sao việc "làm sạch dữ liệu" (Data Cleaning) lại là một bước quan trọng, thường tốn nhiều thời gian trong Khoa học dữ liệu?

A. Chỉ để làm cho dữ liệu trông đẹp mắt hơn.
B. Vì dữ liệu bẩn không ảnh hưởng đến kết quả mô hình.
C. Để giảm khối lượng dữ liệu.
D. Vì dữ liệu không chính xác, thiếu hoặc không nhất quán có thể dẫn đến kết quả phân tích và mô hình sai lệch.

Câu 13: Khi một mô hình dự đoán (ví dụ: dự đoán giá nhà) đã được xây dựng và đánh giá thành công, bước tiếp theo là đưa mô hình đó vào sử dụng thực tế để đưa ra dự đoán cho dữ liệu mới. Giai đoạn này gọi là gì?

A. Thu thập dữ liệu.
B. Triển khai mô hình (Model Deployment).
C. Chuẩn bị dữ liệu.
D. Xây dựng mô hình.

Câu 14: Đặc điểm nào của Dữ liệu lớn liên quan đến sự không chắc chắn hoặc độ tin cậy của dữ liệu?

A. Tính khối lượng (Volume).
B. Tính tốc độ (Velocity).
C. Tính xác thực (Veracity).
D. Tính đa dạng (Variety).

Câu 15: Máy tính hỗ trợ "xử lý dữ liệu theo thời gian thực" (Real-time Data Processing) trong Khoa học dữ liệu như thế nào?

A. Cung cấp tốc độ xử lý và kết nối mạng đủ nhanh để phân tích dữ liệu ngay khi nó được tạo ra hoặc thu thập.
B. Bằng cách giảm khối lượng dữ liệu cần xử lý.
C. Chỉ thực hiện khi dữ liệu đã được lưu trữ hoàn toàn.
D. Không hỗ trợ xử lý theo thời gian thực, chỉ xử lý hàng loạt.

Câu 16: Thuật toán nào thường được sử dụng để tìm ra mối quan hệ hoặc quy tắc giữa các mục trong tập dữ liệu giao dịch (ví dụ: "những khách hàng mua X cũng thường mua Y")?

A. Thuật toán phân loại (Classification).
B. Thuật toán hồi quy (Regression).
C. Thuật toán phân cụm (Clustering).
D. Thuật toán luật kết hợp (Association Rule Mining).

Câu 17: "Tính giá trị" (Value) trong bối cảnh Dữ liệu lớn đề cập đến khía cạnh nào?

A. Dữ liệu phải được thu thập miễn phí.
B. Khả năng chuyển đổi dữ liệu thành thông tin có ý nghĩa và có thể sử dụng để đưa ra quyết định hoặc tạo ra lợi ích.
C. Dữ liệu phải có cấu trúc rõ ràng.
D. Tốc độ xử lý dữ liệu.

Câu 18: So với các phương pháp phân tích thống kê truyền thống, Khoa học dữ liệu thường có xu hướng xử lý loại dữ liệu nào nhiều hơn?

A. Chỉ dữ liệu có cấu trúc từ bảng tính.
B. Chỉ dữ liệu định tính (mô tả).
C. Dữ liệu phi cấu trúc và bán cấu trúc (văn bản, hình ảnh, âm thanh, video).
D. Chỉ dữ liệu được thu thập thủ công.

Câu 19: Máy tính và thuật toán đóng vai trò then chốt trong việc tự động hóa các tác vụ lặp đi lặp lại trong Khoa học dữ liệu. Điều này mang lại lợi ích chính là gì?

A. Tăng hiệu quả, giảm thời gian và chi phí xử lý, đồng thời giảm thiểu lỗi do con người.
B. Làm cho dữ liệu trở nên phức tạp hơn.
C. Loại bỏ hoàn toàn nhu cầu về sự can thiệp của con người.
D. Chỉ áp dụng cho dữ liệu nhỏ.

Câu 20: Khi đánh giá một mô hình học máy trong Khoa học dữ liệu, chúng ta đang kiểm tra điều gì?

A. Tốc độ thu thập dữ liệu.
B. Chi phí xây dựng hệ thống máy tính.
C. Mức độ phức tạp của thuật toán được sử dụng.
D. Mức độ hiệu quả và độ chính xác của mô hình trong việc giải quyết bài toán đã đặt ra trên dữ liệu mới.

Câu 21: Một công ty muốn phân tích các bài đăng trên mạng xã hội của khách hàng để hiểu cảm nhận của họ về sản phẩm. Loại dữ liệu này (văn bản không có cấu trúc) thuộc đặc điểm nào của Dữ liệu lớn?

A. Tính đa dạng (Variety).
B. Tính khối lượng (Volume).
C. Tính tốc độ (Velocity).
D. Tính giá trị (Value).

Câu 22: Thuật toán "phân cụm" (Clustering) trong Khoa học dữ liệu được sử dụng chủ yếu để làm gì?

A. Dự đoán một giá trị số liên tục.
B. Gán nhãn cho các đối tượng dựa trên dữ liệu đã được gán nhãn trước.
C. Nhóm các điểm dữ liệu tương tự nhau lại với nhau dựa trên các đặc điểm của chúng mà không cần nhãn có sẵn.
D. Tìm mối quan hệ nhân quả giữa hai biến.

Câu 23: Tại sao việc trực quan hóa dữ liệu (Data Visualization) là một phần quan trọng trong Khoa học dữ liệu?

A. Chỉ để làm cho báo cáo trông chuyên nghiệp hơn.
B. Không có vai trò trong việc hiểu dữ liệu.
C. Chỉ hữu ích sau khi mô hình đã được triển khai.
D. Giúp con người dễ dàng khám phá xu hướng, mẫu hình và các điểm bất thường trong dữ liệu, cũng như truyền đạt kết quả phân tích một cách hiệu quả.

Câu 24: Một hệ thống giám sát giao thông sử dụng camera và cảm biến để thu thập dữ liệu về lưu lượng xe theo thời gian thực và điều chỉnh đèn tín hiệu. Đây là ví dụ về việc ứng dụng Khoa học dữ liệu, đặc biệt là khía cạnh nào?

A. Xử lý và phân tích dữ liệu theo thời gian thực để đưa ra quyết định tức thời.
B. Chỉ lưu trữ dữ liệu cho mục đích lịch sử.
C. Chỉ tạo ra dữ liệu mới.
D. Không liên quan đến Khoa học dữ liệu.

Câu 25: Khi một nhà khoa học dữ liệu sử dụng các kỹ thuật thống kê để kiểm tra xem kết quả của mô hình có ý nghĩa hay không, anh/cô ấy đang thực hiện công việc thuộc giai đoạn nào?

A. Thu thập dữ liệu.
B. Đánh giá mô hình (Model Evaluation).
C. Chuẩn bị dữ liệu.
D. Triển khai mô hình.

Câu 26: Thuật toán nào sau đây thường được sử dụng để dự đoán một giá trị số liên tục (ví dụ: dự đoán doanh số bán hàng, dự đoán nhiệt độ)?

A. Thuật toán hồi quy (Regression).
B. Thuật toán phân loại (Classification).
C. Thuật toán phân cụm (Clustering).
D. Thuật toán luật kết hợp (Association Rule Mining).

Câu 27: Mối quan hệ giữa Máy tính, Thuật toán và Khoa học dữ liệu có thể được mô tả tốt nhất như thế nào?

A. Máy tính là mục tiêu cuối cùng của Khoa học dữ liệu, còn thuật toán là công cụ duy nhất.
B. Thuật toán hoàn toàn độc lập với máy tính và Khoa học dữ liệu.
C. Khoa học dữ liệu chỉ là việc sử dụng máy tính để chạy bất kỳ thuật toán nào.
D. Máy tính cung cấp nền tảng phần cứng và năng lực tính toán; thuật toán cung cấp phương pháp luận và các bước xử lý; Khoa học dữ liệu sử dụng cả hai để khai thác giá trị từ dữ liệu.

Câu 28: Tại sao việc hiểu rõ bài toán kinh doanh hoặc nghiên cứu là bước thiết yếu trước khi bắt đầu thu thập và xử lý dữ liệu trong Khoa học dữ liệu?

A. Giúp xác định loại dữ liệu cần thu thập, phương pháp phân tích phù hợp và tiêu chí đánh giá thành công.
B. Chỉ để làm hài lòng người quản lý.
C. Không ảnh hưởng đến các giai đoạn sau.
D. Chỉ cần thiết khi dữ liệu rất nhỏ.

Câu 29: Khi xử lý Dữ liệu lớn, việc sử dụng các hệ thống lưu trữ phân tán (Distributed Storage Systems) trên máy tính (ví dụ: HDFS) có ưu điểm gì?

A. Chỉ giúp giảm chi phí phần mềm.
B. Làm giảm tốc độ truy xuất dữ liệu.
C. Cho phép lưu trữ và quản lý hiệu quả các tập dữ liệu có khối lượng khổng lồ trên nhiều máy tính.
D. Chỉ dùng để xử lý dữ liệu theo thời gian thực.

Câu 30: Một thuật toán học máy được huấn luyện để phân loại email là "spam" hoặc "không spam". Đây là ví dụ về bài toán thuộc loại nào trong Khoa học dữ liệu?

A. Bài toán hồi quy (Regression).
B. Bài toán phân cụm (Clustering).
C. Bài toán luật kết hợp (Association Rule Mining).
D. Bài toán phân loại (Classification).

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 1: Trong bối cảnh Khoa học dữ liệu, vai trò chính của máy tính vượt trội so với các công cụ xử lý truyền thống (như bảng tính đơn giản) là gì?

Cung cấp năng lực tính toán và lưu trữ cho khối lượng dữ liệu lớn và phức tạp.

Tự động tạo ra các câu hỏi nghiên cứu mới.

Loại bỏ hoàn toàn nhu cầu về kiến thức chuyên môn của con người.

Chỉ dùng để hiển thị kết quả phân tích cuối cùng.

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 2: Thuật toán trong Khoa học dữ liệu được hiểu là gì?

Một tập hợp các dữ liệu thô chưa được xử lý.

Phần cứng máy tính dùng để lưu trữ dữ liệu.

Một chuỗi các bước hoặc quy tắc được xác định rõ ràng để giải quyết một vấn đề hoặc thực hiện một nhiệm vụ trên dữ liệu.

Giao diện người dùng của phần mềm phân tích dữ liệu.

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 3: Giai đoạn đầu tiên và quan trọng nhất trong quy trình Khoa học dữ liệu là gì?

Xây dựng mô hình học máy phức tạp nhất có thể.

Xác định rõ ràng bài toán hoặc mục tiêu cần giải quyết dựa trên dữ liệu.

Thu thập tất cả dữ liệu có thể tìm thấy mà không cần chọn lọc.

Trực quan hóa dữ liệu bằng biểu đồ đẹp mắt.

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Tính đa dạng (Variety)

Tính xác thực (Veracity)

Tính giá trị (Value)

Tính khối lượng (Volume) và Tính tốc độ (Velocity)

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 5: Thuật toán xử lý song song (Parallel Processing) mang lại lợi ích gì đáng kể trong việc xử lý dữ liệu lớn?

Giảm đáng kể thời gian xử lý bằng cách chia nhỏ tác vụ trên nhiều bộ xử lý.

Tăng tính đa dạng của dữ liệu đầu vào.

Chỉ áp dụng cho dữ liệu có cấu trúc đơn giản.

Giảm nhu cầu về phần cứng máy tính.

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 6: Trong quy trình Khoa học dữ liệu, giai đoạn 'Chuẩn bị dữ liệu' (Data Preparation) bao gồm những công việc chính nào?

Chỉ thu thập dữ liệu từ các nguồn khác nhau.

Chỉ xây dựng mô hình dự đoán.

Làm sạch dữ liệu (xử lý thiếu, nhiễu), biến đổi dữ liệu, và tích hợp dữ liệu từ nhiều nguồn.

Chỉ trình bày kết quả cuối cùng cho người dùng.

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 7: Tại sao khả năng mở rộng (Scalability) của hệ thống máy tính lại quan trọng đối với Khoa học dữ liệu?

Chỉ giúp giảm chi phí đầu tư ban đầu.

Chỉ cần thiết khi dữ liệu có cấu trúc.

Không liên quan đến khối lượng dữ liệu.

Cho phép hệ thống xử lý hiệu quả khi khối lượng dữ liệu và độ phức tạp tính toán tăng lên.

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 8: Khi một thuật toán học máy được áp dụng để phân loại hình ảnh, nó đang thực hiện nhiệm vụ gì trong quy trình Khoa học dữ liệu?

Xây dựng mô hình (Model Building).

Thu thập dữ liệu (Data Collection).

Đánh giá mô hình (Model Evaluation).

Triển khai mô hình (Model Deployment).

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 9: Đặc điểm 'Tính đa dạng' (Variety) của Dữ liệu lớn đề cập đến điều gì?

Dữ liệu luôn có cùng định dạng và cấu trúc.

Sự tồn tại của nhiều loại định dạng dữ liệu khác nhau (có cấu trúc, bán cấu trúc, phi cấu trúc).

Tốc độ thay đổi của dữ liệu.

Khối lượng dữ liệu được tạo ra mỗi giây.

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 10: Vai trò của thuật toán tự động hóa trong Khoa học dữ liệu là gì?

Chỉ giúp thu thập dữ liệu nhanh hơn.

Chỉ thay thế hoàn toàn con người trong mọi công đoạn.

Giúp thực hiện lặp đi lặp lại các tác vụ xử lý dữ liệu hoặc xây dựng mô hình một cách hiệu quả và giảm thiểu lỗi thủ công.

Chỉ dùng để trình bày kết quả.

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Phân tích khám phá dữ liệu (Exploratory Data Analysis - EDA) hoặc Chuẩn bị dữ liệu.

Xác định vấn đề.

Triển khai mô hình.

Đánh giá mô hình.

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 12: Tại sao việc 'làm sạch dữ liệu' (Data Cleaning) lại là một bước quan trọng, thường tốn nhiều thời gian trong Khoa học dữ liệu?

Chỉ để làm cho dữ liệu trông đẹp mắt hơn.

Vì dữ liệu bẩn không ảnh hưởng đến kết quả mô hình.

Để giảm khối lượng dữ liệu.

Vì dữ liệu không chính xác, thiếu hoặc không nhất quán có thể dẫn đến kết quả phân tích và mô hình sai lệch.

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Thu thập dữ liệu.

Triển khai mô hình (Model Deployment).

Chuẩn bị dữ liệu.

Xây dựng mô hình.

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 14: Đặc điểm nào của Dữ liệu lớn liên quan đến sự không chắc chắn hoặc độ tin cậy của dữ liệu?

Tính khối lượng (Volume).

Tính tốc độ (Velocity).

Tính xác thực (Veracity).

Tính đa dạng (Variety).

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 15: Máy tính hỗ trợ 'xử lý dữ liệu theo thời gian thực' (Real-time Data Processing) trong Khoa học dữ liệu như thế nào?

Cung cấp tốc độ xử lý và kết nối mạng đủ nhanh để phân tích dữ liệu ngay khi nó được tạo ra hoặc thu thập.

Bằng cách giảm khối lượng dữ liệu cần xử lý.

Chỉ thực hiện khi dữ liệu đã được lưu trữ hoàn toàn.

Không hỗ trợ xử lý theo thời gian thực, chỉ xử lý hàng loạt.

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 16: Thuật toán nào thường được sử dụng để tìm ra mối quan hệ hoặc quy tắc giữa các mục trong tập dữ liệu giao dịch (ví dụ: 'những khách hàng mua X cũng thường mua Y')?

Thuật toán phân loại (Classification).

Thuật toán hồi quy (Regression).

Thuật toán phân cụm (Clustering).

Thuật toán luật kết hợp (Association Rule Mining).

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 17: 'Tính giá trị' (Value) trong bối cảnh Dữ liệu lớn đề cập đến khía cạnh nào?

Dữ liệu phải được thu thập miễn phí.

Khả năng chuyển đổi dữ liệu thành thông tin có ý nghĩa và có thể sử dụng để đưa ra quyết định hoặc tạo ra lợi ích.

Dữ liệu phải có cấu trúc rõ ràng.

Tốc độ xử lý dữ liệu.

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 18: So với các phương pháp phân tích thống kê truyền thống, Khoa học dữ liệu thường có xu hướng xử lý loại dữ liệu nào nhiều hơn?

Chỉ dữ liệu có cấu trúc từ bảng tính.

Chỉ dữ liệu định tính (mô tả).

Dữ liệu phi cấu trúc và bán cấu trúc (văn bản, hình ảnh, âm thanh, video).

Chỉ dữ liệu được thu thập thủ công.

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Tăng hiệu quả, giảm thời gian và chi phí xử lý, đồng thời giảm thiểu lỗi do con người.

Làm cho dữ liệu trở nên phức tạp hơn.

Loại bỏ hoàn toàn nhu cầu về sự can thiệp của con người.

Chỉ áp dụng cho dữ liệu nhỏ.

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 20: Khi đánh giá một mô hình học máy trong Khoa học dữ liệu, chúng ta đang kiểm tra điều gì?

Tốc độ thu thập dữ liệu.

Chi phí xây dựng hệ thống máy tính.

Mức độ phức tạp của thuật toán được sử dụng.

Mức độ hiệu quả và độ chính xác của mô hình trong việc giải quyết bài toán đã đặt ra trên dữ liệu mới.

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Tính đa dạng (Variety).

Tính khối lượng (Volume).

Tính tốc độ (Velocity).

Tính giá trị (Value).

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 22: Thuật toán 'phân cụm' (Clustering) trong Khoa học dữ liệu được sử dụng chủ yếu để làm gì?

Dự đoán một giá trị số liên tục.

Gán nhãn cho các đối tượng dựa trên dữ liệu đã được gán nhãn trước.

Nhóm các điểm dữ liệu tương tự nhau lại với nhau dựa trên các đặc điểm của chúng mà không cần nhãn có sẵn.

Tìm mối quan hệ nhân quả giữa hai biến.

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 23: Tại sao việc trực quan hóa dữ liệu (Data Visualization) là một phần quan trọng trong Khoa học dữ liệu?

Chỉ để làm cho báo cáo trông chuyên nghiệp hơn.

Không có vai trò trong việc hiểu dữ liệu.

Chỉ hữu ích sau khi mô hình đã được triển khai.

Giúp con người dễ dàng khám phá xu hướng, mẫu hình và các điểm bất thường trong dữ liệu, cũng như truyền đạt kết quả phân tích một cách hiệu quả.

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Xử lý và phân tích dữ liệu theo thời gian thực để đưa ra quyết định tức thời.

Chỉ lưu trữ dữ liệu cho mục đích lịch sử.

Chỉ tạo ra dữ liệu mới.

Không liên quan đến Khoa học dữ liệu.

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Thu thập dữ liệu.

Đánh giá mô hình (Model Evaluation).

Chuẩn bị dữ liệu.

Triển khai mô hình.

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 26: Thuật toán nào sau đây thường được sử dụng để dự đoán một giá trị số liên tục (ví dụ: dự đoán doanh số bán hàng, dự đoán nhiệt độ)?

Thuật toán hồi quy (Regression).

Thuật toán phân loại (Classification).

Thuật toán phân cụm (Clustering).

Thuật toán luật kết hợp (Association Rule Mining).

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 27: Mối quan hệ giữa Máy tính, Thuật toán và Khoa học dữ liệu có thể được mô tả tốt nhất như thế nào?

Máy tính là mục tiêu cuối cùng của Khoa học dữ liệu, còn thuật toán là công cụ duy nhất.

Thuật toán hoàn toàn độc lập với máy tính và Khoa học dữ liệu.

Khoa học dữ liệu chỉ là việc sử dụng máy tính để chạy bất kỳ thuật toán nào.

Máy tính cung cấp nền tảng phần cứng và năng lực tính toán; thuật toán cung cấp phương pháp luận và các bước xử lý; Khoa học dữ liệu sử dụng cả hai để khai thác giá trị từ dữ liệu.

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 28: Tại sao việc hiểu rõ bài toán kinh doanh hoặc nghiên cứu là bước thiết yếu trước khi bắt đầu thu thập và xử lý dữ liệu trong Khoa học dữ liệu?

Giúp xác định loại dữ liệu cần thu thập, phương pháp phân tích phù hợp và tiêu chí đánh giá thành công.

Chỉ để làm hài lòng người quản lý.

Không ảnh hưởng đến các giai đoạn sau.

Chỉ cần thiết khi dữ liệu rất nhỏ.

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 29: Khi xử lý Dữ liệu lớn, việc sử dụng các hệ thống lưu trữ phân tán (Distributed Storage Systems) trên máy tính (ví dụ: HDFS) có ưu điểm gì?

Chỉ giúp giảm chi phí phần mềm.

Làm giảm tốc độ truy xuất dữ liệu.

Cho phép lưu trữ và quản lý hiệu quả các tập dữ liệu có khối lượng khổng lồ trên nhiều máy tính.

Chỉ dùng để xử lý dữ liệu theo thời gian thực.

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 30: Một thuật toán học máy được huấn luyện để phân loại email là 'spam' hoặc 'không spam'. Đây là ví dụ về bài toán thuộc loại nào trong Khoa học dữ liệu?

Bài toán hồi quy (Regression).

Bài toán phân cụm (Clustering).

Bài toán luật kết hợp (Association Rule Mining).

Bài toán phân loại (Classification).

Xem kết quả

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Nhận kết quả

Xảy ra lỗi

Bước 1: Vào google.com rồi gõ từ khóa:
Copy nhanh thanh-tim-kiem

Bước 2: Trong kết quả tìm kiếm Google, hãy tìm website giống hình bên dưới

Nếu trang 1 không có hãy tìm ở trang 2, 3, 4... nhé trang-google

Bước 3:

Cuộn xuống cuối bài viết rồi bấm vào nút GIỐNG HÌNH DƯỚI và chờ 1 lát để lấy mã:

luot-xem

Nếu tìm không thấy mã bạn có thể Đổi nhiệm vụ để lấy mã khác.

By Wordpress Quiz plugin

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 04

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 04 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong quy trình Khoa học dữ liệu, giai đoạn nào đóng vai trò định hình câu hỏi nghiên cứu và xác định mục tiêu cần đạt được?

A. Xác định vấn đề
B. Thu thập dữ liệu
C. Chuẩn bị dữ liệu
D. Xây dựng mô hình

Câu 2: Một công ty thương mại điện tử thu thập hàng triệu lượt click, xem sản phẩm và lịch sử mua hàng của khách hàng mỗi ngày. Đặc điểm nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất trong tình huống này?

A. Variety (Đa dạng)
B. Velocity (Tốc độ)
C. Veracity (Độ tin cậy)
D. Value (Giá trị)

Câu 3: Vai trò cốt lõi của máy tính trong việc xử lý dữ liệu lớn trong Khoa học dữ liệu là gì?

A. Thay thế hoàn toàn con người trong mọi công đoạn
B. Chỉ đơn thuần là nơi lưu trữ dữ liệu thô
C. Cung cấp năng lực tính toán mạnh mẽ để phân tích, xử lý và trích xuất thông tin từ dữ liệu quy mô lớn
D. Tự động tạo ra các câu hỏi nghiên cứu mới

Câu 4: Giai đoạn "Chuẩn bị dữ liệu" trong quy trình Khoa học dữ liệu thường bao gồm những công việc nào sau đây?

A. Xác định mục tiêu kinh doanh và các chỉ số đo lường
B. Triển khai mô hình đã xây dựng vào môi trường thực tế
C. Chọn thuật toán học máy phù hợp với bài toán
D. Làm sạch dữ liệu, xử lý dữ liệu thiếu/nhiễu, và biến đổi dữ liệu về định dạng phù hợp

Câu 5: Thuật toán "xử lý song song" mang lại lợi ích gì quan trọng nhất trong xử lý dữ liệu lớn?

A. Đảm bảo dữ liệu luôn chính xác tuyệt đối
B. Giảm đáng kể thời gian xử lý bằng cách chia nhỏ và thực hiện đồng thời các tác vụ
C. Tự động thu thập dữ liệu từ nhiều nguồn khác nhau
D. Chỉ hoạt động hiệu quả với dữ liệu có cấu trúc đơn giản

Câu 6: Tại sao khả năng "mở rộng" (scalability) của hệ thống máy tính lại quan trọng đối với Khoa học dữ liệu, đặc biệt khi làm việc với Dữ liệu lớn?

A. Vì khối lượng và tốc độ dữ liệu có thể tăng lên nhanh chóng, hệ thống cần có khả năng mở rộng để xử lý kịp thời
B. Vì nó giúp giảm số lượng thuật toán cần sử dụng
C. Vì nó chỉ cần thiết cho giai đoạn thu thập dữ liệu
D. Vì nó giúp giảm chi phí lưu trữ dữ liệu

Câu 7: Trong quy trình Khoa học dữ liệu, giai đoạn "Xây dựng mô hình" bao gồm những hoạt động chính nào?

A. Làm sạch và trực quan hóa dữ liệu
B. Đánh giá hiệu suất của mô hình đã triển khai
C. Lựa chọn thuật toán, huấn luyện mô hình trên dữ liệu đã chuẩn bị và điều chỉnh tham số
D. Xác định các nguồn dữ liệu tiềm năng

Câu 8: Dữ liệu từ cảm biến IoT (Internet of Things) trong các nhà máy hoặc hệ thống giao thông thường có đặc điểm "Velocity" (Tốc độ) rất cao. Điều này đòi hỏi hệ thống xử lý dữ liệu phải có khả năng gì?

A. Chỉ lưu trữ dữ liệu mà không cần phân tích ngay
B. Giảm khối lượng dữ liệu thu thập
C. Chỉ xử lý dữ liệu theo đợt (batch processing) hàng ngày
D. Xử lý dữ liệu theo thời gian thực (real-time processing) hoặc gần thời gian thực

Câu 9: Một nhà khoa học dữ liệu đang phân tích dữ liệu khảo sát khách hàng có chứa các câu trả lời dạng văn bản tự do, hình ảnh và dữ liệu số. Đặc điểm "Variety" (Đa dạng) của Dữ liệu lớn thể hiện ở đây đòi hỏi điều gì về công cụ và kỹ thuật xử lý?

A. Sử dụng các công cụ và kỹ thuật xử lý đa dạng, có khả năng làm việc với nhiều định dạng dữ liệu khác nhau
B. Chỉ tập trung vào dữ liệu số và bỏ qua các loại dữ liệu khác
C. Chuyển đổi tất cả dữ liệu về cùng một định dạng duy nhất (ví dụ: chỉ văn bản)
D. Giảm kích thước của dữ liệu để dễ xử lý hơn

Câu 10: Thuật toán "tự động hóa" trong Khoa học dữ liệu có ý nghĩa gì đối với hiệu quả công việc?

A. Làm tăng sự phụ thuộc vào công việc thủ công
B. Giảm thiểu sự can thiệp của con người vào các tác vụ lặp đi lặp lại, giúp tăng tốc độ và giảm sai sót
C. Chỉ áp dụng cho giai đoạn thu thập dữ liệu
D. Loại bỏ hoàn toàn nhu cầu về con người trong Khoa học dữ liệu

Câu 11: Giả sử một dự án Khoa học dữ liệu nhằm dự đoán giá nhà dựa trên các đặc điểm của ngôi nhà. Sau khi xây dựng mô hình, giai đoạn tiếp theo quan trọng nhất là gì để biết mô hình có hữu ích hay không?

A. Thu thập thêm dữ liệu về giá nhà
B. Xác định lại vấn đề ban đầu
C. Làm sạch dữ liệu một lần nữa
D. Đánh giá hiệu suất của mô hình bằng các chỉ số phù hợp

Câu 12: Khi một nhà khoa học dữ liệu sử dụng máy tính để chạy các thuật toán phức tạp trên một tập dữ liệu khổng lồ kéo dài nhiều giờ, yếu tố nào của máy tính đang được khai thác tối đa?

A. Năng lực xử lý (Computing Power)
B. Khả năng hiển thị đồ họa
C. Kích thước màn hình
D. Chỉ là công cụ nhập dữ liệu

Câu 13: Đặc điểm "Veracity" (Độ tin cậy) của Dữ liệu lớn đề cập đến khía cạnh nào?

A. Tốc độ dữ liệu được tạo ra
B. Kích thước của tập dữ liệu
C. Tính chính xác, đầy đủ và đáng tin cậy của dữ liệu
D. Sự đa dạng về định dạng dữ liệu

Câu 14: Tại sao việc trực quan hóa dữ liệu (data visualization) thường được thực hiện trong giai đoạn "Chuẩn bị dữ liệu" hoặc "Phân tích dữ liệu" trong Khoa học dữ liệu?

A. Để triển khai mô hình học máy
B. Để khám phá các mẫu, xu hướng, và phát hiện các điểm bất thường hoặc lỗi trong dữ liệu một cách trực quan
C. Để tự động thu thập thêm dữ liệu
D. Để đánh giá hiệu suất cuối cùng của mô hình

Câu 15: Thuật toán nào sau đây có thể được sử dụng để nhóm các khách hàng có hành vi mua sắm tương tự nhau dựa trên dữ liệu lịch sử mua hàng của họ?

A. Thuật toán phân cụm (Clustering)
B. Thuật toán sắp xếp (Sorting)
C. Thuật toán tìm kiếm (Searching)
D. Thuật toán nén dữ liệu (Data Compression)

Câu 16: Giai đoạn cuối cùng trong quy trình Khoa học dữ liệu, nơi mô hình đã xây dựng được đưa vào sử dụng thực tế để tạo ra giá trị (ví dụ: đưa ra khuyến nghị sản phẩm cho khách hàng), được gọi là gì?

A. Thu thập dữ liệu
B. Xây dựng mô hình
C. Đánh giá
D. Triển khai (Deployment)

Câu 17: Hệ thống máy tính phân tán (distributed computing systems) như Hadoop hoặc Spark thường được sử dụng trong Khoa học dữ liệu để xử lý Dữ liệu lớn. Điều này chủ yếu liên quan đến khả năng nào của máy tính?

A. Khả năng hiển thị đồ họa cao
B. Khả năng mở rộng và xử lý song song trên nhiều máy
C. Khả năng tạo ra dữ liệu mới
D. Khả năng giao tiếp với người dùng bằng ngôn ngữ tự nhiên

Câu 18: Khi nào thì việc sử dụng thuật toán "xử lý theo thời gian thực" (real-time processing) trở nên cực kỳ quan trọng trong ứng dụng Khoa học dữ liệu?

A. Khi các quyết định cần được đưa ra ngay lập tức dựa trên dữ liệu đến liên tục (ví dụ: phát hiện gian lận thẻ tín dụng, giám sát hệ thống mạng)
B. Khi chỉ cần phân tích dữ liệu lịch sử
C. Khi dữ liệu có khối lượng nhỏ
D. Khi dữ liệu chỉ có một định dạng duy nhất

Câu 19: Đặc điểm "Volume" (Khối lượng) của Dữ liệu lớn đề cập đến khía cạnh nào?

A. Tốc độ thay đổi của dữ liệu
B. Sự đa dạng của các nguồn dữ liệu
C. Tính chính xác của dữ liệu
D. Kích thước khổng lồ của tập dữ liệu, vượt quá khả năng xử lý của các công cụ truyền thống

Câu 20: Một trong những thách thức lớn nhất khi làm việc với Dữ liệu lớn có đặc điểm "Veracity" (Độ tin cậy) thấp là gì?

A. Khó khăn trong việc lưu trữ dữ liệu
B. Tốc độ xử lý dữ liệu bị chậm lại
C. Kết quả phân tích và mô hình dự đoán có thể không chính xác hoặc sai lệch nghiêm trọng
D. Không thể trực quan hóa dữ liệu

Câu 21: Công việc nào sau đây KHÔNG thuộc về giai đoạn "Chuẩn bị dữ liệu"?

A. Đưa ra quyết định kinh doanh dựa trên kết quả phân tích
B. Xử lý các giá trị bị thiếu (missing values)
C. Chuẩn hóa hoặc mở rộng tỷ lệ dữ liệu (scaling/normalization)
D. Phát hiện và loại bỏ các ngoại lệ (outliers)

Câu 22: Khi một thuật toán học máy được sử dụng để phân loại email thành "spam" hoặc "không spam", đây là một ví dụ về việc áp dụng kiến thức trong giai đoạn nào của quy trình Khoa học dữ liệu?

A. Thu thập dữ liệu
B. Xây dựng mô hình
C. Xác định vấn đề
D. Đánh giá

Câu 23: Yếu tố nào sau đây thể hiện rõ nhất vai trò của thuật toán trong việc giúp máy tính xử lý dữ liệu hiệu quả?

A. Lưu trữ dữ liệu trên ổ cứng
B. Kết nối mạng Internet
C. Hiển thị hình ảnh trên màn hình
D. Cung cấp các bước xử lý logic và tuần tự để máy tính thực hiện các tác vụ phân tích, biến đổi dữ liệu

Câu 24: Đặc điểm "Value" (Giá trị) trong các "Vs" của Dữ liệu lớn đề cập đến điều gì?

A. Khả năng trích xuất thông tin hữu ích và có thể hành động được từ dữ liệu
B. Chi phí để thu thập và lưu trữ dữ liệu
C. Số lượng người dùng truy cập dữ liệu
D. Thời gian cần thiết để xử lý dữ liệu

Câu 25: Nếu một mô hình dự đoán giá nhà (đã xây dựng ở Câu 11) cho kết quả dự đoán rất xa so với giá thực tế trên dữ liệu mới, thì nhà khoa học dữ liệu cần xem xét lại giai đoạn nào trong quy trình?

A. Chỉ cần triển khai mô hình lên hệ thống khác
B. Chỉ cần thu thập thêm dữ liệu mà không cần kiểm tra lại
C. Xem xét lại các giai đoạn Chuẩn bị dữ liệu, Xây dựng mô hình và Đánh giá để tìm ra nguyên nhân (ví dụ: dữ liệu nhiễu, mô hình không phù hợp, đánh giá sai)
D. Bỏ qua mô hình và bắt đầu lại từ đầu

Câu 26: Việc sử dụng các công cụ như bảng biểu, biểu đồ cột, biểu đồ đường để tóm tắt và trình bày dữ liệu thuộc về hoạt động nào trong Khoa học dữ liệu?

A. Xây dựng mô hình
B. Trực quan hóa dữ liệu (Data Visualization)
C. Triển khai mô hình
D. Thu thập dữ liệu

Câu 27: Khả năng nào của máy tính cho phép lưu trữ và quản lý các tập dữ liệu có kích thước rất lớn trong Khoa học dữ liệu?

A. Khả năng lưu trữ (Storage Capacity)
B. Tốc độ xử lý (Processing Speed)
C. Độ phân giải màn hình
D. Khả năng kết nối mạng

Câu 28: So sánh giữa việc xử lý dữ liệu truyền thống và xử lý Dữ liệu lớn, điểm khác biệt cốt lõi về mặt công nghệ là gì?

A. Dữ liệu truyền thống không cần lưu trữ
B. Dữ liệu lớn chỉ sử dụng một loại thuật toán duy nhất
C. Xử lý Dữ liệu lớn thường đòi hỏi các hệ thống phân tán, xử lý song song và các công nghệ chuyên biệt do khối lượng, tốc độ và đa dạng vượt trội
D. Máy tính không cần thiết cho xử lý dữ liệu truyền thống

Câu 29: Một nhà khoa học dữ liệu đang làm việc với dữ liệu từ các tweet trên Twitter để phân tích cảm xúc của người dùng về một sản phẩm. Loại dữ liệu này chủ yếu thuộc đặc điểm nào của Dữ liệu lớn?

A. Variety (Đa dạng - dữ liệu phi cấu trúc/bán cấu trúc)
B. Volume (Khối lượng)
C. Veracity (Độ tin cậy)
D. Value (Giá trị)

Câu 30: Tại sao việc hiểu rõ quy trình Khoa học dữ liệu lại quan trọng đối với người làm việc trong lĩnh vực này?

A. Chỉ cần thiết cho người quản lý dự án, không liên quan đến kỹ thuật
B. Giúp tự động hóa mọi công việc mà không cần suy nghĩ
C. Chỉ để biết tên các giai đoạn mà không cần hiểu nội dung
D. Giúp tiếp cận bài toán một cách có hệ thống, đảm bảo không bỏ sót các bước quan trọng và tăng khả năng thành công của dự án

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 1: Trong quy trình Khoa học dữ liệu, giai đoạn nào đóng vai trò định hình câu hỏi nghiên cứu và xác định mục tiêu cần đạt được?

Xác định vấn đề

Thu thập dữ liệu

Chuẩn bị dữ liệu

Xây dựng mô hình

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Variety (Đa dạng)

Velocity (Tốc độ)

Veracity (Độ tin cậy)

Value (Giá trị)

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 3: Vai trò cốt lõi của máy tính trong việc xử lý dữ liệu lớn trong Khoa học dữ liệu là gì?

Thay thế hoàn toàn con người trong mọi công đoạn

Chỉ đơn thuần là nơi lưu trữ dữ liệu thô

Cung cấp năng lực tính toán mạnh mẽ để phân tích, xử lý và trích xuất thông tin từ dữ liệu quy mô lớn

Tự động tạo ra các câu hỏi nghiên cứu mới

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 4: Giai đoạn 'Chuẩn bị dữ liệu' trong quy trình Khoa học dữ liệu thường bao gồm những công việc nào sau đây?

Xác định mục tiêu kinh doanh và các chỉ số đo lường

Triển khai mô hình đã xây dựng vào môi trường thực tế

Chọn thuật toán học máy phù hợp với bài toán

Làm sạch dữ liệu, xử lý dữ liệu thiếu/nhiễu, và biến đổi dữ liệu về định dạng phù hợp

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 5: Thuật toán 'xử lý song song' mang lại lợi ích gì quan trọng nhất trong xử lý dữ liệu lớn?

Đảm bảo dữ liệu luôn chính xác tuyệt đối

Giảm đáng kể thời gian xử lý bằng cách chia nhỏ và thực hiện đồng thời các tác vụ

Tự động thu thập dữ liệu từ nhiều nguồn khác nhau

Chỉ hoạt động hiệu quả với dữ liệu có cấu trúc đơn giản

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 6: Tại sao khả năng 'mở rộng' (scalability) của hệ thống máy tính lại quan trọng đối với Khoa học dữ liệu, đặc biệt khi làm việc với Dữ liệu lớn?

Vì khối lượng và tốc độ dữ liệu có thể tăng lên nhanh chóng, hệ thống cần có khả năng mở rộng để xử lý kịp thời

Vì nó giúp giảm số lượng thuật toán cần sử dụng

Vì nó chỉ cần thiết cho giai đoạn thu thập dữ liệu

Vì nó giúp giảm chi phí lưu trữ dữ liệu

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 7: Trong quy trình Khoa học dữ liệu, giai đoạn 'Xây dựng mô hình' bao gồm những hoạt động chính nào?

Làm sạch và trực quan hóa dữ liệu

Đánh giá hiệu suất của mô hình đã triển khai

Lựa chọn thuật toán, huấn luyện mô hình trên dữ liệu đã chuẩn bị và điều chỉnh tham số

Xác định các nguồn dữ liệu tiềm năng

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 8: Dữ liệu từ cảm biến IoT (Internet of Things) trong các nhà máy hoặc hệ thống giao thông thường có đặc điểm 'Velocity' (Tốc độ) rất cao. Điều này đòi hỏi hệ thống xử lý dữ liệu phải có khả năng gì?

Chỉ lưu trữ dữ liệu mà không cần phân tích ngay

Giảm khối lượng dữ liệu thu thập

Chỉ xử lý dữ liệu theo đợt (batch processing) hàng ngày

Xử lý dữ liệu theo thời gian thực (real-time processing) hoặc gần thời gian thực

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 9: Một nhà khoa học dữ liệu đang phân tích dữ liệu khảo sát khách hàng có chứa các câu trả lời dạng văn bản tự do, hình ảnh và dữ liệu số. Đặc điểm 'Variety' (Đa dạng) của Dữ liệu lớn thể hiện ở đây đòi hỏi điều gì về công cụ và kỹ thuật xử lý?

Sử dụng các công cụ và kỹ thuật xử lý đa dạng, có khả năng làm việc với nhiều định dạng dữ liệu khác nhau

Chỉ tập trung vào dữ liệu số và bỏ qua các loại dữ liệu khác

Chuyển đổi tất cả dữ liệu về cùng một định dạng duy nhất (ví dụ: chỉ văn bản)

Giảm kích thước của dữ liệu để dễ xử lý hơn

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 10: Thuật toán 'tự động hóa' trong Khoa học dữ liệu có ý nghĩa gì đối với hiệu quả công việc?

Làm tăng sự phụ thuộc vào công việc thủ công

Giảm thiểu sự can thiệp của con người vào các tác vụ lặp đi lặp lại, giúp tăng tốc độ và giảm sai sót

Chỉ áp dụng cho giai đoạn thu thập dữ liệu

Loại bỏ hoàn toàn nhu cầu về con người trong Khoa học dữ liệu

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Thu thập thêm dữ liệu về giá nhà

Xác định lại vấn đề ban đầu

Làm sạch dữ liệu một lần nữa

Đánh giá hiệu suất của mô hình bằng các chỉ số phù hợp

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Năng lực xử lý (Computing Power)

Khả năng hiển thị đồ họa

Kích thước màn hình

Chỉ là công cụ nhập dữ liệu

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 13: Đặc điểm 'Veracity' (Độ tin cậy) của Dữ liệu lớn đề cập đến khía cạnh nào?

Tốc độ dữ liệu được tạo ra

Kích thước của tập dữ liệu

Tính chính xác, đầy đủ và đáng tin cậy của dữ liệu

Sự đa dạng về định dạng dữ liệu

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 14: Tại sao việc trực quan hóa dữ liệu (data visualization) thường được thực hiện trong giai đoạn 'Chuẩn bị dữ liệu' hoặc 'Phân tích dữ liệu' trong Khoa học dữ liệu?

Để triển khai mô hình học máy

Để khám phá các mẫu, xu hướng, và phát hiện các điểm bất thường hoặc lỗi trong dữ liệu một cách trực quan

Để tự động thu thập thêm dữ liệu

Để đánh giá hiệu suất cuối cùng của mô hình

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 15: Thuật toán nào sau đây có thể được sử dụng để nhóm các khách hàng có hành vi mua sắm tương tự nhau dựa trên dữ liệu lịch sử mua hàng của họ?

Thuật toán phân cụm (Clustering)

Thuật toán sắp xếp (Sorting)

Thuật toán tìm kiếm (Searching)

Thuật toán nén dữ liệu (Data Compression)

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Thu thập dữ liệu

Xây dựng mô hình

Đánh giá

Triển khai (Deployment)

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Khả năng hiển thị đồ họa cao

Khả năng mở rộng và xử lý song song trên nhiều máy

Khả năng tạo ra dữ liệu mới

Khả năng giao tiếp với người dùng bằng ngôn ngữ tự nhiên

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 18: Khi nào thì việc sử dụng thuật toán 'xử lý theo thời gian thực' (real-time processing) trở nên cực kỳ quan trọng trong ứng dụng Khoa học dữ liệu?

Khi các quyết định cần được đưa ra ngay lập tức dựa trên dữ liệu đến liên tục (ví dụ: phát hiện gian lận thẻ tín dụng, giám sát hệ thống mạng)

Khi chỉ cần phân tích dữ liệu lịch sử

Khi dữ liệu có khối lượng nhỏ

Khi dữ liệu chỉ có một định dạng duy nhất

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 19: Đặc điểm 'Volume' (Khối lượng) của Dữ liệu lớn đề cập đến khía cạnh nào?

Tốc độ thay đổi của dữ liệu

Sự đa dạng của các nguồn dữ liệu

Tính chính xác của dữ liệu

Kích thước khổng lồ của tập dữ liệu, vượt quá khả năng xử lý của các công cụ truyền thống

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 20: Một trong những thách thức lớn nhất khi làm việc với Dữ liệu lớn có đặc điểm 'Veracity' (Độ tin cậy) thấp là gì?

Khó khăn trong việc lưu trữ dữ liệu

Tốc độ xử lý dữ liệu bị chậm lại

Kết quả phân tích và mô hình dự đoán có thể không chính xác hoặc sai lệch nghiêm trọng

Không thể trực quan hóa dữ liệu

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 21: Công việc nào sau đây KHÔNG thuộc về giai đoạn 'Chuẩn bị dữ liệu'?

Đưa ra quyết định kinh doanh dựa trên kết quả phân tích

Xử lý các giá trị bị thiếu (missing values)

Chuẩn hóa hoặc mở rộng tỷ lệ dữ liệu (scaling/normalization)

Phát hiện và loại bỏ các ngoại lệ (outliers)

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 22: Khi một thuật toán học máy được sử dụng để phân loại email thành 'spam' hoặc 'không spam', đây là một ví dụ về việc áp dụng kiến thức trong giai đoạn nào của quy trình Khoa học dữ liệu?

Thu thập dữ liệu

Xây dựng mô hình

Xác định vấn đề

Đánh giá

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 23: Yếu tố nào sau đây thể hiện rõ nhất vai trò của thuật toán trong việc giúp máy tính xử lý dữ liệu hiệu quả?

Lưu trữ dữ liệu trên ổ cứng

Kết nối mạng Internet

Hiển thị hình ảnh trên màn hình

Cung cấp các bước xử lý logic và tuần tự để máy tính thực hiện các tác vụ phân tích, biến đổi dữ liệu

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 24: Đặc điểm 'Value' (Giá trị) trong các 'Vs' của Dữ liệu lớn đề cập đến điều gì?

Khả năng trích xuất thông tin hữu ích và có thể hành động được từ dữ liệu

Chi phí để thu thập và lưu trữ dữ liệu

Số lượng người dùng truy cập dữ liệu

Thời gian cần thiết để xử lý dữ liệu

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Chỉ cần triển khai mô hình lên hệ thống khác

Chỉ cần thu thập thêm dữ liệu mà không cần kiểm tra lại

Xem xét lại các giai đoạn Chuẩn bị dữ liệu, Xây dựng mô hình và Đánh giá để tìm ra nguyên nhân (ví dụ: dữ liệu nhiễu, mô hình không phù hợp, đánh giá sai)

Bỏ qua mô hình và bắt đầu lại từ đầu

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Xây dựng mô hình

Trực quan hóa dữ liệu (Data Visualization)

Triển khai mô hình

Thu thập dữ liệu

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 27: Khả năng nào của máy tính cho phép lưu trữ và quản lý các tập dữ liệu có kích thước rất lớn trong Khoa học dữ liệu?

Khả năng lưu trữ (Storage Capacity)

Tốc độ xử lý (Processing Speed)

Độ phân giải màn hình

Khả năng kết nối mạng

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 28: So sánh giữa việc xử lý dữ liệu truyền thống và xử lý Dữ liệu lớn, điểm khác biệt cốt lõi về mặt công nghệ là gì?

Dữ liệu truyền thống không cần lưu trữ

Dữ liệu lớn chỉ sử dụng một loại thuật toán duy nhất

Xử lý Dữ liệu lớn thường đòi hỏi các hệ thống phân tán, xử lý song song và các công nghệ chuyên biệt do khối lượng, tốc độ và đa dạng vượt trội

Máy tính không cần thiết cho xử lý dữ liệu truyền thống

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Variety (Đa dạng - dữ liệu phi cấu trúc/bán cấu trúc)

Volume (Khối lượng)

Veracity (Độ tin cậy)

Value (Giá trị)

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 30: Tại sao việc hiểu rõ quy trình Khoa học dữ liệu lại quan trọng đối với người làm việc trong lĩnh vực này?

Chỉ cần thiết cho người quản lý dự án, không liên quan đến kỹ thuật

Giúp tự động hóa mọi công việc mà không cần suy nghĩ

Chỉ để biết tên các giai đoạn mà không cần hiểu nội dung

Giúp tiếp cận bài toán một cách có hệ thống, đảm bảo không bỏ sót các bước quan trọng và tăng khả năng thành công của dự án

Xem kết quả

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Nhận kết quả

Xảy ra lỗi

Bước 1: Vào google.com rồi gõ từ khóa:
Copy nhanh thanh-tim-kiem

Bước 2: Trong kết quả tìm kiếm Google, hãy tìm website giống hình bên dưới

Nếu trang 1 không có hãy tìm ở trang 2, 3, 4... nhé trang-google

Bước 3:

Cuộn xuống cuối bài viết rồi bấm vào nút GIỐNG HÌNH DƯỚI và chờ 1 lát để lấy mã:

luot-xem

Nếu tìm không thấy mã bạn có thể Đổi nhiệm vụ để lấy mã khác.

By Wordpress Quiz plugin

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!

Trắc nghiệm Công nghệ 10 Kết nối tri thức Bài 11: Hình chiếu trục đo

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 05

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 05 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Một nhà khoa học dữ liệu đang làm việc với tập dữ liệu bao gồm hàng tỷ giao dịch mua sắm trực tuyến mỗi ngày. Đặc điểm nào của dữ liệu lớn (Big Data) được thể hiện rõ nhất trong tình huống này?

A. Khối lượng (Volume)
B. Đa dạng (Variety)
C. Tốc độ (Velocity)
D. Độ tin cậy (Veracity)

Câu 2: Trong quy trình Khoa học dữ liệu, sau khi đã thu thập dữ liệu thô từ nhiều nguồn khác nhau, nhà khoa học dữ liệu cần thực hiện bước tiếp theo là gì để đảm bảo dữ liệu sẵn sàng cho việc phân tích và xây dựng mô hình?

A. Xây dựng mô hình
B. Triển khai kết quả
C. Chuẩn bị và làm sạch dữ liệu
D. Đánh giá mô hình

Câu 3: Máy tính đóng vai trò then chốt trong việc xử lý dữ liệu lớn bởi vì nó cung cấp khả năng tính toán mạnh mẽ. Điều này đặc biệt quan trọng khi thực hiện các tác vụ đòi hỏi nhiều tài nguyên như:

A. Lưu trữ dữ liệu dưới dạng văn bản
B. Hiển thị dữ liệu trên màn hình
C. Nhập liệu thủ công
D. Huấn luyện các mô hình học máy phức tạp

Câu 4: Một thuật toán được thiết kế để phân loại email thành "thư rác" hoặc "không phải thư rác" dựa trên nội dung và người gửi. Thuật toán này đang thực hiện chức năng chính nào trong Khoa học dữ liệu?

A. Thu thập dữ liệu
B. Phân tích và xử lý dữ liệu
C. Trực quan hóa dữ liệu
D. Xác định vấn đề

Câu 5: Đặc điểm "Đa dạng" (Variety) của dữ liệu lớn đề cập đến điều gì?

A. Dữ liệu có nhiều định dạng khác nhau (văn bản, hình ảnh, âm thanh, video, dữ liệu cấu trúc, bán cấu trúc, phi cấu trúc).
B. Dữ liệu được tạo ra với tốc độ rất nhanh.
C. Dữ liệu có dung lượng rất lớn.
D. Dữ liệu có độ chính xác cao.

Câu 6: Trong quy trình Khoa học dữ liệu, giai đoạn nào quan trọng nhất trong việc đảm bảo kết quả phân tích là đáng tin cậy và có ý nghĩa?

A. Thu thập dữ liệu (vì cần nhiều dữ liệu)
B. Chuẩn bị và làm sạch dữ liệu (vì loại bỏ sai sót, thiếu sót)
C. Xây dựng mô hình (vì mô hình càng phức tạp càng tốt)
D. Triển khai kết quả (vì đây là bước cuối cùng)

Câu 7: Máy tính hiện đại có khả năng xử lý song song, tức là thực hiện nhiều tác vụ cùng lúc. Khả năng này mang lại lợi ích gì rõ rệt nhất trong việc xử lý dữ liệu lớn?

A. Giảm yêu cầu về lưu trữ dữ liệu
B. Tăng tính đa dạng của dữ liệu
C. Đảm bảo độ chính xác tuyệt đối của dữ liệu
D. Tăng tốc độ xử lý các tập dữ liệu khổng lồ

Câu 8: Một công ty muốn dự đoán xu hướng mua hàng của khách hàng trong 3 tháng tới dựa trên lịch sử giao dịch 5 năm qua. Giai đoạn nào trong quy trình Khoa học dữ liệu đang được thực hiện khi họ chọn thuật toán dự báo phù hợp (ví dụ: hồi quy, chuỗi thời gian)?

A. Xây dựng mô hình
B. Thu thập dữ liệu
C. Đánh giá mô hình
D. Triển khai kết quả

Câu 9: "Độ tin cậy" (Veracity) là một trong những đặc điểm của dữ liệu lớn. Yếu tố nào sau đây liên quan trực tiếp đến "Độ tin cậy"?

A. Số lượng bản ghi trong tập dữ liệu.
B. Tốc độ mà dữ liệu được tạo ra.
C. Tính chính xác, đầy đủ và đáng tin cậy của dữ liệu.
D. Số lượng các định dạng dữ liệu khác nhau.

Câu 10: Thuật toán tự động hóa trong xử lý dữ liệu lớn mang lại lợi ích chính nào cho con người?

A. Giảm khả năng mở rộng của hệ thống.
B. Giảm thiểu công sức làm việc thủ công, cho phép tập trung vào phân tích chuyên sâu.
C. Tăng chi phí lưu trữ dữ liệu.
D. Hạn chế khả năng xử lý dữ liệu theo thời gian thực.

Câu 11: Một nhà khoa học dữ liệu vừa hoàn thành việc huấn luyện một mô hình dự đoán. Bước tiếp theo trong quy trình Khoa học dữ liệu là gì để xác định mô hình có hoạt động tốt hay không?

A. Thu thập thêm dữ liệu
B. Xác định lại vấn đề
C. Làm sạch lại dữ liệu
D. Đánh giá mô hình

Câu 12: Khả năng "mở rộng" (scalability) của hệ thống máy tính là yếu tố quan trọng trong xử lý dữ liệu lớn vì nó cho phép:

A. Hệ thống tăng cường năng lực xử lý và lưu trữ khi khối lượng dữ liệu tăng lên.
B. Chỉ xử lý được dữ liệu có cấu trúc.
C. Giảm tốc độ xử lý khi thêm tài nguyên.
D. Hạn chế số lượng người dùng truy cập.

Câu 13: Yếu tố nào sau đây là một ví dụ về dữ liệu phi cấu trúc (unstructured data) mà Khoa học dữ liệu thường xuyên xử lý?

A. Dữ liệu trong bảng cơ sở dữ liệu quan hệ (các cột, hàng rõ ràng).
B. Nội dung các bài đăng trên mạng xã hội.
C. Dữ liệu từ cảm biến nhiệt độ (chuỗi số).
D. Thông tin khách hàng trong bảng tính Excel.

Câu 14: Một công ty logistic cần tối ưu hóa tuyến đường giao hàng cho hàng ngàn bưu kiện mỗi ngày, xét đến các yếu tố như khoảng cách, thời gian giao nhận, và năng lực xe. Vấn đề này có thể được giải quyết hiệu quả nhất bằng cách áp dụng:

A. Quy trình nhập liệu thủ công.
B. Lưu trữ dữ liệu trên giấy.
C. Thiết kế và triển khai các thuật toán tối ưu hóa.
D. Chỉ sử dụng máy tính để hiển thị bản đồ.

Câu 15: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại là một bước quan trọng trong giai đoạn chuẩn bị dữ liệu của quy trình Khoa học dữ liệu?

A. Giúp con người dễ dàng phát hiện xu hướng, mẫu hình và các bất thường trong dữ liệu.
B. Tự động làm sạch tất cả các lỗi trong dữ liệu.
C. Là bước cuối cùng trước khi triển khai mô hình.
D. Chỉ cần thiết khi dữ liệu có dung lượng nhỏ.

Câu 16: Một hệ thống phát hiện gian lận thẻ tín dụng cần phân tích hàng triệu giao dịch trong thời gian rất ngắn để xác định giao dịch đáng ngờ ngay lập tức. Khía cạnh nào của dữ liệu lớn và khả năng của máy tính là quan trọng nhất trong trường hợp này?

A. Khối lượng và khả năng lưu trữ lớn.
B. Đa dạng và khả năng trực quan hóa.
C. Độ tin cậy và khả năng tự động hóa.
D. Tốc độ và khả năng xử lý theo thời gian thực.

Câu 17: Khi một mô hình học máy đã được xây dựng và đánh giá là có hiệu quả tốt trên dữ liệu thử nghiệm, bước tiếp theo trong quy trình Khoa học dữ liệu là gì để đưa mô hình vào ứng dụng thực tế?

A. Thu thập thêm dữ liệu mới.
B. Xây dựng lại mô hình.
C. Triển khai mô hình.
D. Quay lại bước xác định vấn đề.

Câu 18: Thuật toán đóng vai trò trung tâm trong Khoa học dữ liệu vì chúng cung cấp:

A. Các phương pháp có hệ thống để xử lý, phân tích và rút trích thông tin từ dữ liệu.
B. Năng lực lưu trữ vật lý cho dữ liệu.
C. Giao diện đồ họa để người dùng tương tác.
D. Nguồn dữ liệu ban đầu.

Câu 19: "Giá trị" (Value) trong các đặc điểm của dữ liệu lớn đề cập đến điều gì?

A. Chi phí để lưu trữ dữ liệu.
B. Thời gian cần thiết để xử lý dữ liệu.
C. Số lượng người tạo ra dữ liệu.
D. Khả năng chuyển đổi dữ liệu thành thông tin có ý nghĩa và hành động cụ thể.

Câu 20: Khi một nhà khoa học dữ liệu phát hiện ra rằng mô hình dự đoán của họ không đạt được độ chính xác như mong muốn trong giai đoạn đánh giá, họ nên làm gì tiếp theo trong quy trình Khoa học dữ liệu?

A. Triển khai mô hình ngay lập tức.
B. Xem xét lại các bước trước đó như chuẩn bị dữ liệu hoặc xây dựng mô hình.
C. Bỏ qua kết quả đánh giá và kết thúc dự án.
D. Chỉ cần thu thập thêm dữ liệu mà không thay đổi gì khác.

Câu 21: Máy tính có khả năng kết nối mạng mạnh mẽ. Khả năng này hỗ trợ Khoa học dữ liệu như thế nào?

A. Giúp thu thập dữ liệu từ các nguồn phân tán và chia sẻ kết quả phân tích.
B. Làm giảm khối lượng dữ liệu cần xử lý.
C. Chỉ quan trọng cho việc in ấn báo cáo.
D. Thay thế hoàn toàn nhu cầu về thuật toán.

Câu 22: Phân tích cảm xúc từ các bình luận của khách hàng trên website là một ví dụ về việc xử lý loại dữ liệu nào và ứng dụng của Khoa học dữ liệu?

A. Dữ liệu có cấu trúc và dự báo.
B. Dữ liệu số và phân loại.
C. Dữ liệu bán cấu trúc và hồi quy.
D. Dữ liệu phi cấu trúc (văn bản) và phân tích văn bản/phân loại.

Câu 23: Việc sử dụng các hệ thống máy tính phân tán (ví dụ: điện toán đám mây) trong Khoa học dữ liệu chủ yếu nhằm mục đích gì?

A. Làm cho dữ liệu kém đa dạng hơn.
B. Tăng cường khả năng xử lý và lưu trữ cho các tập dữ liệu rất lớn.
C. Giảm tốc độ truy cập dữ liệu.
D. Chỉ để trực quan hóa dữ liệu.

Câu 24: Bước "Xác định vấn đề" trong quy trình Khoa học dữ liệu có ý nghĩa như thế nào đối với toàn bộ dự án?

A. Thiết lập mục tiêu rõ ràng, định hướng cho các bước tiếp theo và tiêu chí đánh giá thành công.
B. Là bước chỉ liên quan đến việc thu thập dữ liệu.
C. Chỉ cần thiết khi dữ liệu đã được thu thập đầy đủ.
D. Không ảnh hưởng đến việc chọn thuật toán.

Câu 25: Thuật toán nào thường được sử dụng trong Khoa học dữ liệu để tìm ra các nhóm đối tượng tương đồng trong một tập dữ liệu lớn (ví dụ: phân khúc khách hàng)?

A. Thuật toán hồi quy.
B. Thuật toán phân loại.
C. Thuật toán dự báo chuỗi thời gian.
D. Thuật toán phân cụm (Clustering).

Câu 26: Một trong những thách thức lớn khi xử lý dữ liệu lớn là "Tốc độ" (Velocity). Thách thức này đòi hỏi hệ thống máy tính và thuật toán phải có khả năng gì?

A. Lưu trữ dữ liệu vĩnh viễn.
B. Xử lý và phân tích dữ liệu gần như ngay lập tức khi dữ liệu được tạo ra hoặc cập nhật.
C. Giảm số lượng các nguồn dữ liệu.
D. Chỉ xử lý dữ liệu cũ, không thay đổi.

Câu 27: Khoa học dữ liệu là lĩnh vực liên ngành. Những lĩnh vực chính nào thường kết hợp với nhau để tạo nên Khoa học dữ liệu?

A. Toán học & Thống kê, Khoa học Máy tính, Kiến thức chuyên môn về lĩnh vực cụ thể.
B. Văn học, Lịch sử, Địa lý.
C. Hội họa, Âm nhạc, Điêu khắc.
D. Thiết kế đồ họa, Quay phim, Dựng phim.

Câu 28: Khi triển khai một mô hình Khoa học dữ liệu vào môi trường thực tế (ví dụ: tích hợp vào website để đưa ra gợi ý sản phẩm), điều gì là quan trọng để đảm bảo mô hình tiếp tục hoạt động hiệu quả theo thời gian?

A. Ngừng thu thập dữ liệu mới.
B. Thay đổi thuật toán liên tục một cách ngẫu nhiên.
C. Giám sát hiệu suất của mô hình và cập nhật/huấn luyện lại khi cần thiết.
D. Chỉ sử dụng mô hình trong một khoảng thời gian ngắn.

Câu 29: Vai trò của thuật toán trong giai đoạn "Chuẩn bị dữ liệu" có thể bao gồm những công việc nào?

A. Chỉ đơn thuần hiển thị dữ liệu thô.
B. Dự đoán kết quả cuối cùng của dự án.
C. Thu thập dữ liệu mới từ các nguồn khác nhau.
D. Tự động phát hiện và xử lý các giá trị thiếu, ngoại lai, hoặc chuyển đổi định dạng dữ liệu.

Câu 30: Khoa học dữ liệu giúp các tổ chức đưa ra quyết định dựa trên dữ liệu (data-driven decisions). Điều này có ý nghĩa gì so với việc đưa ra quyết định dựa trên trực giác hoặc kinh nghiệm cá nhân?

A. Quyết định có cơ sở khoa học, khách quan hơn, giảm thiểu rủi ro và có khả năng mang lại hiệu quả cao hơn.
B. Quyết định tốn kém hơn và chậm hơn.
C. Quyết định chỉ phù hợp với dữ liệu nhỏ.
D. Quyết định hoàn toàn tự động, không cần sự can thiệp của con người.

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Khối lượng (Volume)

Đa dạng (Variety)

Tốc độ (Velocity)

Độ tin cậy (Veracity)

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Xây dựng mô hình

Triển khai kết quả

Chuẩn bị và làm sạch dữ liệu

Đánh giá mô hình

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Lưu trữ dữ liệu dưới dạng văn bản

Hiển thị dữ liệu trên màn hình

Nhập liệu thủ công

Huấn luyện các mô hình học máy phức tạp

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 4: Một thuật toán được thiết kế để phân loại email thành 'thư rác' hoặc 'không phải thư rác' dựa trên nội dung và người gửi. Thuật toán này đang thực hiện chức năng chính nào trong Khoa học dữ liệu?

Thu thập dữ liệu

Phân tích và xử lý dữ liệu

Trực quan hóa dữ liệu

Xác định vấn đề

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 5: Đặc điểm 'Đa dạng' (Variety) của dữ liệu lớn đề cập đến điều gì?

Dữ liệu có nhiều định dạng khác nhau (văn bản, hình ảnh, âm thanh, video, dữ liệu cấu trúc, bán cấu trúc, phi cấu trúc).

Dữ liệu được tạo ra với tốc độ rất nhanh.

Dữ liệu có dung lượng rất lớn.

Dữ liệu có độ chính xác cao.

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 6: Trong quy trình Khoa học dữ liệu, giai đoạn nào quan trọng nhất trong việc đảm bảo kết quả phân tích là đáng tin cậy và có ý nghĩa?

Thu thập dữ liệu (vì cần nhiều dữ liệu)

Chuẩn bị và làm sạch dữ liệu (vì loại bỏ sai sót, thiếu sót)

Xây dựng mô hình (vì mô hình càng phức tạp càng tốt)

Triển khai kết quả (vì đây là bước cuối cùng)

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Máy tính hiện đại có khả năng xử lý song song, tức là thực hiện nhiều tác vụ cùng lúc. Khả năng này mang lại lợi ích gì rõ rệt nhất trong việc xử lý dữ liệu lớn?

Giảm yêu cầu về lưu trữ dữ liệu

Tăng tính đa dạng của dữ liệu

Đảm bảo độ chính xác tuyệt đối của dữ liệu

Tăng tốc độ xử lý các tập dữ liệu khổng lồ

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Xây dựng mô hình

Thu thập dữ liệu

Đánh giá mô hình

Triển khai kết quả

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 9: 'Độ tin cậy' (Veracity) là một trong những đặc điểm của dữ liệu lớn. Yếu tố nào sau đây liên quan trực tiếp đến 'Độ tin cậy'?

Số lượng bản ghi trong tập dữ liệu.

Tốc độ mà dữ liệu được tạo ra.

Tính chính xác, đầy đủ và đáng tin cậy của dữ liệu.

Số lượng các định dạng dữ liệu khác nhau.

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 10: Thuật toán tự động hóa trong xử lý dữ liệu lớn mang lại lợi ích chính nào cho con người?

Giảm khả năng mở rộng của hệ thống.

Giảm thiểu công sức làm việc thủ công, cho phép tập trung vào phân tích chuyên sâu.

Tăng chi phí lưu trữ dữ liệu.

Hạn chế khả năng xử lý dữ liệu theo thời gian thực.

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Thu thập thêm dữ liệu

Xác định lại vấn đề

Làm sạch lại dữ liệu

Đánh giá mô hình

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 12: Khả năng 'mở rộng' (scalability) của hệ thống máy tính là yếu tố quan trọng trong xử lý dữ liệu lớn vì nó cho phép:

Hệ thống tăng cường năng lực xử lý và lưu trữ khi khối lượng dữ liệu tăng lên.

Chỉ xử lý được dữ liệu có cấu trúc.

Giảm tốc độ xử lý khi thêm tài nguyên.

Hạn chế số lượng người dùng truy cập.

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 13: Yếu tố nào sau đây là một ví dụ về dữ liệu phi cấu trúc (unstructured data) mà Khoa học dữ liệu thường xuyên xử lý?

Dữ liệu trong bảng cơ sở dữ liệu quan hệ (các cột, hàng rõ ràng).

Nội dung các bài đăng trên mạng xã hội.

Dữ liệu từ cảm biến nhiệt độ (chuỗi số).

Thông tin khách hàng trong bảng tính Excel.

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Quy trình nhập liệu thủ công.

Lưu trữ dữ liệu trên giấy.

Thiết kế và triển khai các thuật toán tối ưu hóa.

Chỉ sử dụng máy tính để hiển thị bản đồ.

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 15: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại là một bước quan trọng trong giai đoạn chuẩn bị dữ liệu của quy trình Khoa học dữ liệu?

Giúp con người dễ dàng phát hiện xu hướng, mẫu hình và các bất thường trong dữ liệu.

Tự động làm sạch tất cả các lỗi trong dữ liệu.

Là bước cuối cùng trước khi triển khai mô hình.

Chỉ cần thiết khi dữ liệu có dung lượng nhỏ.

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Khối lượng và khả năng lưu trữ lớn.

Đa dạng và khả năng trực quan hóa.

Độ tin cậy và khả năng tự động hóa.

Tốc độ và khả năng xử lý theo thời gian thực.

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Thu thập thêm dữ liệu mới.

Xây dựng lại mô hình.

Triển khai mô hình.

Quay lại bước xác định vấn đề.

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 18: Thuật toán đóng vai trò trung tâm trong Khoa học dữ liệu vì chúng cung cấp:

Các phương pháp có hệ thống để xử lý, phân tích và rút trích thông tin từ dữ liệu.

Năng lực lưu trữ vật lý cho dữ liệu.

Giao diện đồ họa để người dùng tương tác.

Nguồn dữ liệu ban đầu.

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 19: 'Giá trị' (Value) trong các đặc điểm của dữ liệu lớn đề cập đến điều gì?

Chi phí để lưu trữ dữ liệu.

Thời gian cần thiết để xử lý dữ liệu.

Số lượng người tạo ra dữ liệu.

Khả năng chuyển đổi dữ liệu thành thông tin có ý nghĩa và hành động cụ thể.

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Triển khai mô hình ngay lập tức.

Xem xét lại các bước trước đó như chuẩn bị dữ liệu hoặc xây dựng mô hình.

Bỏ qua kết quả đánh giá và kết thúc dự án.

Chỉ cần thu thập thêm dữ liệu mà không thay đổi gì khác.

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 21: Máy tính có khả năng kết nối mạng mạnh mẽ. Khả năng này hỗ trợ Khoa học dữ liệu như thế nào?

Giúp thu thập dữ liệu từ các nguồn phân tán và chia sẻ kết quả phân tích.

Làm giảm khối lượng dữ liệu cần xử lý.

Chỉ quan trọng cho việc in ấn báo cáo.

Thay thế hoàn toàn nhu cầu về thuật toán.

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 22: Phân tích cảm xúc từ các bình luận của khách hàng trên website là một ví dụ về việc xử lý loại dữ liệu nào và ứng dụng của Khoa học dữ liệu?

Dữ liệu có cấu trúc và dự báo.

Dữ liệu số và phân loại.

Dữ liệu bán cấu trúc và hồi quy.

Dữ liệu phi cấu trúc (văn bản) và phân tích văn bản/phân loại.

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 23: Việc sử dụng các hệ thống máy tính phân tán (ví dụ: điện toán đám mây) trong Khoa học dữ liệu chủ yếu nhằm mục đích gì?

Làm cho dữ liệu kém đa dạng hơn.

Tăng cường khả năng xử lý và lưu trữ cho các tập dữ liệu rất lớn.

Giảm tốc độ truy cập dữ liệu.

Chỉ để trực quan hóa dữ liệu.

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 24: Bước 'Xác định vấn đề' trong quy trình Khoa học dữ liệu có ý nghĩa như thế nào đối với toàn bộ dự án?

Thiết lập mục tiêu rõ ràng, định hướng cho các bước tiếp theo và tiêu chí đánh giá thành công.

Là bước chỉ liên quan đến việc thu thập dữ liệu.

Chỉ cần thiết khi dữ liệu đã được thu thập đầy đủ.

Không ảnh hưởng đến việc chọn thuật toán.

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Thuật toán hồi quy.

Thuật toán phân loại.

Thuật toán dự báo chuỗi thời gian.

Thuật toán phân cụm (Clustering).

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 26: Một trong những thách thức lớn khi xử lý dữ liệu lớn là 'Tốc độ' (Velocity). Thách thức này đòi hỏi hệ thống máy tính và thuật toán phải có khả năng gì?

Lưu trữ dữ liệu vĩnh viễn.

Xử lý và phân tích dữ liệu gần như ngay lập tức khi dữ liệu được tạo ra hoặc cập nhật.

Giảm số lượng các nguồn dữ liệu.

Chỉ xử lý dữ liệu cũ, không thay đổi.

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 27: Khoa học dữ liệu là lĩnh vực liên ngành. Những lĩnh vực chính nào thường kết hợp với nhau để tạo nên Khoa học dữ liệu?

Toán học & Thống kê, Khoa học Máy tính, Kiến thức chuyên môn về lĩnh vực cụ thể.

Văn học, Lịch sử, Địa lý.

Hội họa, Âm nhạc, Điêu khắc.

Thiết kế đồ họa, Quay phim, Dựng phim.

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Ngừng thu thập dữ liệu mới.

Thay đổi thuật toán liên tục một cách ngẫu nhiên.

Giám sát hiệu suất của mô hình và cập nhật/huấn luyện lại khi cần thiết.

Chỉ sử dụng mô hình trong một khoảng thời gian ngắn.

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 29: Vai trò của thuật toán trong giai đoạn 'Chuẩn bị dữ liệu' có thể bao gồm những công việc nào?

Chỉ đơn thuần hiển thị dữ liệu thô.

Dự đoán kết quả cuối cùng của dự án.

Thu thập dữ liệu mới từ các nguồn khác nhau.

Tự động phát hiện và xử lý các giá trị thiếu, ngoại lai, hoặc chuyển đổi định dạng dữ liệu.

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 5

Quyết định có cơ sở khoa học, khách quan hơn, giảm thiểu rủi ro và có khả năng mang lại hiệu quả cao hơn.

Quyết định tốn kém hơn và chậm hơn.

Quyết định chỉ phù hợp với dữ liệu nhỏ.

Quyết định hoàn toàn tự động, không cần sự can thiệp của con người.

Xem kết quả

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Nhận kết quả

Xảy ra lỗi

Bước 1: Vào google.com rồi gõ từ khóa:
Copy nhanh thanh-tim-kiem

Bước 2: Trong kết quả tìm kiếm Google, hãy tìm website giống hình bên dưới

Nếu trang 1 không có hãy tìm ở trang 2, 3, 4... nhé trang-google

Bước 3:

Cuộn xuống cuối bài viết rồi bấm vào nút GIỐNG HÌNH DƯỚI và chờ 1 lát để lấy mã:

luot-xem

Nếu tìm không thấy mã bạn có thể Đổi nhiệm vụ để lấy mã khác.

By Wordpress Quiz plugin

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 06

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 06 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Vai trò cốt lõi nào của máy tính khiến nó trở thành công cụ không thể thiếu trong Khoa học dữ liệu, đặc biệt khi làm việc với tập dữ liệu lớn?

A. Khả năng tạo ra dữ liệu mới liên tục
B. Cung cấp giao diện người dùng thân thiện cho mọi đối tượng
C. Năng lực tính toán và xử lý dữ liệu quy mô lớn với tốc độ cao
D. Tự động diễn giải kết quả phân tích mà không cần sự can thiệp của con người

Câu 2: Trong quy trình Khoa học dữ liệu, giai đoạn nào thường bao gồm các công việc như làm sạch dữ liệu bị thiếu hoặc không nhất quán, chuyển đổi định dạng dữ liệu và tích hợp dữ liệu từ nhiều nguồn khác nhau?

A. Xác định vấn đề
B. Chuẩn bị dữ liệu
C. Xây dựng mô hình
D. Triển khai

Câu 3: Một công ty thương mại điện tử thu thập dữ liệu từ hàng triệu lượt truy cập website mỗi ngày, bao gồm lịch sử xem sản phẩm, hành vi click, và thông tin giỏ hàng. Dữ liệu này có đặc điểm "Tốc độ" (Velocity) cao. Điều này có ý nghĩa quan trọng nhất đối với công ty như thế nào?

A. Dữ liệu này rất đa dạng về định dạng.
B. Khối lượng dữ liệu rất lớn và khó lưu trữ.
C. Cần đảm bảo dữ liệu luôn chính xác 100%.
D. Cần có khả năng xử lý và phân tích dữ liệu gần như ngay lập tức để đưa ra quyết định kịp thời (ví dụ: gợi ý sản phẩm).

Câu 4: Thuật toán xử lý song song đóng vai trò quan trọng trong xử lý dữ liệu lớn vì nó cho phép:

A. Chia nhỏ dữ liệu và xử lý đồng thời trên nhiều bộ xử lý hoặc máy tính.
B. Giảm thiểu khối lượng dữ liệu cần xử lý.
C. Tự động xác định vấn đề cần giải quyết từ dữ liệu.
D. Trực quan hóa dữ liệu một cách tự động.

Câu 5: Bạn đang phân tích dữ liệu phản hồi của khách hàng từ các mạng xã hội, email, và khảo sát văn bản. Loại dữ liệu này thường là "phi cấu trúc" hoặc "bán cấu trúc". Đặc điểm nào của Dữ liệu lớn được thể hiện rõ nhất trong trường hợp này?

A. Khối lượng (Volume)
B. Tốc độ (Velocity)
C. Đa dạng (Variety)
D. Giá trị (Value)

Câu 6: Khi một mô hình dự đoán đã được xây dựng và đánh giá là hiệu quả, giai đoạn tiếp theo trong quy trình Khoa học dữ liệu là gì? Đây là lúc mô hình được đưa vào sử dụng thực tế.

A. Thu thập dữ liệu mới
B. Đánh giá lại mô hình
C. Chuẩn bị dữ liệu cho mô hình khác
D. Triển khai (Deployment)

Câu 7: Việc sử dụng máy tính và các thuật toán hiệu quả trong Khoa học dữ liệu mang lại lợi ích kinh tế quan trọng nào cho các tổ chức?

A. Giảm thiểu hoàn toàn nhu cầu về chuyên gia dữ liệu.
B. Giảm thời gian và chi phí xử lý, phân tích lượng lớn dữ liệu.
C. Loại bỏ rủi ro về bảo mật dữ liệu.
D. Đảm bảo dữ liệu luôn chính xác tuyệt đối.

Câu 8: Đặc điểm "Giá trị" (Value) trong Dữ liệu lớn đề cập đến khía cạnh nào?

A. Khả năng khai thác thông tin hữu ích và tạo ra lợi ích từ dữ liệu.
B. Chi phí để lưu trữ và xử lý dữ liệu.
C. Tốc độ dữ liệu được tạo ra.
D. Sự đa dạng về định dạng của dữ liệu.

Câu 9: Tại sao giai đoạn "Chuẩn bị dữ liệu" lại chiếm phần lớn thời gian và công sức trong quy trình Khoa học dữ liệu?

A. Vì đây là lúc xây dựng các mô hình học máy phức tạp nhất.
B. Vì cần thu thập dữ liệu từ rất nhiều nguồn khác nhau.
C. Vì dữ liệu thực tế thường không hoàn hảo (thiếu, nhiễu, không nhất quán) và cần được làm sạch, biến đổi trước khi sử dụng cho mô hình.
D. Vì cần đánh giá hiệu suất của mô hình đã xây dựng.

Câu 10: Một hệ thống dự báo thời tiết sử dụng dữ liệu từ hàng ngàn trạm cảm biến, vệ tinh, và mô hình khí hậu để đưa ra dự báo theo thời gian thực. Khả năng xử lý dữ liệu "theo thời gian thực" (real-time processing) của máy tính là cực kỳ quan trọng trong ứng dụng này vì:

A. Nó giúp giảm khối lượng dữ liệu cần lưu trữ.
B. Nó cho phép đưa ra dự báo cập nhật liên tục dựa trên dữ liệu mới nhất.
C. Nó đảm bảo dữ liệu từ các nguồn khác nhau có cùng định dạng.
D. Nó tự động xác định các kiểu thời tiết cực đoan.

Câu 11: Đặc điểm nào của Dữ liệu lớn mô tả sự không chắc chắn hoặc độ tin cậy của dữ liệu, có thể ảnh hưởng đến chất lượng phân tích?

A. Khối lượng (Volume)
B. Tốc độ (Velocity)
C. Đa dạng (Variety)
D. Độ tin cậy (Veracity)

Câu 12: Trong quy trình Khoa học dữ liệu, giai đoạn "Xây dựng mô hình" (Modeling) liên quan chủ yếu đến việc gì?

A. Thu thập thêm dữ liệu nếu cần.
B. Làm sạch và trực quan hóa dữ liệu.
C. Lựa chọn và áp dụng các thuật toán học máy để tìm ra mối quan hệ hoặc đưa ra dự đoán.
D. Đưa mô hình đã hoàn thiện vào sử dụng thực tế.

Câu 13: Khả năng "mở rộng" (scalability) của hệ thống máy tính là một yếu tố quan trọng trong Khoa học dữ liệu vì nó cho phép:

A. Dễ dàng tăng cường năng lực xử lý và lưu trữ khi khối lượng dữ liệu tăng lên.
B. Chỉ làm việc với các tập dữ liệu nhỏ.
C. Giảm thiểu nhu cầu về các thuật toán phức tạp.
D. Tự động tạo ra dữ liệu tổng hợp.

Câu 14: Thuật toán tự động hóa (automation) trong xử lý dữ liệu lớn mang lại lợi ích chính nào?

A. Giảm khối lượng dữ liệu thô.
B. Đảm bảo tất cả dữ liệu đều có cấu trúc.
C. Loại bỏ hoàn toàn lỗi trong dữ liệu.
D. Thực hiện lặp đi lặp lại các tác vụ xử lý dữ liệu mà không cần sự can thiệp thủ công liên tục, tiết kiệm thời gian và công sức.

Câu 15: Một nhà khoa học dữ liệu đang trình bày kết quả phân tích cho các nhà quản lý. Họ sử dụng biểu đồ, đồ thị và báo cáo tóm tắt để giải thích các phát hiện từ dữ liệu. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

A. Đánh giá và truyền đạt kết quả (một phần của Đánh giá hoặc sau Triển khai/Đánh giá)
B. Thu thập dữ liệu
C. Xây dựng mô hình
D. Chuẩn bị dữ liệu

Câu 16: Bạn cần phân tích một tập dữ liệu rất lớn không thể chứa vừa trong bộ nhớ RAM của một máy tính thông thường. Vấn đề này liên quan trực tiếp đến đặc điểm nào của Dữ liệu lớn và yêu cầu giải pháp về mặt cơ sở hạ tầng máy tính?

A. Tốc độ (Velocity)
B. Khối lượng (Volume)
C. Đa dạng (Variety)
D. Độ tin cậy (Veracity)

Câu 17: Tại sao việc xác định rõ ràng "vấn đề" hoặc "mục tiêu" kinh doanh là bước đầu tiên và quan trọng nhất trong quy trình Khoa học dữ liệu?

A. Để có thể thu thập càng nhiều dữ liệu càng tốt.
B. Để quyết định loại máy tính nào sẽ sử dụng.
C. Để định hướng cho toàn bộ quy trình, từ việc thu thập dữ liệu nào, chuẩn bị dữ liệu ra sao, chọn mô hình nào, cho đến cách đánh giá kết quả.
D. Để tự động hóa toàn bộ quy trình.

Câu 18: Một thuật toán sắp xếp cần xử lý một danh sách 1 tỷ số nguyên. Máy tính giúp thực hiện công việc này như thế nào một cách hiệu quả hơn so với con người?

A. Thực hiện các phép so sánh và hoán đổi với tốc độ cực cao và độ chính xác gần như tuyệt đối.
B. Tự động thay đổi thuật toán nếu cần.
C. Giảm số lượng số nguyên cần sắp xếp.
D. Trực quan hóa quá trình sắp xếp.

Câu 19: Đặc điểm "Đa dạng" (Variety) của Dữ liệu lớn đặt ra thách thức chính nào trong giai đoạn "Chuẩn bị dữ liệu"?

A. Tốc độ dữ liệu thay đổi liên tục.
B. Cần xử lý, tích hợp và chuẩn hóa dữ liệu đến từ nhiều nguồn với các định dạng khác nhau (cấu trúc, bán cấu trúc, phi cấu trúc).
C. Khối lượng dữ liệu quá lớn không thể lưu trữ.
D. Độ tin cậy của dữ liệu luôn thấp.

Câu 20: Trong quy trình Khoa học dữ liệu, giai đoạn "Đánh giá" (Evaluation) nhằm mục đích gì?

A. Thu thập thêm dữ liệu để làm phong phú tập dữ liệu ban đầu.
B. Xác định vấn đề tiếp theo cần giải quyết.
C. Làm sạch dữ liệu trước khi đưa vào mô hình.
D. Đo lường hiệu suất của mô hình đã xây dựng dựa trên các tiêu chí phù hợp với mục tiêu ban đầu.

Câu 21: Khoa học dữ liệu kết hợp kiến thức từ các lĩnh vực nào để trích xuất thông tin và hiểu biết từ dữ liệu?

A. Thiết kế đồ họa, Âm nhạc, Lịch sử
B. Toán học/Thống kê, Khoa học máy tính, Kiến thức chuyên môn về lĩnh vực dữ liệu
C. Văn học, Ngoại ngữ, Giáo dục công dân
D. Điện ảnh, Hội họa, Kiến trúc

Câu 22: Một hệ thống phát hiện gian lận thẻ tín dụng cần phân tích hàng triệu giao dịch mỗi giây để xác định các hoạt động đáng ngờ. Ứng dụng này đòi hỏi máy tính phải có khả năng xử lý dữ liệu với đặc điểm nào nổi bật nhất?

A. Lưu trữ dữ liệu vô hạn
B. Tạo ra các giao dịch mới
C. Xử lý theo thời gian thực (Real-time processing)
D. Tự động trả lời email của khách hàng

Câu 23: Khi nói về "Thuật toán" trong xử lý dữ liệu, ta đang đề cập đến điều gì?

A. Một tập hợp các bước hoặc quy tắc rõ ràng để giải quyết một vấn đề hoặc thực hiện một tác vụ.
B. Phần cứng của máy tính.
C. Chỉ là các công thức toán học đơn giản.
D. Dữ liệu thô chưa được xử lý.

Câu 24: Một công ty muốn phân tích dữ liệu bán hàng lịch sử để dự báo doanh thu cho quý tới. Giai đoạn đầu tiên trong quy trình Khoa học dữ liệu mà họ cần thực hiện là gì?

A. Xây dựng mô hình dự báo ngay lập tức.
B. Trực quan hóa dữ liệu bán hàng.
C. Triển khai kết quả dự báo.
D. Xác định vấn đề: Dự báo doanh thu quý tới là mục tiêu chính.

Câu 25: Đặc điểm nào của Dữ liệu lớn đặt ra thách thức về khả năng lưu trữ và xử lý, đòi hỏi các hệ thống phân tán và cơ sở hạ tầng mạnh mẽ?

A. Khối lượng (Volume)
B. Độ tin cậy (Veracity)
C. Đa dạng (Variety)
D. Giá trị (Value)

Câu 26: Sau khi xây dựng một mô hình phân loại khách hàng, nhà khoa học dữ liệu sử dụng các chỉ số như độ chính xác (accuracy), độ nhạy (sensitivity), và độ đặc hiệu (specificity) để đánh giá hiệu quả của mô hình. Hoạt động này thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

A. Chuẩn bị dữ liệu
B. Đánh giá (Evaluation)
C. Triển khai
D. Thu thập dữ liệu

Câu 27: Thuật toán tìm kiếm nhị phân (Binary Search) là một ví dụ về việc máy tính sử dụng thuật toán để giải quyết vấn đề tìm kiếm thông tin một cách hiệu quả hơn so với tìm kiếm tuần tự. Hiệu quả này đến từ việc:

A. Chỉ tìm kiếm trong một phần nhỏ của dữ liệu.
B. Tự động sửa lỗi trong dữ liệu.
C. Chia đôi tập dữ liệu tại mỗi bước và loại bỏ một nửa không chứa phần tử cần tìm (áp dụng trên dữ liệu đã sắp xếp).
D. Tạo ra dữ liệu mới để tìm kiếm.

Câu 28: Một thách thức phổ biến khi làm việc với dữ liệu lớn là đảm bảo tính "Độ tin cậy" (Veracity). Điều này có thể được cải thiện trong giai đoạn "Chuẩn bị dữ liệu" bằng cách nào?

A. Thực hiện các kỹ thuật làm sạch dữ liệu để xử lý các giá trị ngoại lai, dữ liệu thiếu hoặc không nhất quán.
B. Chỉ thu thập dữ liệu từ một nguồn duy nhất.
C. Tăng tốc độ thu thập dữ liệu.
D. Giảm khối lượng dữ liệu cần xử lý.

Câu 29: Việc sử dụng các công cụ trực quan hóa dữ liệu (ví dụ: biểu đồ, đồ thị) trong Khoa học dữ liệu chủ yếu hỗ trợ giai đoạn nào của quy trình?

A. Xác định vấn đề (mục tiêu).
B. Xây dựng mô hình.
C. Triển khai mô hình.
D. Chuẩn bị dữ liệu (khám phá, hiểu dữ liệu) và Đánh giá/Truyền đạt kết quả.

Câu 30: Máy tính và thuật toán không thể thay thế hoàn toàn vai trò của con người trong Khoa học dữ liệu ở khía cạnh nào?

A. Lưu trữ dữ liệu.
B. Hiểu biết sâu sắc về lĩnh vực (domain knowledge) để đặt câu hỏi đúng, diễn giải kết quả phân tích trong bối cảnh thực tế và đưa ra quyết định chiến lược.
C. Thực hiện các phép tính phức tạp.
D. Xử lý dữ liệu với tốc độ cao.

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 1: Vai trò cốt lõi nào của máy tính khiến nó trở thành công cụ không thể thiếu trong Khoa học dữ liệu, đặc biệt khi làm việc với tập dữ liệu lớn?

Khả năng tạo ra dữ liệu mới liên tục

Cung cấp giao diện người dùng thân thiện cho mọi đối tượng

Năng lực tính toán và xử lý dữ liệu quy mô lớn với tốc độ cao

Tự động diễn giải kết quả phân tích mà không cần sự can thiệp của con người

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Xác định vấn đề

Chuẩn bị dữ liệu

Xây dựng mô hình

Triển khai

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 3: Một công ty thương mại điện tử thu thập dữ liệu từ hàng triệu lượt truy cập website mỗi ngày, bao gồm lịch sử xem sản phẩm, hành vi click, và thông tin giỏ hàng. Dữ liệu này có đặc điểm 'Tốc độ' (Velocity) cao. Điều này có ý nghĩa quan trọng nhất đối với công ty như thế nào?

Dữ liệu này rất đa dạng về định dạng.

Khối lượng dữ liệu rất lớn và khó lưu trữ.

Cần đảm bảo dữ liệu luôn chính xác 100%.

Cần có khả năng xử lý và phân tích dữ liệu gần như ngay lập tức để đưa ra quyết định kịp thời (ví dụ: gợi ý sản phẩm).

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 4: Thuật toán xử lý song song đóng vai trò quan trọng trong xử lý dữ liệu lớn vì nó cho phép:

Chia nhỏ dữ liệu và xử lý đồng thời trên nhiều bộ xử lý hoặc máy tính.

Giảm thiểu khối lượng dữ liệu cần xử lý.

Tự động xác định vấn đề cần giải quyết từ dữ liệu.

Trực quan hóa dữ liệu một cách tự động.

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 5: Bạn đang phân tích dữ liệu phản hồi của khách hàng từ các mạng xã hội, email, và khảo sát văn bản. Loại dữ liệu này thường là 'phi cấu trúc' hoặc 'bán cấu trúc'. Đặc điểm nào của Dữ liệu lớn được thể hiện rõ nhất trong trường hợp này?

Khối lượng (Volume)

Tốc độ (Velocity)

Đa dạng (Variety)

Giá trị (Value)

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Thu thập dữ liệu mới

Đánh giá lại mô hình

Chuẩn bị dữ liệu cho mô hình khác

Triển khai (Deployment)

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 7: Việc sử dụng máy tính và các thuật toán hiệu quả trong Khoa học dữ liệu mang lại lợi ích kinh tế quan trọng nào cho các tổ chức?

Giảm thiểu hoàn toàn nhu cầu về chuyên gia dữ liệu.

Giảm thời gian và chi phí xử lý, phân tích lượng lớn dữ liệu.

Loại bỏ rủi ro về bảo mật dữ liệu.

Đảm bảo dữ liệu luôn chính xác tuyệt đối.

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 8: Đặc điểm 'Giá trị' (Value) trong Dữ liệu lớn đề cập đến khía cạnh nào?

Khả năng khai thác thông tin hữu ích và tạo ra lợi ích từ dữ liệu.

Chi phí để lưu trữ và xử lý dữ liệu.

Tốc độ dữ liệu được tạo ra.

Sự đa dạng về định dạng của dữ liệu.

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 9: Tại sao giai đoạn 'Chuẩn bị dữ liệu' lại chiếm phần lớn thời gian và công sức trong quy trình Khoa học dữ liệu?

Vì đây là lúc xây dựng các mô hình học máy phức tạp nhất.

Vì cần thu thập dữ liệu từ rất nhiều nguồn khác nhau.

Vì dữ liệu thực tế thường không hoàn hảo (thiếu, nhiễu, không nhất quán) và cần được làm sạch, biến đổi trước khi sử dụng cho mô hình.

Vì cần đánh giá hiệu suất của mô hình đã xây dựng.

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 10: Một hệ thống dự báo thời tiết sử dụng dữ liệu từ hàng ngàn trạm cảm biến, vệ tinh, và mô hình khí hậu để đưa ra dự báo theo thời gian thực. Khả năng xử lý dữ liệu 'theo thời gian thực' (real-time processing) của máy tính là cực kỳ quan trọng trong ứng dụng này vì:

Nó giúp giảm khối lượng dữ liệu cần lưu trữ.

Nó cho phép đưa ra dự báo cập nhật liên tục dựa trên dữ liệu mới nhất.

Nó đảm bảo dữ liệu từ các nguồn khác nhau có cùng định dạng.

Nó tự động xác định các kiểu thời tiết cực đoan.

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 11: Đặc điểm nào của Dữ liệu lớn mô tả sự không chắc chắn hoặc độ tin cậy của dữ liệu, có thể ảnh hưởng đến chất lượng phân tích?

Khối lượng (Volume)

Tốc độ (Velocity)

Đa dạng (Variety)

Độ tin cậy (Veracity)

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 12: Trong quy trình Khoa học dữ liệu, giai đoạn 'Xây dựng mô hình' (Modeling) liên quan chủ yếu đến việc gì?

Thu thập thêm dữ liệu nếu cần.

Làm sạch và trực quan hóa dữ liệu.

Lựa chọn và áp dụng các thuật toán học máy để tìm ra mối quan hệ hoặc đưa ra dự đoán.

Đưa mô hình đã hoàn thiện vào sử dụng thực tế.

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 13: Khả năng 'mở rộng' (scalability) của hệ thống máy tính là một yếu tố quan trọng trong Khoa học dữ liệu vì nó cho phép:

Dễ dàng tăng cường năng lực xử lý và lưu trữ khi khối lượng dữ liệu tăng lên.

Chỉ làm việc với các tập dữ liệu nhỏ.

Giảm thiểu nhu cầu về các thuật toán phức tạp.

Tự động tạo ra dữ liệu tổng hợp.

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 14: Thuật toán tự động hóa (automation) trong xử lý dữ liệu lớn mang lại lợi ích chính nào?

Giảm khối lượng dữ liệu thô.

Đảm bảo tất cả dữ liệu đều có cấu trúc.

Loại bỏ hoàn toàn lỗi trong dữ liệu.

Thực hiện lặp đi lặp lại các tác vụ xử lý dữ liệu mà không cần sự can thiệp thủ công liên tục, tiết kiệm thời gian và công sức.

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Đánh giá và truyền đạt kết quả (một phần của Đánh giá hoặc sau Triển khai/Đánh giá)

Thu thập dữ liệu

Xây dựng mô hình

Chuẩn bị dữ liệu

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Tốc độ (Velocity)

Khối lượng (Volume)

Đa dạng (Variety)

Độ tin cậy (Veracity)

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 17: Tại sao việc xác định rõ ràng 'vấn đề' hoặc 'mục tiêu' kinh doanh là bước đầu tiên và quan trọng nhất trong quy trình Khoa học dữ liệu?

Để có thể thu thập càng nhiều dữ liệu càng tốt.

Để quyết định loại máy tính nào sẽ sử dụng.

Để định hướng cho toàn bộ quy trình, từ việc thu thập dữ liệu nào, chuẩn bị dữ liệu ra sao, chọn mô hình nào, cho đến cách đánh giá kết quả.

Để tự động hóa toàn bộ quy trình.

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Thực hiện các phép so sánh và hoán đổi với tốc độ cực cao và độ chính xác gần như tuyệt đối.

Tự động thay đổi thuật toán nếu cần.

Giảm số lượng số nguyên cần sắp xếp.

Trực quan hóa quá trình sắp xếp.

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 19: Đặc điểm 'Đa dạng' (Variety) của Dữ liệu lớn đặt ra thách thức chính nào trong giai đoạn 'Chuẩn bị dữ liệu'?

Tốc độ dữ liệu thay đổi liên tục.

Cần xử lý, tích hợp và chuẩn hóa dữ liệu đến từ nhiều nguồn với các định dạng khác nhau (cấu trúc, bán cấu trúc, phi cấu trúc).

Khối lượng dữ liệu quá lớn không thể lưu trữ.

Độ tin cậy của dữ liệu luôn thấp.

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 20: Trong quy trình Khoa học dữ liệu, giai đoạn 'Đánh giá' (Evaluation) nhằm mục đích gì?

Thu thập thêm dữ liệu để làm phong phú tập dữ liệu ban đầu.

Xác định vấn đề tiếp theo cần giải quyết.

Làm sạch dữ liệu trước khi đưa vào mô hình.

Đo lường hiệu suất của mô hình đã xây dựng dựa trên các tiêu chí phù hợp với mục tiêu ban đầu.

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 21: Khoa học dữ liệu kết hợp kiến thức từ các lĩnh vực nào để trích xuất thông tin và hiểu biết từ dữ liệu?

Thiết kế đồ họa, Âm nhạc, Lịch sử

Toán học/Thống kê, Khoa học máy tính, Kiến thức chuyên môn về lĩnh vực dữ liệu

Văn học, Ngoại ngữ, Giáo dục công dân

Điện ảnh, Hội họa, Kiến trúc

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Lưu trữ dữ liệu vô hạn

Tạo ra các giao dịch mới

Xử lý theo thời gian thực (Real-time processing)

Tự động trả lời email của khách hàng

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 23: Khi nói về 'Thuật toán' trong xử lý dữ liệu, ta đang đề cập đến điều gì?

Một tập hợp các bước hoặc quy tắc rõ ràng để giải quyết một vấn đề hoặc thực hiện một tác vụ.

Phần cứng của máy tính.

Chỉ là các công thức toán học đơn giản.

Dữ liệu thô chưa được xử lý.

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Xây dựng mô hình dự báo ngay lập tức.

Trực quan hóa dữ liệu bán hàng.

Triển khai kết quả dự báo.

Xác định vấn đề: Dự báo doanh thu quý tới là mục tiêu chính.

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 25: Đặc điểm nào của Dữ liệu lớn đặt ra thách thức về khả năng lưu trữ và xử lý, đòi hỏi các hệ thống phân tán và cơ sở hạ tầng mạnh mẽ?

Khối lượng (Volume)

Độ tin cậy (Veracity)

Đa dạng (Variety)

Giá trị (Value)

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Chuẩn bị dữ liệu

Đánh giá (Evaluation)

Triển khai

Thu thập dữ liệu

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Chỉ tìm kiếm trong một phần nhỏ của dữ liệu.

Tự động sửa lỗi trong dữ liệu.

Chia đôi tập dữ liệu tại mỗi bước và loại bỏ một nửa không chứa phần tử cần tìm (áp dụng trên dữ liệu đã sắp xếp).

Tạo ra dữ liệu mới để tìm kiếm.

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 28: Một thách thức phổ biến khi làm việc với dữ liệu lớn là đảm bảo tính 'Độ tin cậy' (Veracity). Điều này có thể được cải thiện trong giai đoạn 'Chuẩn bị dữ liệu' bằng cách nào?

Thực hiện các kỹ thuật làm sạch dữ liệu để xử lý các giá trị ngoại lai, dữ liệu thiếu hoặc không nhất quán.

Chỉ thu thập dữ liệu từ một nguồn duy nhất.

Tăng tốc độ thu thập dữ liệu.

Giảm khối lượng dữ liệu cần xử lý.

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 29: Việc sử dụng các công cụ trực quan hóa dữ liệu (ví dụ: biểu đồ, đồ thị) trong Khoa học dữ liệu chủ yếu hỗ trợ giai đoạn nào của quy trình?

Xác định vấn đề (mục tiêu).

Xây dựng mô hình.

Triển khai mô hình.

Chuẩn bị dữ liệu (khám phá, hiểu dữ liệu) và Đánh giá/Truyền đạt kết quả.

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 30: Máy tính và thuật toán không thể thay thế hoàn toàn vai trò của con người trong Khoa học dữ liệu ở khía cạnh nào?

Lưu trữ dữ liệu.

Hiểu biết sâu sắc về lĩnh vực (domain knowledge) để đặt câu hỏi đúng, diễn giải kết quả phân tích trong bối cảnh thực tế và đưa ra quyết định chiến lược.

Thực hiện các phép tính phức tạp.

Xử lý dữ liệu với tốc độ cao.

Xem kết quả

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Nhận kết quả

Xảy ra lỗi

Bước 1: Vào google.com rồi gõ từ khóa:
Copy nhanh thanh-tim-kiem

Bước 2: Trong kết quả tìm kiếm Google, hãy tìm website giống hình bên dưới

Nếu trang 1 không có hãy tìm ở trang 2, 3, 4... nhé trang-google

Bước 3:

Cuộn xuống cuối bài viết rồi bấm vào nút GIỐNG HÌNH DƯỚI và chờ 1 lát để lấy mã:

luot-xem

Nếu tìm không thấy mã bạn có thể Đổi nhiệm vụ để lấy mã khác.

By Wordpress Quiz plugin

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 07

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 07 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong Khoa học dữ liệu, vai trò cốt lõi nào của máy tính giúp xử lý hiệu quả tập dữ liệu có dung lượng rất lớn, vượt quá khả năng của các công cụ truyền thống?

A. Chỉ hiển thị kết quả cuối cùng
B. Tạo ra các câu hỏi nghiên cứu mới
C. Giới hạn kích thước dữ liệu cần phân tích
D. Cung cấp năng lực tính toán và lưu trữ mạnh mẽ

Câu 2: Quy trình Khoa học dữ liệu thường bắt đầu bằng bước nào trước khi tiến hành thu thập hoặc chuẩn bị dữ liệu?

A. Xác định vấn đề và mục tiêu nghiên cứu
B. Xây dựng mô hình học máy
C. Trực quan hóa dữ liệu
D. Đánh giá hiệu suất mô hình

Câu 3: Khi làm việc với Dữ liệu lớn (Big Data), đặc điểm "Variety" (Đa dạng) đề cập đến khía cạnh nào của dữ liệu?

A. Tốc độ dữ liệu được tạo ra
B. Dung lượng lưu trữ của dữ liệu
C. Sự đa dạng về định dạng và nguồn gốc dữ liệu
D. Độ chính xác của dữ liệu

Câu 4: Một nhóm Khoa học dữ liệu đang thực hiện làm sạch dữ liệu, xử lý các giá trị thiếu và chuyển đổi định dạng để dữ liệu sẵn sàng cho phân tích. Nhóm đang ở giai đoạn nào trong quy trình KHDL?

A. Thu thập dữ liệu
B. Chuẩn bị dữ liệu
C. Xây dựng mô hình
D. Đánh giá mô hình

Câu 5: Thuật toán đóng vai trò quan trọng như thế nào trong giai đoạn "Xây dựng mô hình" của quy trình Khoa học dữ liệu?

A. Chỉ giúp thu thập dữ liệu nhanh hơn
B. Chỉ dùng để lưu trữ dữ liệu
C. Giúp xác định vấn đề nghiên cứu
D. Là nền tảng để phát triển và huấn luyện các mô hình phân tích/dự đoán

Câu 6: Đặc điểm nào của máy tính hiện đại (như điện toán đám mây hoặc hệ thống phân tán) hỗ trợ xử lý "Volume" (Khối lượng) dữ liệu ngày càng tăng trong KHDL?

A. Khả năng mở rộng (Scalability)
B. Kích thước màn hình hiển thị
C. Tốc độ gõ phím
D. Độ phân giải âm thanh

Câu 7: Trong bối cảnh Dữ liệu lớn, đặc điểm "Velocity" (Tốc độ) có ý nghĩa gì đối với yêu cầu xử lý dữ liệu trong KHDL?

A. Dữ liệu chỉ được cập nhật hàng năm
B. Dữ liệu luôn có định dạng cố định
C. Dữ liệu được tạo ra và cần được xử lý nhanh chóng (thời gian thực hoặc gần thời gian thực)
D. Dữ liệu chỉ đến từ một nguồn duy nhất

Câu 8: Giai đoạn nào trong quy trình KHDL tập trung vào việc đánh giá mức độ hiệu quả, chính xác của mô hình đã xây dựng dựa trên các chỉ số đo lường?

A. Thu thập dữ liệu
B. Chuẩn bị dữ liệu
C. Triển khai mô hình
D. Đánh giá mô hình

Câu 9: Một công ty muốn phân tích hành vi mua sắm của khách hàng từ lịch sử giao dịch khổng lồ để đưa ra các chương trình khuyến mãi cá nhân hóa. Đây là một ứng dụng tiêu biểu của KHDL, đòi hỏi khả năng xử lý dữ liệu lớn và sử dụng thuật toán để làm gì?

A. Chỉ lưu trữ dữ liệu giao dịch
B. Phát hiện mẫu hình, phân khúc khách hàng và đưa ra dự đoán/khuyến nghị
C. Giảm bớt số lượng khách hàng
D. Chỉ hiển thị lịch sử mua hàng thô

Câu 10: Tại sao thuật toán xử lý song song (parallel processing) lại có lợi thế lớn trong việc xử lý Dữ liệu lớn?

A. Cho phép chia nhỏ và xử lý đồng thời các phần của dữ liệu trên nhiều bộ xử lý/máy tính, giúp giảm thời gian xử lý tổng thể.
B. Chỉ hoạt động trên một máy tính duy nhất.
C. Yêu cầu dữ liệu phải có định dạng rất đơn giản.
D. Làm tăng đáng kể dung lượng lưu trữ cần thiết.

Câu 11: Bước "Triển khai mô hình" (Deployment) trong quy trình KHDL thường bao gồm hoạt động nào?

A. Thu thập thêm dữ liệu mới
B. Làm sạch dữ liệu lần cuối
C. Đưa mô hình đã xây dựng vào sử dụng trong môi trường thực tế để tạo ra giá trị (ví dụ: đưa ra dự đoán, phân loại tự động).
D. Thay đổi mục tiêu nghiên cứu ban đầu

Câu 12: Đặc điểm "Veracity" (Độ tin cậy/Chính xác) của Dữ liệu lớn đề cập đến thách thức nào?

A. Dữ liệu luôn đến từ một nguồn duy nhất.
B. Khó khăn trong việc xác định tính chính xác, trung thực và đáng tin cậy của dữ liệu.
C. Dữ liệu chỉ có một định dạng duy nhất.
D. Dữ liệu chỉ được tạo ra một lần duy nhất.

Câu 13: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại là một công cụ hữu ích trong giai đoạn "Chuẩn bị dữ liệu" và "Đánh giá mô hình"?

A. Chỉ để làm cho báo cáo đẹp hơn.
B. Giúp tăng dung lượng lưu trữ dữ liệu.
C. Tự động xây dựng mô hình mà không cần thuật toán.
D. Giúp con người dễ dàng phát hiện xu hướng, mẫu hình, điểm bất thường trong dữ liệu hoặc hiểu rõ hơn kết quả của mô hình.

Câu 14: Một dự án KHDL về phân tích cảm xúc khách hàng từ bình luận trên mạng xã hội sẽ gặp thách thức lớn nhất với đặc điểm nào của Dữ liệu lớn?

A. Variety (Đa dạng về định dạng, ngôn ngữ, cấu trúc phi cấu trúc)
B. Volume (Chỉ cần lượng dữ liệu nhỏ)
C. Velocity (Không cần xử lý nhanh)
D. Value (Dữ liệu không có giá trị)

Câu 15: Mục tiêu chính của việc sử dụng thuật toán tự động hóa trong các bước của quy trình KHDL (ví dụ: làm sạch dữ liệu, lựa chọn đặc trưng) là gì?

A. Làm cho quy trình phức tạp hơn.
B. Tăng cường sự can thiệp thủ công.
C. Giảm sự phụ thuộc vào công việc thủ công, tăng tốc độ và hiệu quả xử lý.
D. Giảm bớt khối lượng dữ liệu.

Câu 16: Khi một mô hình KHDL được đưa vào sử dụng thực tế và thu thập phản hồi về hiệu suất của nó, hoạt động này thuộc giai đoạn nào của quy trình KHDL?

A. Xác định vấn đề
B. Thu thập dữ liệu
C. Xây dựng mô hình
D. Triển khai và giám sát/đánh giá liên tục

Câu 17: Vai trò của máy tính trong giai đoạn "Thu thập dữ liệu" của KHDL là gì?

A. Chỉ tạo ra dữ liệu mới.
B. Kết nối đến các nguồn dữ liệu khác nhau, trích xuất và lưu trữ dữ liệu.
C. Xây dựng mô hình học máy ngay lập tức.
D. Trực quan hóa dữ liệu mà không cần thu thập.

Câu 18: Đặc điểm nào của Dữ liệu lớn nhấn mạnh rằng dữ liệu không chỉ có khối lượng lớn mà còn có tiềm năng mang lại giá trị hoặc thông tin hữu ích nếu được phân tích đúng cách?

A. Value (Giá trị)
B. Volume (Khối lượng)
C. Velocity (Tốc độ)
D. Variety (Đa dạng)

Câu 19: Trong KHDL, việc lựa chọn thuật toán phù hợp cho giai đoạn "Xây dựng mô hình" phụ thuộc chủ yếu vào yếu tố nào?

A. Màu sắc của dữ liệu.
B. Kích thước màn hình máy tính.
C. Loại vấn đề cần giải quyết (ví dụ: phân loại, dự đoán, phân cụm) và đặc điểm của dữ liệu.
D. Tên của người thu thập dữ liệu.

Câu 20: Tại sao KHDL thường được mô tả là một quy trình lặp (iterative) thay vì tuyến tính (linear)?

A. Vì mỗi bước chỉ thực hiện một lần.
B. Vì dữ liệu không bao giờ thay đổi.
C. Vì chỉ có một thuật toán duy nhất được sử dụng.
D. Vì các giai đoạn (như chuẩn bị dữ liệu, xây dựng mô hình, đánh giá) thường cần được lặp lại, điều chỉnh dựa trên kết quả và hiểu biết mới thu được.

Câu 21: Một trong những thách thức lớn nhất khi làm việc với Dữ liệu lớn trong KHDL, liên quan đến việc đảm bảo dữ liệu là chính xác, đầy đủ và không mâu thuẫn, thuộc về đặc điểm nào?

A. Volume (Khối lượng)
B. Veracity (Độ tin cậy/Chính xác)
C. Velocity (Tốc độ)
D. Variety (Đa dạng)

Câu 22: Khi một công ty sử dụng KHDL để phân tích xu hướng thị trường và đưa ra quyết định kinh doanh chiến lược, hoạt động này thể hiện mục tiêu chính nào của KHDL?

A. Chỉ để lưu trữ dữ liệu lịch sử.
B. Tạo ra dữ liệu ngẫu nhiên.
C. Khai thác thông tin và hiểu biết sâu sắc từ dữ liệu để hỗ trợ ra quyết định.
D. Làm chậm quá trình kinh doanh.

Câu 23: Máy tính, đặc biệt là các hệ thống phân tán và công nghệ lưu trữ đám mây, cung cấp khả năng nào giúp KHDL xử lý khối lượng dữ liệu ngày càng tăng theo thời gian?

A. Khả năng lưu trữ và xử lý mở rộng (Scalable Storage and Processing)
B. Khả năng giảm kích thước dữ liệu về 0
C. Khả năng chỉ hoạt động với dữ liệu văn bản
D. Khả năng tự in báo cáo

Câu 24: Giai đoạn nào trong quy trình KHDL đòi hỏi sự hiểu biết sâu sắc về lĩnh vực chuyên môn của vấn đề (ví dụ: y tế, tài chính, marketing) để đặt ra câu hỏi đúng và xác định các chỉ số cần phân tích?

A. Chuẩn bị dữ liệu
B. Xây dựng mô hình
C. Triển khai mô hình
D. Xác định vấn đề và mục tiêu nghiên cứu

Câu 25: Thuật toán có thể giúp tối ưu hóa giai đoạn "Chuẩn bị dữ liệu" bằng cách nào?

A. Tự động tạo ra dữ liệu giả.
B. Tự động hóa các tác vụ như làm sạch dữ liệu, xử lý giá trị thiếu, hoặc chuyển đổi định dạng.
C. Ngăn chặn việc thu thập dữ liệu từ nhiều nguồn.
D. Làm cho dữ liệu trở nên khó hiểu hơn.

Câu 26: Khi một mô hình KHDL dự đoán sai trên dữ liệu mới sau khi đã hoạt động tốt trên dữ liệu huấn luyện, vấn đề này thường được phát hiện ở giai đoạn nào và cần quay lại các bước trước đó để điều chỉnh?

A. Thu thập dữ liệu
B. Xác định vấn đề
C. Đánh giá mô hình và Triển khai (khi giám sát)
D. Chỉ ở giai đoạn thu thập dữ liệu

Câu 27: Mối quan hệ giữa Máy tính, Thuật toán và Khoa học dữ liệu có thể được mô tả như thế nào?

A. Máy tính và thuật toán không liên quan đến Khoa học dữ liệu.
B. Khoa học dữ liệu chỉ là việc lưu trữ dữ liệu trên máy tính.
C. Chỉ cần thuật toán là đủ để làm Khoa học dữ liệu, không cần máy tính.
D. Máy tính cung cấp hạ tầng và năng lực xử lý, thuật toán cung cấp phương pháp và logic, cả hai là công cụ thiết yếu giúp thực hiện các nhiệm vụ trong Khoa học dữ liệu.

Câu 28: Đặc điểm nào của Dữ liệu lớn đề cập đến tốc độ dữ liệu được tạo ra, thu thập và cần được xử lý, thường là rất nhanh và liên tục?

A. Volume
B. Variety
C. Velocity
D. Veracity

Câu 29: Một nhà khoa học dữ liệu đang sử dụng các kỹ thuật thống kê và học máy để tìm ra mối quan hệ giữa các biến trong tập dữ liệu. Hoạt động này chủ yếu thuộc giai đoạn nào của quy trình KHDL?

A. Xây dựng mô hình
B. Xác định vấn đề
C. Thu thập dữ liệu
D. Triển khai mô hình

Câu 30: Tại sao việc "Xác định vấn đề" một cách rõ ràng ngay từ đầu lại quan trọng đối với sự thành công của một dự án KHDL?

A. Để đảm bảo thu thập được càng nhiều dữ liệu càng tốt.
B. Để định hướng toàn bộ quy trình, từ việc thu thập dữ liệu nào, chọn thuật toán nào, đến cách đánh giá kết quả và triển khai.
C. Để tránh phải sử dụng máy tính mạnh.
D. Chỉ để làm cho báo cáo cuối cùng dài hơn.

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Chỉ hiển thị kết quả cuối cùng

Tạo ra các câu hỏi nghiên cứu mới

Giới hạn kích thước dữ liệu cần phân tích

Cung cấp năng lực tính toán và lưu trữ mạnh mẽ

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 2: Quy trình Khoa học dữ liệu thường bắt đầu bằng bước nào trước khi tiến hành thu thập hoặc chuẩn bị dữ liệu?

Xác định vấn đề và mục tiêu nghiên cứu

Xây dựng mô hình học máy

Trực quan hóa dữ liệu

Đánh giá hiệu suất mô hình

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 3: Khi làm việc với Dữ liệu lớn (Big Data), đặc điểm 'Variety' (Đa dạng) đề cập đến khía cạnh nào của dữ liệu?

Tốc độ dữ liệu được tạo ra

Dung lượng lưu trữ của dữ liệu

Sự đa dạng về định dạng và nguồn gốc dữ liệu

Độ chính xác của dữ liệu

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Thu thập dữ liệu

Chuẩn bị dữ liệu

Xây dựng mô hình

Đánh giá mô hình

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 5: Thuật toán đóng vai trò quan trọng như thế nào trong giai đoạn 'Xây dựng mô hình' của quy trình Khoa học dữ liệu?

Chỉ giúp thu thập dữ liệu nhanh hơn

Chỉ dùng để lưu trữ dữ liệu

Giúp xác định vấn đề nghiên cứu

Là nền tảng để phát triển và huấn luyện các mô hình phân tích/dự đoán

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 6: Đặc điểm nào của máy tính hiện đại (như điện toán đám mây hoặc hệ thống phân tán) hỗ trợ xử lý 'Volume' (Khối lượng) dữ liệu ngày càng tăng trong KHDL?

Khả năng mở rộng (Scalability)

Kích thước màn hình hiển thị

Tốc độ gõ phím

Độ phân giải âm thanh

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 7: Trong bối cảnh Dữ liệu lớn, đặc điểm 'Velocity' (Tốc độ) có ý nghĩa gì đối với yêu cầu xử lý dữ liệu trong KHDL?

Dữ liệu chỉ được cập nhật hàng năm

Dữ liệu luôn có định dạng cố định

Dữ liệu được tạo ra và cần được xử lý nhanh chóng (thời gian thực hoặc gần thời gian thực)

Dữ liệu chỉ đến từ một nguồn duy nhất

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 8: Giai đoạn nào trong quy trình KHDL tập trung vào việc đánh giá mức độ hiệu quả, chính xác của mô hình đã xây dựng dựa trên các chỉ số đo lường?

Thu thập dữ liệu

Chuẩn bị dữ liệu

Triển khai mô hình

Đánh giá mô hình

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Chỉ lưu trữ dữ liệu giao dịch

Phát hiện mẫu hình, phân khúc khách hàng và đưa ra dự đoán/khuyến nghị

Giảm bớt số lượng khách hàng

Chỉ hiển thị lịch sử mua hàng thô

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 10: Tại sao thuật toán xử lý song song (parallel processing) lại có lợi thế lớn trong việc xử lý Dữ liệu lớn?

Cho phép chia nhỏ và xử lý đồng thời các phần của dữ liệu trên nhiều bộ xử lý/máy tính, giúp giảm thời gian xử lý tổng thể.

Chỉ hoạt động trên một máy tính duy nhất.

Yêu cầu dữ liệu phải có định dạng rất đơn giản.

Làm tăng đáng kể dung lượng lưu trữ cần thiết.

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 11: Bước 'Triển khai mô hình' (Deployment) trong quy trình KHDL thường bao gồm hoạt động nào?

Thu thập thêm dữ liệu mới

Làm sạch dữ liệu lần cuối

Đưa mô hình đã xây dựng vào sử dụng trong môi trường thực tế để tạo ra giá trị (ví dụ: đưa ra dự đoán, phân loại tự động).

Thay đổi mục tiêu nghiên cứu ban đầu

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 12: Đặc điểm 'Veracity' (Độ tin cậy/Chính xác) của Dữ liệu lớn đề cập đến thách thức nào?

Dữ liệu luôn đến từ một nguồn duy nhất.

Khó khăn trong việc xác định tính chính xác, trung thực và đáng tin cậy của dữ liệu.

Dữ liệu chỉ có một định dạng duy nhất.

Dữ liệu chỉ được tạo ra một lần duy nhất.

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 13: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại là một công cụ hữu ích trong giai đoạn 'Chuẩn bị dữ liệu' và 'Đánh giá mô hình'?

Chỉ để làm cho báo cáo đẹp hơn.

Giúp tăng dung lượng lưu trữ dữ liệu.

Tự động xây dựng mô hình mà không cần thuật toán.

Giúp con người dễ dàng phát hiện xu hướng, mẫu hình, điểm bất thường trong dữ liệu hoặc hiểu rõ hơn kết quả của mô hình.

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 14: Một dự án KHDL về phân tích cảm xúc khách hàng từ bình luận trên mạng xã hội sẽ gặp thách thức lớn nhất với đặc điểm nào của Dữ liệu lớn?

Variety (Đa dạng về định dạng, ngôn ngữ, cấu trúc phi cấu trúc)

Volume (Chỉ cần lượng dữ liệu nhỏ)

Velocity (Không cần xử lý nhanh)

Value (Dữ liệu không có giá trị)

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 15: Mục tiêu chính của việc sử dụng thuật toán tự động hóa trong các bước của quy trình KHDL (ví dụ: làm sạch dữ liệu, lựa chọn đặc trưng) là gì?

Làm cho quy trình phức tạp hơn.

Tăng cường sự can thiệp thủ công.

Giảm sự phụ thuộc vào công việc thủ công, tăng tốc độ và hiệu quả xử lý.

Giảm bớt khối lượng dữ liệu.

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Xác định vấn đề

Thu thập dữ liệu

Xây dựng mô hình

Triển khai và giám sát/đánh giá liên tục

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 17: Vai trò của máy tính trong giai đoạn 'Thu thập dữ liệu' của KHDL là gì?

Chỉ tạo ra dữ liệu mới.

Kết nối đến các nguồn dữ liệu khác nhau, trích xuất và lưu trữ dữ liệu.

Xây dựng mô hình học máy ngay lập tức.

Trực quan hóa dữ liệu mà không cần thu thập.

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Value (Giá trị)

Volume (Khối lượng)

Velocity (Tốc độ)

Variety (Đa dạng)

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 19: Trong KHDL, việc lựa chọn thuật toán phù hợp cho giai đoạn 'Xây dựng mô hình' phụ thuộc chủ yếu vào yếu tố nào?

Màu sắc của dữ liệu.

Kích thước màn hình máy tính.

Loại vấn đề cần giải quyết (ví dụ: phân loại, dự đoán, phân cụm) và đặc điểm của dữ liệu.

Tên của người thu thập dữ liệu.

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 20: Tại sao KHDL thường được mô tả là một quy trình lặp (iterative) thay vì tuyến tính (linear)?

Vì mỗi bước chỉ thực hiện một lần.

Vì dữ liệu không bao giờ thay đổi.

Vì chỉ có một thuật toán duy nhất được sử dụng.

Vì các giai đoạn (như chuẩn bị dữ liệu, xây dựng mô hình, đánh giá) thường cần được lặp lại, điều chỉnh dựa trên kết quả và hiểu biết mới thu được.

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Volume (Khối lượng)

Veracity (Độ tin cậy/Chính xác)

Velocity (Tốc độ)

Variety (Đa dạng)

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Chỉ để lưu trữ dữ liệu lịch sử.

Tạo ra dữ liệu ngẫu nhiên.

Khai thác thông tin và hiểu biết sâu sắc từ dữ liệu để hỗ trợ ra quyết định.

Làm chậm quá trình kinh doanh.

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Khả năng lưu trữ và xử lý mở rộng (Scalable Storage and Processing)

Khả năng giảm kích thước dữ liệu về 0

Khả năng chỉ hoạt động với dữ liệu văn bản

Khả năng tự in báo cáo

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Chuẩn bị dữ liệu

Xây dựng mô hình

Triển khai mô hình

Xác định vấn đề và mục tiêu nghiên cứu

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 25: Thuật toán có thể giúp tối ưu hóa giai đoạn 'Chuẩn bị dữ liệu' bằng cách nào?

Tự động tạo ra dữ liệu giả.

Tự động hóa các tác vụ như làm sạch dữ liệu, xử lý giá trị thiếu, hoặc chuyển đổi định dạng.

Ngăn chặn việc thu thập dữ liệu từ nhiều nguồn.

Làm cho dữ liệu trở nên khó hiểu hơn.

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Thu thập dữ liệu

Xác định vấn đề

Đánh giá mô hình và Triển khai (khi giám sát)

Chỉ ở giai đoạn thu thập dữ liệu

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 27: Mối quan hệ giữa Máy tính, Thuật toán và Khoa học dữ liệu có thể được mô tả như thế nào?

Máy tính và thuật toán không liên quan đến Khoa học dữ liệu.

Khoa học dữ liệu chỉ là việc lưu trữ dữ liệu trên máy tính.

Chỉ cần thuật toán là đủ để làm Khoa học dữ liệu, không cần máy tính.

Máy tính cung cấp hạ tầng và năng lực xử lý, thuật toán cung cấp phương pháp và logic, cả hai là công cụ thiết yếu giúp thực hiện các nhiệm vụ trong Khoa học dữ liệu.

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 28: Đặc điểm nào của Dữ liệu lớn đề cập đến tốc độ dữ liệu được tạo ra, thu thập và cần được xử lý, thường là rất nhanh và liên tục?

Volume

Variety

Velocity

Veracity

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Xây dựng mô hình

Xác định vấn đề

Thu thập dữ liệu

Triển khai mô hình

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 30: Tại sao việc 'Xác định vấn đề' một cách rõ ràng ngay từ đầu lại quan trọng đối với sự thành công của một dự án KHDL?

Để đảm bảo thu thập được càng nhiều dữ liệu càng tốt.

Để định hướng toàn bộ quy trình, từ việc thu thập dữ liệu nào, chọn thuật toán nào, đến cách đánh giá kết quả và triển khai.

Để tránh phải sử dụng máy tính mạnh.

Chỉ để làm cho báo cáo cuối cùng dài hơn.

Xem kết quả

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Nhận kết quả

Xảy ra lỗi

Bước 1: Vào google.com rồi gõ từ khóa:
Copy nhanh thanh-tim-kiem

Bước 2: Trong kết quả tìm kiếm Google, hãy tìm website giống hình bên dưới

Nếu trang 1 không có hãy tìm ở trang 2, 3, 4... nhé trang-google

Bước 3:

Cuộn xuống cuối bài viết rồi bấm vào nút GIỐNG HÌNH DƯỚI và chờ 1 lát để lấy mã:

luot-xem

Nếu tìm không thấy mã bạn có thể Đổi nhiệm vụ để lấy mã khác.

By Wordpress Quiz plugin

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 08

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 08 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong Khoa học dữ liệu, vai trò cốt lõi nào của máy tính cho phép xử lý và phân tích các tập dữ liệu có kích thước vượt quá khả năng xử lý thủ công?

A. Khả năng tạo ra dữ liệu mới
B. Năng lực tính toán và xử lý dữ liệu lớn
C. Chỉ đơn thuần là thiết bị lưu trữ
D. Cung cấp giao diện người dùng thân thiện

Câu 2: Một công ty thương mại điện tử thu thập hàng tỉ lượt truy cập trang web mỗi ngày. Thách thức lớn nhất khi phân tích dữ liệu này để hiểu hành vi khách hàng theo thời gian thực (real-time) thường liên quan đến đặc điểm nào của dữ liệu lớn?

A. Khối lượng (Volume)
B. Đa dạng (Variety)
C. Tốc độ (Velocity)
D. Độ tin cậy (Veracity)

Câu 3: Khi một nhà khoa học dữ liệu bắt đầu một dự án, bước đầu tiên và quan trọng nhất là xác định rõ câu hỏi hoặc mục tiêu kinh doanh cần giải quyết. Giai đoạn này trong quy trình Khoa học dữ liệu được gọi là gì?

A. Xác định vấn đề
B. Thu thập dữ liệu
C. Chuẩn bị dữ liệu
D. Xây dựng mô hình

Câu 4: Một tập dữ liệu bao gồm các loại thông tin khác nhau như văn bản từ bình luận khách hàng, hình ảnh sản phẩm, dữ liệu bán hàng dạng số và video quảng cáo. Đặc điểm nào của dữ liệu lớn được thể hiện rõ nhất trong trường hợp này?

A. Tốc độ (Velocity)
B. Khối lượng (Volume)
C. Độ tin cậy (Veracity)
D. Đa dạng (Variety)

Câu 5: Thuật toán xử lý song song (Parallel Processing) được sử dụng rộng rãi trong xử lý dữ liệu lớn vì nó mang lại lợi ích chính nào?

A. Giảm thiểu khối lượng dữ liệu cần xử lý
B. Tăng tốc độ xử lý bằng cách phân chia công việc
C. Tự động hóa hoàn toàn quy trình thu thập dữ liệu
D. Chỉ áp dụng cho dữ liệu có cấu trúc

Câu 6: Trước khi xây dựng mô hình dự đoán giá nhà, một nhà khoa học dữ liệu cần kiểm tra các giá trị bị thiếu, loại bỏ các bản ghi trùng lặp và chuẩn hóa định dạng các trường dữ liệu. Các hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

A. Xác định vấn đề
B. Thu thập dữ liệu
C. Chuẩn bị dữ liệu
D. Đánh giá mô hình

Câu 7: Máy tính cung cấp khả năng mở rộng (Scalability) như thế nào để đáp ứng nhu cầu xử lý dữ liệu ngày càng tăng trong Khoa học dữ liệu?

A. Có thể kết hợp nhiều máy tính thành hệ thống hoặc sử dụng điện toán đám mây
B. Chỉ cần nâng cấp bộ xử lý của một máy tính duy nhất
C. Giảm kích thước dữ liệu đầu vào
D. Tự động tạo ra dữ liệu tổng hợp

Câu 8: Sau khi mô hình học máy đã được xây dựng và đánh giá là hiệu quả, bước tiếp theo là đưa mô hình đó vào sử dụng trong môi trường thực tế, ví dụ như tích hợp vào ứng dụng di động hoặc hệ thống website. Giai đoạn này được gọi là gì trong quy trình Khoa học dữ liệu?

A. Thu thập dữ liệu
B. Chuẩn bị dữ liệu
C. Xây dựng mô hình
D. Triển khai

Câu 9: Đặc điểm nào của dữ liệu lớn liên quan đến sự không chắc chắn hoặc không chính xác của dữ liệu do nguồn gốc khác nhau hoặc lỗi thu thập?

A. Độ tin cậy (Veracity)
B. Tốc độ (Velocity)
C. Khối lượng (Volume)
D. Đa dạng (Variety)

Câu 10: Một thuật toán được thiết kế để tự động phân loại email thành thư rác hoặc không phải thư rác dựa trên nội dung của chúng. Việc sử dụng thuật toán này thể hiện ưu điểm nào của máy tính và thuật toán trong xử lý dữ liệu?

A. Tăng khối lượng dữ liệu
B. Giảm tốc độ xử lý
C. Tự động hóa quy trình
D. Chỉ lưu trữ dữ liệu

Câu 11: Trong giai đoạn nào của quy trình Khoa học dữ liệu, các nhà khoa học dữ liệu sử dụng các kỹ thuật thống kê và trực quan hóa để khám phá các mẫu, xu hướng và mối quan hệ trong dữ liệu?

A. Xác định vấn đề
B. Chuẩn bị dữ liệu (thường bao gồm khám phá dữ liệu)
C. Xây dựng mô hình
D. Triển khai

Câu 12: Thuật toán học máy (Machine Learning) đóng vai trò gì trong quy trình Khoa học dữ liệu?

A. Giúp máy tính học hỏi từ dữ liệu để đưa ra dự đoán hoặc quyết định
B. Chỉ dùng để thu thập dữ liệu từ các nguồn khác nhau
C. Giúp xác định vấn đề cần giải quyết
D. Đảm bảo an toàn cho dữ liệu được lưu trữ

Câu 13: Việc sử dụng máy tính trong Khoa học dữ liệu giúp tiết kiệm đáng kể thời gian và chi phí so với các phương pháp thủ công hoặc truyền thống, chủ yếu nhờ vào khả năng nào?

A. Giảm số lượng dữ liệu cần phân tích
B. Loại bỏ hoàn toàn nhu cầu về con người
C. Tạo ra dữ liệu chất lượng cao hơn một cách tự động
D. Tăng tốc độ xử lý và tự động hóa các tác vụ lặp lại

Câu 14: Đặc điểm nào của dữ liệu lớn đề cập đến việc dữ liệu có thể có nhiều định dạng khác nhau, từ có cấu trúc (ví dụ: cơ sở dữ liệu) đến bán cấu trúc (ví dụ: XML, JSON) và phi cấu trúc (ví dụ: văn bản, hình ảnh, video)?

A. Khối lượng (Volume)
B. Đa dạng (Variety)
C. Tốc độ (Velocity)
D. Giá trị (Value)

Câu 15: Trong quy trình Khoa học dữ liệu, sau khi mô hình đã được triển khai, cần liên tục giám sát và đánh giá hiệu suất của nó trong môi trường thực tế. Giai đoạn này thuộc về bước nào trong quy trình?

A. Đánh giá và Triển khai (sau khi triển khai vẫn cần đánh giá liên tục)
B. Xây dựng mô hình
C. Chuẩn bị dữ liệu
D. Thu thập dữ liệu

Câu 16: Một hệ thống khuyến nghị sản phẩm trên website thương mại điện tử sử dụng lịch sử mua sắm của người dùng để gợi ý các sản phẩm phù hợp. Đây là một ví dụ điển hình về việc áp dụng giai đoạn nào của quy trình Khoa học dữ liệu vào thực tế?

A. Thu thập dữ liệu
B. Chuẩn bị dữ liệu
C. Xây dựng mô hình
D. Triển khai

Câu 17: Yếu tố nào không phải là một trong những "V" truyền thống thường được sử dụng để mô tả dữ liệu lớn?

A. Volume (Khối lượng)
B. Velocity (Tốc độ)
C. Visualization (Trực quan hóa)
D. Variety (Đa dạng)

Câu 18: Khi xử lý một tập dữ liệu lớn, việc chia nhỏ dữ liệu thành các phần nhỏ hơn và xử lý độc lập trên nhiều máy tính hoặc lõi xử lý khác nhau, sau đó tổng hợp kết quả, là ứng dụng của nguyên tắc thuật toán nào?

A. Xử lý song song
B. Xử lý tuần tự
C. Thuật toán tìm kiếm nhị phân
D. Thuật toán sắp xếp nổi bọt

Câu 19: Khả năng nào của máy tính là nền tảng cho việc thực hiện các thuật toán học máy phức tạp, đòi hỏi hàng tỷ phép tính để huấn luyện mô hình trên các tập dữ liệu khổng lồ?

A. Khả năng hiển thị đồ họa
B. Năng lực tính toán cao (High computational power)
C. Kích thước màn hình lớn
D. Kết nối internet tốc độ thấp

Câu 20: Một nhà khoa học dữ liệu đang làm việc với dữ liệu khảo sát khách hàng. Anh ta nhận thấy có nhiều câu trả lời không đầy đủ hoặc mâu thuẫn. Hoạt động làm sạch dữ liệu này nhằm mục đích cải thiện đặc điểm nào của dữ liệu, liên quan đến "V" thứ năm (ngoài 4 V truyền thống)?

A. Tốc độ (Velocity)
B. Khối lượng (Volume)
C. Giá trị (Value) và Độ tin cậy (Veracity)
D. Đa dạng (Variety)

Câu 21: Giả sử bạn là một nhà khoa học dữ liệu được giao nhiệm vụ dự đoán doanh số bán hàng quý tới của một cửa hàng. Sau khi thu thập và làm sạch dữ liệu lịch sử bán hàng, bước tiếp theo bạn sẽ thực hiện là gì trong quy trình Khoa học dữ liệu?

A. Triển khai mô hình
B. Xây dựng mô hình dự đoán
C. Xác định lại vấn đề ban đầu
D. Chỉ báo cáo số liệu thô

Câu 22: Thuật toán nào thường được sử dụng để phân tích dữ liệu theo thời gian thực, cho phép đưa ra quyết định hoặc phản ứng ngay lập tức dựa trên dữ liệu mới đến?

A. Thuật toán xử lý dòng dữ liệu (Stream Processing)
B. Thuật toán xử lý hàng loạt (Batch Processing)
C. Thuật toán sắp xếp nhanh (Quick Sort)
D. Thuật toán nén dữ liệu

Câu 23: Việc lưu trữ an toàn và hiệu quả các tập dữ liệu lớn, đôi khi có chứa thông tin nhạy cảm, là một thách thức quan trọng trong Khoa học dữ liệu. Vai trò nào của máy tính đóng góp trực tiếp vào việc giải quyết thách thức này?

A. Khả năng xử lý đồ họa
B. Tốc độ tính toán
C. Khả năng tự động hóa
D. Năng lực lưu trữ và các công nghệ bảo mật tích hợp

Câu 24: Phân tích một sơ đồ quy trình Khoa học dữ liệu, bạn thấy một mũi tên chỉ từ "Xây dựng mô hình" đến "Đánh giá mô hình". Hoạt động chính diễn ra ở giai đoạn "Đánh giá mô hình" là gì?

A. Thu thập thêm dữ liệu mới
B. Kiểm tra hiệu suất của mô hình trên dữ liệu chưa từng thấy
C. Làm sạch dữ liệu đầu vào
D. Xác định mục tiêu kinh doanh

Câu 25: Một công ty muốn sử dụng Khoa học dữ liệu để phân khúc khách hàng dựa trên hành vi mua sắm của họ. Họ thu thập dữ liệu về các giao dịch trong 5 năm qua. Đặc điểm nào của dữ liệu lớn được thể hiện qua việc thu thập dữ liệu trong một khoảng thời gian dài, dẫn đến tập dữ liệu rất lớn?

A. Khối lượng (Volume)
B. Tốc độ (Velocity)
C. Đa dạng (Variety)
D. Độ tin cậy (Veracity)

Câu 26: Việc sử dụng các thuật toán tự động hóa trong quy trình Khoa học dữ liệu mang lại lợi ích gì cho các nhà khoa học dữ liệu?

A. Giảm khả năng mở rộng của hệ thống
B. Yêu cầu nhiều công việc thủ công hơn
C. Giảm thiểu các tác vụ lặp đi lặp lại, cho phép tập trung vào phân tích chuyên sâu
D. Chỉ áp dụng cho việc trực quan hóa dữ liệu

Câu 27: Một thuật toán được sử dụng để tìm ra các nhóm khách hàng có hành vi tương tự nhau trong một tập dữ liệu lớn (ví dụ: phân khúc thị trường). Đây là một ví dụ về việc áp dụng thuật toán trong giai đoạn nào của quy trình Khoa học dữ liệu?

A. Thu thập dữ liệu
B. Xây dựng mô hình (phân cụm là một kỹ thuật mô hình hóa)
C. Triển khai
D. Đánh giá mô hình

Câu 28: So sánh giữa xử lý dữ liệu thủ công và xử lý bằng máy tính trong Khoa học dữ liệu, ưu điểm rõ rệt nhất của việc sử dụng máy tính là gì?

A. Độ chính xác luôn tuyệt đối 100%
B. Không cần bất kỳ sự giám sát nào của con người
C. Chỉ xử lý được dữ liệu có cấu trúc
D. Tốc độ xử lý vượt trội và khả năng xử lý khối lượng dữ liệu khổng lồ

Câu 29: Khi một mô hình dự đoán giá nhà được triển khai và sử dụng, việc liên tục thu thập dữ liệu giá nhà mới, dữ liệu thị trường, v.v., để cập nhật mô hình và đảm bảo nó vẫn chính xác theo thời gian, là hoạt động của giai đoạn nào trong quy trình Khoa học dữ liệu?

A. Thu thập dữ liệu và Đánh giá/Giám sát (quy trình lặp lại)
B. Chỉ Triển khai
C. Chỉ Chuẩn bị dữ liệu
D. Chỉ Xây dựng mô hình

Câu 30: Một trong những lợi ích kinh tế chính của việc áp dụng Khoa học dữ liệu với sự hỗ trợ của máy tính và thuật toán là gì?

A. Tăng chi phí vận hành do cần nhiều máy móc
B. Tối ưu hóa hoạt động, đưa ra quyết định dựa trên dữ liệu, tạo lợi thế cạnh tranh
C. Giảm khả năng hiểu biết về khách hàng
D. Chỉ áp dụng cho các công ty công nghệ lớn

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Khả năng tạo ra dữ liệu mới

Năng lực tính toán và xử lý dữ liệu lớn

Chỉ đơn thuần là thiết bị lưu trữ

Cung cấp giao diện người dùng thân thiện

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Khối lượng (Volume)

Đa dạng (Variety)

Tốc độ (Velocity)

Độ tin cậy (Veracity)

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Xác định vấn đề

Thu thập dữ liệu

Chuẩn bị dữ liệu

Xây dựng mô hình

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Tốc độ (Velocity)

Khối lượng (Volume)

Độ tin cậy (Veracity)

Đa dạng (Variety)

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 5: Thuật toán xử lý song song (Parallel Processing) được sử dụng rộng rãi trong xử lý dữ liệu lớn vì nó mang lại lợi ích chính nào?

Giảm thiểu khối lượng dữ liệu cần xử lý

Tăng tốc độ xử lý bằng cách phân chia công việc

Tự động hóa hoàn toàn quy trình thu thập dữ liệu

Chỉ áp dụng cho dữ liệu có cấu trúc

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Xác định vấn đề

Thu thập dữ liệu

Chuẩn bị dữ liệu

Đánh giá mô hình

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 7: Máy tính cung cấp khả năng mở rộng (Scalability) như thế nào để đáp ứng nhu cầu xử lý dữ liệu ngày càng tăng trong Khoa học dữ liệu?

Có thể kết hợp nhiều máy tính thành hệ thống hoặc sử dụng điện toán đám mây

Chỉ cần nâng cấp bộ xử lý của một máy tính duy nhất

Giảm kích thước dữ liệu đầu vào

Tự động tạo ra dữ liệu tổng hợp

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Thu thập dữ liệu

Chuẩn bị dữ liệu

Xây dựng mô hình

Triển khai

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 9: Đặc điểm nào của dữ liệu lớn liên quan đến sự không chắc chắn hoặc không chính xác của dữ liệu do nguồn gốc khác nhau hoặc lỗi thu thập?

Độ tin cậy (Veracity)

Tốc độ (Velocity)

Khối lượng (Volume)

Đa dạng (Variety)

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Tăng khối lượng dữ liệu

Giảm tốc độ xử lý

Tự động hóa quy trình

Chỉ lưu trữ dữ liệu

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Xác định vấn đề

Chuẩn bị dữ liệu (thường bao gồm khám phá dữ liệu)

Xây dựng mô hình

Triển khai

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 12: Thuật toán học máy (Machine Learning) đóng vai trò gì trong quy trình Khoa học dữ liệu?

Giúp máy tính học hỏi từ dữ liệu để đưa ra dự đoán hoặc quyết định

Chỉ dùng để thu thập dữ liệu từ các nguồn khác nhau

Giúp xác định vấn đề cần giải quyết

Đảm bảo an toàn cho dữ liệu được lưu trữ

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Giảm số lượng dữ liệu cần phân tích

Loại bỏ hoàn toàn nhu cầu về con người

Tạo ra dữ liệu chất lượng cao hơn một cách tự động

Tăng tốc độ xử lý và tự động hóa các tác vụ lặp lại

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Khối lượng (Volume)

Đa dạng (Variety)

Tốc độ (Velocity)

Giá trị (Value)

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Đánh giá và Triển khai (sau khi triển khai vẫn cần đánh giá liên tục)

Xây dựng mô hình

Chuẩn bị dữ liệu

Thu thập dữ liệu

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Thu thập dữ liệu

Chuẩn bị dữ liệu

Xây dựng mô hình

Triển khai

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 17: Yếu tố nào không phải là một trong những 'V' truyền thống thường được sử dụng để mô tả dữ liệu lớn?

Volume (Khối lượng)

Velocity (Tốc độ)

Visualization (Trực quan hóa)

Variety (Đa dạng)

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Xử lý song song

Xử lý tuần tự

Thuật toán tìm kiếm nhị phân

Thuật toán sắp xếp nổi bọt

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Khả năng hiển thị đồ họa

Năng lực tính toán cao (High computational power)

Kích thước màn hình lớn

Kết nối internet tốc độ thấp

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Tốc độ (Velocity)

Khối lượng (Volume)

Giá trị (Value) và Độ tin cậy (Veracity)

Đa dạng (Variety)

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Triển khai mô hình

Xây dựng mô hình dự đoán

Xác định lại vấn đề ban đầu

Chỉ báo cáo số liệu thô

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Thuật toán xử lý dòng dữ liệu (Stream Processing)

Thuật toán xử lý hàng loạt (Batch Processing)

Thuật toán sắp xếp nhanh (Quick Sort)

Thuật toán nén dữ liệu

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Khả năng xử lý đồ họa

Tốc độ tính toán

Khả năng tự động hóa

Năng lực lưu trữ và các công nghệ bảo mật tích hợp

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 24: Phân tích một sơ đồ quy trình Khoa học dữ liệu, bạn thấy một mũi tên chỉ từ 'Xây dựng mô hình' đến 'Đánh giá mô hình'. Hoạt động chính diễn ra ở giai đoạn 'Đánh giá mô hình' là gì?

Thu thập thêm dữ liệu mới

Kiểm tra hiệu suất của mô hình trên dữ liệu chưa từng thấy

Làm sạch dữ liệu đầu vào

Xác định mục tiêu kinh doanh

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Khối lượng (Volume)

Tốc độ (Velocity)

Đa dạng (Variety)

Độ tin cậy (Veracity)

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 26: Việc sử dụng các thuật toán tự động hóa trong quy trình Khoa học dữ liệu mang lại lợi ích gì cho các nhà khoa học dữ liệu?

Giảm khả năng mở rộng của hệ thống

Yêu cầu nhiều công việc thủ công hơn

Giảm thiểu các tác vụ lặp đi lặp lại, cho phép tập trung vào phân tích chuyên sâu

Chỉ áp dụng cho việc trực quan hóa dữ liệu

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Thu thập dữ liệu

Xây dựng mô hình (phân cụm là một kỹ thuật mô hình hóa)

Triển khai

Đánh giá mô hình

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 28: So sánh giữa xử lý dữ liệu thủ công và xử lý bằng máy tính trong Khoa học dữ liệu, ưu điểm rõ rệt nhất của việc sử dụng máy tính là gì?

Độ chính xác luôn tuyệt đối 100%

Không cần bất kỳ sự giám sát nào của con người

Chỉ xử lý được dữ liệu có cấu trúc

Tốc độ xử lý vượt trội và khả năng xử lý khối lượng dữ liệu khổng lồ

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Thu thập dữ liệu và Đánh giá/Giám sát (quy trình lặp lại)

Chỉ Triển khai

Chỉ Chuẩn bị dữ liệu

Chỉ Xây dựng mô hình

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 30: Một trong những lợi ích kinh tế chính của việc áp dụng Khoa học dữ liệu với sự hỗ trợ của máy tính và thuật toán là gì?

Tăng chi phí vận hành do cần nhiều máy móc

Tối ưu hóa hoạt động, đưa ra quyết định dựa trên dữ liệu, tạo lợi thế cạnh tranh

Giảm khả năng hiểu biết về khách hàng

Chỉ áp dụng cho các công ty công nghệ lớn

Xem kết quả

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Nhận kết quả

Xảy ra lỗi

Bước 1: Vào google.com rồi gõ từ khóa:
Copy nhanh thanh-tim-kiem

Bước 2: Trong kết quả tìm kiếm Google, hãy tìm website giống hình bên dưới

Nếu trang 1 không có hãy tìm ở trang 2, 3, 4... nhé trang-google

Bước 3:

Cuộn xuống cuối bài viết rồi bấm vào nút GIỐNG HÌNH DƯỚI và chờ 1 lát để lấy mã:

luot-xem

Nếu tìm không thấy mã bạn có thể Đổi nhiệm vụ để lấy mã khác.

By Wordpress Quiz plugin

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 09

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 09 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong quy trình Khoa học dữ liệu, giai đoạn nào đóng vai trò nền tảng, đòi hỏi máy tính phải có khả năng lưu trữ và truy xuất dữ liệu hiệu quả từ nhiều nguồn khác nhau?

A. Xây dựng mô hình
B. Thu thập dữ liệu
C. Đánh giá mô hình
D. Triển khai

Câu 2: Khả năng xử lý song song (parallel processing) của máy tính và thuật toán mang lại lợi ích chủ yếu nào trong việc phân tích dữ liệu lớn?

A. Giảm khối lượng dữ liệu cần xử lý.
B. Tăng độ chính xác của dữ liệu đầu vào.
C. Rút ngắn đáng kể thời gian xử lý dữ liệu quy mô lớn.
D. Tự động hóa hoàn toàn quy trình thu thập dữ liệu.

Câu 3: Khi phân tích dữ liệu từ các nguồn đa dạng như cảm biến IoT, bài đăng mạng xã hội, video, và cơ sở dữ liệu truyền thống, đặc điểm nào của Dữ liệu lớn (Big Data) được nhấn mạnh rõ nhất?

A. Khối lượng (Volume)
B. Tốc độ (Velocity)
C. Độ tin cậy (Veracity)
D. Đa dạng (Variety)

Câu 4: Trong giai đoạn Chuẩn bị dữ liệu của quy trình Khoa học dữ liệu, máy tính và thuật toán thường được sử dụng để thực hiện những công việc nào sau đây?

A. Làm sạch dữ liệu (xử lý giá trị thiếu, ngoại lai) và chuyển đổi định dạng.
B. Thu thập dữ liệu mới từ các nguồn trực tuyến.
C. Triển khai mô hình dự đoán vào môi trường thực tế.
D. Xác định mục tiêu kinh doanh cho dự án.

Câu 5: Một công ty muốn xây dựng hệ thống phát hiện gian lận thẻ tín dụng dựa trên dữ liệu giao dịch theo thời gian thực. Yếu tố nào của Dữ liệu lớn là thách thức chính mà hệ thống máy tính cần giải quyết để đưa ra cảnh báo kịp thời?

A. Đa dạng (Variety)
B. Tốc độ (Velocity)
C. Khối lượng (Volume)
D. Độ tin cậy (Veracity)

Câu 6: Khả năng mở rộng (scalability) của hệ thống máy tính, đặc biệt là thông qua điện toán đám mây, có ý nghĩa quan trọng như thế nào đối với Khoa học dữ liệu?

A. Giúp giảm thiểu số lượng thuật toán cần sử dụng.
B. Đảm bảo độ chính xác tuyệt đối của dữ liệu.
C. Cho phép xử lý lượng dữ liệu ngày càng tăng mà không cần đầu tư lớn vào phần cứng cố định.
D. Tự động xác định vấn đề cần giải quyết.

Câu 7: Vai trò chính của thuật toán trong giai đoạn Xây dựng mô hình (Building Model) của quy trình Khoa học dữ liệu là gì?

A. Phân tích dữ liệu đã chuẩn bị để tìm ra mối quan hệ, quy luật và xây dựng mô hình dự đoán/phân loại.
B. Làm sạch và trực quan hóa dữ liệu để hiểu rõ hơn.
C. Thu thập dữ liệu mới từ các nguồn khác nhau.
D. Đánh giá hiệu quả hoạt động của mô hình sau khi triển khai.

Câu 8: Dữ liệu lớn thường bao gồm dữ liệu có cấu trúc (ví dụ: cơ sở dữ liệu quan hệ), bán cấu trúc (ví dụ: XML, JSON), và phi cấu trúc (ví dụ: văn bản, hình ảnh). Điều này liên quan trực tiếp đến đặc điểm nào?

A. Tốc độ (Velocity)
B. Khối lượng (Volume)
C. Đa dạng (Variety)
D. Giá trị (Value)

Câu 9: Tại sao việc áp dụng thuật toán tự động hóa lại quan trọng trong xử lý dữ liệu lớn và Khoa học dữ liệu?

A. Giúp con người dễ dàng hiểu được toàn bộ dữ liệu thô.
B. Loại bỏ hoàn toàn nhu cầu về chuyên gia Khoa học dữ liệu.
C. Chỉ cần thiết cho các tác vụ đơn giản, lặp lại.
D. Giảm thiểu sự can thiệp thủ công, tăng tốc độ và hiệu quả cho các tác vụ lặp đi lặp lại như thu thập, làm sạch hoặc phân tích sơ bộ dữ liệu.

Câu 10: Giai đoạn Đánh giá (Evaluation) trong quy trình Khoa học dữ liệu có mục đích chính là gì?

A. Kiểm tra xem mô hình đã xây dựng có đáp ứng được mục tiêu ban đầu và hoạt động hiệu quả trên dữ liệu mới hay không.
B. Thu thập thêm dữ liệu nếu mô hình hoạt động chưa tốt.
C. Xác định lại vấn đề nếu kết quả đánh giá không như mong đợi.
D. Trực quan hóa kết quả cuối cùng cho người dùng.

Câu 11: Đặc điểm nào của máy tính hiện đại cho phép xử lý các thuật toán phức tạp như mạng nơ-ron sâu (deep learning) đòi hỏi hàng tỷ phép tính?

A. Giao diện người dùng thân thiện.
B. Năng lực tính toán mạnh mẽ (ví dụ: sử dụng GPU).
C. Kích thước nhỏ gọn.
D. Khả năng kết nối internet.

Câu 12: Khi một thuật toán được thiết kế để dự đoán hành vi khách hàng dựa trên lịch sử mua sắm khổng lồ, nó đang thực hiện chức năng chính nào của Khoa học dữ liệu?

A. Chỉ đơn thuần lưu trữ dữ liệu.
B. Làm sạch dữ liệu bị lỗi.
C. Phân tích dữ liệu để đưa ra dự đoán hoặc hiểu biết sâu sắc.
D. Trực quan hóa dữ liệu đơn giản.

Câu 13: Dữ liệu lớn thường có "Độ tin cậy" (Veracity) không đồng đều. Điều này có nghĩa là gì và tại sao máy tính/thuật toán cần giải quyết vấn đề này?

A. Dữ liệu có thể không chính xác, không đầy đủ hoặc không nhất quán, đòi hỏi thuật toán làm sạch và xử lý ngoại lệ để đảm bảo kết quả phân tích đáng tin cậy.
B. Dữ liệu đến quá nhanh, máy tính không kịp xử lý.
C. Dữ liệu có quá nhiều định dạng khác nhau.
D. Khối lượng dữ liệu quá lớn để lưu trữ.

Câu 14: Giai đoạn Triển khai (Deployment) trong quy trình Khoa học dữ liệu bao gồm những hoạt động nào?

A. Thu thập dữ liệu mới để huấn luyện lại mô hình.
B. Làm sạch dữ liệu lần cuối trước khi sử dụng.
C. Xây dựng các mô hình thay thế nếu mô hình hiện tại không tốt.
D. Tích hợp mô hình đã xây dựng và đánh giá vào hệ thống hoặc quy trình hiện có để sử dụng trong thực tế.

Câu 15: Việc sử dụng các thuật toán phân tích dữ liệu trên các hệ thống máy tính phân tán (distributed computing systems) như Hadoop hoặc Spark chủ yếu nhằm mục đích gì?

A. Chỉ để lưu trữ dữ liệu một cách an toàn hơn.
B. Xử lý và phân tích hiệu quả các tập dữ liệu có khối lượng vượt quá khả năng của một máy tính đơn lẻ.
C. Tạo ra dữ liệu tổng hợp mới một cách tự động.
D. Trực quan hóa dữ liệu phức tạp thành biểu đồ đơn giản.

Câu 16: Yếu tố "Giá trị" (Value) trong mô tả Dữ liệu lớn (Big Data) đề cập đến khía cạnh nào?

A. Khả năng khai thác thông tin hữu ích và tạo ra giá trị kinh doanh hoặc hiểu biết từ dữ liệu.
B. Chi phí để thu thập và lưu trữ dữ liệu.
C. Số lượng người truy cập dữ liệu.
D. Tốc độ dữ liệu được tạo ra.

Câu 17: Tại sao các thuật toán học máy (Machine Learning) là một phần không thể thiếu trong Khoa học dữ liệu hiện đại?

A. Chúng giúp thu thập dữ liệu tự động từ internet.
B. Chúng chỉ đơn giản là các công cụ thống kê cũ.
C. Chúng cho phép máy tính học hỏi từ dữ liệu để đưa ra dự đoán, phân loại hoặc phát hiện mẫu mà không cần được lập trình tường minh cho từng trường hợp cụ thể.
D. Chúng chỉ có thể xử lý dữ liệu có cấu trúc đơn giản.

Câu 18: Việc trực quan hóa dữ liệu (Data Visualization) thường được thực hiện trong giai đoạn nào của quy trình Khoa học dữ liệu và mục đích chính của nó là gì?

A. Giai đoạn Triển khai - Để người dùng cuối dễ dàng tương tác với mô hình.
B. Giai đoạn Chuẩn bị dữ liệu và Phân tích ban đầu - Để khám phá dữ liệu, hiểu cấu trúc, tìm ngoại lệ và truyền đạt hiểu biết cho người khác.
C. Giai đoạn Xây dựng mô hình - Để tự động chọn thuật toán tốt nhất.
D. Giai đoạn Đánh giá - Để tự động tính toán các chỉ số hiệu suất của mô hình.

Câu 19: Thách thức lớn nhất khi xử lý Dữ liệu lớn liên quan đến đặc điểm Tốc độ (Velocity) là gì?

A. Yêu cầu hệ thống phải có khả năng tiếp nhận, xử lý và phân tích dữ liệu gần như ngay lập tức khi nó được tạo ra.
B. Khối lượng dữ liệu quá lớn để lưu trữ.
C. Dữ liệu có quá nhiều định dạng khác nhau.
D. Dữ liệu chứa nhiều thông tin không đáng tin cậy.

Câu 20: Giả sử bạn có một tập dữ liệu về các giao dịch mua hàng trực tuyến. Bạn muốn nhóm các khách hàng có hành vi mua sắm tương tự nhau để đưa ra các chiến dịch marketing cá nhân hóa. Thuật toán thuộc nhóm nào của học máy thường được sử dụng cho bài toán này?

A. Thuật toán phân loại (Classification).
B. Thuật toán hồi quy (Regression).
C. Thuật toán phân cụm (Clustering).
D. Thuật toán quy tắc kết hợp (Association Rule Mining).

Câu 21: Vai trò của máy tính trong việc hỗ trợ giai đoạn Xác định vấn đề (Problem Definition) trong Khoa học dữ liệu là gì?

A. Tự động xác định vấn đề dựa trên dữ liệu có sẵn.
B. Thu thập dữ liệu ngay lập tức sau khi vấn đề được xác định.
C. Chỉ lưu trữ mô tả vấn đề.
D. Cung cấp các công cụ tìm kiếm, phân tích sơ bộ dữ liệu hoặc trực quan hóa ban đầu để giúp chuyên gia hiểu rõ hơn bối cảnh và khả năng giải quyết vấn đề bằng dữ liệu.

Câu 22: Sự tiến bộ trong công nghệ lưu trữ dữ liệu, ví dụ như hệ thống lưu trữ phân tán (distributed storage systems), đã tác động thế nào đến khả năng xử lý Dữ liệu lớn?

A. Cho phép lưu trữ an toàn và hiệu quả các tập dữ liệu có khối lượng khổng lồ.
B. Giúp tăng tốc độ dữ liệu được tạo ra.
C. Làm giảm tính đa dạng của dữ liệu.
D. Chỉ hỗ trợ dữ liệu có cấu trúc đơn giản.

Câu 23: Khi một thuật toán được sử dụng để phân tích cảm xúc (sentiment analysis) từ hàng triệu bình luận trên mạng xã hội, nó đang xử lý loại dữ liệu nào phổ biến trong Dữ liệu lớn?

A. Dữ liệu có cấu trúc (Structured Data).
B. Dữ liệu phi cấu trúc (Unstructured Data).
C. Dữ liệu bán cấu trúc (Semi-structured Data).
D. Dữ liệu số (Numerical Data).

Câu 24: Tại sao quy trình Khoa học dữ liệu thường được mô tả là một chu trình lặp (iterative) thay vì một quy trình tuyến tính (linear)?

A. Vì mỗi giai đoạn chỉ cần thực hiện một lần duy nhất.
B. Vì mục tiêu của dự án không bao giờ thay đổi.
C. Vì kết quả từ các giai đoạn sau (như đánh giá mô hình) có thể yêu cầu quay lại các giai đoạn trước (như chuẩn bị dữ liệu hoặc thu thập thêm dữ liệu) để cải thiện.
D. Vì máy tính chỉ có thể xử lý từng bước một cách riêng lẻ.

Câu 25: Một trong những thách thức của Dữ liệu lớn là việc xử lý và phân tích nó có thể tốn kém. Máy tính và thuật toán giúp giải quyết thách thức này như thế nào?

A. Bằng cách tự động giảm kích thước của dữ liệu.
B. Bằng cách loại bỏ hoàn toàn nhu cầu về phần cứng đắt tiền.
C. Bằng cách chỉ phân tích một phần nhỏ của dữ liệu.
D. Bằng cách cung cấp các phương pháp xử lý hiệu quả (như xử lý song song, thuật toán tối ưu) trên hạ tầng có khả năng mở rộng (như đám mây), giúp giảm chi phí trên mỗi đơn vị dữ liệu được xử lý.

Câu 26: Giả sử bạn xây dựng một mô hình dự đoán giá nhà. Sau khi đánh giá, bạn nhận thấy mô hình hoạt động kém với các căn nhà có đặc điểm bất thường (ngoại lệ). Bạn cần quay lại giai đoạn nào của quy trình Khoa học dữ liệu để khắc phục vấn đề này?

A. Thu thập dữ liệu (Data Collection).
B. Chuẩn bị dữ liệu (Data Preparation).
C. Triển khai (Deployment).
D. Xác định vấn đề (Problem Definition).

Câu 27: Thuật toán nào thường được sử dụng để tìm ra các mối quan hệ "Nếu-Thì" (ví dụ: Nếu khách hàng mua A thì có khả năng cao sẽ mua B) trong tập dữ liệu giao dịch lớn?

A. Thuật toán quy tắc kết hợp (Association Rule Mining, ví dụ: Apriori).
B. Thuật toán phân loại (Classification).
C. Thuật toán hồi quy (Regression).
D. Thuật toán phân cụm (Clustering).

Câu 28: Vai trò của máy tính trong việc đảm bảo an toàn và bảo mật cho Dữ liệu lớn là gì?

A. Tự động mã hóa tất cả dữ liệu mà không cần cấu hình.
B. Ngăn chặn mọi truy cập trái phép vào dữ liệu.
C. Cung cấp các công cụ, hệ thống và thuật toán để mã hóa, quản lý quyền truy cập, giám sát và phát hiện các mối đe dọa bảo mật.
D. Giúp giảm khối lượng dữ liệu cần bảo vệ.

Câu 29: Khi một mô hình Khoa học dữ liệu đã được triển khai và đang hoạt động trong thực tế, điều gì là cần thiết để đảm bảo nó tiếp tục mang lại kết quả tốt?

A. Ngừng thu thập dữ liệu mới.
B. Thay đổi mục tiêu ban đầu của dự án.
C. Chỉ sử dụng mô hình trong một thời gian giới hạn.
D. Theo dõi hiệu suất của mô hình và cập nhật/huấn luyện lại nếu cần thiết do sự thay đổi của dữ liệu hoặc môi trường (concept drift).

Câu 30: Tóm lại, mối quan hệ giữa Máy tính, Thuật toán và Khoa học dữ liệu được mô tả chính xác nhất như thế nào?

A. Máy tính cung cấp hạ tầng tính toán và lưu trữ mạnh mẽ; Thuật toán là các phương pháp xử lý; Khoa học dữ liệu là lĩnh vực sử dụng cả hai để trích xuất hiểu biết và giá trị từ dữ liệu.
B. Máy tính là công cụ duy nhất cần thiết; Thuật toán và Khoa học dữ liệu là các tên gọi khác nhau của cùng một khái niệm.
C. Thuật toán hoạt động độc lập với máy tính và dữ liệu.
D. Khoa học dữ liệu chỉ là việc thu thập dữ liệu, không liên quan đến máy tính hay thuật toán.

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Một cột dữ liệu 'Doanh thu' trong bảng tính của bạn chứa một số ô trống. Điều này thể hiện vấn đề gì về chất lượng dữ liệu?

Dữ liệu bị thiếu (Missing Data)

Dữ liệu không nhất quán (Inconsistent Data)

Dữ liệu trùng lặp (Duplicate Data)

Dữ liệu không đúng định dạng (Incorrect Format)

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Mục đích chính của việc sử dụng PivotTable trong Excel là gì?

Tìm và thay thế văn bản trong bảng tính

Tự động nhập dữ liệu từ website

Thực hiện các phép tính phức tạp trên từng dòng dữ liệu

Tổng hợp, tóm tắt và khám phá dữ liệu từ một nguồn lớn

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Bạn muốn tạo một bảng tổng hợp (PivotTable) để hiển thị *tổng số lượng sản phẩm bán được* cho *mỗi loại sản phẩm*. Trường 'Loại sản phẩm' nên được đặt vào vùng nào trong PivotTable?

Rows (Dòng)

Columns (Cột)

Values (Giá trị)

Filters (Bộ lọc)

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Tiếp theo câu hỏi trên, trường 'Số lượng bán' (chứa giá trị số lượng) nên được đặt vào vùng nào trong PivotTable để tính tổng?

Rows (Dòng)

Columns (Cột)

Values (Giá trị)

Filters (Bộ lọc)

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Một cột dữ liệu 'Giá' chứa các giá trị như '100.000 VNĐ', '50 USD', '£20'. Để chuẩn bị cột này cho các phép tính toán học, bạn cần thực hiện bước làm sạch dữ liệu nào là quan trọng nhất?

Xóa các dòng chứa giá trị này

Thay thế tất cả bằng 0

Sử dụng hàm VLOOKUP

Loại bỏ ký tự không phải số ('VNĐ', 'USD', '£', dấu chấm) và chuyển đổi sang định dạng số

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Bạn đã tạo một PivotTable tóm tắt tỷ lệ đóng góp doanh thu của từng khu vực. Để trực quan hóa kết quả này một cách hiệu quả, biểu đồ nào sau đây thường được sử dụng?

Biểu đồ đường (Line Chart)

Biểu đồ cột (Column Chart)

Biểu đồ tròn (Pie Chart)

Biểu đồ phân tán (Scatter Plot)

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Khi sử dụng 'Get Data' trong Excel để nhập dữ liệu từ một nguồn bên ngoài (ví dụ: file CSV), việc chọn 'Transform Data' (mở Power Query Editor) thay vì 'Load' trực tiếp mang lại lợi ích gì?

Cho phép thực hiện các thao tác làm sạch và biến đổi dữ liệu trước khi đưa vào bảng tính chính

Tự động tạo biểu đồ từ dữ liệu nguồn

Tự động phát hiện và sửa lỗi chính tả trong dữ liệu

Lưu dữ liệu nguồn vào một định dạng file khác

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Bạn có một tập dữ liệu về các giao dịch, bao gồm cột 'Số lượng' và cột 'Đơn giá'. Bạn muốn tạo một cột mới tên là 'Tổng tiền' bằng cách nhân Số lượng với Đơn giá. Thao tác nào trong Power Query giúp bạn làm điều này?

Remove Columns (Xóa cột)

Group By (Nhóm theo)

Pivot Column (Chuyển cột thành hàng)

Add Custom Column (Thêm cột tùy chỉnh)

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Đâu là một ví dụ về dữ liệu không nhất quán (Inconsistent Data)?

Một ô trống trong cột 'Email'

Trong cùng một cột 'Quốc gia', có các giá trị như 'Mỹ', 'USA', 'Hoa Kỳ'

Một dòng dữ liệu xuất hiện nhiều lần

Giá trị âm trong cột 'Số lượng bán'

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Sau khi tạo PivotTable, dữ liệu nguồn ban đầu của bạn được cập nhật với các dòng mới. Để PivotTable hiển thị dữ liệu mới này, bạn cần làm gì?

Refresh (Làm mới) PivotTable

Tạo lại PivotTable từ đầu

Sao chép và dán dữ liệu mới vào PivotTable

Đóng và mở lại file Excel

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Phát biểu nào sau đây *không đúng* về PivotTable trong Excel?

Có thể tính tổng, trung bình, đếm, v.v. cho các nhóm dữ liệu.

Cho phép xem dữ liệu từ nhiều góc độ khác nhau bằng cách kéo thả các trường.

Giúp tóm tắt một lượng lớn dữ liệu một cách nhanh chóng.

Tự động cập nhật theo thời gian thực khi dữ liệu nguồn thay đổi mà không cần thao tác thủ công.

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Tại sao việc xác định và xử lý dữ liệu trùng lặp (duplicate data) lại quan trọng trong bước làm sạch dữ liệu?

Để làm cho bảng tính trông gọn gàng hơn

Để tăng số lượng dòng dữ liệu

Để tránh làm sai lệch kết quả phân tích (ví dụ: tính tổng hoặc đếm)

Để giảm kích thước file Excel

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Bạn đang làm việc với một cột 'Mã sản phẩm' và nhận thấy một số mã có khoảng trắng thừa ở đầu hoặc cuối (ví dụ: ' ABC ', 'XYZ '). Thao tác nào trong Power Query giúp loại bỏ các khoảng trắng thừa này?

Trim (Cắt bỏ khoảng trắng thừa)

Clean (Làm sạch ký tự không in được)

Format (Định dạng)

Extract (Trích xuất)

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Khi tạo PivotChart từ một PivotTable, biểu đồ sẽ phản ánh dữ liệu *nào*?

Dữ liệu thô ban đầu trước khi làm sạch

Dữ liệu đã được tổng hợp và tóm tắt bởi PivotTable

Chỉ các dòng dữ liệu bị thiếu hoặc không hợp lệ

Dữ liệu được nhập thủ công sau khi tạo PivotTable

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Bạn muốn phân tích xem có bao nhiêu dự án đầu tư thuộc các 'Lĩnh vực' khác nhau và xem tổng vốn đầu tư (USD) cho mỗi lĩnh vực đó. Bạn n??n kéo trường 'Lĩnh vực' và 'Tổng vốn USD' vào những vùng nào trong PivotTable?

'Lĩnh vực' vào Values, 'Tổng vốn USD' vào Rows

'Lĩnh vực' vào Columns, 'Tổng vốn USD' vào Filters

'Lĩnh vực' vào Rows (hoặc Columns), 'Tổng vốn USD' vào Values

Cả hai trường vào Filters

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Power Query ghi lại các bước làm sạch và biến đổi dữ liệu bạn thực hiện dưới dạng các 'Applied Steps'. Lợi ích của việc này là gì?

Giúp tăng tốc độ tính toán trong PivotTable

Tự động tạo mã lập trình cho các bước xử lý

Ẩn dữ liệu gốc để bảo mật

Cho phép dễ dàng xem lại, chỉnh sửa hoặc áp dụng lại các bước xử lý cho dữ liệu mới

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Khi làm sạch dữ liệu, việc chuyển đổi các cột chứa ngày tháng hoặc tiền tệ sang đúng *định dạng dữ liệu* (Data Type) phù hợp (ví dụ: Date, Currency) là quan trọng vì:

Giúp giảm dung lượng file Excel

Đảm bảo các phép tính toán (tổng, trung bình, sắp xếp theo ngày) được thực hiện chính xác

Tự động tạo ra các biểu đồ đẹp hơn

Bắt buộc phải làm như vậy để có thể lưu file

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Trong PivotTable, bạn có thể thay đổi cách tổng hợp các giá trị (ví dụ: từ Sum sang Average, Count, Max, Min). Tùy chọn này được thiết lập ở đâu?

Trong vùng Rows

Trong vùng Columns

Trong cài đặt của trường dữ liệu trong vùng Values

Trong tùy chọn của PivotChart

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Bạn có một danh sách khách hàng và muốn loại bỏ những dòng dữ liệu bị trùng lặp hoàn toàn. Thao tác nào trong Power Query giúp thực hiện việc này?

Remove Duplicates (Xóa trùng lặp)

Replace Values (Thay thế giá trị)

Fill Down/Up (Điền giá trị xuống/lên)

Unpivot Columns (Chuyển cột thành thuộc tính/giá trị)

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Khi tạo biểu đồ từ PivotTable, bạn nhận thấy tên các mục trên trục hoành hoặc chú giải quá dài, gây khó đọc. Bạn nên chỉnh sửa điều này ở đâu?

Trong dữ liệu nguồn gốc

Trong cài đặt của Power Query

Trong cài đặt của PivotTable Field List

Trực tiếp trên các thành phần của PivotChart (ví dụ: nhãn trục, tiêu đề)

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Bạn đã sử dụng PivotTable để nhóm dữ liệu theo 'Năm' và tính tổng 'Doanh thu'. Bạn muốn chỉ hiển thị kết quả cho các năm 2020, 2021 và 2022. Thao tác nào trong PivotTable giúp bạn thực hiện điều này?

Sử dụng Slicer (Bộ lọc cắt lát)

Áp dụng Filter (Bộ lọc) trên trường 'Năm' trong PivotTable

Xóa dữ liệu của các năm không mong muốn trong nguồn

Thay đổi kiểu tổng hợp trong Value Field Settings

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Lợi ích của việc sử dụng Power Query để làm sạch dữ liệu so với việc làm thủ công trực tiếp trên bảng tính Excel là gì?

Các bước xử lý được ghi lại và có thể tự động áp dụng lại khi dữ liệu nguồn cập nhật, giảm thiểu sai sót thủ công.

Chỉ Power Query mới có thể xử lý các file dữ liệu lớn.

Power Query tự động dự đoán kết quả phân tích cuối cùng.

Không có lợi ích nào đáng kể, chỉ là một cách làm khác.

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Để tải dữ liệu đã làm sạch từ Power Query Editor vào một trang tính mới trong Excel, bạn sử dụng tùy chọn nào sau khi hoàn thành các bước biến đổi?

Save (Lưu)

Export (Xuất)

Close & Load To... (Đóng và Tải đến...)

Refresh All (Làm mới tất cả)

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Bạn có một cột 'Tên đầy đủ' và muốn tách nó thành 'Họ' và 'Tên'. Bạn nhận thấy tên được phân tách bởi dấu cách. Thao tác 'Split Column' trong Power Query nên được cấu hình như thế nào?

By Number of Characters (Theo số ký tự)

By Delimiter (Theo dấu phân cách) với dấu cách là dấu phân cách

By Position (Theo vị trí)

By Uppercase to Lowercase (Theo chữ hoa thành chữ thường)

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Trong PivotTable, nếu bạn kéo một trường chứa dữ liệu dạng văn bản (ví dụ: 'Tên khách hàng') vào vùng Values, kết quả mặc định thường là gì?

Count (Đếm số lượng)

Sum (Tổng)

Average (Trung bình)

Max (Giá trị lớn nhất)

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Khi trực quan hóa dữ liệu bằng biểu đồ, việc lựa chọn loại biểu đồ phù hợp với *mục đích* phân tích là rất quan trọng. Nếu bạn muốn so sánh giá trị bán hàng giữa các tháng trong năm, biểu đồ nào là lựa chọn tốt?

Biểu đồ tròn (Pie Chart)

Biểu đồ phân tán (Scatter Plot)

Biểu đồ cột (Column Chart) hoặc Biểu đồ đường (Line Chart)

Biểu đồ vùng (Area Chart)

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Bạn đang làm việc với một tập dữ liệu lớn trong Excel. Việc sử dụng Power Query và PivotTable để phân tích dữ liệu thay vì chỉ dùng các hàm Excel truyền thống trên bảng tính thô có ưu điểm gì về hiệu suất?

Không có ưu điểm nào, chỉ là cách làm khác.

Chỉ nhanh hơn đối với các tập dữ liệu rất nhỏ.

Power Query và PivotTable luôn làm chậm Excel.

Thường xử lý các tập dữ liệu lớn hiệu quả và nhanh hơn, đặc biệt khi cần lặp lại các bước hoặc làm mới dữ liệu.

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Điều nào sau đây là một trong những mục tiêu chính của 'Hoạt động trải nghiệm về Khoa học dữ liệu' trong bài học F17?

Trở thành chuyên gia lập trình Python

Hiểu và thực hành các bước cơ bản trong xử lý và phân tích dữ liệu bằng công cụ sẵn có (như Excel)

Thiết kế cơ sở dữ liệu phức tạp

Xây dựng website động

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F18: Kĩ thuật mô phỏng

Tags: Bộ đề 9

Câu 1: Một kỹ sư đang thiết kế hệ thống thoát nước cho một khu đô thị mới. Trước khi triển khai, anh ấy sử dụng phần mềm để tạo mô hình số của khu vực và mô phỏng dòng chảy của nước mưa dưới các kịch bản lượng mưa khác nhau (nhẹ, vừa, lớn). Mục đích chính của việc sử dụng kỹ thuật mô phỏng trong trường hợp này là gì?

Giảm chi phí vật liệu xây dựng ban đầu.

Tăng tính thẩm mỹ cho bản thiết kế.

Đánh giá hiệu quả và phát hiện các vấn đề tiềm ẩn của hệ thống trước khi xây dựng.

Rút ngắn thời gian thi công công trình.

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F18: Kĩ thuật mô phỏng

Tags: Bộ đề 9

Câu 2: Trong lĩnh vực y tế, việc sử dụng mô hình mô phỏng phẫu thuật cho sinh viên y khoa thực hành có ưu điểm vượt trội nào so với việc học trực tiếp trên bệnh nhân thật ngay từ đầu?

Giảm thời gian đào tạo tổng thể.

Cung cấp kiến thức lý thuyết chuyên sâu hơn.

Giúp sinh viên làm quen với môi trường bệnh viện thực tế.

Cho phép thực hành lặp lại trong môi trường an toàn, không gây rủi ro cho bệnh nhân và người học có thể mắc lỗi để rút kinh nghiệm.

Xem kết quả

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Nhận kết quả

Xảy ra lỗi

Bước 1: Vào google.com rồi gõ từ khóa:
Copy nhanh thanh-tim-kiem

Bước 2: Trong kết quả tìm kiếm Google, hãy tìm website giống hình bên dưới

Nếu trang 1 không có hãy tìm ở trang 2, 3, 4... nhé trang-google

Bước 3:

Cuộn xuống cuối bài viết rồi bấm vào nút GIỐNG HÌNH DƯỚI và chờ 1 lát để lấy mã:

luot-xem

Nếu tìm không thấy mã bạn có thể Đổi nhiệm vụ để lấy mã khác.

By Wordpress Quiz plugin

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 10

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 10 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong quy trình Khoa học dữ liệu, giai đoạn nào tập trung vào việc thu thập, làm sạch, chuyển đổi và tích hợp dữ liệu từ nhiều nguồn khác nhau?

A. Xây dựng mô hình
B. Chuẩn bị dữ liệu
C. Đánh giá
D. Triển khai

Câu 2: Một công ty thương mại điện tử muốn dự đoán sản phẩm nào khách hàng có khả năng mua trong lần truy cập tiếp theo dựa trên lịch sử duyệt web và mua hàng của họ. Công việc này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

A. Xác định vấn đề
B. Thu thập dữ liệu
C. Xây dựng mô hình
D. Đánh giá

Câu 3: Đặc điểm nào của Dữ liệu lớn (Big Data) thể hiện rằng dữ liệu được tạo ra và cập nhật liên tục với tốc độ rất nhanh, đòi hỏi khả năng xử lý gần như tức thời?

A. Khối lượng (Volume)
B. Đa dạng (Variety)
C. Độ tin cậy (Veracity)
D. Tốc độ (Velocity)

Câu 4: Tại sao máy tính có năng lực tính toán mạnh mẽ lại đóng vai trò cốt lõi trong việc xử lý Dữ liệu lớn?

A. Vì Dữ liệu lớn đòi hỏi phân tích phức tạp và xử lý hàng petabyte/exabyte dữ liệu mà sức người không thể làm được.
B. Vì máy tính giúp tạo ra Dữ liệu lớn nhanh hơn.
C. Vì máy tính chỉ cần thiết để lưu trữ Dữ liệu lớn.
D. Vì máy tính có thể trực quan hóa dữ liệu một cách tự động.

Câu 5: Thuật toán xử lý song song (Parallel Processing) mang lại lợi ích gì đáng kể trong bối cảnh xử lý Dữ liệu lớn?

A. Giảm khối lượng dữ liệu cần xử lý.
B. Tăng tính đa dạng của dữ liệu.
C. Rút ngắn thời gian xử lý bằng cách chia nhỏ công việc cho nhiều bộ xử lý.
D. Đảm bảo độ chính xác tuyệt đối của dữ liệu.

Câu 6: Một nhà khoa học dữ liệu đang làm việc với dữ liệu từ mạng xã hội (văn bản, hình ảnh, video), dữ liệu cảm biến (số liệu), và dữ liệu giao dịch (số). Thử thách lớn nhất mà nhà khoa học này phải đối mặt liên quan đến đặc điểm nào của Dữ liệu lớn?

A. Tốc độ (Velocity)
B. Đa dạng (Variety)
C. Khối lượng (Volume)
D. Độ tin cậy (Veracity)

Câu 7: Giai đoạn "Đánh giá" trong quy trình Khoa học dữ liệu có mục đích chính là gì?

A. Kiểm tra hiệu quả và độ chính xác của mô hình đã xây dựng.
B. Thu thập thêm dữ liệu mới.
C. Xác định lại vấn đề ban đầu.
D. Triển khai mô hình vào ứng dụng thực tế.

Câu 8: Việc sử dụng các thuật toán tự động hóa trong Khoa học dữ liệu giúp ích như thế nào cho quy trình xử lý?

A. Tăng sự tham gia của con người vào mọi bước.
B. Chỉ áp dụng cho dữ liệu có cấu trúc.
C. Giảm tốc độ xử lý để đảm bảo độ chính xác.
D. Giảm thiểu công sức thủ công, tăng hiệu quả và tính lặp lại của các tác vụ.

Câu 9: Một hệ thống phát hiện gian lận thẻ tín dụng cần xử lý hàng triệu giao dịch mỗi giây để xác định các giao dịch đáng ngờ ngay lập tức. Yêu cầu này liên quan trực tiếp đến khả năng xử lý nào của máy tính và thuật toán trong Khoa học dữ liệu?

A. Xử lý theo thời gian thực (Real-time processing).
B. Lưu trữ dữ liệu lớn.
C. Trực quan hóa dữ liệu.
D. Chuẩn bị dữ liệu ban đầu.

Câu 10: Yếu tố "Độ tin cậy (Veracity)" của Dữ liệu lớn đề cập đến khía cạnh nào?

A. Tốc độ tạo ra dữ liệu.
B. Tính chính xác, đáng tin cậy và không sai lệch của dữ liệu.
C. Số lượng nguồn dữ liệu khác nhau.
D. Khả năng xử lý dữ liệu bằng máy tính.

Câu 11: Sự khác biệt cơ bản giữa "Phân tích dữ liệu truyền thống" và "Khoa học dữ liệu" (trong bối cảnh Bài F16) là gì?

A. Phân tích dữ liệu truyền thống không sử dụng máy tính.
B. Khoa học dữ liệu chỉ làm việc với dữ liệu có cấu trúc.
C. Khoa học dữ liệu bao gồm cả việc xây dựng mô hình dự đoán/phân loại dựa trên dữ liệu phức tạp, thường là dữ liệu lớn, vượt ra ngoài phân tích mô tả đơn thuần.
D. Phân tích dữ liệu truyền thống sử dụng thuật toán, còn Khoa học dữ liệu thì không.

Câu 12: Giả sử bạn có một tập dữ liệu khổng lồ về hành vi người dùng trên một trang web. Việc sử dụng thuật toán học máy để phân nhóm (clustering) người dùng có hành vi tương tự nhau thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

A. Chuẩn bị dữ liệu
B. Thu thập dữ liệu
C. Xây dựng mô hình
D. Đánh giá

Câu 13: Tại sao việc trực quan hóa dữ liệu (Data Visualization) là một phần quan trọng trong giai đoạn "Chuẩn bị dữ liệu" và "Đánh giá"?

A. Nó giúp tự động làm sạch dữ liệu.
B. Nó là bước cuối cùng trước khi triển khai.
C. Nó chỉ cần thiết cho dữ liệu số.
D. Nó giúp con người dễ dàng hiểu cấu trúc dữ liệu, phát hiện xu hướng, ngoại lệ và đánh giá kết quả mô hình.

Câu 14: Việc sử dụng điện toán đám mây (Cloud Computing) trong Khoa học dữ liệu chủ yếu hỗ trợ giải quyết thách thức nào liên quan đến máy tính và Dữ liệu lớn?

A. Khả năng mở rộng (Scalability) và xử lý Khối lượng (Volume) dữ liệu.
B. Giảm tính Đa dạng (Variety) của dữ liệu.
C. Tăng Tốc độ (Velocity) thu thập dữ liệu.
D. Đảm bảo Độ tin cậy (Veracity) của dữ liệu nguồn.

Câu 15: Một thuật toán phân loại (Classification Algorithm) trong Khoa học dữ liệu có mục đích chính là gì?

A. Dự đoán một giá trị số liên tục (ví dụ: giá nhà).
B. Gán một đối tượng vào một trong các lớp/nhóm đã định trước (ví dụ: spam/không spam).
C. Tìm kiếm các mối quan hệ ẩn giữa các biến.
D. Giảm chiều dữ liệu.

Câu 16: Tại sao bước "Xác định vấn đề" lại là bước đầu tiên và quan trọng nhất trong quy trình Khoa học dữ liệu?

A. Vì nó giúp thu thập dữ liệu dễ dàng hơn.
B. Vì nó chỉ cần thiết cho các dự án nhỏ.
C. Vì nó định hướng toàn bộ quá trình, đảm bảo dự án giải quyết được một vấn đề có ý nghĩa và có mục tiêu rõ ràng.
D. Vì nó giúp chọn thuật toán phù hợp ngay từ đầu.

Câu 17: Một trong những ứng dụng thực tế của Khoa học dữ liệu dựa trên khả năng xử lý dữ liệu lớn và thuật toán phức tạp là gì?

A. Hệ thống gợi ý sản phẩm trên các trang mua sắm trực tuyến.
B. Viết phần mềm soạn thảo văn bản.
C. Thiết kế phần cứng máy tính.
D. Quản lý cơ sở dữ liệu truyền thống.

Câu 18: Khi một mô hình học máy đã được xây dựng và đánh giá là tốt, giai đoạn tiếp theo trong quy trình Khoa học dữ liệu thường là gì?

A. Thu thập thêm dữ liệu.
B. Làm sạch dữ liệu lại từ đầu.
C. Xác định một vấn đề mới.
D. Triển khai (Deployment) mô hình vào môi trường hoạt động thực tế.

Câu 19: Thách thức nào của Dữ liệu lớn đề cập đến việc dữ liệu có thể không đầy đủ, không nhất quán hoặc chứa sai sót?

A. Khối lượng (Volume)
B. Tốc độ (Velocity)
C. Độ tin cậy (Veracity)
D. Đa dạng (Variety)

Câu 20: Vai trò của thuật toán trong Khoa học dữ liệu có thể được mô tả là gì?

A. Cung cấp các phương pháp, quy tắc xử lý và phân tích dữ liệu để tìm ra thông tin hữu ích hoặc xây dựng mô hình.
B. Chỉ dùng để thu thập dữ liệu.
C. Chỉ dùng để lưu trữ dữ liệu.
D. Chỉ dùng để hiển thị dữ liệu.

Câu 21: Một trong những lợi ích chính của việc áp dụng Khoa học dữ liệu trong kinh doanh là gì?

A. Giảm chi phí lưu trữ dữ liệu.
B. Tăng số lượng dữ liệu được tạo ra.
C. Chỉ tập trung vào phân tích dữ liệu quá khứ.
D. Đưa ra quyết định dựa trên dữ liệu, tối ưu hóa hoạt động và tạo ra lợi thế cạnh tranh.

Câu 22: Bước nào trong quy trình Khoa học dữ liệu đòi hỏi sự hiểu biết sâu sắc về lĩnh vực ứng dụng để đặt ra những câu hỏi đúng và có giá trị?

A. Xác định vấn đề
B. Thu thập dữ liệu
C. Chuẩn bị dữ liệu
D. Xây dựng mô hình

Câu 23: Khi xây dựng một mô hình dự đoán giá nhà, nhà khoa học dữ liệu cần xem xét các yếu tố như diện tích, số phòng ngủ, vị trí, v.v. Việc lựa chọn và xử lý các yếu tố này thuộc chủ yếu về giai đoạn nào?

A. Thu thập dữ liệu
B. Chuẩn bị dữ liệu (Feature Engineering, Data Transformation)
C. Đánh giá
D. Triển khai

Câu 24: Thuật toán tìm kiếm (Search Algorithms) hoặc thuật toán sắp xếp (Sorting Algorithms) có thể được áp dụng trong giai đoạn nào của quy trình Khoa học dữ liệu?

A. Chỉ trong giai đoạn Xác định vấn đề.
B. Chỉ trong giai đoạn Triển khai.
C. Chỉ trong giai đoạn Thu thập dữ liệu.
D. Trong giai đoạn Chuẩn bị dữ liệu (ví dụ: sắp xếp để xử lý hiệu quả hơn) hoặc Xây dựng mô hình (là một phần của các thuật toán học máy).

Câu 25: Khả năng "mở rộng" (Scalability) của hệ thống máy tính trong Khoa học dữ liệu có ý nghĩa gì?

A. Hệ thống có thể dễ dàng tăng hoặc giảm năng lực xử lý và lưu trữ để đáp ứng khối lượng dữ liệu thay đổi.
B. Hệ thống chỉ có thể xử lý một loại dữ liệu duy nhất.
C. Hệ thống chỉ hoạt động trên một máy tính duy nhất.
D. Hệ thống chỉ có thể xử lý dữ liệu theo thời gian thực.

Câu 26: Tại sao việc bỏ qua hoặc làm sơ sài giai đoạn "Chuẩn bị dữ liệu" có thể dẫn đến kết quả không chính xác trong Khoa học dữ liệu?

A. Vì nó làm tăng tốc độ xử lý dữ liệu.
B. Vì nó giúp xác định vấn đề dễ dàng hơn.
C. Vì dữ liệu bẩn, thiếu hoặc không đúng định dạng sẽ làm sai lệch quá trình xây dựng mô hình và kết quả phân tích.
D. Vì nó chỉ ảnh hưởng đến việc trực quan hóa dữ liệu.

Câu 27: Thuật toán hồi quy (Regression Algorithm) khác với thuật toán phân loại (Classification Algorithm) ở điểm nào?

A. Thuật toán hồi quy chỉ làm việc với dữ liệu phi cấu trúc.
B. Thuật toán phân loại dự đoán một giá trị số liên tục.
C. Thuật toán hồi quy không sử dụng máy tính.
D. Thuật toán hồi quy dự đoán một giá trị số liên tục, trong khi thuật toán phân loại dự đoán một nhãn/lớp rời rạc.

Câu 28: Một công ty muốn phân tích cảm xúc (tích cực, tiêu cực, trung lập) từ hàng triệu bình luận của khách hàng trên mạng xã hội. Đây là một ví dụ ứng dụng của Khoa học dữ liệu liên quan đến xử lý dữ liệu có đặc điểm nào nổi bật?

A. Chỉ Khối lượng (Volume).
B. Khối lượng (Volume) và Đa dạng (Variety - dữ liệu văn bản phi cấu trúc).
C. Chỉ Tốc độ (Velocity).
D. Chỉ Độ tin cậy (Veracity).

Câu 29: Vai trò của con người trong Khoa học dữ liệu là gì?

A. Chỉ nhập dữ liệu vào máy tính.
B. Chỉ đọc kết quả do máy tính tạo ra.
C. Xác định vấn đề, hiểu ngữ cảnh kinh doanh/lĩnh vực, lựa chọn phương pháp/thuật toán phù hợp, diễn giải kết quả và đưa ra quyết định.
D. Thay thế hoàn toàn máy tính và thuật toán.

Câu 30: Tại sao việc lưu trữ và bảo mật dữ liệu quy mô lớn lại là một thách thức quan trọng trong Khoa học dữ liệu?

A. Vì khối lượng dữ liệu khổng lồ đòi hỏi hạ tầng lưu trữ phức tạp và nguy cơ rò rỉ/lạm dụng dữ liệu nhạy cảm cao.
B. Vì dữ liệu lớn thường có cấu trúc đơn giản, dễ bị tấn công.
C. Vì chỉ có máy tính cá nhân mới có thể lưu trữ dữ liệu lớn.
D. Vì dữ liệu lớn luôn được tạo ra ở một địa điểm duy nhất.

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Trong quy trình Khoa học dữ liệu, giai đoạn nào tập trung vào việc thu thập, làm sạch, chuyển đổi và tích hợp dữ liệu từ nhiều nguồn khác nhau?

Xây dựng mô hình

Chuẩn bị dữ liệu

Đánh giá

Triển khai

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Một công ty thương mại điện tử muốn dự đoán sản phẩm nào khách hàng có khả năng mua trong lần truy cập tiếp theo dựa trên lịch sử duyệt web và mua hàng của họ. Công việc này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

Xác định vấn đề

Thu thập dữ liệu

Xây dựng mô hình

Đánh giá

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Đặc điểm nào của Dữ liệu lớn (Big Data) thể hiện rằng dữ liệu được tạo ra và cập nhật liên tục với tốc độ rất nhanh, đòi hỏi khả năng xử lý gần như tức thời?

Khối lượng (Volume)

Đa dạng (Variety)

Độ tin cậy (Veracity)

Tốc độ (Velocity)

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Tại sao máy tính có năng lực tính toán mạnh mẽ lại đóng vai trò cốt lõi trong việc xử lý Dữ liệu lớn?

Vì Dữ liệu lớn đòi hỏi phân tích phức tạp và xử lý hàng petabyte/exabyte dữ liệu mà sức người không thể làm được.

Vì máy tính giúp tạo ra Dữ liệu lớn nhanh hơn.

Vì máy tính chỉ cần thiết để lưu trữ Dữ liệu lớn.

Vì máy tính có thể trực quan hóa dữ liệu một cách tự động.

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Thuật toán xử lý song song (Parallel Processing) mang lại lợi ích gì đáng kể trong bối cảnh xử lý Dữ liệu lớn?

Giảm khối lượng dữ liệu cần xử lý.

Tăng tính đa dạng của dữ liệu.

Rút ngắn thời gian xử lý bằng cách chia nhỏ công việc cho nhiều bộ xử lý.

Đảm bảo độ chính xác tuyệt đối của dữ liệu.

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Một nhà khoa học dữ liệu đang làm việc với dữ liệu từ mạng xã hội (văn bản, hình ảnh, video), dữ liệu cảm biến (số liệu), và dữ liệu giao dịch (số). Thử thách lớn nhất mà nhà khoa học này phải đối mặt liên quan đến đặc điểm nào của Dữ liệu lớn?

Tốc độ (Velocity)

Đa dạng (Variety)

Khối lượng (Volume)

Độ tin cậy (Veracity)

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Giai đoạn 'Đánh giá' trong quy trình Khoa học dữ liệu có mục đích chính là gì?

Kiểm tra hiệu quả và độ chính xác của mô hình đã xây dựng.

Thu thập thêm dữ liệu mới.

Xác định lại vấn đề ban đầu.

Triển khai mô hình vào ứng dụng thực tế.

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Việc sử dụng các thuật toán tự động hóa trong Khoa học dữ liệu giúp ích như thế nào cho quy trình xử lý?

Tăng sự tham gia của con người vào mọi bước.

Chỉ áp dụng cho dữ liệu có cấu trúc.

Giảm tốc độ xử lý để đảm bảo độ chính xác.

Giảm thiểu công sức thủ công, tăng hiệu quả và tính lặp lại của các tác vụ.

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Một hệ thống phát hiện gian lận thẻ tín dụng cần xử lý hàng triệu giao dịch mỗi giây để xác định các giao dịch đáng ngờ ngay lập tức. Yêu cầu này liên quan trực tiếp đến khả năng xử lý nào của máy tính và thuật toán trong Khoa học dữ liệu?

Xử lý theo thời gian thực (Real-time processing).

Lưu trữ dữ liệu lớn.

Trực quan hóa dữ liệu.

Chuẩn bị dữ liệu ban đầu.

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Yếu tố 'Độ tin cậy (Veracity)' của Dữ liệu lớn đề cập đến khía cạnh nào?

Tốc độ tạo ra dữ liệu.

Tính chính xác, đáng tin cậy và không sai lệch của dữ liệu.

Số lượng nguồn dữ liệu khác nhau.

Khả năng xử lý dữ liệu bằng máy tính.

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Sự khác biệt cơ bản giữa 'Phân tích dữ liệu truyền thống' và 'Khoa học dữ liệu' (trong bối cảnh Bài F16) là gì?

Phân tích dữ liệu truyền thống không sử dụng máy tính.

Khoa học dữ liệu chỉ làm việc với dữ liệu có cấu trúc.

Khoa học dữ liệu bao gồm cả việc xây dựng mô hình dự đoán/phân loại dựa trên dữ liệu phức tạp, thường là dữ liệu lớn, vượt ra ngoài phân tích mô tả đơn thuần.

Phân tích dữ liệu truyền thống sử dụng thuật toán, còn Khoa học dữ liệu thì không.

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Giả sử bạn có một tập dữ liệu khổng lồ về hành vi người dùng trên một trang web. Việc sử dụng thuật toán học máy để phân nhóm (clustering) người dùng có hành vi tương tự nhau thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

Chuẩn bị dữ liệu

Thu thập dữ liệu

Xây dựng mô hình

Đánh giá

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Tại sao việc trực quan hóa dữ liệu (Data Visualization) là một phần quan trọng trong giai đoạn 'Chuẩn bị dữ liệu' và 'Đánh giá'?

Nó giúp tự động làm sạch dữ liệu.

Nó là bước cuối cùng trước khi triển khai.

Nó chỉ cần thiết cho dữ liệu số.

Nó giúp con người dễ dàng hiểu cấu trúc dữ liệu, phát hiện xu hướng, ngoại lệ và đánh giá kết quả mô hình.

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Việc sử dụng điện toán đám mây (Cloud Computing) trong Khoa học dữ liệu chủ yếu hỗ trợ giải quyết thách thức nào liên quan đến máy tính và Dữ liệu lớn?

Khả năng mở rộng (Scalability) và xử lý Khối lượng (Volume) dữ liệu.

Giảm tính Đa dạng (Variety) của dữ liệu.

Tăng Tốc độ (Velocity) thu thập dữ liệu.

Đảm bảo Độ tin cậy (Veracity) của dữ liệu nguồn.

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Một thuật toán phân loại (Classification Algorithm) trong Khoa học dữ liệu có mục đích chính là gì?

Dự đoán một giá trị số liên tục (ví dụ: giá nhà).

Gán một đối tượng vào một trong các lớp/nhóm đã định trước (ví dụ: spam/không spam).

Tìm kiếm các mối quan hệ ẩn giữa các biến.

Giảm chiều dữ liệu.

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Tại sao bước 'Xác định vấn đề' lại là bước đầu tiên và quan trọng nhất trong quy trình Khoa học dữ liệu?

Vì nó giúp thu thập dữ liệu dễ dàng hơn.

Vì nó chỉ cần thiết cho các dự án nhỏ.

Vì nó định hướng toàn bộ quá trình, đảm bảo dự án giải quyết được một vấn đề có ý nghĩa và có mục tiêu rõ ràng.

Vì nó giúp chọn thuật toán phù hợp ngay từ đầu.

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Một trong những ứng dụng thực tế của Khoa học dữ liệu dựa trên khả năng xử lý dữ liệu lớn và thuật toán phức tạp là gì?

Hệ thống gợi ý sản phẩm trên các trang mua sắm trực tuyến.

Viết phần mềm soạn thảo văn bản.

Thiết kế phần cứng máy tính.

Quản lý cơ sở dữ liệu truyền thống.

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Khi một mô hình học máy đã được xây dựng và đánh giá là tốt, giai đoạn tiếp theo trong quy trình Khoa học dữ liệu thường là gì?

Thu thập thêm dữ liệu.

Làm sạch dữ liệu lại từ đầu.

Xác định một vấn đề mới.

Triển khai (Deployment) mô hình vào môi trường hoạt động thực tế.

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Thách thức nào của Dữ liệu lớn đề cập đến việc dữ liệu có thể không đầy đủ, không nhất quán hoặc chứa sai sót?

Khối lượng (Volume)

Tốc độ (Velocity)

Độ tin cậy (Veracity)

Đa dạng (Variety)

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Vai trò của thuật toán trong Khoa học dữ liệu có thể được mô tả là gì?

Cung cấp các phương pháp, quy tắc xử lý và phân tích dữ liệu để tìm ra thông tin hữu ích hoặc xây dựng mô hình.

Chỉ dùng để thu thập dữ liệu.

Chỉ dùng để lưu trữ dữ liệu.

Chỉ dùng để hiển thị dữ liệu.

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Một trong những lợi ích chính của việc áp dụng Khoa học dữ liệu trong kinh doanh là gì?

Giảm chi phí lưu trữ dữ liệu.

Tăng số lượng dữ liệu được tạo ra.

Chỉ tập trung vào phân tích dữ liệu quá khứ.

Đưa ra quyết định dựa trên dữ liệu, tối ưu hóa hoạt động và tạo ra lợi thế cạnh tranh.

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Bước nào trong quy trình Khoa học dữ liệu đòi hỏi sự hiểu biết sâu sắc về lĩnh vực ứng dụng để đặt ra những câu hỏi đúng và có giá trị?

Xác định vấn đề

Thu thập dữ liệu

Chuẩn bị dữ liệu

Xây dựng mô hình

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Khi xây dựng một mô hình dự đoán giá nhà, nhà khoa học dữ liệu cần xem xét các yếu tố như diện tích, số phòng ngủ, vị trí, v.v. Việc lựa chọn và xử lý các yếu tố này thuộc chủ yếu về giai đoạn nào?

Thu thập dữ liệu

Chuẩn bị dữ liệu (Feature Engineering, Data Transformation)

Đánh giá

Triển khai

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Thuật toán tìm kiếm (Search Algorithms) hoặc thuật toán sắp xếp (Sorting Algorithms) có thể được áp dụng trong giai đoạn nào của quy trình Khoa học dữ liệu?

Chỉ trong giai đoạn Xác định vấn đề.

Chỉ trong giai đoạn Triển khai.

Chỉ trong giai đoạn Thu thập dữ liệu.

Trong giai đoạn Chuẩn bị dữ liệu (ví dụ: sắp xếp để xử lý hiệu quả hơn) hoặc Xây dựng mô hình (là một phần của các thuật toán học máy).

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Khả năng 'mở rộng' (Scalability) của hệ thống máy tính trong Khoa học dữ liệu có ý nghĩa gì?

Hệ thống có thể dễ dàng tăng hoặc giảm năng lực xử lý và lưu trữ để đáp ứng khối lượng dữ liệu thay đổi.

Hệ thống chỉ có thể xử lý một loại dữ liệu duy nhất.

Hệ thống chỉ hoạt động trên một máy tính duy nhất.

Hệ thống chỉ có thể xử lý dữ liệu theo thời gian thực.

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Tại sao việc bỏ qua hoặc làm sơ sài giai đoạn 'Chuẩn bị dữ liệu' có thể dẫn đến kết quả không chính xác trong Khoa học dữ liệu?

Vì nó làm tăng tốc độ xử lý dữ liệu.

Vì nó giúp xác định vấn đề dễ dàng hơn.

Vì dữ liệu bẩn, thiếu hoặc không đúng định dạng sẽ làm sai lệch quá trình xây dựng mô hình và kết quả phân tích.

Vì nó chỉ ảnh hưởng đến việc trực quan hóa dữ liệu.

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Thuật toán hồi quy (Regression Algorithm) khác với thuật toán phân loại (Classification Algorithm) ở điểm nào?

Thuật toán hồi quy chỉ làm việc với dữ liệu phi cấu trúc.

Thuật toán phân loại dự đoán một giá trị số liên tục.

Thuật toán hồi quy không sử dụng máy tính.

Thuật toán hồi quy dự đoán một giá trị số liên tục, trong khi thuật toán phân loại dự đoán một nhãn/lớp rời rạc.

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Một công ty muốn phân tích cảm xúc (tích cực, tiêu cực, trung lập) từ hàng triệu bình luận của khách hàng trên mạng xã hội. Đây là một ví dụ ứng dụng của Khoa học dữ liệu liên quan đến xử lý dữ liệu có đặc điểm nào nổi bật?

Chỉ Khối lượng (Volume).

Khối lượng (Volume) và Đa dạng (Variety - dữ liệu văn bản phi cấu trúc).

Chỉ Tốc độ (Velocity).

Chỉ Độ tin cậy (Veracity).

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Vai trò của con người trong Khoa học dữ liệu là gì?

Chỉ nhập dữ liệu vào máy tính.

Chỉ đọc kết quả do máy tính tạo ra.

Xác định vấn đề, hiểu ngữ cảnh kinh doanh/lĩnh vực, lựa chọn phương pháp/thuật toán phù hợp, diễn giải kết quả và đưa ra quyết định.

Thay thế hoàn toàn máy tính và thuật toán.

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Tại sao việc lưu trữ và bảo mật dữ liệu quy mô lớn lại là một thách thức quan trọng trong Khoa học dữ liệu?

Vì khối lượng dữ liệu khổng lồ đòi hỏi hạ tầng lưu trữ phức tạp và nguy cơ rò rỉ/lạm dụng dữ liệu nhạy cảm cao.

Vì dữ liệu lớn thường có cấu trúc đơn giản, dễ bị tấn công.

Vì chỉ có máy tính cá nhân mới có thể lưu trữ dữ liệu lớn.

Vì dữ liệu lớn luôn được tạo ra ở một địa điểm duy nhất.

Xem kết quả

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Nhận kết quả

Xảy ra lỗi

Bước 1: Vào google.com rồi gõ từ khóa:
Copy nhanh thanh-tim-kiem

Bước 2: Trong kết quả tìm kiếm Google, hãy tìm website giống hình bên dưới

Nếu trang 1 không có hãy tìm ở trang 2, 3, 4... nhé trang-google

Bước 3:

Cuộn xuống cuối bài viết rồi bấm vào nút GIỐNG HÌNH DƯỚI và chờ 1 lát để lấy mã:

luot-xem

Nếu tìm không thấy mã bạn có thể Đổi nhiệm vụ để lấy mã khác.

By Wordpress Quiz plugin

Đề trắc nghiệm liên quan:

15+ Đề Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F18: Kĩ thuật mô phỏng
15+ Đề Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài G2: Nhóm nghề quản trị thuộc ngành Công nghệ thông tin
15+ Đề Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài B5: Đường truyền hữu tuyến và vô tuyến
15+ Đề Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài E6: Chèn YouTube, Calendar, Drive và Collapsible group
15+ Đề Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài E7: ử dụng Map, Forms và các thiết lập trang web

Đề 01

Đề 02

Đề 03

Đề 04

Đề 05

Đề 06

Đề 07

Đề 08

Đề 09

Đề 10

Bạn ơi!!! Để xem được kết quảbạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quảbạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quảbạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quảbạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quảbạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quảbạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quảbạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quảbạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quảbạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quảbạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Đề trắc nghiệm liên quan:

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

Bạn ơi!!! Để xem được kết quả
bạn vui lòng làm nhiệm vụ nhỏ xíu này nha