15+ Đề Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Đề 01

Đề 02

Đề 03

Đề 04

Đề 05

Đề 06

Đề 07

Đề 08

Đề 09

Đề 10

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 01

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 01 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Đặc điểm nào sau đây KHÔNG phải là một trong 5V đặc trưng của Dữ liệu lớn (Big Data)?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Validity (Tính hợp lệ)

Câu 2: Trong bối cảnh Khoa học Dữ liệu, kỹ năng nào sau đây KHÔNG thuộc nhóm kỹ năng chính cần thiết?

  • A. Toán học và Thống kê
  • B. Lập trình và Khoa học Máy tính
  • C. Kiến thức chuyên môn về lĩnh vực ứng dụng
  • D. Ngoại ngữ thành thạo

Câu 3: Loại phân tích dữ liệu nào tập trung vào việc "điều gì có thể xảy ra" trong tương lai, dựa trên dữ liệu hiện tại và lịch sử?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích chẩn đoán (Diagnostic Analytics)
  • D. Phân tích quy định (Prescriptive Analytics)

Câu 4: Cơ sở dữ liệu nào sau đây được thiết kế đặc biệt để xử lý dữ liệu phi cấu trúc hoặc bán cấu trúc, thường gặp trong dữ liệu lớn?

  • A. Cơ sở dữ liệu quan hệ (Relational Database)
  • B. Cơ sở dữ liệu phân cấp (Hierarchical Database)
  • C. Cơ sở dữ liệu NoSQL
  • D. Cơ sở dữ liệu hướng đối tượng (Object-Oriented Database)

Câu 5: Thuật toán song song được sử dụng trong Khoa học Dữ liệu nhằm mục đích chính nào?

  • A. Tăng tốc độ xử lý dữ liệu
  • B. Giảm thiểu lỗi trong dữ liệu
  • C. Tăng tính bảo mật cho dữ liệu
  • D. Đơn giản hóa việc thu thập dữ liệu

Câu 6: Điện toán đám mây đóng vai trò quan trọng trong Khoa học Dữ liệu, đặc biệt trong việc:

  • A. Cải thiện chất lượng dữ liệu đầu vào
  • B. Cung cấp hạ tầng linh hoạt và khả năng mở rộng cho lưu trữ và xử lý dữ liệu
  • C. Giảm sự phụ thuộc vào con người trong phân tích dữ liệu
  • D. Tăng cường khả năng trực quan hóa dữ liệu

Câu 7: Trong quy trình Khoa học Dữ liệu, giai đoạn nào tập trung vào việc làm sạch, chuyển đổi và tích hợp dữ liệu từ nhiều nguồn khác nhau?

  • A. Thu thập dữ liệu (Data Collection)
  • B. Phân tích dữ liệu (Data Analysis)
  • C. Chuẩn bị dữ liệu (Data Preparation)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 8: Phương pháp khai phá dữ liệu nào thường được sử dụng để phân nhóm khách hàng dựa trên hành vi mua sắm của họ?

  • A. Hồi quy (Regression)
  • B. Phân loại (Classification)
  • C. Dự báo chuỗi thời gian (Time Series Forecasting)
  • D. Phân cụm (Clustering)

Câu 9: "Veracity" trong 5V của Dữ liệu lớn đề cập đến khía cạnh nào của dữ liệu?

  • A. Độ tin cậy và tính xác thực của dữ liệu
  • B. Tốc độ tạo ra và xử lý dữ liệu
  • C. Sự đa dạng về loại và nguồn dữ liệu
  • D. Khối lượng dữ liệu khổng lồ

Câu 10: Trong phân tích dữ liệu, kỹ thuật trực quan hóa dữ liệu (Data Visualization) giúp ích gì?

  • A. Tăng tốc độ xử lý dữ liệu
  • B. Giúp nhận diện mẫu, xu hướng và thông tin ẩn sâu trong dữ liệu
  • C. Đảm bảo tính chính xác tuyệt đối của dữ liệu
  • D. Thay thế hoàn toàn các phương pháp phân tích thống kê truyền thống

Câu 11: Để xử lý hiệu quả lượng dữ liệu lớn vượt quá khả năng của một máy tính đơn lẻ, các chuyên gia Khoa học Dữ liệu thường sử dụng:

  • A. Phần mềm diệt virus mạnh mẽ
  • B. Bộ nhớ RAM dung lượng cực lớn
  • C. Máy tính cụm (Computer Cluster)
  • D. Kết nối Internet tốc độ cao

Câu 12: Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của Khoa học Dữ liệu?

  • A. Dự đoán xu hướng thị trường chứng khoán
  • B. Cá nhân hóa trải nghiệm người dùng trên mạng xã hội và thương mại điện tử
  • C. Hỗ trợ chẩn đoán bệnh và phát triển thuốc mới trong y tế
  • D. Soạn thảo văn bản và tạo báo cáo tự động

Câu 13: Trong Khoa học Dữ liệu, "học máy" (Machine Learning) được sử dụng chủ yếu để:

  • A. Lưu trữ và quản lý dữ liệu hiệu quả hơn
  • B. Xây dựng mô hình dự đoán và tự động hóa quyết định dựa trên dữ liệu
  • C. Trực quan hóa dữ liệu một cách sinh động và hấp dẫn
  • D. Đảm bảo an toàn và bảo mật cho dữ liệu

Câu 14: Loại phân tích dữ liệu nào tập trung vào việc tìm hiểu "tại sao điều gì đó đã xảy ra" trong quá khứ?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích chẩn đoán (Diagnostic Analytics)
  • D. Phân tích quy định (Prescriptive Analytics)

Câu 15: "Value" (Giá trị) trong 5V của Dữ liệu lớn đề cập đến:

  • A. Kích thước vật lý của thiết bị lưu trữ dữ liệu
  • B. Chi phí đầu tư vào cơ sở hạ tầng dữ liệu
  • C. Số lượng người dùng truy cập vào dữ liệu
  • D. Khả năng tạo ra thông tin hữu ích và giá trị kinh doanh từ dữ liệu

Câu 16: Để đánh giá hiệu quả của một mô hình phân loại trong Khoa học Dữ liệu, người ta thường sử dụng các chỉ số như độ chính xác, độRecall và:

  • A. Vận tốc (Velocity)
  • B. Độ chính xác (Precision)
  • C. Tính đa dạng (Variety)
  • D. Khối lượng (Volume)

Câu 17: Trong Khoa học Dữ liệu, vấn đề "overfitting" (quá khớp) xảy ra khi nào?

  • A. Dữ liệu huấn luyện quá ít
  • B. Mô hình quá đơn giản
  • C. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới
  • D. Thiếu tài nguyên tính toán để huấn luyện mô hình

Câu 18: Phương pháp nào sau đây KHÔNG thuộc nhóm kỹ thuật khai phá dữ liệu?

  • A. Phân cụm (Clustering)
  • B. Phân loại (Classification)
  • C. Hồi quy (Regression)
  • D. Kiểm thử phần mềm (Software Testing)

Câu 19: Để đảm bảo tính "Veracity" của dữ liệu lớn, quy trình nào sau đây là quan trọng?

  • A. Làm sạch dữ liệu (Data Cleaning)
  • B. Mã hóa dữ liệu (Data Encryption)
  • C. Nén dữ liệu (Data Compression)
  • D. Sao lưu dữ liệu (Data Backup)

Câu 20: Trong phân tích dữ liệu, "biến mục tiêu" (target variable) thường được sử dụng trong loại bài toán học máy nào?

  • A. Học máy không giám sát (Unsupervised Learning)
  • B. Học máy có giám sát (Supervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học sâu (Deep Learning)

Câu 21: Một nhà khoa học dữ liệu muốn phân tích cảm xúc của khách hàng về một sản phẩm mới từ dữ liệu văn bản trên mạng xã hội. Kỹ thuật nào sau đây phù hợp nhất?

  • A. Phân tích chuỗi thời gian (Time Series Analysis)
  • B. Phân tích hồi quy (Regression Analysis)
  • C. Phân tích cảm xúc (Sentiment Analysis)
  • D. Phân tích phương sai (Variance Analysis)

Câu 22: Để triển khai một hệ thống Khoa học Dữ liệu quy mô lớn, yếu tố nào sau đây KHÔNG nên được ưu tiên?

  • A. Khả năng mở rộng hệ thống (Scalability)
  • B. Bảo mật dữ liệu (Data Security)
  • C. Hiệu suất xử lý dữ liệu (Processing Performance)
  • D. Giao diện người dùng bắt mắt và dễ sử dụng

Câu 23: Trong Khoa học Dữ liệu, "tính năng" (feature) dùng để chỉ điều gì?

  • A. Mục tiêu cuối cùng của phân tích dữ liệu
  • B. Thuộc tính hoặc đặc điểm của dữ liệu được sử dụng để phân tích
  • C. Dạng biểu diễn trực quan của dữ liệu
  • D. Quy trình làm sạch và chuẩn hóa dữ liệu

Câu 24: Loại phân tích dữ liệu nào giúp trả lời câu hỏi "điều gì nên làm" để đạt được kết quả mong muốn?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích chẩn đoán (Diagnostic Analytics)
  • D. Phân tích quy định (Prescriptive Analytics)

Câu 25: Để giảm chiều dữ liệu (dimensionality reduction) trong Khoa học Dữ liệu, kỹ thuật nào sau đây thường được sử dụng?

  • A. Phân tích thành phần chính (Principal Component Analysis - PCA)
  • B. Phân tích tương quan (Correlation Analysis)
  • C. Phân tích tần suất (Frequency Analysis)
  • D. Phân tích độ lệch chuẩn (Standard Deviation Analysis)

Câu 26: Trong mô hình học máy, tập dữ liệu "kiểm thử" (test set) được sử dụng cho mục đích gì?

  • A. Huấn luyện mô hình học máy
  • B. Tinh chỉnh các tham số của mô hình
  • C. Đánh giá hiệu năng của mô hình trên dữ liệu mới
  • D. Trực quan hóa kết quả của mô hình

Câu 27: Rào cản nào sau đây KHÔNG phải là thách thức thường gặp khi làm việc với dữ liệu lớn?

  • A. Dung lượng dữ liệu quá lớn để xử lý bằng công cụ truyền thống
  • B. Tốc độ dữ liệu sinh ra quá nhanh
  • C. Sự đa dạng của các loại dữ liệu khác nhau
  • D. Dữ liệu có cấu trúc rõ ràng và dễ hiểu

Câu 28: Trong Khoa học Dữ liệu, thuật ngữ "feature engineering" (kỹ thuật tạo đặc trưng) đề cập đến:

  • A. Quy trình làm sạch dữ liệu bị thiếu hoặc sai sót
  • B. Quá trình chọn lọc, biến đổi và tạo ra các đặc trưng phù hợp từ dữ liệu thô
  • C. Phương pháp trực quan hóa dữ liệu dưới dạng biểu đồ và đồ thị
  • D. Kỹ thuật nén dữ liệu để giảm dung lượng lưu trữ

Câu 29: Một công ty muốn dự đoán nhu cầu sản phẩm trong quý tới dựa trên dữ liệu bán hàng lịch sử, dữ liệu thời tiết và các sự kiện marketing. Loại phân tích dữ liệu nào phù hợp nhất?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích chẩn đoán (Diagnostic Analytics)
  • D. Phân tích quy định (Prescriptive Analytics)

Câu 30: Đâu là ví dụ về công cụ trực quan hóa dữ liệu phổ biến trong Khoa học Dữ liệu?

  • A. Tableau
  • B. Python
  • C. Microsoft Excel
  • D. SQL

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 1: Đặc điểm nào sau đây KHÔNG phải là một trong 5V đặc trưng của Dữ liệu lớn (Big Data)?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 2: Trong bối cảnh Khoa học Dữ liệu, kỹ năng nào sau đây KHÔNG thuộc nhóm kỹ năng chính cần thiết?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 3: Loại phân tích dữ liệu nào tập trung vào việc 'điều gì có thể xảy ra' trong tương lai, dựa trên dữ liệu hiện tại và lịch sử?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 4: Cơ sở dữ liệu nào sau đây được thiết kế đặc biệt để xử lý dữ liệu phi cấu trúc hoặc bán cấu trúc, thường gặp trong dữ liệu lớn?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 5: Thuật toán song song được sử dụng trong Khoa học Dữ liệu nhằm mục đích chính nào?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 6: Điện toán đám mây đóng vai trò quan trọng trong Khoa học Dữ liệu, đặc biệt trong việc:

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 7: Trong quy trình Khoa học Dữ liệu, giai đoạn nào tập trung vào việc làm sạch, chuyển đổi và tích hợp dữ liệu từ nhiều nguồn khác nhau?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 8: Phương pháp khai phá dữ liệu nào thường được sử dụng để phân nhóm khách hàng dựa trên hành vi mua sắm của họ?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 9: 'Veracity' trong 5V của Dữ liệu lớn đề cập đến khía cạnh nào của dữ liệu?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 10: Trong phân tích dữ liệu, kỹ thuật trực quan hóa dữ liệu (Data Visualization) giúp ích gì?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 11: Để xử lý hiệu quả lượng dữ liệu lớn vượt quá khả năng của một máy tính đơn lẻ, các chuyên gia Khoa học Dữ liệu thường sử dụng:

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 12: Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của Khoa học Dữ liệu?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 13: Trong Khoa học Dữ liệu, 'học máy' (Machine Learning) được sử dụng chủ yếu để:

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 14: Loại phân tích dữ liệu nào tập trung vào việc tìm hiểu 'tại sao điều gì đó đã xảy ra' trong quá khứ?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 15: 'Value' (Giá trị) trong 5V của Dữ liệu lớn đề cập đến:

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 16: Để đánh giá hiệu quả của một mô hình phân loại trong Khoa học Dữ liệu, người ta thường sử dụng các chỉ số như độ chính xác, độRecall và:

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 17: Trong Khoa học Dữ liệu, vấn đề 'overfitting' (quá khớp) xảy ra khi nào?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 18: Phương pháp nào sau đây KHÔNG thuộc nhóm kỹ thuật khai phá dữ liệu?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 19: Để đảm bảo tính 'Veracity' của dữ liệu lớn, quy trình nào sau đây là quan trọng?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 20: Trong phân tích dữ liệu, 'biến mục tiêu' (target variable) thường được sử dụng trong loại bài toán học máy nào?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 21: Một nhà khoa học dữ liệu muốn phân tích cảm xúc của khách hàng về một sản phẩm mới từ dữ liệu văn bản trên mạng xã hội. Kỹ thuật nào sau đây phù hợp nhất?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 22: Để triển khai một hệ thống Khoa học Dữ liệu quy mô lớn, yếu tố nào sau đây KHÔNG nên được ưu tiên?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 23: Trong Khoa học Dữ liệu, 'tính năng' (feature) dùng để chỉ điều gì?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 24: Loại phân tích dữ liệu nào giúp trả lời câu hỏi 'điều gì nên làm' để đạt được kết quả mong muốn?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 25: Để giảm chiều dữ liệu (dimensionality reduction) trong Khoa học Dữ liệu, kỹ thuật nào sau đây thường được sử dụng?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 26: Trong mô hình học máy, tập dữ liệu 'kiểm thử' (test set) được sử dụng cho mục đích gì?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 27: Rào cản nào sau đây KHÔNG phải là thách thức thường gặp khi làm việc với dữ liệu lớn?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 28: Trong Khoa học Dữ liệu, thuật ngữ 'feature engineering' (kỹ thuật tạo đặc trưng) đề cập đến:

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 29: Một công ty muốn dự đoán nhu cầu sản phẩm trong quý tới dựa trên dữ liệu bán hàng lịch sử, dữ liệu thời tiết và các sự kiện marketing. Loại phân tích dữ liệu nào phù hợp nhất?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 1

Câu 30: Đâu là ví dụ về công cụ trực quan hóa dữ liệu phổ biến trong Khoa học Dữ liệu?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 02

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 02 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong khoa học dữ liệu, đặc điểm "khối lượng" (Volume) của dữ liệu lớn thường được thể hiện rõ nhất qua yếu tố nào?

  • A. Tốc độ truyền tải dữ liệu nhanh chóng.
  • B. Sự đa dạng về định dạng dữ liệu (văn bản, hình ảnh, video...).
  • C. Độ tin cậy và chính xác của nguồn dữ liệu.
  • D. Dung lượng lưu trữ dữ liệu khổng lồ, vượt xa khả năng xử lý truyền thống.

Câu 2: "Velocity" là một trong 5V đặc trưng của dữ liệu lớn, yếu tố này nhấn mạnh đến khía cạnh nào trong khoa học dữ liệu?

  • A. Giá trị thông tin hữu ích có thể khai thác từ dữ liệu.
  • B. Tốc độ phát sinh và cần xử lý dữ liệu cực kỳ nhanh.
  • C. Sự khác biệt về nguồn gốc và ngữ cảnh của dữ liệu.
  • D. Khả năng kiểm chứng và đảm bảo chất lượng dữ liệu.

Câu 3: Tính "đa dạng" (Variety) của dữ liệu lớn gây ra thách thức chủ yếu nào cho các hệ thống xử lý dữ liệu truyền thống?

  • A. Yêu cầu dung lượng lưu trữ lớn hơn.
  • B. Tăng chi phí đầu tư vào phần cứng máy tính.
  • C. Khó khăn trong việc tích hợp và phân tích dữ liệu từ nhiều nguồn khác nhau.
  • D. Giảm độ chính xác của các thuật toán phân tích dữ liệu.

Câu 4: Trong quy trình khai phá dữ liệu, bước nào tập trung vào việc chuyển đổi dữ liệu thô sang định dạng phù hợp cho phân tích?

  • A. Đánh giá và lựa chọn mô hình khai phá.
  • B. Làm sạch và chuyển đổi dữ liệu.
  • C. Trích xuất tri thức và mô hình hóa.
  • D. Thu thập và tích hợp dữ liệu.

Câu 5: Phân tích dữ liệu mô tả (Descriptive Analytics) chủ yếu được sử dụng để trả lời câu hỏi nào về dữ liệu?

  • A. Điều gì đã xảy ra trong quá khứ?
  • B. Điều gì có thể xảy ra trong tương lai?
  • C. Tại sao điều này đã xảy ra?
  • D. Chúng ta nên làm gì tiếp theo?

Câu 6: Để dự đoán doanh số bán hàng trong quý tới dựa trên dữ liệu lịch sử và các yếu tố thị trường hiện tại, loại phân tích dữ liệu nào sẽ phù hợp nhất?

  • A. Phân tích chẩn đoán (Diagnostic Analytics).
  • B. Phân tích quy chuẩn (Prescriptive Analytics).
  • C. Phân tích dự đoán (Predictive Analytics).
  • D. Phân tích mô tả (Descriptive Analytics).

Câu 7: Công nghệ điện toán đám mây (Cloud Computing) mang lại lợi ích gì quan trọng trong việc xử lý và lưu trữ dữ liệu lớn?

  • A. Tăng cường khả năng bảo mật tuyệt đối cho dữ liệu.
  • B. Giảm thiểu sự phụ thuộc vào kết nối internet.
  • C. Đơn giản hóa việc quản lý cơ sở dữ liệu quan hệ.
  • D. Khả năng mở rộng linh hoạt và tiết kiệm chi phí đầu tư cơ sở hạ tầng.

Câu 8: Cơ sở dữ liệu NoSQL được thiết kế đặc biệt để giải quyết vấn đề nào mà các cơ sở dữ liệu quan hệ (SQL) truyền thống gặp khó khăn?

  • A. Quản lý dữ liệu có cấu trúc chặt chẽ, tuân thủ lược đồ cố định.
  • B. Xử lý dữ liệu phi cấu trúc hoặc bán cấu trúc với khối lượng lớn.
  • C. Đảm bảo tính toàn vẹn dữ liệu ACID (Atomicity, Consistency, Isolation, Durability).
  • D. Thực hiện các truy vấn phức tạp và phép kết nối (JOIN) giữa nhiều bảng.

Câu 9: Máy tính cụm (Computer Cluster) được sử dụng phổ biến trong khoa học dữ liệu để làm gì?

  • A. Thay thế cho máy tính cá nhân để làm việc văn phòng.
  • B. Cải thiện hiệu suất đồ họa cho các ứng dụng thiết kế.
  • C. Tăng cường năng lực tính toán song song để xử lý dữ liệu lớn.
  • D. Giảm thiểu điện năng tiêu thụ của các trung tâm dữ liệu.

Câu 10: Thuật toán song song (Parallel Algorithm) đóng vai trò như thế nào trong việc phân tích dữ liệu lớn?

  • A. Chia nhỏ bài toán thành nhiều phần nhỏ để thực hiện đồng thời, tăng tốc độ xử lý.
  • B. Tự động phát hiện và sửa lỗi dữ liệu trong quá trình phân tích.
  • C. Giảm độ phức tạp của thuật toán phân tích dữ liệu.
  • D. Tăng cường khả năng trực quan hóa kết quả phân tích dữ liệu.

Câu 11: Để phân tích cảm xúc (Sentiment Analysis) từ hàng triệu bình luận trên mạng xã hội về một sản phẩm mới, công cụ nào sau đây sẽ hữu ích nhất?

  • A. Bảng tính điện tử (Spreadsheet).
  • B. Công cụ xử lý ngôn ngữ tự nhiên (NLP).
  • C. Phần mềm quản lý cơ sở dữ liệu quan hệ (RDBMS).
  • D. Trình duyệt web (Web browser).

Câu 12: Trong lĩnh vực y tế, khoa học dữ liệu có thể được ứng dụng để làm gì?

  • A. Thiết kế giao diện người dùng cho thiết bị y tế.
  • B. Quản lý hồ sơ bệnh án trên giấy.
  • C. Tự động hóa quy trình nhập liệu thông tin bệnh nhân.
  • D. Phân tích dữ liệu bệnh sử để dự đoán nguy cơ mắc bệnh và hỗ trợ chẩn đoán.

Câu 13: Một nhà bán lẻ trực tuyến muốn cá nhân hóa trải nghiệm mua sắm cho từng khách hàng. Khoa học dữ liệu có thể giúp họ thực hiện điều này bằng cách nào?

  • A. Phân tích lịch sử mua hàng và hành vi duyệt web để đưa ra gợi ý sản phẩm phù hợp.
  • B. Tăng cường số lượng quảng cáo hiển thị trên trang web.
  • C. Giảm giá tất cả các sản phẩm để thu hút khách hàng.
  • D. Thu thập thông tin cá nhân của khách hàng mà không có sự đồng ý.

Câu 14: "Veracity" trong 5V của dữ liệu lớn đề cập đến vấn đề gì quan trọng khi làm việc với dữ liệu?

  • A. Tốc độ tạo ra dữ liệu.
  • B. Sự đa dạng của các loại dữ liệu.
  • C. Độ tin cậy và chất lượng của dữ liệu.
  • D. Dung lượng lưu trữ dữ liệu.

Câu 15: Để phát hiện gian lận trong giao dịch thẻ tín dụng, kỹ thuật khai phá dữ liệu nào thường được sử dụng?

  • A. Phân tích hồi quy (Regression analysis).
  • B. Phát hiện bất thường (Anomaly detection).
  • C. Phân cụm (Clustering).
  • D. Phân tích tương quan (Correlation analysis).

Câu 16: Trong phân tích dữ liệu, "trực quan hóa dữ liệu" (Data Visualization) có vai trò chính là gì?

  • A. Tăng tốc độ xử lý dữ liệu.
  • B. Làm sạch và chuẩn hóa dữ liệu.
  • C. Thay thế các phương pháp phân tích thống kê truyền thống.
  • D. Giúp con người dễ dàng hiểu và nhận diện các mẫu, xu hướng trong dữ liệu.

Câu 17: "Value" là yếu tố cuối cùng trong 5V của dữ liệu lớn. Yếu tố này nhấn mạnh đến điều gì?

  • A. Số lượng nguồn dữ liệu khác nhau.
  • B. Tốc độ thu thập dữ liệu.
  • C. Giá trị và lợi ích kinh doanh mà dữ liệu mang lại.
  • D. Độ tin cậy của dữ liệu.

Câu 18: Để xây dựng một hệ thống tự động phân loại email vào hộp thư "spam" và "không spam", kỹ thuật học máy nào sau đây thường được sử dụng?

  • A. Học có giám sát (Supervised learning).
  • B. Học không giám sát (Unsupervised learning).
  • C. Học tăng cường (Reinforcement learning).
  • D. Học sâu (Deep learning).

Câu 19: Sự khác biệt chính giữa phân tích dữ liệu dự đoán (Predictive Analytics) và phân tích dữ liệu quy chuẩn (Prescriptive Analytics) là gì?

  • A. Phân tích dự đoán tập trung vào dữ liệu hiện tại, còn phân tích quy chuẩn tập trung vào dữ liệu quá khứ.
  • B. Phân tích dự đoán đưa ra dự báo về tương lai, còn phân tích quy chuẩn đề xuất hành động nên thực hiện.
  • C. Phân tích dự đoán sử dụng thuật toán thống kê, còn phân tích quy chuẩn sử dụng học máy.
  • D. Phân tích dự đoán dễ thực hiện hơn phân tích quy chuẩn.

Câu 20: Trong khoa học dữ liệu, thuật ngữ "kỹ sư dữ liệu" (Data Engineer) thường dùng để chỉ người có vai trò chính là gì?

  • A. Phân tích và diễn giải kết quả dữ liệu.
  • B. Xây dựng mô hình học máy.
  • C. Thiết kế, xây dựng và duy trì hệ thống lưu trữ và xử lý dữ liệu.
  • D. Giao tiếp với khách hàng để xác định yêu cầu về dữ liệu.

Câu 21: Giả sử bạn có một tập dữ liệu lớn về thông tin khách hàng và hành vi mua sắm. Bạn muốn phân nhóm khách hàng thành các phân khúc khác nhau dựa trên đặc điểm chung. Kỹ thuật khai phá dữ liệu nào phù hợp?

  • A. Phân tích hồi quy (Regression).
  • B. Phân tích chuỗi thời gian (Time series analysis).
  • C. Phân tích phân loại (Classification).
  • D. Phân cụm (Clustering).

Câu 22: Ưu điểm nổi bật của cơ sở dữ liệu NoSQL so với cơ sở dữ liệu quan hệ SQL trong việc quản lý dữ liệu lớn là gì?

  • A. Khả năng đảm bảo tính toàn vẹn dữ liệu cao hơn.
  • B. Khả năng mở rộng quy mô linh hoạt và dễ dàng hơn.
  • C. Hỗ trợ tốt hơn cho các truy vấn phức tạp.
  • D. Chi phí triển khai và vận hành thấp hơn.

Câu 23: Để xử lý dữ liệu lớn có tốc độ phát sinh liên tục từ các cảm biến IoT, kiến trúc hệ thống nào sẽ hiệu quả hơn?

  • A. Hệ thống cơ sở dữ liệu quan hệ truyền thống.
  • B. Hệ thống lưu trữ dữ liệu tập trung trên một máy chủ duy nhất.
  • C. Hệ thống xử lý dữ liệu phân tán và song song.
  • D. Hệ thống lưu trữ dữ liệu trên băng từ.

Câu 24: Trong một dự án khoa học dữ liệu, bước nào thường tốn nhiều thời gian và công sức nhất?

  • A. Thu thập, làm sạch và chuẩn bị dữ liệu.
  • B. Xây dựng và huấn luyện mô hình học máy.
  • C. Trực quan hóa và báo cáo kết quả.
  • D. Triển khai mô hình vào thực tế.

Câu 25: Vấn đề "thiên vị" (bias) trong dữ liệu có thể gây ra hậu quả gì trong các ứng dụng khoa học dữ liệu?

  • A. Tăng tốc độ xử lý dữ liệu.
  • B. Đưa ra các quyết định không công bằng hoặc phân biệt đối xử.
  • C. Giảm chi phí lưu trữ dữ liệu.
  • D. Cải thiện độ chính xác của mô hình học máy.

Câu 26: Để đánh giá hiệu quả của một mô hình phân loại trong khoa học dữ liệu, chỉ số nào thường được sử dụng?

  • A. Thời gian chạy của thuật toán.
  • B. Dung lượng bộ nhớ sử dụng.
  • C. Độ chính xác (Accuracy) hoặc F1-score.
  • D. Số lượng dòng dữ liệu đầu vào.

Câu 27: Trong lĩnh vực tài chính, khoa học dữ liệu có thể được sử dụng để làm gì?

  • A. Quản lý hệ thống mạng máy tính.
  • B. Phát triển phần mềm kế toán.
  • C. Thiết kế giao diện website ngân hàng.
  • D. Dự báo rủi ro tín dụng và phát hiện giao dịch đáng ngờ.

Câu 28: Khi dữ liệu lớn không thể lưu trữ trên một máy tính duy nhất, giải pháp lưu trữ phân tán nào thường được sử dụng?

  • A. Ổ cứng thể rắn (SSD) dung lượng lớn.
  • B. Hệ thống tệp phân tán (Distributed File System) như Hadoop HDFS.
  • C. Cơ sở dữ liệu quan hệ SQL.
  • D. Bộ nhớ RAM mở rộng.

Câu 29: Để đảm bảo tính "xác thực" (Veracity) của dữ liệu lớn, biện pháp nào sau đây quan trọng nhất?

  • A. Tăng tốc độ thu thập dữ liệu.
  • B. Mở rộng dung lượng lưu trữ dữ liệu.
  • C. Kiểm tra và làm sạch dữ liệu để loại bỏ sai sót và nhiễu.
  • D. Sử dụng nhiều nguồn dữ liệu khác nhau.

Câu 30: Trong bối cảnh khoa học dữ liệu ngày càng phát triển, kỹ năng nào trở nên quan trọng hơn bao giờ hết đối với người làm việc với dữ liệu?

  • A. Kỹ năng lập trình chuyên sâu.
  • B. Kiến thức toán học thống kê nâng cao.
  • C. Khả năng sử dụng các công cụ trực quan hóa dữ liệu.
  • D. Tư duy phản biện và khả năng giải quyết vấn đề phức tạp.

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 1: Trong khoa học dữ liệu, đặc điểm 'khối lượng' (Volume) của dữ liệu lớn thường được thể hiện rõ nhất qua yếu tố nào?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 2: 'Velocity' là một trong 5V đặc trưng của dữ liệu lớn, yếu tố này nhấn mạnh đến khía cạnh nào trong khoa học dữ liệu?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 3: Tính 'đa dạng' (Variety) của dữ liệu lớn gây ra thách thức chủ yếu nào cho các hệ thống xử lý dữ liệu truyền thống?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 4: Trong quy trình khai phá dữ liệu, bước nào tập trung vào việc chuyển đổi dữ liệu thô sang định dạng phù hợp cho phân tích?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 5: Phân tích dữ liệu mô tả (Descriptive Analytics) chủ yếu được sử dụng để trả lời câu hỏi nào về dữ liệu?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 6: Để dự đoán doanh số bán hàng trong quý tới dựa trên dữ liệu lịch sử và các yếu tố thị trường hiện tại, loại phân tích dữ liệu nào sẽ phù hợp nhất?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 7: Công nghệ điện toán đám mây (Cloud Computing) mang lại lợi ích gì quan trọng trong việc xử lý và lưu trữ dữ liệu lớn?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 8: Cơ sở dữ liệu NoSQL được thiết kế đặc biệt để giải quyết vấn đề nào mà các cơ sở dữ liệu quan hệ (SQL) truyền thống gặp khó khăn?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 9: Máy tính cụm (Computer Cluster) được sử dụng phổ biến trong khoa học dữ liệu để làm gì?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 10: Thuật toán song song (Parallel Algorithm) đóng vai trò như thế nào trong việc phân tích dữ liệu lớn?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 11: Để phân tích cảm xúc (Sentiment Analysis) từ hàng triệu bình luận trên mạng xã hội về một sản phẩm mới, công cụ nào sau đây sẽ hữu ích nhất?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 12: Trong lĩnh vực y tế, khoa học dữ liệu có thể được ứng dụng để làm gì?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 13: Một nhà bán lẻ trực tuyến muốn cá nhân hóa trải nghiệm mua sắm cho từng khách hàng. Khoa học dữ liệu có thể giúp họ thực hiện điều này bằng cách nào?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 14: 'Veracity' trong 5V của dữ liệu lớn đề cập đến vấn đề gì quan trọng khi làm việc với dữ liệu?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 15: Để phát hiện gian lận trong giao dịch thẻ tín dụng, kỹ thuật khai phá dữ liệu nào thường được sử dụng?

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 16: Trong phân tích dữ liệu, 'trực quan hóa dữ liệu' (Data Visualization) có vai trò chính là gì?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 17: 'Value' là yếu tố cuối cùng trong 5V của dữ liệu lớn. Yếu tố này nhấn mạnh đến điều gì?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 18: Để xây dựng một hệ thống tự động phân loại email vào hộp thư 'spam' và 'không spam', kỹ thuật học máy nào sau đây thường được sử dụng?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 19: Sự khác biệt chính giữa phân tích dữ liệu dự đoán (Predictive Analytics) và phân tích dữ liệu quy chuẩn (Prescriptive Analytics) là gì?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 20: Trong khoa học dữ liệu, thuật ngữ 'kỹ sư dữ liệu' (Data Engineer) thường dùng để chỉ người có vai trò chính là gì?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 21: Giả sử bạn có một tập dữ liệu lớn về thông tin khách hàng và hành vi mua sắm. Bạn muốn phân nhóm khách hàng thành các phân khúc khác nhau dựa trên đặc điểm chung. Kỹ thuật khai phá dữ liệu nào phù hợp?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 22: Ưu điểm nổi bật của cơ sở dữ liệu NoSQL so với cơ sở dữ liệu quan hệ SQL trong việc quản lý dữ liệu lớn là gì?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 23: Để xử lý dữ liệu lớn có tốc độ phát sinh liên tục từ các cảm biến IoT, kiến trúc hệ thống nào sẽ hiệu quả hơn?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 24: Trong một dự án khoa học dữ liệu, bước nào thường tốn nhiều thời gian và công sức nhất?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 25: Vấn đề 'thiên vị' (bias) trong dữ liệu có thể gây ra hậu quả gì trong các ứng dụng khoa học dữ liệu?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 26: Để đánh giá hiệu quả của một mô hình phân loại trong khoa học dữ liệu, chỉ số nào thường được sử dụng?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 27: Trong lĩnh vực tài chính, khoa học dữ liệu có thể được sử dụng để làm gì?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 28: Khi dữ liệu lớn không thể lưu trữ trên một máy tính duy nhất, giải pháp lưu trữ phân tán nào thường được sử dụng?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 29: Để đảm bảo tính 'xác thực' (Veracity) của dữ liệu lớn, biện pháp nào sau đây quan trọng nhất?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 2

Câu 30: Trong bối cảnh khoa học dữ liệu ngày càng phát triển, kỹ năng nào trở nên quan trọng hơn bao giờ hết đối với người làm việc với dữ liệu?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 03

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 03 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Một công ty thương mại điện tử thu thập hàng terabyte dữ liệu mỗi ngày từ hành vi duyệt web, lịch sử mua hàng và tương tác trên ứng dụng của hàng triệu khách hàng. Đặc trưng nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất trong tình huống này?

  • A. Variety (Tính đa dạng)
  • B. Volume (Khối lượng)
  • C. Velocity (Tốc độ)
  • D. Veracity (Tính xác thực)

Câu 2: Hệ thống giám sát giao thông đô thị xử lý dữ liệu từ hàng nghìn camera và cảm biến theo thời gian thực để điều khiển đèn tín hiệu và cảnh báo ùn tắc ngay lập tức. Đặc trưng nào của Dữ liệu lớn (Big Data) đặt ra thách thức lớn nhất trong việc thiết kế hệ thống này?

  • A. Volume (Khối lượng)
  • B. Variety (Tính đa dạng)
  • C. Velocity (Tốc độ)
  • D. Value (Giá trị)

Câu 3: Một chiến dịch phân tích dữ liệu khách hàng của ngân hàng bao gồm thông tin giao dịch (số), lịch sử tín dụng (có cấu trúc), email hỗ trợ khách hàng (văn bản phi cấu trúc), và ghi âm cuộc gọi (âm thanh). Đặc trưng nào của Dữ liệu lớn (Big Data) mô tả sự kết hợp các loại dữ liệu này?

  • A. Variety (Tính đa dạng)
  • B. Volume (Khối lượng)
  • C. Velocity (Tốc độ)
  • D. Veracity (Tính xác thực)

Câu 4: Dữ liệu thu thập từ các cảm biến IoT trong nông nghiệp có thể bị sai lệch do điều kiện thời tiết khắc nghiệt hoặc lỗi thiết bị. Việc đảm bảo dữ liệu này đủ tin cậy để đưa ra quyết định về tưới tiêu và bón phân liên quan trực tiếp đến đặc trưng nào của Dữ liệu lớn (Big Data)?

  • A. Volume (Khối lượng)
  • B. Variety (Tính đa dạng)
  • C. Velocity (Tốc độ)
  • D. Veracity (Tính xác thực)

Câu 5: Mục tiêu cuối cùng của việc phân tích Dữ liệu lớn là trích xuất những thông tin hữu ích, tìm ra các mẫu ẩn và đưa ra quyết định dựa trên dữ liệu để tạo ra lợi ích cụ thể (ví dụ: tăng doanh thu, giảm chi phí). Điều này thể hiện đặc trưng nào của Dữ liệu lớn?

  • A. Velocity (Tốc độ)
  • B. Value (Giá trị)
  • C. Veracity (Tính xác thực)
  • D. Volume (Khối lượng)

Câu 6: Một nhà khoa học dữ liệu đang sử dụng các thuật toán để tìm ra các nhóm khách hàng có hành vi mua sắm tương tự nhau trong một tập dữ liệu khổng lồ. Quá trình này được gọi là gì?

  • A. Thu thập dữ liệu
  • B. Trực quan hóa dữ liệu
  • C. Khai phá dữ liệu (Data Mining)
  • D. Lưu trữ dữ liệu

Câu 7: Phân tích dữ liệu nào nhằm mục đích tóm tắt các đặc điểm chính của dữ liệu quá khứ, thường sử dụng các biểu đồ, thống kê mô tả để trả lời câu hỏi "Điều gì đã xảy ra?"

  • A. Phân tích mô tả (Descriptive Analysis)
  • B. Phân tích dự đoán (Predictive Analysis)
  • C. Phân tích đề xuất (Prescriptive Analysis)
  • D. Khai phá dữ liệu (Data Mining)

Câu 8: Một công ty muốn dự đoán doanh số bán hàng cho quý tới dựa trên dữ liệu bán hàng của nhiều năm trước, các yếu tố mùa vụ và xu hướng thị trường. Loại hình phân tích dữ liệu nào phù hợp nhất để thực hiện mục tiêu này?

  • A. Phân tích mô tả (Descriptive Analysis)
  • B. Phân tích dự đoán (Predictive Analysis)
  • C. Phân tích đề xuất (Prescriptive Analysis)
  • D. Trực quan hóa dữ liệu

Câu 9: Sau khi phân tích dữ liệu khách hàng và dự đoán được những người có nguy cơ rời bỏ dịch vụ cao, một công ty muốn biết nên đưa ra những ưu đãi cụ thể nào cho từng nhóm khách hàng đó để giữ chân họ hiệu quả nhất. Loại hình phân tích dữ liệu nào cung cấp các khuyến nghị hành động tối ưu?

  • A. Phân tích mô tả (Descriptive Analysis)
  • B. Phân tích dự đoán (Predictive Analysis)
  • C. Phân tích đề xuất (Prescriptive Analysis)
  • D. Khai phá dữ liệu (Data Mining)

Câu 10: Học máy (Machine Learning) đóng vai trò quan trọng trong Khoa học dữ liệu chủ yếu ở khâu nào?

  • A. Chỉ thu thập dữ liệu
  • B. Chỉ lưu trữ dữ liệu
  • C. Chỉ hiển thị dữ liệu
  • D. Xây dựng mô hình từ dữ liệu để đưa ra dự đoán hoặc quyết định

Câu 11: Khi làm việc với Dữ liệu lớn, việc sử dụng Điện toán đám mây (Cloud Computing) mang lại lợi ích đáng kể nào?

  • A. Cung cấp tài nguyên tính toán và lưu trữ linh hoạt, theo nhu cầu
  • B. Giảm tính đa dạng của dữ liệu
  • C. Loại bỏ hoàn toàn nhu cầu về thuật toán phân tích
  • D. Chỉ phù hợp với dữ liệu có cấu trúc

Câu 12: Một dự án Khoa học dữ liệu cần xử lý một lượng lớn dữ liệu phi cấu trúc và bán cấu trúc từ mạng xã hội (bài đăng, bình luận, hình ảnh). Loại cơ sở dữ liệu nào thường được ưu tiên sử dụng trong trường hợp này so với cơ sở dữ liệu quan hệ truyền thống?

  • A. Cơ sở dữ liệu SQL (Quan hệ)
  • B. Cơ sở dữ liệu NoSQL
  • C. Cơ sở dữ liệu phân cấp
  • D. Bảng tính Excel

Câu 13: Để tăng tốc độ xử lý các tác vụ phân tích dữ liệu lớn đòi hỏi nhiều phép tính phức tạp, các nhà khoa học dữ liệu thường sử dụng các hệ thống gồm nhiều máy tính hoạt động song song như một đơn vị xử lý duy nhất. Hệ thống này được gọi là gì?

  • A. Máy tính cá nhân hiệu năng cao
  • B. Máy chủ đơn lẻ
  • C. Máy tính cụm (Cluster Computing)
  • D. Thiết bị lưu trữ ngoại vi

Câu 14: Thuật toán song song (Parallel Algorithms) mang lại lợi ích chính nào khi xử lý Dữ liệu lớn?

  • A. Giảm khối lượng dữ liệu cần xử lý
  • B. Tăng tính xác thực của dữ liệu đầu vào
  • C. Chỉ hoạt động với dữ liệu văn bản
  • D. Thực hiện nhiều phép tính đồng thời, rút ngắn thời gian xử lý

Câu 15: Khi trực quan hóa dữ liệu, mục đích chính là gì?

  • A. Biến dữ liệu phức tạp thành dạng biểu đồ, đồ thị dễ hiểu để phát hiện xu hướng, mẫu
  • B. Lưu trữ dữ liệu một cách hiệu quả
  • C. Thực hiện các phép tính thống kê phức tạp
  • D. Tự động thu thập dữ liệu từ các nguồn khác nhau

Câu 16: Một công ty viễn thông muốn phân tích dữ liệu cuộc gọi và tin nhắn để phát hiện các hoạt động bất thường, có thể là dấu hiệu của gian lận. Đây là một ứng dụng điển hình của Khoa học dữ liệu trong lĩnh vực nào?

  • A. Chăm sóc sức khỏe
  • B. Phát hiện gian lận (Fraud Detection)
  • C. Dự báo thời tiết
  • D. Phân tích hình ảnh y tế

Câu 17: Trong quy trình Khoa học dữ liệu, bước nào thường diễn ra sau khi dữ liệu đã được thu thập và làm sạch?

  • A. Triển khai mô hình
  • B. Thu thập dữ liệu
  • C. Phân tích và mô hình hóa dữ liệu
  • D. Đưa ra quyết định kinh doanh

Câu 18: Một nhà khoa học dữ liệu nhận thấy rằng dữ liệu tuổi của khách hàng trong tập dữ liệu có nhiều giá trị không hợp lệ (ví dụ: tuổi âm, tuổi quá lớn). Bước nào trong quy trình Khoa học dữ liệu sẽ xử lý vấn đề này?

  • A. Làm sạch dữ liệu (Data Cleaning)
  • B. Trực quan hóa dữ liệu
  • C. Xây dựng mô hình
  • D. Thu thập dữ liệu

Câu 19: Một trong những thách thức lớn nhất khi làm việc với đặc trưng Veracity (Tính xác thực) của Dữ liệu lớn là gì?

  • A. Khó khăn trong việc lưu trữ dữ liệu quá lớn
  • B. Tốc độ dữ liệu thay đổi quá nhanh
  • C. Dữ liệu đến từ quá nhiều nguồn khác nhau
  • D. Đảm bảo độ tin cậy, chính xác và không bị sai lệch của dữ liệu

Câu 20: Công ty A đang sử dụng một hệ thống cơ sở dữ liệu quan hệ truyền thống. Tuy nhiên, khi lượng dữ liệu tăng lên đột biến (đạt petabyte) và bao gồm cả video, âm thanh từ mạng xã hội, hệ thống trở nên chậm chạp và khó mở rộng. Vấn đề này liên quan chủ yếu đến đặc trưng nào của Dữ liệu lớn?

  • A. Volume (Khối lượng) và Variety (Tính đa dạng)
  • B. Velocity (Tốc độ) và Veracity (Tính xác thực)
  • C. Value (Giá trị) và Volume (Khối lượng)
  • D. Variety (Tính đa dạng) và Velocity (Tốc độ)

Câu 21: Một nhà bán lẻ trực tuyến muốn phân tích lịch sử duyệt web và mua hàng của khách hàng để đề xuất sản phẩm phù hợp. Họ sử dụng thuật toán học máy để xây dựng mô hình dự đoán sở thích khách hàng. Đây là ví dụ về việc áp dụng Khoa học dữ liệu trong lĩnh vực nào?

  • A. Y tế
  • B. Giáo dục
  • C. Thương mại điện tử (E-commerce)
  • D. Nông nghiệp

Câu 22: Phân tích dữ liệu nào thường trả lời câu hỏi "Điều gì có thể xảy ra?" dựa trên các mẫu và xu hướng trong dữ liệu quá khứ và hiện tại?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích đề xuất
  • D. Làm sạch dữ liệu

Câu 23: Một trong những mục tiêu của Khai phá dữ liệu (Data Mining) là khám phá ra các mối quan hệ hoặc mẫu ẩn mà con người khó có thể nhận biết được chỉ bằng cách quan sát dữ liệu thô. Phát biểu này Đúng hay Sai?

  • A. Đúng
  • B. Sai
  • C. Chỉ đúng với dữ liệu số
  • D. Chỉ đúng với dữ liệu văn bản

Câu 24: Khi sử dụng các thuật toán học máy để phân tích dữ liệu, nếu dữ liệu huấn luyện (training data) chứa đựng sự thiên vị (bias) về một nhóm người nhất định, điều gì có khả năng xảy ra với kết quả phân tích hoặc mô hình được xây dựng?

  • A. Mô hình sẽ trở nên chính xác hơn với tất cả các nhóm.
  • B. Mô hình sẽ không thể hoạt động được.
  • C. Mô hình sẽ đưa ra kết quả ngẫu nhiên.
  • D. Mô hình có thể đưa ra dự đoán hoặc quyết định thiên vị, không công bằng cho nhóm bị thiên vị trong dữ liệu.

Câu 25: Giả sử bạn có một tập dữ liệu chứa thông tin về việc sử dụng năng lượng của các hộ gia đình trong 5 năm qua. Bạn muốn sử dụng dữ liệu này để xây dựng một mô hình dự báo mức tiêu thụ năng lượng của một hộ gia đình mới trong năm tới. Kỹ năng nào của nhà khoa học dữ liệu là quan trọng nhất ở đây?

  • A. Thiết kế giao diện người dùng
  • B. Xây dựng và đánh giá mô hình dự báo (sử dụng kỹ thuật thống kê/học máy)
  • C. Quản lý cơ sở hạ tầng mạng
  • D. Biên soạn tài liệu hướng dẫn sử dụng phần mềm

Câu 26: Một công ty Logistics thu thập dữ liệu vị trí từ hàng nghìn xe tải mỗi phút. Việc phân tích dữ liệu này để tối ưu hóa lộ trình giao hàng và dự báo thời gian đến nơi (ETA) liên quan chủ yếu đến sự kết hợp của những đặc trưng nào của Dữ liệu lớn?

  • A. Volume (Khối lượng) và Velocity (Tốc độ)
  • B. Variety (Tính đa dạng) và Veracity (Tính xác thực)
  • C. Value (Giá trị) và Variety (Tính đa dạng)
  • D. Veracity (Tính xác thực) và Velocity (Tốc độ)

Câu 27: Trực quan hóa dữ liệu hiệu quả có thể giúp phát hiện các ngoại lệ (outliers) hoặc các điểm dữ liệu bất thường mà khó nhận ra chỉ qua bảng số. Phát biểu này Đúng hay Sai?

  • A. Đúng
  • B. Sai
  • C. Chỉ đúng với dữ liệu nhỏ
  • D. Chỉ đúng với dữ liệu có cấu trúc

Câu 28: So với các phương pháp xử lý dữ liệu truyền thống, việc áp dụng Khoa học dữ liệu và Dữ liệu lớn thường đòi hỏi những yếu tố nào?

  • A. Chỉ cần phần mềm xử lý dữ liệu thông thường.
  • B. Ít yêu cầu về năng lực tính toán và lưu trữ.
  • C. Chỉ làm việc với dữ liệu có cấu trúc.
  • D. Cần các công nghệ và thuật toán chuyên biệt để xử lý khối lượng, tốc độ và sự đa dạng của dữ liệu.

Câu 29: Một công ty bảo hiểm muốn phân tích dữ liệu về các yêu cầu bồi thường (claims) để xác định những yêu cầu có dấu hiệu gian lận, nhằm giảm thiểu tổn thất. Họ sử dụng các kỹ thuật phân tích dữ liệu để tìm kiếm các mẫu hành vi bất thường trong lịch sử yêu cầu bồi thường. Đây là ứng dụng của Khoa học dữ liệu trong việc gì?

  • A. Tối ưu hóa chuỗi cung ứng
  • B. Cá nhân hóa trải nghiệm người dùng
  • C. Phát hiện bất thường (Anomaly Detection)
  • D. Phân tích cảm xúc khách hàng

Câu 30: Phân tích dữ liệu nào trả lời câu hỏi "Chúng ta nên làm gì?" bằng cách đề xuất hành động tốt nhất dựa trên kết quả dự đoán và các ràng buộc?

  • A. Phân tích dự đoán
  • B. Phân tích đề xuất
  • C. Phân tích mô tả
  • D. Trực quan hóa dữ liệu

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 1: Một công ty thương mại điện tử thu thập hàng terabyte dữ liệu mỗi ngày từ hành vi duyệt web, lịch sử mua hàng và tương tác trên ứng dụng của hàng triệu khách hàng. Đặc trưng nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất trong tình huống này?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 2: Hệ thống giám sát giao thông đô thị xử lý dữ liệu từ hàng nghìn camera và cảm biến theo thời gian thực để điều khiển đèn tín hiệu và cảnh báo ùn tắc ngay lập tức. Đặc trưng nào của Dữ liệu lớn (Big Data) đặt ra thách thức lớn nhất trong việc thiết kế hệ thống này?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 3: Một chiến dịch phân tích dữ liệu khách hàng của ngân hàng bao gồm thông tin giao dịch (số), lịch sử tín dụng (có cấu trúc), email hỗ trợ khách hàng (văn bản phi cấu trúc), và ghi âm cuộc gọi (âm thanh). Đặc trưng nào của Dữ liệu lớn (Big Data) mô tả sự kết hợp các loại dữ liệu này?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 4: Dữ liệu thu thập từ các cảm biến IoT trong nông nghiệp có thể bị sai lệch do điều kiện thời tiết khắc nghiệt hoặc lỗi thiết bị. Việc đảm bảo dữ liệu này đủ tin cậy để đưa ra quyết định về tưới tiêu và bón phân liên quan trực tiếp đến đặc trưng nào của Dữ liệu lớn (Big Data)?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 5: Mục tiêu cuối cùng của việc phân tích Dữ liệu lớn là trích xuất những thông tin hữu ích, tìm ra các mẫu ẩn và đưa ra quyết định dựa trên dữ liệu để tạo ra lợi ích cụ thể (ví dụ: tăng doanh thu, giảm chi phí). Điều này thể hiện đặc trưng nào của Dữ liệu lớn?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 6: Một nhà khoa học dữ liệu đang sử dụng các thuật toán để tìm ra các nhóm khách hàng có hành vi mua sắm tương tự nhau trong một tập dữ liệu khổng lồ. Quá trình này được gọi là gì?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 7: Phân tích dữ liệu nào nhằm mục đích tóm tắt các đặc điểm chính của dữ liệu quá khứ, thường sử dụng các biểu đồ, thống kê mô tả để trả lời câu hỏi 'Điều gì đã xảy ra?'

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 8: Một công ty muốn dự đoán doanh số bán hàng cho quý tới dựa trên dữ liệu bán hàng của nhiều năm trước, các yếu tố mùa vụ và xu hướng thị trường. Loại hình phân tích dữ liệu nào phù hợp nhất để thực hiện mục tiêu này?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 9: Sau khi phân tích dữ liệu khách hàng và dự đoán được những người có nguy cơ rời bỏ dịch vụ cao, một công ty muốn biết nên đưa ra những ưu đãi cụ thể nào cho từng nhóm khách hàng đó để giữ chân họ hiệu quả nhất. Loại hình phân tích dữ liệu nào cung cấp các khuyến nghị hành động tối ưu?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 10: Học máy (Machine Learning) đóng vai trò quan trọng trong Khoa học dữ liệu chủ yếu ở khâu nào?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 11: Khi làm việc với Dữ liệu lớn, việc sử dụng Điện toán đám mây (Cloud Computing) mang lại lợi ích đáng kể nào?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 12: Một dự án Khoa học dữ liệu cần xử lý một lượng lớn dữ liệu phi cấu trúc và bán cấu trúc từ mạng xã hội (bài đăng, bình luận, hình ảnh). Loại cơ sở dữ liệu nào thường được ưu tiên sử dụng trong trường hợp này so với cơ sở dữ liệu quan hệ truyền thống?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 13: Để tăng tốc độ xử lý các tác vụ phân tích dữ liệu lớn đòi hỏi nhiều phép tính phức tạp, các nhà khoa học dữ liệu thường sử dụng các hệ thống gồm nhiều máy tính hoạt động song song như một đơn vị xử lý duy nhất. Hệ thống này được gọi là gì?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 14: Thuật toán song song (Parallel Algorithms) mang lại lợi ích chính nào khi xử lý Dữ liệu lớn?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 15: Khi trực quan hóa dữ liệu, mục đích chính là gì?

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 16: Một công ty viễn thông muốn phân tích dữ liệu cuộc gọi và tin nhắn để phát hiện các hoạt động bất thường, có thể là dấu hiệu của gian lận. Đây là một ứng dụng điển hình của Khoa học dữ liệu trong lĩnh vực nào?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 17: Trong quy trình Khoa học dữ liệu, bước nào thường diễn ra sau khi dữ liệu đã được thu thập và làm sạch?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 18: Một nhà khoa học dữ liệu nhận thấy rằng dữ liệu tuổi của khách hàng trong tập dữ liệu có nhiều giá trị không hợp lệ (ví dụ: tuổi âm, tuổi quá lớn). Bước nào trong quy trình Khoa học dữ liệu sẽ xử lý vấn đề này?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 19: Một trong những thách thức lớn nhất khi làm việc với đặc trưng Veracity (Tính xác thực) của Dữ liệu lớn là gì?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 20: Công ty A đang sử dụng một hệ thống cơ sở dữ liệu quan hệ truyền thống. Tuy nhiên, khi lượng dữ liệu tăng lên đột biến (đạt petabyte) và bao gồm cả video, âm thanh từ mạng xã hội, hệ thống trở nên chậm chạp và khó mở rộng. Vấn đề này liên quan chủ yếu đến đặc trưng nào của Dữ liệu lớn?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 21: Một nhà bán lẻ trực tuyến muốn phân tích lịch sử duyệt web và mua hàng của khách hàng để đề xuất sản phẩm phù hợp. Họ sử dụng thuật toán học máy để xây dựng mô hình dự đoán sở thích khách hàng. Đây là ví dụ về việc áp dụng Khoa học dữ liệu trong lĩnh vực nào?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 22: Phân tích dữ liệu nào thường trả lời câu hỏi 'Điều gì có thể xảy ra?' dựa trên các mẫu và xu hướng trong dữ liệu quá khứ và hiện tại?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 23: Một trong những mục tiêu của Khai phá dữ liệu (Data Mining) là khám phá ra các mối quan hệ hoặc mẫu ẩn mà con người khó có thể nhận biết được chỉ bằng cách quan sát dữ liệu thô. Phát biểu này Đúng hay Sai?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 24: Khi sử dụng các thuật toán học máy để phân tích dữ liệu, nếu dữ liệu huấn luyện (training data) chứa đựng sự thiên vị (bias) về một nhóm người nhất định, điều gì có khả năng xảy ra với kết quả phân tích hoặc mô hình được xây dựng?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 25: Giả sử bạn có một tập dữ liệu chứa thông tin về việc sử dụng năng lượng của các hộ gia đình trong 5 năm qua. Bạn muốn sử dụng dữ liệu này để xây dựng một mô hình dự báo mức tiêu thụ năng lượng của một hộ gia đình mới trong năm tới. Kỹ năng nào của nhà khoa học dữ liệu là quan trọng nhất ở đây?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 26: Một công ty Logistics thu thập dữ liệu vị trí từ hàng nghìn xe tải mỗi phút. Việc phân tích dữ liệu này để tối ưu hóa lộ trình giao hàng và dự báo thời gian đến nơi (ETA) liên quan chủ yếu đến sự kết hợp của những đặc trưng nào của Dữ liệu lớn?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 27: Trực quan hóa dữ liệu hiệu quả có thể giúp phát hiện các ngoại lệ (outliers) hoặc các điểm dữ liệu bất thường mà khó nhận ra chỉ qua bảng số. Phát biểu này Đúng hay Sai?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 28: So với các phương pháp xử lý dữ liệu truyền thống, việc áp dụng Khoa học dữ liệu và Dữ liệu lớn thường đòi hỏi những yếu tố nào?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 29: Một công ty bảo hiểm muốn phân tích dữ liệu về các yêu cầu bồi thường (claims) để xác định những yêu cầu có dấu hiệu gian lận, nhằm giảm thiểu tổn thất. Họ sử dụng các kỹ thuật phân tích dữ liệu để tìm kiếm các mẫu hành vi bất thường trong lịch sử yêu cầu bồi thường. Đây là ứng dụng của Khoa học dữ liệu trong việc gì?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 3

Câu 30: Phân tích dữ liệu nào trả lời câu hỏi 'Chúng ta nên làm gì?' bằng cách đề xuất hành động tốt nhất dựa trên kết quả dự đoán và các ràng buộc?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 04

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 04 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về hành vi duyệt web của hàng triệu khách hàng mỗi ngày, bao gồm lượt xem sản phẩm, thêm vào giỏ hàng, và thời gian trên trang. Lượng dữ liệu này tăng lên theo cấp số nhân. Đặc điểm nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất trong tình huống này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 2: Hệ thống cảm biến thời tiết trên khắp thế giới liên tục gửi về dữ liệu về nhiệt độ, độ ẩm, áp suất, tốc độ gió theo từng giây. Việc xử lý và phân tích thông tin này cần được thực hiện gần như ngay lập tức để đưa ra dự báo chính xác. Đặc điểm nào của Dữ liệu lớn (Big Data) đặt ra thách thức lớn nhất trong trường hợp này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Value (Giá trị)

Câu 3: Một nền tảng mạng xã hội thu thập dữ liệu từ bài đăng văn bản, hình ảnh, video, âm thanh, dữ liệu vị trí, và thông tin từ các thiết bị kết nối khác. Sự đa dạng về định dạng và nguồn gốc của dữ liệu này được mô tả bằng đặc điểm nào của Dữ liệu lớn (Big Data)?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Viscosity (Độ nhớt)

Câu 4: Dữ liệu thu thập từ các bài đăng trên diễn đàn trực tuyến hoặc đánh giá sản phẩm có thể chứa thông tin sai lệch, ý kiến chủ quan, hoặc thậm chí là spam. Đặc điểm nào của Dữ liệu lớn (Big Data) liên quan trực tiếp đến độ tin cậy và chính xác của thông tin này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 5: Quá trình khám phá các mẫu, xu hướng, và tri thức tiềm ẩn trong các tập dữ liệu lớn bằng cách sử dụng các kỹ thuật từ thống kê, học máy và hệ cơ sở dữ liệu được gọi là gì?

  • A. Trực quan hóa dữ liệu
  • B. Khai phá dữ liệu (Data Mining)
  • C. Thu thập dữ liệu
  • D. Làm sạch dữ liệu

Câu 6: Một nhà bán lẻ muốn hiểu rõ hành vi mua sắm của khách hàng trong quá khứ để đưa ra các chiến lược marketing hiệu quả. Họ cần biết những sản phẩm nào thường được mua cùng nhau hoặc vào những thời điểm nào trong năm doanh số tăng cao. Kỹ thuật khai phá dữ liệu nào phù hợp nhất để tìm ra các mối quan hệ "mua cùng nhau" này?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Phân tích luật kết hợp (Association Rule Mining)
  • D. Phân cụm (Clustering)

Câu 7: Một công ty muốn tạo báo cáo tổng kết về doanh số bán hàng trong quý vừa qua, bao gồm tổng doanh thu, sản phẩm bán chạy nhất, và phân bổ doanh thu theo khu vực. Loại hình phân tích dữ liệu nào đang được áp dụng?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Phân tích chẩn đoán (Diagnostic Analytics)

Câu 8: Một ngân hàng sử dụng dữ liệu lịch sử giao dịch của khách hàng để xây dựng mô hình dự báo khả năng vỡ nợ của các khoản vay mới. Loại hình phân tích dữ liệu nào đang được thực hiện?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Phân tích khám phá (Exploratory Analytics)

Câu 9: Một công ty logistics muốn tối ưu hóa lộ trình giao hàng cho đội xe của mình để giảm thiểu thời gian và chi phí vận chuyển, dựa trên dữ liệu về địa điểm khách hàng, tình hình giao thông thời gian thực và khả năng của từng xe. Loại hình phân tích dữ liệu nào phù hợp nhất để giải quyết bài toán này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 10: Trong Khoa học dữ liệu, việc sử dụng các hệ thống máy tính mạnh mẽ và các thuật toán hiệu quả là cần thiết chủ yếu vì lý do nào?

  • A. Để làm cho dữ liệu trông đẹp mắt hơn.
  • B. Để giảm khối lượng dữ liệu cần xử lý.
  • C. Để loại bỏ hoàn toàn dữ liệu không chính xác.
  • D. Để xử lý, phân tích và trích xuất thông tin từ các tập dữ liệu có khối lượng và độ phức tạp lớn.

Câu 11: Để xử lý một tập dữ liệu khổng lồ mà không thể chứa vừa trong bộ nhớ của một máy tính duy nhất hoặc cần thời gian xử lý quá lâu, người ta thường sử dụng giải pháp nào liên quan đến hạ tầng máy tính?

  • A. Sử dụng máy tính cá nhân cấu hình cao nhất.
  • B. Sử dụng máy tính cụm (Cluster) hoặc điện toán đám mây (Cloud Computing).
  • C. Chỉ phân tích một phần nhỏ của dữ liệu.
  • D. Lưu trữ dữ liệu trên ổ cứng ngoài.

Câu 12: Thuật toán song song (Parallel Algorithms) đóng vai trò quan trọng trong xử lý Dữ liệu lớn vì nó cho phép:

  • A. Giảm số lượng biến trong dữ liệu.
  • B. Chuyển đổi tất cả dữ liệu sang định dạng văn bản.
  • C. Chia nhỏ bài toán lớn thành các phần nhỏ hơn và xử lý đồng thời trên nhiều bộ xử lý/máy tính.
  • D. Tự động làm sạch dữ liệu mà không cần sự can thiệp của con người.

Câu 13: Một công ty khởi nghiệp về phân tích dữ liệu muốn triển khai một dự án KDL nhưng không có đủ ngân sách để đầu tư vào cơ sở hạ tầng máy chủ, lưu trữ và mạng ban đầu. Giải pháp nào về hạ tầng là phù hợp nhất cho họ?

  • A. Sử dụng các dịch vụ điện toán đám mây (Cloud Computing).
  • B. Xây dựng trung tâm dữ liệu riêng.
  • C. Mua các siêu máy tính.
  • D. Chỉ sử dụng phần mềm mã nguồn mở miễn phí.

Câu 14: Hệ cơ sở dữ liệu quan hệ (SQL) gặp khó khăn gì chủ yếu khi xử lý Dữ liệu lớn, đặc biệt là dữ liệu phi cấu trúc và bán cấu trúc?

  • A. Chi phí lưu trữ quá cao.
  • B. Không thể thực hiện các truy vấn cơ bản.
  • C. Tốc độ xử lý quá nhanh.
  • D. Yêu cầu cấu trúc dữ liệu cố định (schema) và khó mở rộng linh hoạt theo chiều ngang.

Câu 15: Cơ sở dữ liệu NoSQL được thiết kế để giải quyết một số hạn chế của cơ sở dữ liệu quan hệ khi làm việc với Dữ liệu lớn. Đặc điểm nổi bật nhất của NoSQL là gì?

  • A. Tuân thủ chặt chẽ mô hình bảng với khóa chính/khóa ngoại.
  • B. Lưu trữ dữ liệu linh hoạt, không yêu cầu cấu trúc cố định (schema-less) và khả năng mở rộng theo chiều ngang tốt.
  • C. Chỉ hỗ trợ lưu trữ dữ liệu số.
  • D. Tốc độ truy vấn chậm hơn nhiều so với SQL.

Câu 16: Một nhà khoa học dữ liệu đang làm việc với tập dữ liệu bao gồm các bài đăng trên mạng xã hội, hình ảnh, video và dữ liệu định vị GPS. Loại cơ sở dữ liệu nào sau đây thường được coi là phù hợp hơn để lưu trữ và xử lý loại dữ liệu đa dạng và phi cấu trúc này?

  • A. NoSQL database (e.g., MongoDB, Cassandra)
  • B. Relational database (e.g., MySQL, PostgreSQL)
  • C. Spreadsheet file (e.g., Excel)
  • D. Text file (.txt)

Câu 17: Trong quy trình Khoa học dữ liệu, giai đoạn nào thường bao gồm các công việc như xử lý dữ liệu bị thiếu, làm sạch dữ liệu không nhất quán, và biến đổi dữ liệu sang định dạng phù hợp cho phân tích?

  • A. Thu thập dữ liệu
  • B. Phân tích dữ liệu
  • C. Tiền xử lý dữ liệu (Data Preprocessing)
  • D. Trực quan hóa dữ liệu

Câu 18: Một nhà khoa học dữ liệu xây dựng một mô hình học máy để phân loại email là "spam" hay "không spam" dựa trên nội dung và người gửi. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Mô hình hóa dữ liệu (Data Modeling)
  • C. Tiền xử lý dữ liệu
  • D. Triển khai kết quả

Câu 19: Sau khi hoàn thành việc phân tích và xây dựng mô hình, nhà khoa học dữ liệu cần trình bày kết quả và những phát hiện quan trọng cho các bên liên quan không chuyên về kỹ thuật (ví dụ: quản lý, đội marketing). Công cụ hoặc kỹ thuật nào sau đây là hiệu quả nhất cho mục đích này?

  • A. Chia sẻ mã nguồn của mô hình.
  • B. Gửi bảng tính dữ liệu thô.
  • C. Trình bày các công thức toán học phức tạp.
  • D. Sử dụng trực quan hóa dữ liệu (Data Visualization) thông qua biểu đồ, đồ thị, dashboard.

Câu 20: Vai trò của một nhà khoa học dữ liệu thường đòi hỏi sự kết hợp của nhiều kỹ năng từ các lĩnh vực khác nhau. Ba lĩnh vực chính nào thường được coi là nền tảng cốt lõi của Khoa học dữ liệu?

  • A. Lịch sử, Văn học, Nghệ thuật.
  • B. Vật lý, Hóa học, Sinh học.
  • C. Toán học/Thống kê, Khoa học Máy tính, Kiến thức chuyên ngành (Domain Knowledge).
  • D. Kinh tế, Luật, Xã hội học.

Câu 21: Khi đối mặt với một tập dữ liệu rất lớn, việc tải toàn bộ dữ liệu vào bộ nhớ RAM của một máy tính thông thường để xử lý là không khả thi. Thách thức này liên quan trực tiếp đến đặc điểm nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 22: Dữ liệu từ các cảm biến IoT (Internet of Things) trên các thiết bị công nghiệp thường được tạo ra với tốc độ rất cao và cần được phân tích theo thời gian thực để phát hiện sớm các dấu hiệu lỗi hoặc cần bảo trì. Điều này nhấn mạnh tầm quan trọng của việc xử lý Dữ liệu lớn liên quan đến đặc điểm nào?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Value (Giá trị)

Câu 23: Một công ty bảo hiểm muốn phân tích dữ liệu từ các đơn yêu cầu bồi thường của khách hàng. Dữ liệu này bao gồm văn bản mô tả sự cố, hình ảnh thiệt hại, báo cáo của cảnh sát (PDF), và dữ liệu định vị GPS. Việc kết hợp và phân tích các loại dữ liệu khác nhau này đòi hỏi giải pháp xử lý dữ liệu lớn có khả năng xử lý tốt đặc điểm nào?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Visibility (Tính hiển thị)

Câu 24: Dữ liệu khảo sát ý kiến khách hàng trên mạng xã hội có thể chứa nhiều thông tin không chính xác do tài khoản giả mạo hoặc ý kiến chủ quan. Để sử dụng dữ liệu này một cách hiệu quả, nhà khoa học dữ liệu cần đặc biệt chú ý đến việc quản lý và cải thiện đặc điểm nào của dữ liệu?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 25: Trong quy trình Khoa học dữ liệu, sau khi đã hiểu rõ bài toán kinh doanh và thu thập dữ liệu, bước tiếp theo quan trọng thường là gì trước khi tiến hành phân tích hoặc mô hình hóa?

  • A. Khám phá và tiền xử lý dữ liệu (Exploration and Preprocessing).
  • B. Trực quan hóa kết quả cuối cùng.
  • C. Triển khai mô hình vào thực tế.
  • D. Báo cáo kết quả cho quản lý.

Câu 26: Phân tích mô tả (Descriptive Analytics) chủ yếu giúp trả lời câu hỏi nào về dữ liệu?

  • A. Điều gì sẽ xảy ra trong tương lai?
  • B. Điều gì đã xảy ra?
  • C. Tại sao điều đó xảy ra?
  • D. Chúng ta nên làm gì?

Câu 27: Phân tích dự đoán (Predictive Analytics) chủ yếu giúp trả lời câu hỏi nào về dữ liệu?

  • A. Điều gì có thể xảy ra trong tương lai?
  • B. Điều gì đã xảy ra?
  • C. Chúng ta nên làm gì?
  • D. Làm thế nào để trực quan hóa dữ liệu?

Câu 28: Phân tích đề xuất (Prescriptive Analytics) chủ yếu giúp trả lời câu hỏi nào về dữ liệu?

  • A. Điều gì đã xảy ra?
  • B. Điều gì có thể xảy ra?
  • C. Tại sao điều đó xảy ra?
  • D. Chúng ta nên làm gì để đạt được kết quả tốt nhất?

Câu 29: Việc sử dụng máy tính cụm (Cluster) thay vì một máy tính đơn lẻ có hiệu năng cao mang lại lợi thế chính nào trong xử lý dữ liệu lớn?

  • A. Giảm chi phí phần cứng ban đầu.
  • B. Đảm bảo tất cả dữ liệu đều có cấu trúc.
  • C. Khả năng mở rộng tài nguyên xử lý và lưu trữ dễ dàng hơn khi khối lượng dữ liệu tăng lên.
  • D. Chỉ phù hợp với các bài toán phân tích mô tả.

Câu 30: Điều nào sau đây mô tả đúng nhất về vai trò của thuật toán trong Khoa học dữ liệu?

  • A. Thuật toán chỉ dùng để thu thập dữ liệu từ các nguồn khác nhau.
  • B. Thuật toán cung cấp các phương pháp và mô hình để xử lý, phân tích và tìm ra tri thức từ dữ liệu.
  • C. Thuật toán giúp làm sạch dữ liệu một cách tự động mà không cần con người kiểm tra.
  • D. Thuật toán chỉ cần thiết cho việc trực quan hóa dữ liệu cuối cùng.

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về hành vi duyệt web của hàng triệu khách hàng mỗi ngày, bao gồm lượt xem sản phẩm, thêm vào giỏ hàng, và thời gian trên trang. Lượng dữ liệu này tăng lên theo cấp số nhân. Đặc điểm nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất trong tình huống này?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 2: Hệ thống cảm biến thời tiết trên khắp thế giới liên tục gửi về dữ liệu về nhiệt độ, độ ẩm, áp suất, tốc độ gió theo từng giây. Việc xử lý và phân tích thông tin này cần được thực hiện gần như ngay lập tức để đưa ra dự báo chính xác. Đặc điểm nào của Dữ liệu lớn (Big Data) đặt ra thách thức lớn nhất trong trường hợp này?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 3: Một nền tảng mạng xã hội thu thập dữ liệu từ bài đăng văn bản, hình ảnh, video, âm thanh, dữ liệu vị trí, và thông tin từ các thiết bị kết nối khác. Sự đa dạng về định dạng và nguồn gốc của dữ liệu này được mô tả bằng đặc điểm nào của Dữ liệu lớn (Big Data)?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 4: Dữ liệu thu thập từ các bài đăng trên diễn đàn trực tuyến hoặc đánh giá sản phẩm có thể chứa thông tin sai lệch, ý kiến chủ quan, hoặc thậm chí là spam. Đặc điểm nào của Dữ liệu lớn (Big Data) liên quan trực tiếp đến độ tin cậy và chính xác của thông tin này?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 5: Quá trình khám phá các mẫu, xu hướng, và tri thức tiềm ẩn trong các tập dữ liệu lớn bằng cách sử dụng các kỹ thuật từ thống kê, học máy và hệ cơ sở dữ liệu được gọi là gì?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 6: Một nhà bán lẻ muốn hiểu rõ hành vi mua sắm của khách hàng trong quá khứ để đưa ra các chiến lược marketing hiệu quả. Họ cần biết những sản phẩm nào thường được mua cùng nhau hoặc vào những thời điểm nào trong năm doanh số tăng cao. Kỹ thuật khai phá dữ liệu nào phù hợp nhất để tìm ra các mối quan hệ 'mua cùng nhau' này?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 7: Một công ty muốn tạo báo cáo tổng kết về doanh số bán hàng trong quý vừa qua, bao gồm tổng doanh thu, sản phẩm bán chạy nhất, và phân bổ doanh thu theo khu vực. Loại hình phân tích dữ liệu nào đang được áp dụng?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 8: Một ngân hàng sử dụng dữ liệu lịch sử giao dịch của khách hàng để xây dựng mô hình dự báo khả năng vỡ nợ của các khoản vay mới. Loại hình phân tích dữ liệu nào đang được thực hiện?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 9: Một công ty logistics muốn tối ưu hóa lộ trình giao hàng cho đội xe của mình để giảm thiểu thời gian và chi phí vận chuyển, dựa trên dữ liệu về địa điểm khách hàng, tình hình giao thông thời gian thực và khả năng của từng xe. Loại hình phân tích dữ liệu nào phù hợp nhất để giải quyết bài toán này?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 10: Trong Khoa học dữ liệu, việc sử dụng các hệ thống máy tính mạnh mẽ và các thuật toán hiệu quả là cần thiết chủ yếu vì lý do nào?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 11: Để xử lý một tập dữ liệu khổng lồ mà không thể chứa vừa trong bộ nhớ của một máy tính duy nhất hoặc cần thời gian xử lý quá lâu, người ta thường sử dụng giải pháp nào liên quan đến hạ tầng máy tính?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 12: Thuật toán song song (Parallel Algorithms) đóng vai trò quan trọng trong xử lý Dữ liệu lớn vì nó cho phép:

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 13: Một công ty khởi nghiệp về phân tích dữ liệu muốn triển khai một dự án KDL nhưng không có đủ ngân sách để đầu tư vào cơ sở hạ tầng máy chủ, lưu trữ và mạng ban đầu. Giải pháp nào về hạ tầng là phù hợp nhất cho họ?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 14: Hệ cơ sở dữ liệu quan hệ (SQL) gặp khó khăn gì chủ yếu khi xử lý Dữ liệu lớn, đặc biệt là dữ liệu phi cấu trúc và bán cấu trúc?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 15: Cơ sở dữ liệu NoSQL được thiết kế để giải quyết một số hạn chế của cơ sở dữ liệu quan hệ khi làm việc với Dữ liệu lớn. Đặc điểm nổi bật nhất của NoSQL là gì?

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 16: Một nhà khoa học dữ liệu đang làm việc với tập dữ liệu bao gồm các bài đăng trên mạng xã hội, hình ảnh, video và dữ liệu định vị GPS. Loại cơ sở dữ liệu nào sau đây thường được coi là phù hợp hơn để lưu trữ và xử lý loại dữ liệu đa dạng và phi cấu trúc này?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 17: Trong quy trình Khoa học dữ liệu, giai đoạn nào thường bao gồm các công việc như xử lý dữ liệu bị thiếu, làm sạch dữ liệu không nhất quán, và biến đổi dữ liệu sang định dạng phù hợp cho phân tích?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 18: Một nhà khoa học dữ liệu xây dựng một mô hình học máy để phân loại email là 'spam' hay 'không spam' dựa trên nội dung và người gửi. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 19: Sau khi hoàn thành việc phân tích và xây dựng mô hình, nhà khoa học dữ liệu cần trình bày kết quả và những phát hiện quan trọng cho các bên liên quan không chuyên về kỹ thuật (ví dụ: quản lý, đội marketing). Công cụ hoặc kỹ thuật nào sau đây là hiệu quả nhất cho mục đích này?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 20: Vai trò của một nhà khoa học dữ liệu thường đòi hỏi sự kết hợp của nhiều kỹ năng từ các lĩnh vực khác nhau. Ba lĩnh vực chính nào thường được coi là nền tảng cốt lõi của Khoa học dữ liệu?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 21: Khi đối mặt với một tập dữ liệu rất lớn, việc tải toàn bộ dữ liệu vào bộ nhớ RAM của một máy tính thông thường để xử lý là không khả thi. Thách thức này liên quan trực tiếp đến đặc điểm nào của Dữ liệu lớn?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 22: Dữ liệu từ các cảm biến IoT (Internet of Things) trên các thiết bị công nghiệp thường được tạo ra với tốc độ rất cao và cần được phân tích theo thời gian thực để phát hiện sớm các dấu hiệu lỗi hoặc cần bảo trì. Điều này nhấn mạnh tầm quan trọng của việc xử lý Dữ liệu lớn liên quan đến đặc điểm nào?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 23: Một công ty bảo hiểm muốn phân tích dữ liệu từ các đơn yêu cầu bồi thường của khách hàng. Dữ liệu này bao gồm văn bản mô tả sự cố, hình ảnh thiệt hại, báo cáo của cảnh sát (PDF), và dữ liệu định vị GPS. Việc kết hợp và phân tích các loại dữ liệu khác nhau này đòi hỏi giải pháp xử lý dữ liệu lớn có khả năng xử lý tốt đặc điểm nào?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 24: Dữ liệu khảo sát ý kiến khách hàng trên mạng xã hội có thể chứa nhiều thông tin không chính xác do tài khoản giả mạo hoặc ý kiến chủ quan. Để sử dụng dữ liệu này một cách hiệu quả, nhà khoa học dữ liệu cần đặc biệt chú ý đến việc quản lý và cải thiện đặc điểm nào của dữ liệu?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 25: Trong quy trình Khoa học dữ liệu, sau khi đã hiểu rõ bài toán kinh doanh và thu thập dữ liệu, bước tiếp theo quan trọng thường là gì trước khi tiến hành phân tích hoặc mô hình hóa?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 26: Phân tích mô tả (Descriptive Analytics) chủ yếu giúp trả lời câu hỏi nào về dữ liệu?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 27: Phân tích dự đoán (Predictive Analytics) chủ yếu giúp trả lời câu hỏi nào về dữ liệu?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 28: Phân tích đề xuất (Prescriptive Analytics) chủ yếu giúp trả lời câu hỏi nào về dữ liệu?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 29: Việc sử dụng máy tính cụm (Cluster) thay vì một máy tính đơn lẻ có hiệu năng cao mang lại lợi thế chính nào trong xử lý dữ liệu lớn?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 4

Câu 30: Điều nào sau đây mô tả đúng nhất về vai trò của thuật toán trong Khoa học dữ liệu?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Công nghệ 10 Cánh diều Bài 4: Thị trường lao động trong lĩnh vực kĩ thuật, công nghệ

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 05

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 05 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Một công ty thu thập dữ liệu từ nhiều nguồn khác nhau như mạng xã hội, cảm biến IoT từ nhà máy và dữ liệu bán hàng từ cửa hàng truyền thống. Đặc trưng nào của Dữ liệu lớn được thể hiện rõ nhất trong tình huống này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 2: Dữ liệu giao dịch chứng khoán được tạo ra và cập nhật liên tục theo từng mili giây, đòi hỏi hệ thống phải xử lý và phân tích gần như ngay lập tức. Đặc trưng nào của Dữ liệu lớn được mô tả ở đây?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Value (Giá trị)

Câu 3: Một nền tảng video trực tuyến lưu trữ hàng petabyte dữ liệu video, âm thanh và thông tin người dùng. Đặc trưng nào của Dữ liệu lớn được nhấn mạnh?

  • A. Velocity (Tốc độ)
  • B. Variety (Đa dạng)
  • C. Veracity (Tính xác thực)
  • D. Volume (Khối lượng)

Câu 4: Khi phân tích dữ liệu khảo sát khách hàng, các nhà khoa học dữ liệu phát hiện ra nhiều câu trả lời mâu thuẫn hoặc thiếu thông tin. Vấn đề này liên quan đến đặc trưng nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 5: Mục tiêu chính của quá trình Khai phá dữ liệu (Data Mining) là gì?

  • A. Chỉ đơn thuần lưu trữ dữ liệu
  • B. Trình bày dữ liệu dưới dạng bảng biểu
  • C. Tìm kiếm và khám phá các mẫu, xu hướng hoặc thông tin ẩn có giá trị từ tập dữ liệu lớn.
  • D. Xóa bỏ các dữ liệu không cần thiết

Câu 6: Khai phá dữ liệu chủ yếu dựa trên các kỹ thuật và phương pháp từ những lĩnh vực nào?

  • A. Ngữ văn và Lịch sử
  • B. Toán học, Thống kê và Học máy (Machine Learning)
  • C. Hội họa và Âm nhạc
  • D. Sinh học và Y học

Câu 7: Một cửa hàng phân tích báo cáo bán hàng của năm trước để biết mặt hàng nào bán chạy nhất và doanh thu theo từng tháng. Loại phân tích dữ liệu nào đang được thực hiện?

  • A. Phân tích dự đoán (Predictive Analysis)
  • B. Phân tích mô tả (Descriptive Analysis)
  • C. Phân tích chuẩn đoán (Diagnostic Analysis)
  • D. Phân tích đề xuất (Prescriptive Analysis)

Câu 8: Một công ty thương mại điện tử sử dụng dữ liệu lịch sử mua sắm của khách hàng để xây dựng mô hình gợi ý sản phẩm mà khách hàng có thể quan tâm trong tương lai. Loại phân tích dữ liệu nào đang được áp dụng?

  • A. Phân tích mô tả (Descriptive Analysis)
  • B. Phân tích dự đoán (Predictive Analysis)
  • C. Phân tích đề xuất (Prescriptive Analysis)
  • D. Phân tích nhân quả (Causal Analysis)

Câu 9: Một hệ thống quản lý năng lượng thông minh phân tích dữ liệu tiêu thụ điện theo thời gian thực và dự báo nhu cầu trong vài giờ tới, sau đó tự động điều chỉnh nguồn cung cấp để tối ưu hóa chi phí. Loại phân tích dữ liệu nào được thể hiện ở bước

  • A. Phân tích mô tả (Descriptive Analysis)
  • B. Phân tích dự đoán (Predictive Analysis)
  • C. Phân tích đề xuất (Prescriptive Analysis)
  • D. Phân tích khám phá (Exploratory Analysis)

Câu 10: Đối với việc xử lý các tập dữ liệu lớn, việc sử dụng thuật toán song song (Parallel Algorithms) mang lại lợi ích chính nào?

  • A. Giảm dung lượng lưu trữ dữ liệu
  • B. Tăng tính đa dạng của dữ liệu
  • C. Cho phép thực hiện nhiều phép tính cùng lúc, tăng tốc độ xử lý.
  • D. Cải thiện tính xác thực của dữ liệu đầu vào

Câu 11: Một startup công nghệ cần một giải pháp lưu trữ và xử lý dữ liệu linh hoạt, có khả năng mở rộng nhanh chóng mà không cần đầu tư lớn vào hạ tầng vật lý ban đầu. Công nghệ nào là lựa chọn phù hợp?

  • A. Máy tính cá nhân hiệu năng cao
  • B. Máy tính cụm (Computer Cluster)
  • C. Điện toán đám mây (Cloud Computing)
  • D. Cơ sở dữ liệu quan hệ truyền thống

Câu 12: Cơ sở dữ liệu NoSQL (Not only SQL) đặc biệt phù hợp để lưu trữ và quản lý loại dữ liệu nào so với cơ sở dữ liệu quan hệ truyền thống?

  • A. Dữ liệu có cấu trúc chặt chẽ (ví dụ: bảng với các cột cố định)
  • B. Dữ liệu chỉ bao gồm các số liệu thống kê
  • C. Dữ liệu phi cấu trúc hoặc bán cấu trúc (ví dụ: văn bản tự do, hình ảnh, dữ liệu cảm biến)
  • D. Dữ liệu có kích thước rất nhỏ

Câu 13: Nhược điểm chính của việc sử dụng cơ sở dữ liệu quan hệ truyền thống (SQL) khi xử lý dữ liệu lớn có đặc trưng

  • A. Tốc độ truy vấn chậm
  • B. Khó khăn trong việc lưu trữ các loại dữ liệu phi cấu trúc hoặc có cấu trúc thay đổi linh hoạt.
  • C. Chi phí lưu trữ quá cao
  • D. Không hỗ trợ truy vấn dữ liệu

Câu 14: Khái niệm

  • A. Một máy tính đơn lẻ với cấu hình rất mạnh
  • B. Một tập hợp nhiều máy tính được kết nối và hoạt động cùng nhau như một hệ thống duy nhất để xử lý công việc lớn.
  • C. Một loại bộ xử lý (CPU) đặc biệt dành cho tính toán khoa học
  • D. Thiết bị ngoại vi dùng để lưu trữ dữ liệu

Câu 15: Tại sao các phương pháp xử lý dữ liệu truyền thống (ví dụ: sử dụng bảng tính Excel trên một máy tính cá nhân) thường gặp khó khăn lớn khi xử lý Dữ liệu lớn (Big Data)?

  • A. Dữ liệu lớn thường chỉ tồn tại trên internet
  • B. Dữ liệu lớn không có cấu trúc
  • C. Dữ liệu lớn vượt quá khả năng lưu trữ, xử lý và phân tích của các công cụ và hạ tầng truyền thống về mặt Volume, Velocity và Variety.
  • D. Dữ liệu lớn luôn chứa đựng thông tin sai lệch

Câu 16: Một nhà nghiên cứu muốn phân tích nội dung của hàng triệu bài đăng trên mạng xã hội để hiểu xu hướng dư luận về một sự kiện. Đặc trưng nào của Dữ liệu lớn là thách thức lớn nhất trong nhiệm vụ này, đặc biệt liên quan đến định dạng dữ liệu?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Value (Giá trị)

Câu 17: Ngoài 4 đặc trưng Volume, Velocity, Variety, Veracity, đặc trưng thứ năm thường được nhắc đến trong bối cảnh Dữ liệu lớn là Value.

  • A. Chi phí để thu thập dữ liệu
  • B. Tốc độ tạo ra dữ liệu
  • C. Khả năng trích xuất thông tin hữu ích và tạo ra giá trị kinh doanh hoặc xã hội từ dữ liệu.
  • D. Số lượng nguồn dữ liệu khác nhau

Câu 18: Khoa học dữ liệu là một lĩnh vực đa ngành. Lĩnh vực nào sau đây ít đóng góp các kỹ thuật cốt lõi trực tiếp cho Khoa học dữ liệu so với các lĩnh vực còn lại?

  • A. Khoa học máy tính
  • B. Thống kê
  • C. Học máy (Machine Learning)
  • D. Triết học cổ điển

Câu 19: Một công ty bảo hiểm sử dụng dữ liệu về tuổi tác, lịch sử bệnh án, và lối sống của khách hàng để ước tính khả năng mắc một căn bệnh cụ thể và đưa ra mức phí bảo hiểm phù hợp. Loại phân tích dữ liệu nào được sử dụng trong việc ước tính khả năng mắc bệnh?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích đề xuất
  • D. Phân tích khám phá

Câu 20: Một ứng dụng bản đồ giao thông phân tích dữ liệu vị trí từ hàng triệu điện thoại di động theo thời gian thực để xác định các điểm ùn tắc và đề xuất tuyến đường thay thế tốt nhất cho người dùng. Loại phân tích dữ liệu nào được áp dụng để đề xuất tuyến đường thay thế?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích đề xuất
  • D. Phân tích thống kê

Câu 21: Bước đầu tiên quan trọng trong quy trình Khoa học dữ liệu, sau khi đã xác định được bài toán cần giải quyết, thường là gì?

  • A. Xây dựng mô hình học máy phức tạp
  • B. Thu thập và làm sạch dữ liệu
  • C. Trực quan hóa dữ liệu bằng biểu đồ
  • D. Báo cáo kết quả cuối cùng

Câu 22: Tại sao công đoạn

  • A. Để giảm dung lượng lưu trữ dữ liệu
  • B. Để tăng tốc độ xử lý dữ liệu
  • C. Để đảm bảo dữ liệu đầu vào chính xác, đầy đủ và nhất quán, từ đó cho ra kết quả phân tích đáng tin cậy.
  • D. Để biến dữ liệu phi cấu trúc thành có cấu trúc

Câu 23: Một dự án nghiên cứu khí hậu thu thập dữ liệu từ hàng ngàn trạm thời tiết, vệ tinh, phao nổi trên biển và các mô hình mô phỏng. Sự đa dạng về nguồn và định dạng dữ liệu này liên quan chủ yếu đến đặc trưng nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 24: Đặc trưng

  • A. Kích thước tổng thể của tập dữ liệu.
  • B. Sự đa dạng về định dạng và nguồn của dữ liệu.
  • C. Tốc độ dữ liệu được tạo ra, thu thập và cần được xử lý/phân tích.
  • D. Độ tin cậy và chính xác của dữ liệu.

Câu 25: Việc sử dụng Dữ liệu lớn để phân tích hành vi cá nhân và đưa ra các quảng cáo nhắm mục tiêu hoặc dự đoán xu hướng tiêu dùng có thể đặt ra những vấn đề đáng quan ngại nào?

  • A. Tốn kém chi phí lưu trữ
  • B. Yêu cầu thuật toán xử lý phức tạp
  • C. Các vấn đề về quyền riêng tư, bảo mật dữ liệu và đạo đức trong sử dụng thông tin cá nhân.
  • D. Dữ liệu có thể không chính xác

Câu 26: Hệ thống gợi ý phim trên một nền tảng xem phim trực tuyến, dựa trên lịch sử xem và đánh giá của người dùng, là một ví dụ điển hình của ứng dụng Khoa học dữ liệu thuộc nhóm nào?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán/Học máy
  • C. Phân tích đề xuất
  • D. Trực quan hóa dữ liệu

Câu 27: Trong giai đoạn phân tích mô tả của Khoa học dữ liệu, tại sao việc trực quan hóa dữ liệu (sử dụng biểu đồ, đồ thị) lại rất quan trọng?

  • A. Để làm cho báo cáo trông đẹp mắt hơn
  • B. Để giảm kích thước tập dữ liệu
  • C. Giúp con người dễ dàng nhìn thấy các mẫu, xu hướng, ngoại lệ và hiểu rõ hơn về dữ liệu.
  • D. Để tự động làm sạch dữ liệu

Câu 28: Khoa học dữ liệu đòi hỏi sự kết hợp của nhiều kỹ năng khác nhau. Những kỹ năng cốt lõi nào thường được xem là nền tảng?

  • A. Chỉ cần kỹ năng lập trình
  • B. Chỉ cần kiến thức về kinh doanh
  • C. Kỹ năng lập trình, kiến thức về toán học và thống kê, và hiểu biết về lĩnh vực ứng dụng.
  • D. Chỉ cần khả năng sử dụng các công cụ trực quan hóa

Câu 29: Một cơ quan dự báo thời tiết sử dụng dữ liệu lịch sử về nhiệt độ, lượng mưa, áp suất khí quyển và các yếu tố khác trong nhiều thập kỷ để xây dựng mô hình dự báo thời tiết cho tuần tới. Loại phân tích dữ liệu nào được thực hiện?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích đề xuất
  • D. Phân tích nhân quả

Câu 30: Đặc trưng

  • A. Dữ liệu càng lớn thì giá trị càng cao.
  • B. Giá trị của dữ liệu được đo bằng chi phí lưu trữ.
  • C. Khả năng chuyển đổi dữ liệu thô thành thông tin có ý nghĩa và hành động cụ thể mang lại lợi ích.
  • D. Dữ liệu chỉ có giá trị khi nó hoàn toàn chính xác.

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 1: Một công ty thu thập dữ liệu từ nhiều nguồn khác nhau như mạng xã hội, cảm biến IoT từ nhà máy và dữ liệu bán hàng từ cửa hàng truyền thống. Đặc trưng nào của Dữ liệu lớn được thể hiện rõ nhất trong tình huống này?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 2: Dữ liệu giao dịch chứng khoán được tạo ra và cập nhật liên tục theo từng mili giây, đòi hỏi hệ thống phải xử lý và phân tích gần như ngay lập tức. Đặc trưng nào của Dữ liệu lớn được mô tả ở đây?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 3: Một nền tảng video trực tuyến lưu trữ hàng petabyte dữ liệu video, âm thanh và thông tin người dùng. Đặc trưng nào của Dữ liệu lớn được nhấn mạnh?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 4: Khi phân tích dữ liệu khảo sát khách hàng, các nhà khoa học dữ liệu phát hiện ra nhiều câu trả lời mâu thuẫn hoặc thiếu thông tin. Vấn đề này liên quan đến đặc trưng nào của Dữ liệu lớn?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 5: Mục tiêu chính của quá trình Khai phá dữ liệu (Data Mining) là gì?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 6: Khai phá dữ liệu chủ yếu dựa trên các kỹ thuật và phương pháp từ những lĩnh vực nào?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 7: Một cửa hàng phân tích báo cáo bán hàng của năm trước để biết mặt hàng nào bán chạy nhất và doanh thu theo từng tháng. Loại phân tích dữ liệu nào đang được thực hiện?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 8: Một công ty thương mại điện tử sử dụng dữ liệu lịch sử mua sắm của khách hàng để xây dựng mô hình gợi ý sản phẩm mà khách hàng có thể quan tâm trong tương lai. Loại phân tích dữ liệu nào đang được áp dụng?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 9: Một hệ thống quản lý năng lượng thông minh phân tích dữ liệu tiêu thụ điện theo thời gian thực và dự báo nhu cầu trong vài giờ tới, sau đó tự động điều chỉnh nguồn cung cấp để tối ưu hóa chi phí. Loại phân tích dữ liệu nào được thể hiện ở bước "tự động điều chỉnh nguồn cung cấp"?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 10: Đối với việc xử lý các tập dữ liệu lớn, việc sử dụng thuật toán song song (Parallel Algorithms) mang lại lợi ích chính nào?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 11: Một startup công nghệ cần một giải pháp lưu trữ và xử lý dữ liệu linh hoạt, có khả năng mở rộng nhanh chóng mà không cần đầu tư lớn vào hạ tầng vật lý ban đầu. Công nghệ nào là lựa chọn phù hợp?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 12: Cơ sở dữ liệu NoSQL (Not only SQL) đặc biệt phù hợp để lưu trữ và quản lý loại dữ liệu nào so với cơ sở dữ liệu quan hệ truyền thống?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 13: Nhược điểm chính của việc sử dụng cơ sở dữ liệu quan hệ truyền thống (SQL) khi xử lý dữ liệu lớn có đặc trưng "Variety" cao là gì?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 14: Khái niệm "Máy tính cụm" (Computer Cluster) mô tả điều gì?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 15: Tại sao các phương pháp xử lý dữ liệu truyền thống (ví dụ: sử dụng bảng tính Excel trên một máy tính cá nhân) thường gặp khó khăn lớn khi xử lý Dữ liệu lớn (Big Data)?

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 16: Một nhà nghiên cứu muốn phân tích nội dung của hàng triệu bài đăng trên mạng xã hội để hiểu xu hướng dư luận về một sự kiện. Đặc trưng nào của Dữ liệu lớn là thách thức lớn nhất trong nhiệm vụ này, đặc biệt liên quan đến định dạng dữ liệu?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 17: Ngoài 4 đặc trưng Volume, Velocity, Variety, Veracity, đặc trưng thứ năm thường được nhắc đến trong bối cảnh Dữ liệu lớn là Value. "Value" ở đây ám chỉ điều gì?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 18: Khoa học dữ liệu là một lĩnh vực đa ngành. Lĩnh vực nào sau đây ít đóng góp các kỹ thuật cốt lõi trực tiếp cho Khoa học dữ liệu so với các lĩnh vực còn lại?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 19: Một công ty bảo hiểm sử dụng dữ liệu về tuổi tác, lịch sử bệnh án, và lối sống của khách hàng để ước tính khả năng mắc một căn bệnh cụ thể và đưa ra mức phí bảo hiểm phù hợp. Loại phân tích dữ liệu nào được sử dụng trong việc ước tính khả năng mắc bệnh?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 20: Một ứng dụng bản đồ giao thông phân tích dữ liệu vị trí từ hàng triệu điện thoại di động theo thời gian thực để xác định các điểm ùn tắc và đề xuất tuyến đường thay thế tốt nhất cho người dùng. Loại phân tích dữ liệu nào được áp dụng để đề xuất tuyến đường thay thế?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 21: Bước đầu tiên quan trọng trong quy trình Khoa học dữ liệu, sau khi đã xác định được bài toán cần giải quyết, thường là gì?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 22: Tại sao công đoạn "làm sạch dữ liệu" (data cleaning) lại cực kỳ quan trọng trong Khoa học dữ liệu, đặc biệt khi làm việc với Dữ liệu lớn có đặc trưng Veracity thấp?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 23: Một dự án nghiên cứu khí hậu thu thập dữ liệu từ hàng ngàn trạm thời tiết, vệ tinh, phao nổi trên biển và các mô hình mô phỏng. Sự đa dạng về nguồn và định dạng dữ liệu này liên quan chủ yếu đến đặc trưng nào của Dữ liệu lớn?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 24: Đặc trưng "Velocity" (Tốc độ) của Dữ liệu lớn chủ yếu liên quan đến khía cạnh nào?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 25: Việc sử dụng Dữ liệu lớn để phân tích hành vi cá nhân và đưa ra các quảng cáo nhắm mục tiêu hoặc dự đoán xu hướng tiêu dùng có thể đặt ra những vấn đề đáng quan ngại nào?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 26: Hệ thống gợi ý phim trên một nền tảng xem phim trực tuyến, dựa trên lịch sử xem và đánh giá của người dùng, là một ví dụ điển hình của ứng dụng Khoa học dữ liệu thuộc nhóm nào?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 27: Trong giai đoạn phân tích mô tả của Khoa học dữ liệu, tại sao việc trực quan hóa dữ liệu (sử dụng biểu đồ, đồ thị) lại rất quan trọng?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 28: Khoa học dữ liệu đòi hỏi sự kết hợp của nhiều kỹ năng khác nhau. Những kỹ năng cốt lõi nào thường được xem là nền tảng?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 29: Một cơ quan dự báo thời tiết sử dụng dữ liệu lịch sử về nhiệt độ, lượng mưa, áp suất khí quyển và các yếu tố khác trong nhiều thập kỷ để xây dựng mô hình dự báo thời tiết cho tuần tới. Loại phân tích dữ liệu nào được thực hiện?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 5

Câu 30: Đặc trưng "Value" trong 5 V's của Dữ liệu lớn nhấn mạnh điều gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 06

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 06 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về hành vi lướt web, lịch sử mua hàng và tương tác mạng xã hội của hàng triệu khách hàng mỗi ngày. Lượng dữ liệu này tăng lên rất nhanh. Đặc trưng nào của dữ liệu lớn (Big Data) được thể hiện rõ nhất trong tình huống này?

  • A. Variety (Tính đa dạng)
  • B. Velocity (Tốc độ)
  • C. Veracity (Tính xác thực)
  • D. Value (Giá trị)

Câu 2: Một nhà khoa học dữ liệu đang làm việc với tập dữ liệu chứa các báo cáo y tế (văn bản), ảnh chụp X-quang (hình ảnh), kết quả xét nghiệm máu (số liệu) và ghi âm lời khai bệnh nhân (âm thanh). Đặc trưng nào của dữ liệu lớn mô tả tốt nhất tính chất của tập dữ liệu này?

  • A. Variety (Tính đa dạng)
  • B. Volume (Khối lượng)
  • C. Velocity (Tốc độ)
  • D. Veracity (Tính xác thực)

Câu 3: Một ngân hàng cần phân tích hàng petabyte dữ liệu giao dịch lịch sử để phát hiện các mẫu gian lận tiềm ẩn. Quá trình này đòi hỏi khả năng lưu trữ và xử lý dữ liệu khổng lồ. Đặc trưng nào của dữ liệu lớn được nhấn mạnh trong yêu cầu này?

  • A. Velocity (Tốc độ)
  • B. Variety (Tính đa dạng)
  • C. Volume (Khối lượng)
  • D. Veracity (Tính xác thực)

Câu 4: Trong bối cảnh dữ liệu lớn, "Veracity" (Tính xác thực) đề cập đến khía cạnh nào của dữ liệu?

  • A. Tốc độ tạo ra dữ liệu
  • B. Số lượng các loại dữ liệu khác nhau
  • C. Khối lượng dữ liệu
  • D. Độ tin cậy và chính xác của dữ liệu

Câu 5: Giá trị (Value) của dữ liệu lớn trong Khoa học dữ liệu được hiểu là gì?

  • A. Khả năng trích xuất thông tin hữu ích và tạo ra lợi ích từ dữ liệu
  • B. Chi phí lưu trữ và xử lý dữ liệu
  • C. Tốc độ xử lý dữ liệu theo thời gian thực
  • D. Số lượng các nguồn dữ liệu khác nhau

Câu 6: Quá trình nào trong Khoa học dữ liệu tập trung vào việc tóm tắt, tổ chức và trình bày dữ liệu lịch sử để hiểu rõ hơn về những gì đã xảy ra?

  • A. Phân tích dự đoán (Predictive Analytics)
  • B. Phân tích đề xuất (Prescriptive Analytics)
  • C. Phân tích mô tả (Descriptive Analytics)
  • D. Khai phá dữ liệu (Data Mining)

Câu 7: Một công ty muốn sử dụng dữ liệu bán hàng và xu hướng thị trường để dự báo doanh số bán hàng cho quý tiếp theo. Đây là ứng dụng của loại hình phân tích nào trong Khoa học dữ liệu?

  • A. Phân tích dự đoán (Predictive Analytics)
  • B. Phân tích mô tả (Descriptive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 8: Một hệ thống đề xuất sản phẩm của trang thương mại điện tử phân tích hành vi của bạn và đề xuất những sản phẩm bạn có thể quan tâm. Đây là ví dụ về loại hình phân tích nào?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích đề xuất
  • D. Trích xuất dữ liệu

Câu 9: Khai phá dữ liệu (Data Mining) chủ yếu sử dụng các kỹ thuật từ những lĩnh vực nào để tìm kiếm các mẫu, xu hướng và tri thức ẩn trong dữ liệu lớn?

  • A. Khoa học máy tính và Lịch sử
  • B. Học máy (Machine Learning) và Thống kê
  • C. Toán học và Ngôn ngữ học
  • D. Vật lý và Sinh học

Câu 10: Vai trò chính của máy tính và thuật toán trong Khoa học dữ liệu là gì?

  • A. Chỉ để lưu trữ dữ liệu
  • B. Chỉ để hiển thị kết quả phân tích
  • C. Chỉ để tạo ra dữ liệu mới
  • D. Xử lý, phân tích, mô hình hóa và trích xuất thông tin từ dữ liệu

Câu 11: Tại sao thuật toán song song lại đóng vai trò quan trọng trong việc xử lý dữ liệu lớn?

  • A. Vì chúng giúp giảm khối lượng dữ liệu cần xử lý.
  • B. Vì chúng giúp tăng tính đa dạng của dữ liệu.
  • C. Vì chúng cho phép thực hiện nhiều phép tính hoặc tác vụ xử lý đồng thời, tăng tốc độ xử lý.
  • D. Vì chúng chỉ hoạt động trên dữ liệu có cấu trúc.

Câu 12: Hệ thống máy tính nào sau đây thường được sử dụng để xử lý các bài toán Khoa học dữ liệu đòi hỏi năng lực tính toán cực lớn, có khả năng thực hiện hàng nghìn tỷ phép tính mỗi giây?

  • A. Siêu máy tính (Supercomputer)
  • B. Máy tính cá nhân (Personal Computer)
  • C. Máy chủ web (Web Server)
  • D. Thiết bị di động (Mobile Device)

Câu 13: Điện toán đám mây (Cloud Computing) mang lại lợi ích gì đáng kể cho các dự án Khoa học dữ liệu liên quan đến dữ liệu lớn?

  • A. Giảm thiểu tính đa dạng của dữ liệu, làm cho việc xử lý dễ dàng hơn.
  • B. Giới hạn khả năng truy cập dữ liệu từ xa.
  • C. Chỉ phù hợp để lưu trữ dữ liệu nhỏ.
  • D. Cung cấp tài nguyên tính toán và lưu trữ linh hoạt, theo yêu cầu, giảm chi phí ban đầu và dễ dàng mở rộng.

Câu 14: Một nhà phân tích dữ liệu đang xem xét biểu đồ cột hiển thị doanh số bán hàng theo từng tháng trong năm qua. Mục đích chính của hoạt động này thuộc loại phân tích nào?

  • A. Phân tích dự đoán
  • B. Phân tích mô tả
  • C. Phân tích đề xuất
  • D. Khai phá dữ liệu

Câu 15: Khi một mô hình học máy được huấn luyện trên dữ liệu lịch sử để dự đoán khả năng khách hàng sẽ rời bỏ dịch vụ trong tháng tới, đây là một ví dụ điển hình của:

  • A. Phân tích dự đoán
  • B. Phân tích mô tả
  • C. Phân tích đề xuất
  • D. Trực quan hóa dữ liệu

Câu 16: Hệ thống cơ sở dữ liệu nào thường được lựa chọn để lưu trữ và quản lý các loại dữ liệu phi cấu trúc hoặc bán cấu trúc như tài liệu văn bản, hình ảnh, video, hay dữ liệu từ mạng xã hội, do tính linh hoạt và khả năng mở rộng theo chiều ngang?

  • A. Cơ sở dữ liệu quan hệ (Relational Database - SQL)
  • B. Bảng tính (Spreadsheet)
  • C. Cơ sở dữ liệu NoSQL
  • D. Hệ thống file truyền thống

Câu 17: Một công ty sản xuất muốn tối ưu hóa quy trình sản xuất bằng cách phân tích dữ liệu từ cảm biến trên máy móc để xác định thời điểm bảo trì tối ưu, nhằm giảm thiểu thời gian ngừng hoạt động. Loại phân tích nào phù hợp nhất cho mục tiêu này?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích đề xuất
  • D. Trực quan hóa dữ liệu

Câu 18: Thuật toán nào sau đây là một ví dụ điển hình của kỹ thuật được sử dụng trong khai phá dữ liệu để phân nhóm các đối tượng dữ liệu dựa trên sự tương đồng về đặc điểm của chúng?

  • A. Thuật toán tìm kiếm nhị phân
  • B. Thuật toán sắp xếp nổi bọt
  • C. Thuật toán mã hóa dữ liệu
  • D. Thuật toán phân cụm (Clustering Algorithm)

Câu 19: Một tập dữ liệu được mô tả là có "tính đa dạng cao". Điều này có nghĩa là gì?

  • A. Dữ liệu được tạo ra với tốc độ rất nhanh.
  • B. Dữ liệu bao gồm nhiều định dạng và nguồn khác nhau (ví dụ: văn bản, hình ảnh, âm thanh, số liệu).
  • C. Dữ liệu có khối lượng rất lớn.
  • D. Dữ liệu có độ tin cậy cao.

Câu 20: Khi phân tích dữ liệu để tìm ra mối quan hệ giữa việc xem quảng cáo và hành vi mua hàng của khách hàng, nhà khoa học dữ liệu đang thực hiện hoạt động gì?

  • A. Khai phá dữ liệu để khám phá các mẫu (patterns)
  • B. Chỉ đơn thuần lưu trữ dữ liệu
  • C. Trực quan hóa dữ liệu mà không phân tích
  • D. Mã hóa dữ liệu để bảo mật

Câu 21: Để xử lý hiệu quả dữ liệu lớn đòi hỏi tốc độ cao (Velocity), yếu tố công nghệ nào đóng vai trò thiết yếu?

  • A. Chỉ cần tăng dung lượng lưu trữ.
  • B. Chỉ cần cải thiện giao diện người dùng.
  • C. Chỉ cần sử dụng dữ liệu có cấu trúc.
  • D. Sử dụng các hệ thống xử lý phân tán và thuật toán song song.

Câu 22: Một doanh nghiệp muốn triển khai một hệ thống có khả năng tự động điều chỉnh giá sản phẩm dựa trên nhu cầu thị trường theo thời gian thực và giá của đối thủ cạnh tranh. Đây là một ứng dụng phức tạp kết hợp nhiều loại phân tích. Loại phân tích nào đóng vai trò đưa ra quyết định hành động tối ưu?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích đề xuất
  • D. Trực quan hóa dữ liệu

Câu 23: Việc một mô hình dự đoán thời tiết sử dụng dữ liệu lịch sử, dữ liệu từ vệ tinh và cảm biến để đưa ra dự báo nhiệt độ cho ngày mai là một ví dụ về việc ứng dụng kiến thức từ lĩnh vực nào trong Khoa học dữ liệu?

  • A. Học máy (Machine Learning)
  • B. Thiết kế đồ họa
  • C. Phát triển website
  • D. Quản lý cơ sở dữ liệu truyền thống

Câu 24: Khi làm việc với dữ liệu lớn, việc đảm bảo "Veracity" (Tính xác thực) là quan trọng nhất vì:

  • A. Nó giúp dữ liệu được tạo ra nhanh hơn.
  • B. Dữ liệu không chính xác hoặc không đáng tin cậy có thể dẫn đến phân tích sai lầm và quyết định tồi.
  • C. Nó làm tăng khối lượng dữ liệu.
  • D. Nó làm cho dữ liệu có nhiều định dạng khác nhau.

Câu 25: Một nhà khoa học dữ liệu sử dụng biểu đồ phân tán (scatter plot) để xem xét mối quan hệ giữa hai biến số trong tập dữ liệu. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Làm sạch dữ liệu
  • C. Xây dựng mô hình
  • D. Thăm dò và trực quan hóa dữ liệu

Câu 26: Hệ thống máy tính cụm (Computer Cluster) đóng vai trò gì trong việc xử lý dữ liệu lớn?

  • A. Kết hợp sức mạnh tính toán của nhiều máy tính để xử lý các tác vụ lớn song song.
  • B. Chỉ dùng để lưu trữ dữ liệu phi cấu trúc.
  • C. Là một loại siêu máy tính đơn lẻ.
  • D. Giúp giảm tốc độ xử lý dữ liệu.

Câu 27: Phân tích dự đoán (Predictive Analytics) khác biệt cơ bản với Phân tích mô tả (Descriptive Analytics) ở điểm nào?

  • A. Phân tích mô tả cần nhiều dữ liệu hơn.
  • B. Phân tích dự đoán chỉ sử dụng dữ liệu phi cấu trúc.
  • C. Phân tích mô tả tập trung vào quá khứ ("điều gì đã xảy ra?"), trong khi phân tích dự đoán hướng tới tương lai ("điều gì sẽ xảy ra?").
  • D. Phân tích dự đoán không cần sử dụng thuật toán.

Câu 28: Một trong những thách thức lớn nhất khi làm việc với dữ liệu lớn có tính "Variety" cao là gì?

  • A. Dữ liệu quá nhỏ để xử lý.
  • B. Việc tích hợp, làm sạch và chuẩn hóa dữ liệu từ nhiều nguồn và định dạng khác nhau rất phức tạp.
  • C. Dữ liệu được tạo ra quá chậm.
  • D. Dữ liệu luôn có độ tin cậy hoàn hảo.

Câu 29: Trong Khoa học dữ liệu, "mô hình" thường được hiểu là gì?

  • A. Một biểu diễn toán học hoặc thuật toán được xây dựng từ dữ liệu để hiểu, dự đoán hoặc mô phỏng hiện tượng.
  • B. Chỉ là một biểu đồ hoặc đồ thị.
  • C. Tập hợp dữ liệu thô chưa qua xử lý.
  • D. Phần mềm để trực quan hóa dữ liệu.

Câu 30: Một ứng dụng di động thu thập dữ liệu vị trí của người dùng theo thời gian thực để phân tích mật độ giao thông. Loại dữ liệu này đặc biệt nhấn mạnh đặc trưng nào của Big Data?

  • A. Volume
  • B. Velocity
  • C. Variety
  • D. Veracity

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về hành vi lướt web, lịch sử mua hàng và tương tác mạng xã hội của hàng triệu khách hàng mỗi ngày. Lượng dữ liệu này tăng lên rất nhanh. Đặc trưng nào của dữ liệu lớn (Big Data) được thể hiện rõ nhất trong tình huống này?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 2: Một nhà khoa học dữ liệu đang làm việc với tập dữ liệu chứa các báo cáo y tế (văn bản), ảnh chụp X-quang (hình ảnh), kết quả xét nghiệm máu (số liệu) và ghi âm lời khai bệnh nhân (âm thanh). Đặc trưng nào của dữ liệu lớn mô tả tốt nhất tính chất của tập dữ liệu này?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 3: Một ngân hàng cần phân tích hàng petabyte dữ liệu giao dịch lịch sử để phát hiện các mẫu gian lận tiềm ẩn. Quá trình này đòi hỏi khả năng lưu trữ và xử lý dữ liệu khổng lồ. Đặc trưng nào của dữ liệu lớn được nhấn mạnh trong yêu cầu này?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 4: Trong bối cảnh dữ liệu lớn, 'Veracity' (Tính xác thực) đề cập đến khía cạnh nào của dữ liệu?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 5: Giá trị (Value) của dữ liệu lớn trong Khoa học dữ liệu được hiểu là gì?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 6: Quá trình nào trong Khoa học dữ liệu tập trung vào việc tóm tắt, tổ chức và trình bày dữ liệu lịch sử để hiểu rõ hơn về những gì đã xảy ra?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 7: Một công ty muốn sử dụng dữ liệu bán hàng và xu hướng thị trường để dự báo doanh số bán hàng cho quý tiếp theo. Đây là ứng dụng của loại hình phân tích nào trong Khoa học dữ liệu?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 8: Một hệ thống đề xuất sản phẩm của trang thương mại điện tử phân tích hành vi của bạn và đề xuất những sản phẩm bạn có thể quan tâm. Đây là ví dụ về loại hình phân tích nào?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 9: Khai phá dữ liệu (Data Mining) chủ yếu sử dụng các kỹ thuật từ những lĩnh vực nào để tìm kiếm các mẫu, xu hướng và tri thức ẩn trong dữ liệu lớn?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 10: Vai trò chính của máy tính và thuật toán trong Khoa học dữ liệu là gì?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 11: Tại sao thuật toán song song lại đóng vai trò quan trọng trong việc xử lý dữ liệu lớn?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 12: Hệ thống máy tính nào sau đây thường được sử dụng để xử lý các bài toán Khoa học dữ liệu đòi hỏi năng lực tính toán cực lớn, có khả năng thực hiện hàng nghìn tỷ phép tính mỗi giây?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 13: Điện toán đám mây (Cloud Computing) mang lại lợi ích gì đáng kể cho các dự án Khoa học dữ liệu liên quan đến dữ liệu lớn?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 14: Một nhà phân tích dữ liệu đang xem xét biểu đồ cột hiển thị doanh số bán hàng theo từng tháng trong năm qua. Mục đích chính của hoạt động này thuộc loại phân tích nào?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 15: Khi một mô hình học máy được huấn luyện trên dữ liệu lịch sử để dự đoán khả năng khách hàng sẽ rời bỏ dịch vụ trong tháng tới, đây là một ví dụ điển hình của:

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 16: Hệ thống cơ sở dữ liệu nào thường được lựa chọn để lưu trữ và quản lý các loại dữ liệu phi cấu trúc hoặc bán cấu trúc như tài liệu văn bản, hình ảnh, video, hay dữ liệu từ mạng xã hội, do tính linh hoạt và khả năng mở rộng theo chiều ngang?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 17: Một công ty sản xuất muốn tối ưu hóa quy trình sản xuất bằng cách phân tích dữ liệu từ cảm biến trên máy móc để xác định thời điểm bảo trì tối ưu, nhằm giảm thiểu thời gian ngừng hoạt động. Loại phân tích nào phù hợp nhất cho mục tiêu này?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 18: Thuật toán nào sau đây là một ví dụ điển hình của kỹ thuật được sử dụng trong khai phá dữ liệu để phân nhóm các đối tượng dữ liệu dựa trên sự tương đồng về đặc điểm của chúng?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 19: Một tập dữ liệu được mô tả là có 'tính đa dạng cao'. Điều này có nghĩa là gì?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 20: Khi phân tích dữ liệu để tìm ra mối quan hệ giữa việc xem quảng cáo và hành vi mua hàng của khách hàng, nhà khoa học dữ liệu đang thực hiện hoạt động gì?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 21: Để xử lý hiệu quả dữ liệu lớn đòi hỏi tốc độ cao (Velocity), yếu tố công nghệ nào đóng vai trò thiết yếu?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 22: Một doanh nghiệp muốn triển khai một hệ thống có khả năng tự động điều chỉnh giá sản phẩm dựa trên nhu cầu thị trường theo thời gian thực và giá của đối thủ cạnh tranh. Đây là một ứng dụng phức tạp kết hợp nhiều loại phân tích. Loại phân tích nào đóng vai trò đưa ra quyết định hành động tối ưu?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 23: Việc một mô hình dự đoán thời tiết sử dụng dữ liệu lịch sử, dữ liệu từ vệ tinh và cảm biến để đưa ra dự báo nhiệt độ cho ngày mai là một ví dụ về việc ứng dụng kiến thức từ lĩnh vực nào trong Khoa học dữ liệu?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 24: Khi làm việc với dữ liệu lớn, việc đảm bảo 'Veracity' (Tính xác thực) là quan trọng nhất vì:

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 25: Một nhà khoa học dữ liệu sử dụng biểu đồ phân tán (scatter plot) để xem xét mối quan hệ giữa hai biến số trong tập dữ liệu. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 26: Hệ thống máy tính cụm (Computer Cluster) đóng vai trò gì trong việc xử lý dữ liệu lớn?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 27: Phân tích dự đoán (Predictive Analytics) khác biệt cơ bản với Phân tích mô tả (Descriptive Analytics) ở điểm nào?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 28: Một trong những thách thức lớn nhất khi làm việc với dữ liệu lớn có tính 'Variety' cao là gì?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 29: Trong Khoa học dữ liệu, 'mô hình' thường được hiểu là gì?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 6

Câu 30: Một ứng dụng di động thu thập dữ liệu vị trí của người dùng theo thời gian thực để phân tích mật độ giao thông. Loại dữ liệu này đặc biệt nhấn mạnh đặc trưng nào của Big Data?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 07

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 07 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Một công ty thương mại điện tử thu thập hàng tỉ lượt truy cập trang web, lịch sử mua hàng, phản hồi của khách hàng từ nhiều kênh khác nhau (website, ứng dụng di động, mạng xã hội). Đặc trưng nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua việc thu thập dữ liệu từ nhiều nguồn và định dạng khác nhau như vậy?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Veracity (Tính xác thực)

Câu 2: Một hệ thống giám sát an ninh thành phố sử dụng hàng ngàn camera để phân tích luồng giao thông, phát hiện sự cố và nhận diện biển số xe theo thời gian thực. Thách thức lớn nhất đối với hệ thống này liên quan đến đặc trưng nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Value (Giá trị)

Câu 3: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khổng lồ chứa thông tin về các giao dịch tài chính. Anh ta nhận thấy có nhiều bản ghi bị thiếu thông tin, định dạng không nhất quán và một số dữ liệu dường như không chính xác. Vấn đề này liên quan trực tiếp đến đặc trưng nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Veracity (Tính xác thực)

Câu 4: Mục tiêu chính của Khai phá dữ liệu (Data Mining) trong Khoa học dữ liệu là gì?

  • A. Trích xuất tri thức, mẫu hình và mối quan hệ hữu ích từ các tập dữ liệu lớn.
  • B. Chỉ đơn giản là lưu trữ dữ liệu một cách có tổ chức.
  • C. Tạo ra các báo cáo thống kê mô tả đơn giản về dữ liệu.
  • D. Xóa bỏ tất cả dữ liệu không chính xác hoặc bị thiếu.

Câu 5: Một ngân hàng muốn phân tích hành vi giao dịch của khách hàng để xác định những khách hàng có khả năng rời bỏ dịch vụ trong 6 tháng tới. Hoạt động này thuộc loại phân tích dữ liệu nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Phân tích chẩn đoán (Diagnostic Analytics)

Câu 6: Khi phân tích dữ liệu bán hàng trong quá khứ để tạo ra các biểu đồ, báo cáo tổng kết về doanh thu theo từng tháng, sản phẩm bán chạy nhất, hoặc phân bố khách hàng theo vùng địa lý, nhà phân tích đang thực hiện loại phân tích dữ liệu nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Khai phá dữ liệu (Data Mining)

Câu 7: Một công ty sử dụng dữ liệu lịch sử và các mô hình thống kê để không chỉ dự báo nhu cầu sản phẩm cho mùa tới mà còn đề xuất mức tồn kho tối ưu và chiến lược khuyến mãi phù hợp để tối đa hóa lợi nhuận. Loại phân tích dữ liệu nào đang được áp dụng ở đây?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Phân tích chẩn đoán (Diagnostic Analytics)

Câu 8: Đối với việc xử lý và phân tích các tập dữ liệu lớn (petabyte trở lên), sử dụng một máy tính cá nhân thông thường là không khả thi. Công nghệ nào sau đây cung cấp khả năng tính toán và lưu trữ linh hoạt, có thể mở rộng hoặc thu hẹp tài nguyên theo nhu cầu, rất phù hợp cho Khoa học dữ liệu quy mô lớn?

  • A. Máy tính nhúng (Embedded systems)
  • B. Máy tính xách tay (Laptops)
  • C. Siêu máy tính truyền thống (Traditional Supercomputers)
  • D. Điện toán đám mây (Cloud Computing)

Câu 9: Khi làm việc với Dữ liệu lớn có tính đa dạng cao (Variety), bao gồm dữ liệu phi cấu trúc như bài đăng mạng xã hội, hình ảnh, video, loại cơ sở dữ liệu nào thường được ưa chuộng hơn so với cơ sở dữ liệu quan hệ (SQL) truyền thống?

  • A. Cơ sở dữ liệu quan hệ (Relational Database - SQL)
  • B. Cơ sở dữ liệu NoSQL (Not Only SQL)
  • C. Hệ thống tệp phẳng (Flat file system)
  • D. Bảng tính (Spreadsheet)

Câu 10: Để tăng tốc độ xử lý các tác vụ phân tích phức tạp trên Dữ liệu lớn, thay vì xử lý tuần tự từng phần, các thuật toán thường được thiết kế để chia nhỏ vấn đề và thực hiện nhiều phép tính cùng lúc trên nhiều bộ xử lý hoặc máy tính khác nhau. Kỹ thuật này được gọi là gì?

  • A. Thuật toán tối ưu hóa (Optimization algorithms)
  • B. Thuật toán sắp xếp (Sorting algorithms)
  • C. Thuật toán song song (Parallel algorithms)
  • D. Thuật toán mã hóa (Encryption algorithms)

Câu 11: Một nhà nghiên cứu đang phân tích dữ liệu về hành vi người dùng trên một ứng dụng di động để tìm ra các nhóm người dùng có hành vi tương đồng và đề xuất nội dung cá nhân hóa cho từng nhóm. Hoạt động này liên quan mật thiết đến kỹ thuật nào trong Khoa học dữ liệu?

  • A. Phân cụm (Clustering)
  • B. Hồi quy (Regression)
  • C. Phân loại (Classification)
  • D. Tóm tắt dữ liệu (Data Summarization)

Câu 12: Khi xây dựng một mô hình để dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, v.v., nhà khoa học dữ liệu đang sử dụng kỹ thuật học máy nào phổ biến cho bài toán dự đoán một giá trị số liên tục?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Phân cụm (Clustering)
  • D. Luật kết hợp (Association Rules)

Câu 13: Một mô hình học máy được huấn luyện để phân loại email thành "thư rác" hoặc "không phải thư rác". Đây là ví dụ điển hình của bài toán thuộc loại nào trong học máy?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Phân cụm (Clustering)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 14: Trong quy trình xử lý Dữ liệu lớn, bước "Làm sạch dữ liệu" (Data Cleaning) bao gồm những công việc chính nào?

  • A. Chỉ đơn giản là thu thập thêm dữ liệu từ các nguồn khác.
  • B. Áp dụng các thuật toán học máy để xây dựng mô hình.
  • C. Xử lý dữ liệu bị thiếu, không nhất quán, không chính xác hoặc trùng lặp.
  • D. Trực quan hóa dữ liệu bằng biểu đồ và đồ thị.

Câu 15: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại là một bước quan trọng trong Khoa học dữ liệu, đặc biệt khi làm việc với Dữ liệu lớn?

  • A. Vì nó là bước cuối cùng và duy nhất cần thiết để đưa ra quyết định.
  • B. Chỉ để làm cho báo cáo trông đẹp mắt hơn.
  • C. Giúp tự động hóa hoàn toàn quá trình phân tích.
  • D. Giúp con người dễ dàng hiểu được các mẫu hình, xu hướng và ngoại lệ phức tạp trong dữ liệu lớn một cách trực quan.

Câu 16: Một thách thức khi làm việc với Dữ liệu lớn liên quan đến "Tính xác thực" (Veracity) là gì?

  • A. Dữ liệu được tạo ra quá nhanh.
  • B. Dữ liệu có thể không đáng tin cậy, không chính xác hoặc chứa sai lệch.
  • C. Dữ liệu đến từ quá nhiều nguồn khác nhau.
  • D. Khối lượng dữ liệu quá lớn để lưu trữ.

Câu 17: Khi một nhà khoa học dữ liệu sử dụng các kỹ thuật thống kê để xác định nguyên nhân gốc rễ của sự sụt giảm doanh số bán hàng đột ngột trong tháng trước, anh ta đang thực hiện loại phân tích dữ liệu nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Phân tích chẩn đoán (Diagnostic Analytics)

Câu 18: Hệ thống gợi ý sản phẩm của các trang thương mại điện tử (ví dụ: "Khách hàng mua sản phẩm X thường mua kèm sản phẩm Y") là một ứng dụng thực tế của kỹ thuật khai phá dữ liệu nào?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Luật kết hợp (Association Rules)
  • D. Phân cụm (Clustering)

Câu 19: Để xử lý Dữ liệu lớn đòi hỏi khả năng tính toán và lưu trữ phân tán. Mô hình "Máy tính cụm" (Computer Cluster) đóng vai trò gì trong việc này?

  • A. Kết hợp nhiều máy tính thành một hệ thống duy nhất để xử lý các tác vụ tính toán lớn.
  • B. Chỉ dùng để lưu trữ dữ liệu mà không xử lý.
  • C. Tăng tốc độ truy cập Internet cho người dùng.
  • D. Là một loại phần mềm dùng để trực quan hóa dữ liệu.

Câu 20: Đặc trưng "Value" (Giá trị) trong Dữ liệu lớn đề cập đến điều gì?

  • A. Chi phí để thu thập và lưu trữ dữ liệu.
  • B. Số lượng bản ghi trong tập dữ liệu.
  • C. Tốc độ xử lý dữ liệu theo thời gian thực.
  • D. Tiềm năng chuyển đổi dữ liệu thành thông tin hữu ích và có thể hành động được.

Câu 21: Giả sử bạn có một tập dữ liệu về nhiệt độ hàng ngày của một thành phố trong 10 năm. Bạn muốn tìm ra nhiệt độ trung bình của từng tháng trong các năm. Công việc này phù hợp nhất với loại phân tích dữ liệu nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Phân loại (Classification)

Câu 22: Một công ty bảo hiểm muốn xây dựng mô hình để dự đoán khả năng một khách hàng cụ thể sẽ yêu cầu bồi thường trong năm tới dựa trên lịch sử sức khỏe và các yếu tố nhân khẩu học. Đây là một ví dụ về ứng dụng của kỹ thuật học máy nào?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Phân cụm (Clustering)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 23: Ưu điểm chính của việc sử dụng Điện toán đám mây cho các dự án Khoa học dữ liệu lớn là gì?

  • A. Giảm thiểu hoàn toàn nhu cầu về kỹ năng phân tích dữ liệu.
  • B. Chỉ cho phép lưu trữ dữ liệu có cấu trúc.
  • C. Cung cấp khả năng mở rộng linh hoạt tài nguyên tính toán và lưu trữ theo yêu cầu, giảm chi phí đầu tư ban đầu.
  • D. Tự động tạo ra các mô hình dự đoán chính xác mà không cần con người can thiệp.

Câu 24: Khi nói về Dữ liệu lớn, "streaming data" (dữ liệu luồng) từ các cảm biến IoT hoặc giao dịch chứng khoán theo thời gian thực liên quan trực tiếp đến đặc trưng nào?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Veracity (Tính xác thực)

Câu 25: Sự khác biệt cơ bản giữa Phân tích mô tả và Phân tích dự đoán là gì?

  • A. Phân tích mô tả sử dụng thuật toán phức tạp hơn.
  • B. Phân tích dự đoán chỉ làm việc với dữ liệu có cấu trúc.
  • C. Phân tích mô tả tập trung vào "điều gì đã xảy ra", còn phân tích dự đoán tập trung vào "điều gì có thể xảy ra".
  • D. Phân tích mô tả yêu cầu lượng dữ liệu lớn hơn.

Câu 26: Trong bối cảnh Khoa học dữ liệu, thuật ngữ ETL (Extract, Transform, Load) mô tả quy trình nào?

  • A. Huấn luyện mô hình học máy.
  • B. Trực quan hóa kết quả phân tích.
  • C. Xây dựng giao diện người dùng cho ứng dụng dữ liệu.
  • D. Trích xuất dữ liệu từ nguồn, biến đổi dữ liệu cho phù hợp, và tải dữ liệu vào kho lưu trữ đích (ví dụ: Data Warehouse).

Câu 27: Một công ty muốn hiểu rõ hơn về lý do tại sao khách hàng ngừng sử dụng sản phẩm của mình bằng cách phân tích các phản hồi và khảo sát khách hàng cũ. Loại phân tích nào sẽ giúp họ tìm ra nguyên nhân gốc rễ của vấn đề này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Phân tích chẩn đoán (Diagnostic Analytics)

Câu 28: Khi làm việc với Dữ liệu lớn, việc chuẩn bị dữ liệu (Data Preparation), bao gồm làm sạch và biến đổi, thường chiếm tỷ lệ thời gian đáng kể trong toàn bộ quy trình Khoa học dữ liệu. Tại sao bước này lại quan trọng?

  • A. Chỉ để giảm kích thước của tập dữ liệu.
  • B. Dữ liệu không sạch hoặc không đúng định dạng có thể dẫn đến kết quả phân tích sai lệch hoặc mô hình không chính xác.
  • C. Bước này giúp tự động chọn thuật toán học máy tốt nhất.
  • D. Nó chỉ cần thiết cho dữ liệu có cấu trúc.

Câu 29: Một nhà khoa học dữ liệu sử dụng một tập dữ liệu về các giao dịch thẻ tín dụng để phát hiện các giao dịch bất thường có dấu hiệu gian lận. Kỹ thuật này thường dựa trên việc tìm kiếm các điểm dữ liệu khác biệt đáng kể so với mẫu hình thông thường. Đây là ứng dụng của kỹ thuật nào?

  • A. Hồi quy (Regression)
  • B. Phân cụm (Clustering)
  • C. Phát hiện bất thường (Anomaly Detection)
  • D. Luật kết hợp (Association Rules)

Câu 30: Trong quy trình Khoa học dữ liệu, sau khi đã thu thập, làm sạch, khám phá và phân tích dữ liệu, bước cuối cùng thường là gì để truyền đạt kết quả và đưa ra quyết định?

  • A. Truyền thông kết quả (Communication of Results), thường thông qua báo cáo và trực quan hóa.
  • B. Thu thập thêm dữ liệu mới.
  • C. Xóa bỏ tất cả dữ liệu gốc.
  • D. Lặp lại toàn bộ quy trình từ đầu.

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 1: Một công ty thương mại điện tử thu thập hàng tỉ lượt truy cập trang web, lịch sử mua hàng, phản hồi của khách hàng từ nhiều kênh khác nhau (website, ứng dụng di động, mạng xã hội). Đặc trưng nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua việc thu thập dữ liệu từ nhiều nguồn và định dạng khác nhau như vậy?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 2: Một hệ thống giám sát an ninh thành phố sử dụng hàng ngàn camera để phân tích luồng giao thông, phát hiện sự cố và nhận diện biển số xe theo thời gian thực. Thách thức lớn nhất đối với hệ thống này liên quan đến đặc trưng nào của Dữ liệu lớn?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 3: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khổng lồ chứa thông tin về các giao dịch tài chính. Anh ta nhận thấy có nhiều bản ghi bị thiếu thông tin, định dạng không nhất quán và một số dữ liệu dường như không chính xác. Vấn đề này liên quan trực tiếp đến đặc trưng nào của Dữ liệu lớn?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 4: Mục tiêu chính của Khai phá dữ liệu (Data Mining) trong Khoa học dữ liệu là gì?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 5: Một ngân hàng muốn phân tích hành vi giao dịch của khách hàng để xác định những khách hàng có khả năng rời bỏ dịch vụ trong 6 tháng tới. Hoạt động này thuộc loại phân tích dữ liệu nào?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 6: Khi phân tích dữ liệu bán hàng trong quá khứ để tạo ra các biểu đồ, báo cáo tổng kết về doanh thu theo từng tháng, sản phẩm bán chạy nhất, hoặc phân bố khách hàng theo vùng địa lý, nhà phân tích đang thực hiện loại phân tích dữ liệu nào?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 7: Một công ty sử dụng dữ liệu lịch sử và các mô hình thống kê để không chỉ dự báo nhu cầu sản phẩm cho mùa tới mà còn đề xuất mức tồn kho tối ưu và chiến lược khuyến mãi phù hợp để tối đa hóa lợi nhuận. Loại phân tích dữ liệu nào đang được áp dụng ở đây?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 8: Đối với việc xử lý và phân tích các tập dữ liệu lớn (petabyte trở lên), sử dụng một máy tính cá nhân thông thường là không khả thi. Công nghệ nào sau đây cung cấp khả năng tính toán và lưu trữ linh hoạt, có thể mở rộng hoặc thu hẹp tài nguyên theo nhu cầu, rất phù hợp cho Khoa học dữ liệu quy mô lớn?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 9: Khi làm việc với Dữ liệu lớn có tính đa dạng cao (Variety), bao gồm dữ liệu phi cấu trúc như bài đăng mạng xã hội, hình ảnh, video, loại cơ sở dữ liệu nào thường được ưa chuộng hơn so với cơ sở dữ liệu quan hệ (SQL) truyền thống?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 10: Để tăng tốc độ xử lý các tác vụ phân tích phức tạp trên Dữ liệu lớn, thay vì xử lý tuần tự từng phần, các thuật toán thường được thiết kế để chia nhỏ vấn đề và thực hiện nhiều phép tính cùng lúc trên nhiều bộ xử lý hoặc máy tính khác nhau. Kỹ thuật này được gọi là gì?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 11: Một nhà nghiên cứu đang phân tích dữ liệu về hành vi người dùng trên một ứng dụng di động để tìm ra các nhóm người dùng có hành vi tương đồng và đề xuất nội dung cá nhân hóa cho từng nhóm. Hoạt động này liên quan mật thiết đến kỹ thuật nào trong Khoa học dữ liệu?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 12: Khi xây dựng một mô hình để dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, v.v., nhà khoa học dữ liệu đang sử dụng kỹ thuật học máy nào phổ biến cho bài toán dự đoán một giá trị số liên tục?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 13: Một mô hình học máy được huấn luyện để phân loại email thành 'thư rác' hoặc 'không phải thư rác'. Đây là ví dụ điển hình của bài toán thuộc loại nào trong học máy?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 14: Trong quy trình xử lý Dữ liệu lớn, bước 'Làm sạch dữ liệu' (Data Cleaning) bao gồm những công việc chính nào?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 15: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại là một bước quan trọng trong Khoa học dữ liệu, đặc biệt khi làm việc với Dữ liệu lớn?

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 16: Một thách thức khi làm việc với Dữ liệu lớn liên quan đến 'Tính xác thực' (Veracity) là gì?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 17: Khi một nhà khoa học dữ liệu sử dụng các kỹ thuật thống kê để xác định nguyên nhân gốc rễ của sự sụt giảm doanh số bán hàng đột ngột trong tháng trước, anh ta đang thực hiện loại phân tích dữ liệu nào?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 18: Hệ thống gợi ý sản phẩm của các trang thương mại điện tử (ví dụ: 'Khách hàng mua sản phẩm X thường mua kèm sản phẩm Y') là một ứng dụng thực tế của kỹ thuật khai phá dữ liệu nào?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 19: Để xử lý Dữ liệu lớn đòi hỏi khả năng tính toán và lưu trữ phân tán. Mô hình 'Máy tính cụm' (Computer Cluster) đóng vai trò gì trong việc này?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 20: Đặc trưng 'Value' (Giá trị) trong Dữ liệu lớn đề cập đến điều gì?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 21: Giả sử bạn có một tập dữ liệu về nhiệt độ hàng ngày của một thành phố trong 10 năm. Bạn muốn tìm ra nhiệt độ trung bình của từng tháng trong các năm. Công việc này phù hợp nhất với loại phân tích dữ liệu nào?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 22: Một công ty bảo hiểm muốn xây dựng mô hình để dự đoán khả năng một khách hàng cụ thể sẽ yêu cầu bồi thường trong năm tới dựa trên lịch sử sức khỏe và các yếu tố nhân khẩu học. Đây là một ví dụ về ứng dụng của kỹ thuật học máy nào?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 23: Ưu điểm chính của việc sử dụng Điện toán đám mây cho các dự án Khoa học dữ liệu lớn là gì?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 24: Khi nói về Dữ liệu lớn, 'streaming data' (dữ liệu luồng) từ các cảm biến IoT hoặc giao dịch chứng khoán theo thời gian thực liên quan trực tiếp đến đặc trưng nào?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 25: Sự khác biệt cơ bản giữa Phân tích mô tả và Phân tích dự đoán là gì?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 26: Trong bối cảnh Khoa học dữ liệu, thuật ngữ ETL (Extract, Transform, Load) mô tả quy trình nào?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 27: Một công ty muốn hiểu rõ hơn về lý do tại sao khách hàng ngừng sử dụng sản phẩm của mình bằng cách phân tích các phản hồi và khảo sát khách hàng cũ. Loại phân tích nào sẽ giúp họ tìm ra nguyên nhân gốc rễ của vấn đề này?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 28: Khi làm việc với Dữ liệu lớn, việc chuẩn bị dữ liệu (Data Preparation), bao gồm làm sạch và biến đổi, thường chiếm tỷ lệ thời gian đáng kể trong toàn bộ quy trình Khoa học dữ liệu. Tại sao bước này lại quan trọng?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 29: Một nhà khoa học dữ liệu sử dụng một tập dữ liệu về các giao dịch thẻ tín dụng để phát hiện các giao dịch bất thường có dấu hiệu gian lận. Kỹ thuật này thường dựa trên việc tìm kiếm các điểm dữ liệu khác biệt đáng kể so với mẫu hình thông thường. Đây là ứng dụng của kỹ thuật nào?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 7

Câu 30: Trong quy trình Khoa học dữ liệu, sau khi đã thu thập, làm sạch, khám phá và phân tích dữ liệu, bước cuối cùng thường là gì để truyền đạt kết quả và đưa ra quyết định?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 08

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 08 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Một công ty bán lẻ thu thập dữ liệu từ hàng triệu giao dịch mua sắm hàng ngày, dữ liệu này bao gồm mã sản phẩm, thời gian mua, địa điểm cửa hàng và thông tin khách hàng (nếu có). Đặc trưng "Volume" của Dữ liệu lớn (Big Data) thể hiện rõ nhất qua khía cạnh nào trong tình huống này?

  • A. Số lượng bản ghi giao dịch khổng lồ được tạo ra liên tục mỗi ngày.
  • B. Sự đa dạng của các loại sản phẩm được bán.
  • C. Tốc độ xử lý dữ liệu để đưa ra khuyến mãi kịp thời.
  • D. Độ chính xác của thông tin khách hàng.

Câu 2: Một hệ thống giám sát giao thông thông minh thu thập dữ liệu từ hàng ngàn cảm biến, camera và thiết bị GPS trên các phương tiện. Dữ liệu này được cập nhật liên tục theo từng giây. Đặc trưng "Velocity" của Dữ liệu lớn (Big Data) được nhấn mạnh qua yếu tố nào?

  • A. Khối lượng dữ liệu lưu trữ từ các camera.
  • B. Nhiều loại dữ liệu khác nhau (hình ảnh, số liệu cảm biến, vị trí).
  • C. Tốc độ dữ liệu được tạo ra và cần được xử lý gần như tức thời.
  • D. Độ tin cậy của dữ liệu vị trí từ GPS.

Câu 3: Một dự án phân tích dữ liệu về sức khỏe cộng đồng thu thập thông tin từ hồ sơ bệnh án (văn bản có cấu trúc), ghi chú của bác sĩ (văn bản phi cấu trúc), hình ảnh X-quang, kết quả xét nghiệm (số liệu) và dữ liệu từ thiết bị đeo tay thông minh (dữ liệu chuỗi thời gian). Đặc trưng "Variety" của Dữ liệu lớn (Big Data) thể hiện rõ nhất qua khía cạnh nào?

  • A. Số lượng lớn bệnh nhân tham gia dự án.
  • B. Sự tồn tại của nhiều định dạng và nguồn dữ liệu khác nhau.
  • C. Tốc độ cập nhật dữ liệu từ thiết bị đeo tay.
  • D. Mức độ chính xác của kết quả xét nghiệm.

Câu 4: Khi phân tích dữ liệu từ mạng xã hội để hiểu xu hướng dư luận về một sản phẩm mới, nhà khoa học dữ liệu nhận thấy nhiều bài đăng chứa thông tin mâu thuẫn hoặc không rõ ràng. Điều này liên quan trực tiếp đến đặc trưng nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 5: Việc sử dụng các thuật toán học máy để dự đoán khả năng một khách hàng sẽ rời bỏ dịch vụ (churn prediction) dựa trên lịch sử tương tác của họ thuộc loại phân tích dữ liệu nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Phân tích chẩn đoán (Diagnostic Analytics)

Câu 6: Một báo cáo hàng quý tổng hợp số liệu bán hàng của công ty, bao gồm tổng doanh thu theo từng khu vực, sản phẩm bán chạy nhất và biểu đồ xu hướng doanh thu trong 3 tháng qua. Đây là ví dụ điển hình của loại phân tích dữ liệu nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Phân tích nhân quả (Causal Analytics)

Câu 7: Một hệ thống đề xuất sản phẩm trên trang thương mại điện tử phân tích lịch sử mua sắm và xem sản phẩm của bạn, sau đó đưa ra gợi ý về các mặt hàng bạn có khả năng quan tâm nhất. Chức năng này sử dụng chủ yếu loại phân tích dữ liệu nào?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích đề xuất
  • D. Phân tích chẩn đoán

Câu 8: Một ứng dụng bản đồ giao thông sử dụng dữ liệu thời gian thực về mật độ xe cộ, tai nạn và công trình để không chỉ hiển thị tình hình giao thông hiện tại mà còn đề xuất cho người dùng tuyến đường tối ưu nhất để đến đích, tránh các điểm tắc nghẽn. Đây là ví dụ về loại phân tích dữ liệu nào?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích đề xuất
  • D. Phân tích chẩn đoán

Câu 9: Để xử lý và phân tích hàng petabyte dữ liệu từ các kính thiên văn vô tuyến, các nhà khoa học cần một hệ thống có khả năng tính toán song song mạnh mẽ và khả năng lưu trữ linh hoạt. Công nghệ nào dưới đây đóng vai trò quan trọng trong việc cung cấp các tài nguyên này một cách hiệu quả về chi phí và khả năng mở rộng?

  • A. Điện toán đám mây (Cloud Computing)
  • B. Máy tính cá nhân hiệu năng cao (High-performance PC)
  • C. Cơ sở dữ liệu quan hệ truyền thống (Traditional Relational Database)
  • D. Phần mềm bảng tính (Spreadsheet Software)

Câu 10: Một công ty game muốn lưu trữ dữ liệu hồ sơ người dùng (không có cấu trúc cố định cho tất cả các loại game), dữ liệu tương tác trong game, và các bình luận, đánh giá của người chơi. Loại cơ sở dữ liệu nào phù hợp nhất để xử lý tính "Variety" và khả năng mở rộng linh hoạt cho lượng dữ liệu này?

  • A. Cơ sở dữ liệu quan hệ (SQL Database)
  • B. Hệ thống tệp tin phẳng (Flat File System)
  • C. Kho dữ liệu (Data Warehouse)
  • D. Cơ sở dữ liệu NoSQL

Câu 11: Để thực hiện các phép tính phức tạp trên một dataset rất lớn mà không thể chứa vừa trong bộ nhớ của một máy tính đơn lẻ, người ta thường sử dụng phương pháp phân tán công việc tính toán trên nhiều máy tính hoạt động song song. Khái niệm nào mô tả tập hợp các máy tính hoạt động như một hệ thống duy nhất để giải quyết các bài toán lớn?

  • A. Máy tính cá nhân (Personal Computer)
  • B. Máy tính cụm (Computer Cluster)
  • C. Siêu máy tính (Supercomputer) - mặc dù siêu máy tính cũng là dạng cluster, nhưng "cluster" là khái niệm chung hơn cho tập hợp máy tính.
  • D. Máy chủ đơn lẻ (Single Server)

Câu 12: Thuật toán song song (Parallel Algorithm) mang lại lợi ích gì quan trọng nhất trong việc xử lý Dữ liệu lớn?

  • A. Giảm thời gian xử lý bằng cách thực hiện nhiều phép tính đồng thời.
  • B. Làm cho dữ liệu trở nên chính xác hơn.
  • C. Tăng tính đa dạng của dữ liệu đầu vào.
  • D. Giảm khối lượng dữ liệu cần xử lý.

Câu 13: Khoa học dữ liệu là một lĩnh vực liên ngành. Ngoài Tin học và Toán học/Thống kê, lĩnh vực nào sau đây cũng đóng vai trò cốt lõi, đặc biệt trong việc hiểu rõ bài toán kinh doanh và diễn giải kết quả phân tích?

  • A. Vật lý học
  • B. Ngữ văn
  • C. Kiến thức chuyên ngành (Domain Knowledge) của lĩnh vực ứng dụng
  • D. Lịch sử học

Câu 14: Quá trình khám phá các mẫu, xu hướng và thông tin hữu ích từ các tập dữ liệu lớn, thường sử dụng kết hợp các kỹ thuật từ thống kê, học máy và hệ thống cơ sở dữ liệu được gọi là gì?

  • A. Khai phá dữ liệu (Data Mining)
  • B. Nhập liệu (Data Entry)
  • C. Báo cáo dữ liệu (Data Reporting)
  • D. Sao lưu dữ liệu (Data Backup)

Câu 15: Trong quy trình Khoa học dữ liệu, bước nào thường bao gồm việc làm sạch dữ liệu, xử lý các giá trị thiếu, chuẩn hóa định dạng và tích hợp dữ liệu từ nhiều nguồn khác nhau?

  • A. Hiểu biết về bài toán (Business Understanding)
  • B. Chuẩn bị dữ liệu (Data Preparation)
  • C. Mô hình hóa (Modeling)
  • D. Đánh giá mô hình (Evaluation)

Câu 16: Sau khi xây dựng và huấn luyện một mô hình dự đoán, nhà khoa học dữ liệu cần đánh giá hiệu suất của mô hình đó bằng cách sử dụng các chỉ số phù hợp (ví dụ: độ chính xác, độ phủ, F1-score). Bước này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Trực quan hóa dữ liệu
  • C. Mô hình hóa
  • D. Đánh giá mô hình

Câu 17: Việc trình bày kết quả phân tích dữ liệu dưới dạng biểu đồ, đồ thị, báo cáo tương tác để giúp người không chuyên về kỹ thuật dễ dàng hiểu và đưa ra quyết định được gọi là gì?

  • A. Khai phá dữ liệu
  • B. Mô hình hóa dữ liệu
  • C. Trực quan hóa dữ liệu (Data Visualization)
  • D. Thu thập dữ liệu

Câu 18: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích các giao dịch bất thường, phát hiện các mẫu hành vi đáng ngờ nhằm ngăn chặn gian lận thẻ tín dụng. Đây là ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

  • A. Tài chính - Ngân hàng
  • B. Y tế
  • C. Giáo dục
  • D. Nông nghiệp

Câu 19: Một bệnh viện áp dụng Khoa học dữ liệu để phân tích dữ liệu bệnh sử, kết quả xét nghiệm và hình ảnh y tế nhằm hỗ trợ bác sĩ chẩn đoán bệnh sớm hơn hoặc đưa ra phác đồ điều trị cá nhân hóa cho bệnh nhân. Đây là ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

  • A. Thương mại điện tử
  • B. Y tế
  • C. Sản xuất
  • D. Du lịch

Câu 20: Một công ty sản xuất sử dụng cảm biến IoT để thu thập dữ liệu từ máy móc trong nhà máy (nhiệt độ, áp suất, độ rung). Khoa học dữ liệu được áp dụng để phân tích dữ liệu này nhằm dự đoán khi nào một bộ phận máy có khả năng hỏng hóc, từ đó thực hiện bảo trì phòng ngừa. Ứng dụng này thuộc lĩnh vực nào?

  • A. Giải trí
  • B. Chính phủ
  • C. Sản xuất công nghiệp
  • D. Vận tải logistics

Câu 21: Khi làm việc với Dữ liệu lớn, đặc trưng "Value" đề cập đến điều gì?

  • A. Chi phí để lưu trữ dữ liệu.
  • B. Số lượng người truy cập dữ liệu.
  • C. Tốc độ xử lý dữ liệu.
  • D. Khả năng trích xuất thông tin hữu ích và tạo ra giá trị kinh tế/xã hội từ dữ liệu.

Câu 22: Phân tích chẩn đoán (Diagnostic Analytics) trong Khoa học dữ liệu nhằm mục đích chính là gì?

  • A. Mô tả điều gì đang xảy ra.
  • B. Dự đoán điều gì sẽ xảy ra trong tương lai.
  • C. Giải thích tại sao điều gì đó lại xảy ra (tìm nguyên nhân gốc rễ).
  • D. Đề xuất hành động nên làm tiếp theo.

Câu 23: Một nhà khoa học dữ liệu đang tìm cách xây dựng một mô hình để phân loại các email là "spam" hoặc "không spam". Đây là một bài toán điển hình của loại phân tích nào?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán (cụ thể là phân loại)
  • C. Phân tích đề xuất
  • D. Trực quan hóa dữ liệu

Câu 24: Công cụ nào dưới đây thường được sử dụng để trực quan hóa kết quả phân tích dữ liệu, giúp người dùng dễ dàng nhận diện xu hướng và mẫu hình?

  • A. Tableau, Power BI, Matplotlib
  • B. MySQL, PostgreSQL
  • C. Hadoop, Spark
  • D. Python (chỉ ngôn ngữ, không phải công cụ trực quan hóa cụ thể)

Câu 25: Tầm quan trọng của kiến thức chuyên ngành (Domain Knowledge) trong Khoa học dữ liệu thể hiện rõ nhất ở giai đoạn nào trong quy trình xử lý dữ liệu?

  • A. Chỉ trong việc thu thập dữ liệu.
  • B. Chỉ trong việc viết mã lập trình.
  • C. Chỉ trong việc lưu trữ dữ liệu.
  • D. Trong việc hiểu bài toán kinh doanh, chuẩn bị dữ liệu, lựa chọn mô hình và diễn giải kết quả.

Câu 26: Một thách thức lớn khi làm việc với Dữ liệu lớn là việc tích hợp dữ liệu từ nhiều nguồn khác nhau với các định dạng, cấu trúc và mức độ sạch sẽ không đồng nhất. Thách thức này liên quan chủ yếu đến đặc trưng nào của Dữ liệu lớn?

  • A. Volume
  • B. Velocity
  • C. Variety
  • D. Value

Câu 27: Trong bối cảnh Dữ liệu lớn, thuật toán MapReduce (hoặc các framework tương tự như Spark) được thiết kế để làm gì?

  • A. Thu thập dữ liệu từ các nguồn khác nhau.
  • B. Xử lý song song các tập dữ liệu lớn trên một cụm máy tính.
  • C. Trực quan hóa dữ liệu phức tạp.
  • D. Thiết kế cơ sở dữ liệu NoSQL.

Câu 28: Việc đảm bảo quyền riêng tư của người dùng khi phân tích dữ liệu cá nhân là một khía cạnh quan trọng của Khoa học dữ liệu. Điều này thuộc về vấn đề gì?

  • A. Hiệu suất xử lý.
  • B. Khả năng mở rộng hệ thống.
  • C. Đa dạng dữ liệu.
  • D. Đạo đức và pháp lý (Ethics and Legal).

Câu 29: Một trong những vai trò chính của máy tính và thuật toán trong Khoa học dữ liệu là khả năng tự động hóa các tác vụ phân tích phức tạp. Điều này giúp vượt qua hạn chế nào của con người khi xử lý Dữ liệu lớn?

  • A. Khả năng xử lý và tìm mẫu trong lượng dữ liệu khổng lồ và tốc độ cao.
  • B. Khả năng hiểu biết chuyên ngành sâu sắc.
  • C. Khả năng đặt ra câu hỏi nghiên cứu ban đầu.
  • D. Khả năng diễn giải kết quả cho người khác.

Câu 30: Khoa học dữ liệu không chỉ dừng lại ở việc phân tích dữ liệu quá khứ hay dự đoán tương lai mà còn hướng tới việc đưa ra các khuyến nghị hành động cụ thể. Khía cạnh này thể hiện rõ nhất ở loại phân tích nào?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích đề xuất
  • D. Trực quan hóa dữ liệu

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 1: Một công ty bán lẻ thu thập dữ liệu từ hàng triệu giao dịch mua sắm hàng ngày, dữ liệu này bao gồm mã sản phẩm, thời gian mua, địa điểm cửa hàng và thông tin khách hàng (nếu có). Đặc trưng 'Volume' của Dữ liệu lớn (Big Data) thể hiện rõ nhất qua khía cạnh nào trong tình huống này?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 2: Một hệ thống giám sát giao thông thông minh thu thập dữ liệu từ hàng ngàn cảm biến, camera và thiết bị GPS trên các phương tiện. Dữ liệu này được cập nhật liên tục theo từng giây. Đặc trưng 'Velocity' của Dữ liệu lớn (Big Data) được nhấn mạnh qua yếu tố nào?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 3: Một dự án phân tích dữ liệu về sức khỏe cộng đồng thu thập thông tin từ hồ sơ bệnh án (văn bản có cấu trúc), ghi chú của bác sĩ (văn bản phi cấu trúc), hình ảnh X-quang, kết quả xét nghiệm (số liệu) và dữ liệu từ thiết bị đeo tay thông minh (dữ liệu chuỗi thời gian). Đặc trưng 'Variety' của Dữ liệu lớn (Big Data) thể hiện rõ nhất qua khía cạnh nào?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 4: Khi phân tích dữ liệu từ mạng xã hội để hiểu xu hướng dư luận về một sản phẩm mới, nhà khoa học dữ liệu nhận thấy nhiều bài đăng chứa thông tin mâu thuẫn hoặc không rõ ràng. Điều này liên quan trực tiếp đến đặc trưng nào của Dữ liệu lớn?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 5: Việc sử dụng các thuật toán học máy để dự đoán khả năng một khách hàng sẽ rời bỏ dịch vụ (churn prediction) dựa trên lịch sử tương tác của họ thuộc loại phân tích dữ liệu nào?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 6: Một báo cáo hàng quý tổng hợp số liệu bán hàng của công ty, bao gồm tổng doanh thu theo từng khu vực, sản phẩm bán chạy nhất và biểu đồ xu hướng doanh thu trong 3 tháng qua. Đây là ví dụ điển hình của loại phân tích dữ liệu nào?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 7: Một hệ thống đề xuất sản phẩm trên trang thương mại điện tử phân tích lịch sử mua sắm và xem sản phẩm của bạn, sau đó đưa ra gợi ý về các mặt hàng bạn có khả năng quan tâm nhất. Chức năng này sử dụng chủ yếu loại phân tích dữ liệu nào?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 8: Một ứng dụng bản đồ giao thông sử dụng dữ liệu thời gian thực về mật độ xe cộ, tai nạn và công trình để không chỉ hiển thị tình hình giao thông hiện tại mà còn đề xuất cho người dùng tuyến đường tối ưu nhất để đến đích, tránh các điểm tắc nghẽn. Đây là ví dụ về loại phân tích dữ liệu nào?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 9: Để xử lý và phân tích hàng petabyte dữ liệu từ các kính thiên văn vô tuyến, các nhà khoa học cần một hệ thống có khả năng tính toán song song mạnh mẽ và khả năng lưu trữ linh hoạt. Công nghệ nào dưới đây đóng vai trò quan trọng trong việc cung cấp các tài nguyên này một cách hiệu quả về chi phí và khả năng mở rộng?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 10: Một công ty game muốn lưu trữ dữ liệu hồ sơ người dùng (không có cấu trúc cố định cho tất cả các loại game), dữ liệu tương tác trong game, và các bình luận, đánh giá của người chơi. Loại cơ sở dữ liệu nào phù hợp nhất để xử lý tính 'Variety' và khả năng mở rộng linh hoạt cho lượng dữ liệu này?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 11: Để thực hiện các phép tính phức tạp trên một dataset rất lớn mà không thể chứa vừa trong bộ nhớ của một máy tính đơn lẻ, người ta thường sử dụng phương pháp phân tán công việc tính toán trên nhiều máy tính hoạt động song song. Khái niệm nào mô tả tập hợp các máy tính hoạt động như một hệ thống duy nhất để giải quyết các bài toán lớn?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 12: Thuật toán song song (Parallel Algorithm) mang lại lợi ích gì quan trọng nhất trong việc xử lý Dữ liệu lớn?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 13: Khoa học dữ liệu là một lĩnh vực liên ngành. Ngoài Tin học và Toán học/Thống kê, lĩnh vực nào sau đây cũng đóng vai trò cốt lõi, đặc biệt trong việc hiểu rõ bài toán kinh doanh và diễn giải kết quả phân tích?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 14: Quá trình khám phá các mẫu, xu hướng và thông tin hữu ích từ các tập dữ liệu lớn, thường sử dụng kết hợp các kỹ thuật từ thống kê, học máy và hệ thống cơ sở dữ liệu được gọi là gì?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 15: Trong quy trình Khoa học dữ liệu, bước nào thường bao gồm việc làm sạch dữ liệu, xử lý các giá trị thiếu, chuẩn hóa định dạng và tích hợp dữ liệu từ nhiều nguồn khác nhau?

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 16: Sau khi xây dựng và huấn luyện một mô hình dự đoán, nhà khoa học dữ liệu cần đánh giá hiệu suất của mô hình đó bằng cách sử dụng các chỉ số phù hợp (ví dụ: độ chính xác, độ phủ, F1-score). Bước này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 17: Vi???c trình bày kết quả phân tích dữ liệu dưới dạng biểu đồ, đồ thị, báo cáo tương tác để giúp người không chuyên về kỹ thuật dễ dàng hiểu và đưa ra quyết định được gọi là gì?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 18: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích các giao dịch bất thường, phát hiện các mẫu hành vi đáng ngờ nhằm ngăn chặn gian lận thẻ tín dụng. Đây là ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 19: Một bệnh viện áp dụng Khoa học dữ liệu để phân tích dữ liệu bệnh sử, kết quả xét nghiệm và hình ảnh y tế nhằm hỗ trợ bác sĩ chẩn đoán bệnh sớm hơn hoặc đưa ra phác đồ điều trị cá nhân hóa cho bệnh nhân. Đây là ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 20: Một công ty sản xuất sử dụng cảm biến IoT để thu thập dữ liệu từ máy móc trong nhà máy (nhiệt độ, áp suất, độ rung). Khoa học dữ liệu được áp dụng để phân tích dữ liệu này nhằm dự đoán khi nào một bộ phận máy có khả năng hỏng hóc, từ đó thực hiện bảo trì phòng ngừa. Ứng dụng này thuộc lĩnh vực nào?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 21: Khi làm việc với Dữ liệu lớn, đặc trưng 'Value' đề cập đến điều gì?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 22: Phân tích chẩn đoán (Diagnostic Analytics) trong Khoa học dữ liệu nhằm mục đích chính là gì?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 23: Một nhà khoa học dữ liệu đang tìm cách xây dựng một mô hình để phân loại các email là 'spam' hoặc 'không spam'. Đây là một bài toán điển hình của loại phân tích nào?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 24: Công cụ nào dưới đây thường được sử dụng để trực quan hóa kết quả phân tích dữ liệu, giúp người dùng dễ dàng nhận diện xu hướng và mẫu hình?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 25: Tầm quan trọng của kiến thức chuyên ngành (Domain Knowledge) trong Khoa học dữ liệu thể hiện rõ nhất ở giai đoạn nào trong quy trình xử lý dữ liệu?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 26: Một thách thức lớn khi làm việc với Dữ liệu lớn là việc tích hợp dữ liệu từ nhiều nguồn khác nhau với các định dạng, cấu trúc và mức độ sạch sẽ không đồng nhất. Thách thức này liên quan chủ yếu đến đặc trưng nào của Dữ liệu lớn?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 27: Trong bối cảnh Dữ liệu lớn, thuật toán MapReduce (hoặc các framework tương tự như Spark) được thiết kế để làm gì?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 28: Việc đảm bảo quyền riêng tư của người dùng khi phân tích dữ liệu cá nhân là một khía cạnh quan trọng của Khoa học dữ liệu. Điều này thuộc về vấn đề gì?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 29: Một trong những vai trò chính của máy tính và thuật toán trong Khoa học dữ liệu là khả năng tự động hóa các tác vụ phân tích phức tạp. Điều này giúp vượt qua hạn chế nào của con người khi xử lý Dữ liệu lớn?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 8

Câu 30: Khoa học dữ liệu không chỉ dừng lại ở việc phân tích dữ liệu quá khứ hay dự đoán tương lai mà còn hướng tới việc đưa ra các khuyến nghị hành động cụ thể. Khía cạnh này thể hiện rõ nhất ở loại phân tích nào?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 09

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 09 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Mục tiêu cốt lõi và bao trùm nhất của Khoa học dữ liệu là gì?

  • A. Lưu trữ lượng lớn dữ liệu một cách an toàn.
  • B. Trực quan hóa dữ liệu thành các biểu đồ đẹp mắt.
  • C. Phát triển các thuật toán phức tạp.
  • D. Trích xuất tri thức và thông tin hữu ích từ dữ liệu để đưa ra quyết định hoặc giải quyết vấn đề.

Câu 2: Trong quy trình Khoa học dữ liệu, bước nào thường được thực hiện ngay sau khi dữ liệu đã được thu thập?

  • A. Xây dựng mô hình dự đoán.
  • B. Làm sạch và tiền xử lý dữ liệu.
  • C. Trực quan hóa kết quả.
  • D. Triển khai giải pháp.

Câu 3: Một công ty thương mại điện tử thu thập dữ liệu từ nhiều nguồn khác nhau: lịch sử mua hàng của khách (số liệu có cấu trúc), bình luận sản phẩm (văn bản phi cấu trúc), và dữ liệu clickstream trên website (bán cấu trúc). Đặc trưng nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất trong trường hợp này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 4: Một hệ thống phát hiện gian lận thẻ tín dụng cần phân tích hàng triệu giao dịch mỗi giây để xác định các giao dịch bất thường ngay lập tức. Thách thức lớn nhất về đặc trưng của Dữ liệu lớn trong hệ thống này là gì?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Value (Giá trị)

Câu 5: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khảo sát khách hàng rất lớn nhưng nhận thấy nhiều câu trả lời bị thiếu hoặc không nhất quán. Vấn đề này liên quan chủ yếu đến đặc trưng nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 6: Phân tích mô tả (Descriptive Analytics) trong Khoa học dữ liệu chủ yếu tập trung vào việc trả lời câu hỏi nào?

  • A. Điều gì đã xảy ra?
  • B. Điều gì sẽ xảy ra?
  • C. Tại sao điều đó xảy ra?
  • D. Chúng ta nên làm gì?

Câu 7: Một mô hình Khoa học dữ liệu được xây dựng để dự báo khả năng một khách hàng sẽ rời bỏ dịch vụ trong 6 tháng tới. Loại hình phân tích này là gì?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích chẩn đoán (Diagnostic Analytics)
  • D. Phân tích đề xuất (Prescriptive Analytics)

Câu 8: Một hệ thống sử dụng dữ liệu về hành vi mua sắm trực tuyến và dữ liệu thời tiết để tự động đề xuất các sản phẩm phù hợp cho từng khách hàng vào từng thời điểm cụ thể (ví dụ: gợi ý ô dù khi trời sắp mưa). Loại hình phân tích nào đang được áp dụng ở đây?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích chẩn đoán (Diagnostic Analytics)
  • D. Phân tích đề xuất (Prescriptive Analytics)

Câu 9: Khai phá dữ liệu (Data Mining) là một quá trình trong Khoa học dữ liệu nhằm mục đích chính là gì?

  • A. Thu thập dữ liệu từ nhiều nguồn khác nhau.
  • B. Làm sạch và định dạng lại dữ liệu.
  • C. Tìm kiếm các mẫu, xu hướng và tri thức ẩn trong tập dữ liệu lớn.
  • D. Trực quan hóa dữ liệu bằng biểu đồ.

Câu 10: Học máy (Machine Learning) đóng vai trò quan trọng trong Khoa học dữ liệu bằng cách nào?

  • A. Cho phép máy tính học hỏi từ dữ liệu để đưa ra dự đoán hoặc quyết định mà không cần lập trình tường minh.
  • B. Giúp thu thập dữ liệu tự động từ Internet.
  • C. Tạo ra các báo cáo tóm tắt dữ liệu.
  • D. Lưu trữ dữ liệu hiệu quả hơn.

Câu 11: Khi làm việc với dữ liệu lớn, việc sử dụng các thuật toán song song (Parallel Algorithms) mang lại lợi ích gì chính?

  • A. Giảm kích thước của tập dữ liệu.
  • B. Thực hiện nhiều phép tính hoặc xử lý nhiều phần của dữ liệu cùng lúc, tăng tốc độ xử lý.
  • C. Cải thiện tính chính xác của dữ liệu thô.
  • D. Tự động trực quan hóa dữ liệu.

Câu 12: Điện toán đám mây (Cloud Computing) hỗ trợ Khoa học dữ liệu như thế nào?

  • A. Chỉ cung cấp nơi lưu trữ dữ liệu an toàn.
  • B. Chỉ cung cấp phần mềm để trực quan hóa dữ liệu.
  • C. Cung cấp tài nguyên tính toán và lưu trữ linh hoạt, có thể mở rộng dễ dàng để xử lý dữ liệu lớn.
  • D. Giúp tự động thu thập dữ liệu từ các cảm biến.

Câu 13: Một hệ thống cơ sở dữ liệu NoSQL thường phù hợp hơn cho việc lưu trữ loại dữ liệu nào so với cơ sở dữ liệu quan hệ (SQL)?

  • A. Dữ liệu phi cấu trúc hoặc bán cấu trúc, có cấu trúc thay đổi thường xuyên.
  • B. Dữ liệu số có cấu trúc cố định và quan hệ phức tạp.
  • C. Các bản ghi tài chính yêu cầu tính nhất quán cao.
  • D. Dữ liệu cần được truy vấn bằng các câu lệnh phức tạp dựa trên mối quan hệ giữa các bảng.

Câu 14: Bước nào trong quy trình Khoa học dữ liệu là quan trọng nhất để đảm bảo rằng kết quả phân tích là đáng tin cậy và có ý nghĩa?

  • A. Trực quan hóa dữ liệu.
  • B. Làm sạch và tiền xử lý dữ liệu.
  • C. Chọn thuật toán học máy.
  • D. Trình bày kết quả.

Câu 15: Tại sao việc hiểu biết về lĩnh vực ứng dụng (ví dụ: kinh doanh, y tế, giáo dục) lại quan trọng đối với một nhà khoa học dữ liệu?

  • A. Để biết cách thu thập dữ liệu nhanh nhất.
  • B. Để chọn phần mềm thống kê tốt nhất.
  • C. Để viết mã hiệu quả hơn.
  • D. Để đặt câu hỏi đúng, hiểu ngữ cảnh của dữ liệu và diễn giải kết quả phân tích một cách chính xác và có ý nghĩa thực tiễn.

Câu 16: Một biểu đồ hiển thị doanh số bán hàng theo từng tháng trong năm vừa qua. Loại hình phân tích nào được biểu diễn chủ yếu qua biểu đồ này?

  • A. Phân tích mô tả.
  • B. Phân tích dự đoán.
  • C. Phân tích chẩn đoán.
  • D. Phân tích đề xuất.

Câu 17: Khi một nhà khoa học dữ liệu sử dụng các kỹ thuật thống kê để xác định nguyên nhân gốc rễ của sự sụt giảm doanh số đột ngột trong một khu vực cụ thể, họ đang thực hiện loại hình phân tích nào?

  • A. Phân tích mô tả.
  • B. Phân tích dự đoán.
  • C. Phân tích chẩn đoán.
  • D. Phân tích đề xuất.

Câu 18: Một công ty muốn tối ưu hóa chiến lược tồn kho bằng cách dự đoán nhu cầu sản phẩm trong tương lai và đề xuất số lượng hàng cần đặt. Công ty này cần sử dụng chủ yếu loại hình phân tích nào?

  • A. Phân tích mô tả.
  • B. Phân tích dự đoán.
  • C. Phân tích chẩn đoán.
  • D. Kết hợp Phân tích dự đoán và Phân tích đề xuất.

Câu 19: Công cụ nào sau đây chủ yếu được sử dụng trong bước trực quan hóa dữ liệu (Data Visualization)?

  • A. Biểu đồ (Charts), đồ thị (Graphs), bảng điều khiển (Dashboards).
  • B. Cơ sở dữ liệu SQL.
  • C. Trình biên dịch mã nguồn.
  • D. Công cụ thu thập dữ liệu tự động.

Câu 20: Khi một nhà khoa học dữ liệu xây dựng một mô hình để phân loại hình ảnh (ví dụ: phân biệt mèo và chó), họ đang áp dụng kỹ thuật nào phổ biến trong Học máy?

  • A. Hồi quy (Regression).
  • B. Phân loại (Classification).
  • C. Phân cụm (Clustering).
  • D. Luật kết hợp (Association Rules).

Câu 21: Bước "Đánh giá mô hình" (Model Evaluation) trong quy trình Khoa học dữ liệu nhằm mục đích gì?

  • A. Thu thập thêm dữ liệu cho mô hình.
  • B. Làm sạch dữ liệu đầu vào cho mô hình.
  • C. Xác định hiệu suất, độ chính xác và tính phù hợp của mô hình với mục tiêu đề ra.
  • D. Trực quan hóa cấu trúc của mô hình.

Câu 22: Phát biểu nào sau đây mô tả đúng nhất sự khác biệt giữa Dữ liệu lớn (Big Data) và dữ liệu truyền thống?

  • A. Dữ liệu lớn chỉ khác dữ liệu truyền thống ở khối lượng (Volume).
  • B. Dữ liệu lớn luôn có cấu trúc, còn dữ liệu truyền thống thì không.
  • C. Dữ liệu lớn chỉ được tạo ra từ các nguồn trên internet.
  • D. Dữ liệu lớn khác biệt ở nhiều khía cạnh như Volume, Velocity, Variety, Veracity và Value, đòi hỏi công nghệ và kỹ thuật xử lý mới.

Câu 23: Yếu tố nào sau đây KHÔNG phải là một thành phần kỹ thuật chính thường gặp trong hệ sinh thái xử lý Dữ liệu lớn?

  • A. Máy in 3D hiệu suất cao.
  • B. Điện toán đám mây.
  • C. Hệ thống lưu trữ phân tán (ví dụ: HDFS).
  • D. Cơ sở dữ liệu NoSQL.

Câu 24: Khi phân tích dữ liệu, việc phát hiện và loại bỏ các giá trị ngoại lai (outliers) thường thuộc về bước nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Làm sạch và tiền xử lý dữ liệu.
  • C. Xây dựng mô hình.
  • D. Đánh giá mô hình.

Câu 25: Một Data Scientist trình bày kết quả phân tích phức tạp cho một nhóm quản lý không có nền tảng kỹ thuật. Kỹ năng nào sau đây là quan trọng nhất trong tình huống này?

  • A. Khả năng viết mã Python siêu tốc.
  • B. Kiến thức sâu về thuật toán Deep Learning.
  • C. Kỹ năng quản lý cơ sở dữ liệu.
  • D. Kỹ năng giao tiếp và trình bày (storytelling) để giải thích các kết quả phức tạp một cách đơn giản và dễ hiểu.

Câu 26: Đâu là một ví dụ về ứng dụng của Khoa học dữ liệu trong lĩnh vực y tế?

  • A. Tự động hóa quy trình thanh toán viện phí.
  • B. Quản lý lịch làm việc của bác sĩ.
  • C. Phân tích dữ liệu bệnh nhân để dự đoán nguy cơ mắc bệnh hoặc phản ứng với thuốc.
  • D. Lưu trữ hồ sơ bệnh án điện tử.

Câu 27: Một trong những thách thức lớn nhất khi làm việc với Dữ liệu lớn là gì?

  • A. Cần có cơ sở hạ tầng mạnh mẽ và kỹ năng chuyên môn cao để xử lý và phân tích hiệu quả.
  • B. Dữ liệu lớn luôn chứa thông tin sai lệch.
  • C. Không thể áp dụng các kỹ thuật thống kê truyền thống.
  • D. Chỉ có thể lưu trữ trên một loại thiết bị duy nhất.

Câu 28: Khi một nhà khoa học dữ liệu tạo ra các phân đoạn khách hàng dựa trên hành vi mua hàng và đặc điểm nhân khẩu học để mục đích tiếp thị cá nhân hóa, họ đang sử dụng kỹ thuật nào?

  • A. Hồi quy tuyến tính.
  • B. Phát hiện bất thường (Anomaly Detection).
  • C. Phân tích chuỗi thời gian (Time Series Analysis).
  • D. Phân cụm (Clustering).

Câu 29: Bước "Triển khai" (Deployment) trong quy trình Khoa học dữ liệu bao gồm những hoạt động nào?

  • A. Thu thập dữ liệu mới.
  • B. Tích hợp mô hình hoặc kết quả phân tích vào hệ thống sản xuất, ứng dụng, hoặc quy trình kinh doanh để tạo ra giá trị thực tế.
  • C. Làm sạch dữ liệu đã thu thập.
  • D. Đánh giá lại hiệu suất của mô hình trên dữ liệu cũ.

Câu 30: Phát biểu nào sau đây là đúng về mối quan hệ giữa Khoa học dữ liệu và Trí tuệ nhân tạo (AI)?

  • A. Khoa học dữ liệu thường sử dụng các kỹ thuật từ AI (như Học máy) để phân tích dữ liệu và xây dựng mô hình thông minh.
  • B. AI là một phần nhỏ của Khoa học dữ liệu.
  • C. Khoa học dữ liệu và AI là hai lĩnh vực hoàn toàn tách biệt.
  • D. AI chỉ tập trung vào việc thu thập dữ liệu, còn Khoa học dữ liệu tập trung vào việc xây dựng robot.

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 3: Khi thêm một khối (block) thanh điều hướng vào trang web bằng công cụ thiết kế, thao tác nào sau đây là đúng để bắt đầu quá trình này?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 4: Một nhà thiết kế muốn logo của website luôn hiển thị rõ ràng trên thanh điều hướng và có kích thước phù hợp. Họ cần điều chỉnh tùy chọn nào trong bảng thiết lập thông số của thanh điều hướng?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 5: Để một mục trên thanh điều hướng khi được nhấp vào sẽ dẫn người dùng đến một trang khác trong cùng website hoặc một địa chỉ web bên ngoài, thao tác nào sau đây là cần thiết cho mục đó?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 6: Tùy chọn 'Full Width' (Chiều rộng đầy đủ) trong cài đặt thanh điều hướng có tác dụng gì?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 7: Khi thiết kế thanh điều hướng cho một website có nhiều trang và nhiều chuyên mục con, để giữ cho thanh điều hướng chính gọn gàng và dễ quản lý, bạn nên sử dụng tính năng nào?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 8: Tùy chọn 'Sticky' (Cố định) trong cài đặt thanh điều hướng có ý nghĩa như thế nào đối với trải nghiệm người dùng khi cuộn trang?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 9: Một website được xem trên màn hình điện thoại di động. Thanh điều hướng hiển thị dưới dạng một biểu tượng (thường là 3 gạch ngang - 'hamburger icon') mà khi nhấp vào sẽ hiển thị danh sách menu. Tính năng này được gọi là gì?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 10: Khi làm việc với thanh điều hướng trên một công cụ thiết kế website, để loại bỏ hoàn toàn khối thanh điều hướng đã thêm vào, bạn sẽ tìm tùy chọn nào?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 11: Tùy chọn 'Transparent' (Trong suốt) cho thanh điều hướng ảnh hưởng đến yếu tố nào của thanh điều hướng?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 12: Một mục menu có danh sách các mục con hiển thị khi người dùng di chuột qua hoặc nhấp vào. Cấu trúc này được gọi là gì?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 13: Khi thiết lập thanh điều hướng cho một website có nhiều trang, việc áp dụng cùng một cấu trúc và thiết kế thanh điều hướng cho tất cả các trang có ý nghĩa quan trọng gì?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 14: Tùy chọn nào trong cài đặt thanh điều hướng cho phép bạn điều chỉnh khoảng cách giữa các mục menu với nhau hoặc với các cạnh của thanh điều hướng?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 15: Khi xem website trên màn hình nhỏ, thanh điều hướng chính có quá nhiều mục và bị tràn ra ngoài hoặc xuống dòng. Để khắc phục vấn đề này một cách hiệu quả, bạn nên cân nhắc sử dụng tính năng nào?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 16: Để thay đổi màu sắc của các biểu tượng (như biểu tượng tìm kiếm, giỏ hàng, hoặc biểu tượng menu thu gọn) hiển thị trên thanh điều hướng, bạn sẽ tìm tùy chọn cài đặt nào?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 17: Một website thương mại điện tử cần có các nút như Đăng nhập/Đăng ký, Giỏ hàng, và Tìm kiếm trên thanh điều hướng để tiện cho người dùng. Những thành phần này thường được thêm vào thanh điều hướng thông qua tùy chọn nào?

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 18: Khi thiết lập liên kết cho một mục menu, nếu bạn muốn liên kết đó mở ra ở một tab hoặc cửa sổ trình duyệt mới thay vì chuyển hướng trên tab hiện tại, bạn cần chọn tùy chọn gì?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 19: Thanh điều hướng của website có phần tên thương hiệu (Brand Name) hiển thị. Mục đích chính của việc này là gì?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 20: Giả sử bạn đã tạo một thanh điều hướng và muốn nó xuất hiện giống hệt nhau trên tất cả các trang của website. Thao tác nào sau đây giúp đạt được điều này một cách hiệu quả nhất trong hầu hết các công cụ thiết kế website?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 21: Khi thiết kế thanh điều hướng, thứ tự sắp xếp các mục menu có ảnh hưởng như thế nào đến trải nghiệm người dùng?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 22: Bạn nhận thấy thanh điều hướng của mình có màu nền trùng với màu của phần nội dung ngay dưới nó, gây khó phân biệt. Bạn cần điều chỉnh thuộc tính nào của thanh điều hướng để khắc phục?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 23: Một thanh điều hướng có cấu trúc như sau: Trang chủ, Giới thiệu, Sản phẩm (điện thoại, laptop, phụ kiện), Liên hệ. Trong cấu trúc này, 'Sản phẩm' là gì và 'điện thoại, laptop, phụ kiện' là gì?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 24: Khi sử dụng tùy chọn 'Collapsed' cho thanh điều hướng trên màn hình nhỏ, biểu tượng 'hamburger' thường xuất hiện. Khi người dùng nhấp vào biểu tượng này, hành động mong đợi là gì?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 25: Để đảm bảo tính nhất quán về mặt hình ảnh, màu sắc của thanh điều hướng nên được lựa chọn dựa trên yếu tố nào?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 26: Giả sử bạn muốn thêm một biểu tượng điện thoại nhỏ bên cạnh mục menu 'Liên hệ' để người dùng dễ nhận biết. Tùy chọn nào trong cài đặt mục menu sẽ giúp bạn làm điều này?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 27: Sự khác biệt chính giữa việc đặt liên kết đến một 'Phần trên trang hiện tại' (Section on current page) và liên kết đến một 'Trang khác' (Another page) trong cài đặt mục menu là gì?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 28: Trong ngữ cảnh của thiết kế đáp ứng (responsive design), việc thanh điều hướng tự động chuyển sang dạng thu gọn (collapsed) trên màn hình nhỏ là ví dụ của việc điều chỉnh yếu tố nào?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 29: Khi thiết lập thanh điều hướng, nếu bạn muốn một mục menu không phải là một liên kết mà chỉ là tiêu đề cho một nhóm các mục con (ví dụ: 'Sản phẩm' là tiêu đề cho 'Điện thoại', 'Laptop'), bạn thường cấu hình mục đó như thế nào?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Tạo thanh điều hướng cho trang web

Tags: Bộ đề 9

Câu 30: Bạn đang thiết kế một website giới thiệu portfolio cá nhân chỉ gồm một trang duy nhất với các phần cuộn xuống (About, Projects, Contact). Kiểu thanh điều hướng nào sau đây là phù hợp và hiệu quả nhất cho website này?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Thiết kế mạng LAN

Tags: Bộ đề 9

Câu 1: Khi bắt đầu thiết kế mạng LAN cho một văn phòng mới, bước đầu tiên và quan trọng nhất mà người thiết kế cần thực hiện là gì?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Thiết kế mạng LAN

Tags: Bộ đề 9

Câu 2: Một doanh nghiệp nhỏ có 15 máy tính cần kết nối Internet và chia sẻ dữ liệu nội bộ. Doanh nghiệp cũng muốn cung cấp kết nối Wi-Fi cho nhân viên sử dụng laptop và điện thoại. Trong quy trình chọn thiết bị, những thiết bị cơ bản nào là cần thiết nhất cho mạng LAN này?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 10

Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 10 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu hành vi người dùng từ website (lượt click, thời gian xem trang), lịch sử mua hàng, đánh giá sản phẩm, dữ liệu từ ứng dụng di động, và phản hồi trên mạng xã hội. Đặc trưng nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua việc thu thập nhiều loại dữ liệu khác nhau này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Veracity (Tính xác thực)

Câu 2: Một hệ thống giám sát giao thông thông minh thu thập dữ liệu từ hàng nghìn cảm biến, camera và thiết bị GPS trên ô tô theo thời gian thực, xử lý liên tục để điều chỉnh đèn tín hiệu và thông báo tình trạng đường. Đặc trưng nào của Dữ liệu lớn (Big Data) là thách thức lớn nhất đối với hệ thống này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Value (Giá trị)

Câu 3: Một nhà khoa học dữ liệu đang phân tích dữ liệu lịch sử bán hàng để xác định các mặt hàng thường được mua cùng nhau. Mục tiêu là để đưa ra gợi ý sản phẩm cho khách hàng khi họ mua sắm trực tuyến. Quá trình này thuộc lĩnh vực nào của Khoa học dữ liệu?

  • A. Khai phá dữ liệu (Data Mining)
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Kỹ thuật dữ liệu (Data Engineering)
  • D. Quản trị cơ sở dữ liệu (Database Administration)

Câu 4: Phân tích dữ liệu nào chủ yếu tập trung vào việc tóm tắt, mô tả và trình bày dữ liệu quá khứ để hiểu điều gì đã xảy ra?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích quy định (Prescriptive Analytics)
  • D. Phân tích chẩn đoán (Diagnostic Analytics)

Câu 5: Một công ty bảo hiểm muốn sử dụng dữ liệu lịch sử để xây dựng mô hình dự đoán khả năng một khách hàng sẽ yêu cầu bồi thường trong năm tới. Loại phân tích dữ liệu nào phù hợp nhất với mục tiêu này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích quy định (Prescriptive Analytics)
  • D. Phân tích chẩn đoán (Diagnostic Analytics)

Câu 6: Đâu là một ví dụ điển hình về dữ liệu có cấu trúc?

  • A. Bài viết trên mạng xã hội
  • B. Tệp âm thanh ghi âm cuộc họp
  • C. Hình ảnh từ camera giám sát
  • D. Bảng tính Excel chứa danh sách khách hàng (Tên, Địa chỉ, Ngày sinh, Doanh số)

Câu 7: Đâu là một ví dụ điển hình về dữ liệu phi cấu trúc?

  • A. Dữ liệu trong cơ sở dữ liệu quan hệ SQL
  • B. Dữ liệu trong tệp CSV có tiêu đề cột
  • C. Nội dung email và tin nhắn
  • D. Dữ liệu GPS từ thiết bị theo dõi

Câu 8: Trong quy trình Khoa học dữ liệu, bước nào thường diễn ra ngay sau khi dữ liệu được thu thập và trước khi bắt đầu phân tích chuyên sâu?

  • A. Xây dựng mô hình dự đoán
  • B. Làm sạch và tiền xử lý dữ liệu
  • C. Trực quan hóa kết quả cuối cùng
  • D. Triển khai giải pháp

Câu 9: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại là một bước quan trọng trong Khoa học dữ liệu?

  • A. Để tăng khối lượng dữ liệu thu thập được.
  • B. Để giảm tốc độ xử lý dữ liệu.
  • C. Để làm cho dữ liệu trở nên đa dạng hơn.
  • D. Để đảm bảo tính chính xác và đáng tin cậy của dữ liệu cho phân tích.

Câu 10: Công nghệ nào cho phép lưu trữ và xử lý Dữ liệu lớn một cách linh hoạt, có khả năng mở rộng theo nhu cầu và truy cập từ xa qua Internet?

  • A. Điện toán đám mây (Cloud Computing)
  • B. Hệ quản trị cơ sở dữ liệu quan hệ (RDBMS)
  • C. Thiết bị lưu trữ ngoại vi (External Hard Drive)
  • D. Máy tính cá nhân hiệu năng cao (High-Performance PC)

Câu 11: Cơ sở dữ liệu NoSQL thường được sử dụng để lưu trữ loại dữ liệu nào hiệu quả hơn so với cơ sở dữ liệu quan hệ truyền thống?

  • A. Dữ liệu có cấu trúc chặt chẽ và yêu cầu các mối quan hệ phức tạp giữa các bảng.
  • B. Dữ liệu phi cấu trúc hoặc bán cấu trúc, có sự thay đổi thường xuyên về cấu trúc hoặc cần khả năng mở rộng theo chiều ngang lớn.
  • C. Dữ liệu chỉ bao gồm các số nguyên và số thực.
  • D. Dữ liệu chỉ được tạo ra và truy cập bởi một người dùng duy nhất.

Câu 12: Máy tính cụm (Computer Cluster) và thuật toán song song (Parallel Algorithms) đóng vai trò như thế nào trong việc xử lý Dữ liệu lớn?

  • A. Chúng giúp giảm khối lượng dữ liệu cần xử lý.
  • B. Chúng làm tăng tính đa dạng của các loại dữ liệu.
  • C. Chúng cho phép phân chia và thực hiện các tác vụ xử lý trên nhiều máy tính cùng lúc, giúp tăng tốc độ và hiệu quả.
  • D. Chúng chủ yếu giúp cải thiện tính xác thực của dữ liệu đầu vào.

Câu 13: Giả sử bạn có một tập dữ liệu chứa thông tin về nhiệt độ đo được từ hàng triệu cảm biến phân bố trên một khu vực rộng lớn, với mỗi cảm biến gửi dữ liệu mỗi giây. Thách thức lớn nhất khi xử lý tập dữ liệu này bằng các phương pháp truyền thống có thể liên quan đến đặc trưng nào của Big Data?

  • A. Variety (Tính đa dạng) - vì dữ liệu chỉ là nhiệt độ.
  • B. Velocity (Tốc độ) - vì dữ liệu được tạo ra rất nhanh.
  • C. Veracity (Tính xác thực) - vì cảm biến có thể hỏng.
  • D. Value (Giá trị) - vì dữ liệu nhiệt độ có thể không hữu ích.

Câu 14: Phân tích dữ liệu chẩn đoán (Diagnostic Analytics) trong Khoa học dữ liệu nhằm mục đích chính là gì?

  • A. Dự đoán điều gì sẽ xảy ra trong tương lai.
  • B. Đề xuất hành động tối ưu cần thực hiện.
  • C. Mô tả điều gì đã xảy ra trong quá khứ.
  • D. Tìm hiểu lý do tại sao một điều gì đó đã xảy ra.

Câu 15: Tại sao việc trực quan hóa dữ liệu (Data Visualization) là một kỹ năng quan trọng trong Khoa học dữ liệu?

  • A. Để làm cho dữ liệu trở nên phức tạp hơn.
  • B. Để tự động hóa toàn bộ quá trình phân tích.
  • C. Để trình bày kết quả phân tích một cách dễ hiểu, giúp người khác (không chuyên về dữ liệu) nắm bắt được thông tin và đưa ra quyết định.
  • D. Để thay thế hoàn toàn các phương pháp phân tích thống kê.

Câu 16: Đâu là vai trò chính của "Value" (Giá trị) trong 5 chữ V của Dữ liệu lớn?

  • A. Đảm bảo rằng dữ liệu thu thập và phân tích mang lại lợi ích thực tế hoặc thông tin hữu ích.
  • B. Đề cập đến chi phí lưu trữ dữ liệu.
  • C. Liên quan đến tốc độ xử lý dữ liệu.
  • D. Mô tả các loại dữ liệu khác nhau.

Câu 17: Khi làm việc với Dữ liệu lớn, thách thức về "Veracity" (Tính xác thực) thường xuất phát từ đâu?

  • A. Dữ liệu có khối lượng quá lớn.
  • B. Dữ liệu được tạo ra quá nhanh.
  • C. Dữ liệu có nhiều định dạng khác nhau.
  • D. Dữ liệu không đầy đủ, không chính xác, hoặc chứa sai lệch/nhiễu.

Câu 18: Thuật toán học máy (Machine Learning) thường được sử dụng trong lĩnh vực nào của Khoa học dữ liệu?

  • A. Khai phá dữ liệu và phân tích dự đoán.
  • B. Chỉ để lưu trữ dữ liệu.
  • C. Chỉ để tạo ra các biểu đồ đơn giản.
  • D. Chỉ để làm sạch dữ liệu ban đầu.

Câu 19: Giả sử bạn cần phân tích một tập dữ liệu giao dịch ngân hàng khổng lồ để phát hiện các hoạt động gian lận tiềm ẩn. Đặc trưng "Volume" (Khối lượng) của dữ liệu này đòi hỏi giải pháp công nghệ nào?

  • A. Sử dụng phần mềm bảng tính thông thường.
  • B. Chỉ lưu trữ dữ liệu trên một máy tính duy nhất.
  • C. Sử dụng các hệ thống lưu trữ và xử lý phân tán (ví dụ: trên đám mây hoặc máy tính cụm).
  • D. Giảm bớt số lượng giao dịch cần phân tích.

Câu 20: Một nhà bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng trong quá khứ (những sản phẩm họ đã mua, tần suất mua, giá trị đơn hàng trung bình). Loại phân tích nào phù hợp nhất để tạo báo cáo tổng hợp và biểu đồ về các chỉ số này?

  • A. Phân tích mô tả.
  • B. Phân tích dự đoán.
  • C. Phân tích quy định.
  • D. Khai phá dữ liệu (theo nghĩa tìm kiếm tri thức ẩn).

Câu 21: Khi phân tích dữ liệu từ mạng xã hội (bài đăng, bình luận, hình ảnh), thách thức về "Variety" (Tính đa dạng) được giải quyết như thế nào trong Khoa học dữ liệu?

  • A. Bỏ qua các loại dữ liệu không phải văn bản.
  • B. Chỉ lưu trữ dữ liệu trên một máy tính đơn lẻ.
  • C. Sử dụng cơ sở dữ liệu quan hệ truyền thống.
  • D. Sử dụng các công cụ và kỹ thuật xử lý dữ liệu đa dạng, bao gồm xử lý ngôn ngữ tự nhiên (NLP) cho văn bản, nhận dạng hình ảnh cho hình ảnh, v.v.

Câu 22: Trong bối cảnh Dữ liệu lớn, thuật ngữ "Data Lake" (Hồ dữ liệu) thường được sử dụng để chỉ điều gì?

  • A. Một kho lưu trữ tập trung cho phép lưu trữ dữ liệu thô (raw data) ở nhiều định dạng khác nhau (có cấu trúc, bán cấu trúc, phi cấu trúc) với quy mô lớn.
  • B. Một hệ quản trị cơ sở dữ liệu quan hệ.
  • C. Một công cụ trực quan hóa dữ liệu.
  • D. Một thuật toán học máy cụ thể.

Câu 23: Phân tích quy định (Prescriptive Analytics) mở rộng từ phân tích dự đoán (Predictive Analytics) bằng cách nào?

  • A. Chỉ tập trung vào dữ liệu lịch sử.
  • B. Chỉ mô tả điều gì đã xảy ra.
  • C. Không chỉ dự đoán điều gì có thể xảy ra, mà còn đề xuất các hành động tối ưu để đạt được kết quả mong muốn hoặc tránh rủi ro.
  • D. Chỉ tạo ra các biểu đồ đơn giản.

Câu 24: Đâu là một ví dụ về việc áp dụng Khoa học dữ liệu trong lĩnh vực y tế?

  • A. Quản lý hồ sơ bệnh án giấy.
  • B. Thực hiện phẫu thuật truyền thống.
  • C. Pha chế thuốc theo đơn.
  • D. Phân tích dữ liệu bệnh nhân (lịch sử bệnh, kết quả xét nghiệm, hình ảnh y tế) để dự đoán nguy cơ mắc bệnh, cá nhân hóa phác đồ điều trị hoặc phát hiện dịch bệnh sớm.

Câu 25: Một trong những mục tiêu chính của Khai phá dữ liệu (Data Mining) là gì?

  • A. Thu thập càng nhiều dữ liệu càng tốt.
  • B. Phát hiện các mẫu, xu hướng, mối quan hệ hoặc tri thức ẩn có giá trị từ các tập dữ liệu lớn.
  • C. Chỉ đơn thuần sao chép dữ liệu từ nguồn này sang nguồn khác.
  • D. Xóa bỏ tất cả dữ liệu không có cấu trúc.

Câu 26: Xét tập dữ liệu bao gồm các bài đánh giá sản phẩm của khách hàng dưới dạng văn bản tự do trên một trang web. Để rút trích thông tin hữu ích như cảm xúc (tích cực/tiêu cực), các chủ đề được nhắc đến nhiều, Khoa học dữ liệu sẽ sử dụng kỹ thuật nào?

  • A. Phân tích số liệu thống kê mô tả đơn thuần.
  • B. Quản lý cơ sở dữ liệu quan hệ.
  • C. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP).
  • D. Trực quan hóa dữ liệu bằng biểu đồ cột.

Câu 27: Một nhà khoa học dữ liệu cần trình bày kết quả phân tích phức tạp về mối liên hệ giữa các yếu tố khác nhau trong dữ liệu cho một đối tượng không chuyên. Công cụ hoặc kỹ năng nào là quan trọng nhất để làm điều này hiệu quả?

  • A. Trực quan hóa dữ liệu và kỹ năng giao tiếp.
  • B. Khả năng viết mã phức tạp.
  • C. Hiểu biết sâu sắc về thuật toán học máy.
  • D. Khả năng thu thập dữ liệu từ nhiều nguồn.

Câu 28: Thách thức lớn nhất khi xử lý Dữ liệu lớn liên quan đến "Volume" (Khối lượng) là gì?

  • A. Làm cho dữ liệu trở nên đa dạng hơn.
  • B. Yêu cầu dung lượng lưu trữ khổng lồ và tài nguyên xử lý mạnh mẽ, vượt quá khả năng của hệ thống truyền thống.
  • C. Đảm bảo dữ liệu luôn được cập nhật theo thời gian thực.
  • D. Xác định giá trị kinh doanh của dữ liệu.

Câu 29: Công nghệ nào là nền tảng cho phép các ứng dụng Khoa học dữ liệu truy cập và xử lý lượng lớn dữ liệu mà không cần sở hữu và duy trì cơ sở hạ tầng phần cứng đắt đỏ?

  • A. Máy tính cá nhân hiệu năng cao.
  • B. Thiết bị lưu trữ USB.
  • C. Điện toán đám mây.
  • D. Mạng cục bộ (LAN).

Câu 30: Khi một công ty sử dụng dữ liệu hành vi người dùng để cá nhân hóa trải nghiệm trên website (ví dụ: hiển thị sản phẩm gợi ý phù hợp), họ đang áp dụng khía cạnh nào của Khoa học dữ liệu?

  • A. Chỉ thu thập dữ liệu.
  • B. Chỉ lưu trữ dữ liệu.
  • C. Chỉ làm sạch dữ liệu.
  • D. Phân tích dữ liệu để tạo ra giá trị (Value) và cải thiện trải nghiệm người dùng, thường thông qua các kỹ thuật khai phá dữ liệu và phân tích dự đoán.

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu hành vi người dùng từ website (lượt click, thời gian xem trang), lịch sử mua hàng, đánh giá sản phẩm, dữ liệu từ ứng dụng di động, và phản hồi trên mạng xã hội. Đặc trưng nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua việc thu thập nhiều loại dữ liệu khác nhau này?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 2: Một hệ thống giám sát giao thông thông minh thu thập dữ liệu từ hàng nghìn cảm biến, camera và thiết bị GPS trên ô tô theo thời gian thực, xử lý liên tục để điều chỉnh đèn tín hiệu và thông báo tình trạng đường. Đặc trưng nào của Dữ liệu lớn (Big Data) là thách thức lớn nhất đối với hệ thống này?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 3: Một nhà khoa học dữ liệu đang phân tích dữ liệu lịch sử bán hàng để xác định các mặt hàng thường được mua cùng nhau. Mục tiêu là để đưa ra gợi ý sản phẩm cho khách hàng khi họ mua sắm trực tuyến. Quá trình này thuộc lĩnh vực nào của Khoa học dữ liệu?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 4: Phân tích dữ liệu nào chủ yếu tập trung vào việc tóm tắt, mô tả và trình bày dữ liệu quá khứ để hiểu điều gì đã xảy ra?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 5: Một công ty bảo hiểm muốn sử dụng dữ liệu lịch sử để xây dựng mô hình dự đoán khả năng một khách hàng sẽ yêu cầu bồi thường trong năm tới. Loại phân tích dữ liệu nào phù hợp nhất với mục tiêu này?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 6: Đâu là một ví dụ điển hình về dữ liệu có cấu trúc?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 7: Đâu là một ví dụ điển hình về dữ liệu phi cấu trúc?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 8: Trong quy trình Khoa học dữ liệu, bước nào thường diễn ra ngay sau khi dữ liệu được thu thập và trước khi bắt đầu phân tích chuyên sâu?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 9: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại là một bước quan trọng trong Khoa học dữ liệu?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 10: Công nghệ nào cho phép lưu trữ và xử lý Dữ liệu lớn một cách linh hoạt, có khả năng mở rộng theo nhu cầu và truy cập từ xa qua Internet?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 11: Cơ sở dữ liệu NoSQL thường được sử dụng để lưu trữ loại dữ liệu nào hiệu quả hơn so với cơ sở dữ liệu quan hệ truyền thống?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 12: Máy tính cụm (Computer Cluster) và thuật toán song song (Parallel Algorithms) đóng vai trò như thế nào trong việc xử lý Dữ liệu lớn?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 13: Giả sử bạn có một tập dữ liệu chứa thông tin về nhiệt độ đo được từ hàng triệu cảm biến phân bố trên một khu vực rộng lớn, với mỗi cảm biến gửi dữ liệu mỗi giây. Thách thức lớn nhất khi xử lý tập dữ liệu này bằng các phương pháp truyền thống có thể liên quan đến đặc trưng nào của Big Data?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 14: Phân tích dữ liệu chẩn đoán (Diagnostic Analytics) trong Khoa học dữ liệu nhằm mục đích chính là gì?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 15: Tại sao việc trực quan hóa dữ liệu (Data Visualization) là một kỹ năng quan trọng trong Khoa học dữ liệu?

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 16: Đâu là vai trò chính của 'Value' (Giá trị) trong 5 chữ V của Dữ liệu lớn?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 17: Khi làm việc với Dữ liệu lớn, thách thức về 'Veracity' (Tính xác thực) thường xuất phát từ đâu?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 18: Thuật toán học máy (Machine Learning) thường được sử dụng trong lĩnh vực nào của Khoa học dữ liệu?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 19: Giả sử bạn cần phân tích một tập dữ liệu giao dịch ngân hàng khổng lồ để phát hiện các hoạt động gian lận tiềm ẩn. Đặc trưng 'Volume' (Khối lượng) của dữ liệu này đòi hỏi giải pháp công nghệ nào?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 20: Một nhà bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng trong quá khứ (những sản phẩm họ đã mua, tần suất mua, giá trị đơn hàng trung bình). Loại phân tích nào phù hợp nhất để tạo báo cáo tổng hợp và biểu đồ về các chỉ số này?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 21: Khi phân tích dữ liệu từ mạng xã hội (bài đăng, bình luận, hình ảnh), thách thức về 'Variety' (Tính đa dạng) được giải quyết như thế nào trong Khoa học dữ liệu?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 22: Trong bối cảnh Dữ liệu lớn, thuật ngữ 'Data Lake' (Hồ dữ liệu) thường được sử dụng để chỉ điều gì?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 23: Phân tích quy định (Prescriptive Analytics) mở rộng từ phân tích dự đoán (Predictive Analytics) bằng cách nào?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 24: Đâu là một ví dụ về việc áp dụng Khoa học dữ liệu trong lĩnh vực y tế?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 25: Một trong những mục tiêu chính của Khai phá dữ liệu (Data Mining) là gì?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 26: Xét tập dữ liệu bao gồm các bài đánh giá sản phẩm của khách hàng dưới dạng văn bản tự do trên một trang web. Để rút trích thông tin hữu ích như cảm xúc (tích cực/tiêu cực), các chủ đề được nhắc đến nhiều, Khoa học dữ liệu sẽ sử dụng kỹ thuật nào?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 27: Một nhà khoa học dữ liệu cần trình bày kết quả phân tích phức tạp về mối liên hệ giữa các yếu tố khác nhau trong dữ liệu cho một đối tượng không chuyên. Công cụ hoặc kỹ năng nào là quan trọng nhất để làm điều này hiệu quả?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 28: Thách thức lớn nhất khi xử lý Dữ liệu lớn liên quan đến 'Volume' (Khối lượng) là gì?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 29: Công nghệ nào là nền tảng cho phép các ứng dụng Khoa học dữ liệu truy cập và xử lý lượng lớn dữ liệu mà không cần sở hữu và duy trì cơ sở hạ tầng phần cứng đắt đỏ?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 30: Khi một công ty sử dụng dữ liệu hành vi người dùng để cá nhân hóa trải nghiệm trên website (ví dụ: hiển thị sản phẩm gợi ý phù hợp), họ đang áp dụng khía cạnh nào của Khoa học dữ liệu?

Xem kết quả