15+ Đề Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Đề 01

Đề 02

Đề 03

Đề 04

Đề 05

Đề 06

Đề 07

Đề 08

Đề 09

Đề 10

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 01

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 01 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong quy trình phân tích dữ liệu, bước nào sau đây tập trung vào việc làm sạch và chuyển đổi dữ liệu thô để chuẩn bị cho các phân tích tiếp theo?

  • A. Trực quan hóa dữ liệu
  • B. Tiền xử lý dữ liệu
  • C. Khai thác dữ liệu
  • D. Đánh giá mô hình

Câu 2: Để khám phá các mẫu ẩn và mối quan hệ trong một tập dữ liệu lớn về hành vi mua sắm của khách hàng, kỹ thuật nào của Khoa học dữ liệu sẽ được áp dụng hiệu quả nhất?

  • A. Thống kê mô tả
  • B. Truy vấn SQL
  • C. Khai thác dữ liệu
  • D. Lập trình hướng đối tượng

Câu 3: Một công ty muốn dự đoán nhu cầu sản phẩm trong quý tới dựa trên dữ liệu bán hàng lịch sử và các yếu tố mùa vụ. Phương pháp nào sau đây thuộc lĩnh vực Khoa học dữ liệu có thể giúp họ đạt được mục tiêu này?

  • A. Phân tích hồi quy tương quan
  • B. Phân tích phương sai (ANOVA)
  • C. Kiểm định giả thuyết
  • D. Mô hình hóa dự đoán

Câu 4: Biểu đồ nào sau đây thích hợp nhất để so sánh doanh số bán hàng của nhiều sản phẩm khác nhau trong cùng một khoảng thời gian?

  • A. Biểu đồ cột (Bar chart)
  • B. Biểu đồ đường (Line chart)
  • C. Biểu đồ tròn (Pie chart)
  • D. Biểu đồ phân tán (Scatter plot)

Câu 5: Trong Khoa học dữ liệu, "học máy" (Machine Learning) chủ yếu tập trung vào điều gì?

  • A. Lưu trữ và quản lý dữ liệu hiệu quả
  • B. Phát triển các thuật toán cho phép máy tính tự học từ dữ liệu
  • C. Thiết kế giao diện người dùng thân thiện
  • D. Bảo mật dữ liệu và ngăn chặn tấn công mạng

Câu 6: Một nhà khoa học dữ liệu cần kỹ năng nào sau đây để trình bày kết quả phân tích dữ liệu một cách rõ ràng và dễ hiểu cho người không chuyên môn?

  • A. Lập trình Python nâng cao
  • B. Xây dựng mô hình học sâu phức tạp
  • C. Kỹ năng trực quan hóa dữ liệu và kể chuyện bằng dữ liệu
  • D. Quản lý cơ sở dữ liệu quan hệ

Câu 7: Xét bài toán phân loại email rác (spam) và email không rác (non-spam). Thuật toán học máy nào sau đây thường được sử dụng cho bài toán này?

  • A. Hồi quy tuyến tính (Linear Regression)
  • B. Phân tích thành phần chính (PCA)
  • C. K-means Clustering
  • D. Naive Bayes

Câu 8: Trong bối cảnh Khoa học dữ liệu, "dữ liệu lớn" (Big Data) được đặc trưng bởi các thuộc tính nào sau đây?

  • A. Khối lượng lớn (Volume), Tốc độ (Velocity), và Đa dạng (Variety)
  • B. Tính xác thực (Veracity), Giá trị (Value), và Bảo mật (Security)
  • C. Tính toàn vẹn (Integrity), Độ tin cậy (Reliability), và Khả năng mở rộng (Scalability)
  • D. Tính nhất quán (Consistency), Tính sẵn sàng (Availability), và Tính phân tán (Distribution)

Câu 9: Ứng dụng nào sau đây thể hiện vai trò của Khoa học dữ liệu trong lĩnh vực tài chính?

  • A. Tự động hóa dây chuyền sản xuất
  • B. Phát hiện gian lận giao dịch thẻ tín dụng
  • C. Nghiên cứu và phát triển thuốc mới
  • D. Quản lý hệ thống điện quốc gia

Câu 10: Để giảm số chiều dữ liệu (dimensionality reduction) và loại bỏ các thuộc tính ít quan trọng, kỹ thuật nào sau đây có thể được sử dụng?

  • A. Chuẩn hóa dữ liệu (Data normalization)
  • B. Rời rạc hóa dữ liệu (Data discretization)
  • C. Phân tích thành phần chính (PCA)
  • D. Điền giá trị thiếu (Missing value imputation)

Câu 11: Trong quá trình xây dựng mô hình học máy, việc chia dữ liệu thành tập huấn luyện (training set) và tập kiểm tra (testing set) nhằm mục đích gì?

  • A. Tăng tốc độ huấn luyện mô hình
  • B. Đánh giá hiệu năng của mô hình trên dữ liệu mới, chưa từng thấy
  • C. Giảm thiểu dung lượng dữ liệu cần lưu trữ
  • D. Cải thiện khả năng trực quan hóa dữ liệu

Câu 12: "Trực quan hóa dữ liệu" (Data visualization) đóng vai trò quan trọng trong Khoa học dữ liệu vì lý do nào sau đây?

  • A. Tăng độ chính xác của mô hình học máy
  • B. Giảm chi phí xử lý dữ liệu
  • C. Tự động hóa quá trình thu thập dữ liệu
  • D. Giúp con người dễ dàng nhận diện mẫu, xu hướng và hiểu sâu hơn về dữ liệu

Câu 13: Công cụ lập trình phổ biến nào thường được sử dụng trong Khoa học dữ liệu để phân tích và xử lý dữ liệu?

  • A. Java
  • B. C++
  • C. Python
  • D. HTML

Câu 14: Trong Khoa học dữ liệu, thuật ngữ "feature engineering" đề cập đến quá trình nào?

  • A. Thu thập dữ liệu từ nhiều nguồn khác nhau
  • B. Chọn lọc, biến đổi và tạo ra các thuộc tính (features) phù hợp từ dữ liệu thô
  • C. Đánh giá và lựa chọn mô hình học máy tốt nhất
  • D. Triển khai mô hình học máy vào thực tế

Câu 15: Loại hình dữ liệu nào sau đây thường gặp trong các bài toán Khoa học dữ liệu liên quan đến mạng xã hội?

  • A. Dữ liệu số dạng bảng
  • B. Dữ liệu hình ảnh y tế
  • C. Dữ liệu chuỗi thời gian
  • D. Dữ liệu văn bản và dữ liệu đồ thị

Câu 16: Để đánh giá hiệu quả của một mô hình phân loại, chỉ số nào sau đây thường được sử dụng?

  • A. Độ chính xác (Accuracy)
  • B. Phương sai (Variance)
  • C. Độ lệch chuẩn (Standard deviation)
  • D. Giá trị trung bình (Mean)

Câu 17: Trong Khoa học dữ liệu, "đạo đức dữ liệu" (Data ethics) đề cập đến vấn đề gì?

  • A. Tối ưu hóa hiệu suất thuật toán
  • B. Bảo mật hệ thống lưu trữ dữ liệu
  • C. Các nguyên tắc đạo đức và trách nhiệm khi thu thập, sử dụng và phân tích dữ liệu
  • D. Phát triển công nghệ trực quan hóa dữ liệu tiên tiến

Câu 18: Loại bài toán học máy nào phù hợp để nhóm các khách hàng có đặc điểm tương đồng thành các phân khúc khác nhau?

  • A. Hồi quy (Regression)
  • B. Phân cụm (Clustering)
  • C. Phân loại (Classification)
  • D. Giảm chiều dữ liệu (Dimensionality reduction)

Câu 19: Để xử lý dữ liệu dạng văn bản (text data) trong Khoa học dữ liệu, kỹ thuật nào sau đây thường được sử dụng để chuyển đổi văn bản thành dạng số?

  • A. Chuẩn hóa dữ liệu (Normalization)
  • B. Làm sạch dữ liệu (Data cleaning)
  • C. Rời rạc hóa dữ liệu (Discretization)
  • D. Vector hóa văn bản (Text vectorization)

Câu 20: Trong mô hình học máy, hiện tượng "quá khớp" (overfitting) xảy ra khi nào?

  • A. Mô hình hoạt động kém trên cả tập huấn luyện và tập kiểm tra
  • B. Mô hình hoạt động tốt trên tập kiểm tra nhưng kém trên tập huấn luyện
  • C. Mô hình hoạt động quá tốt trên tập huấn luyện nhưng kém trên tập kiểm tra
  • D. Mô hình hoạt động tốt trên cả tập huấn luyện và tập kiểm tra

Câu 21: Một nhà khoa học dữ liệu sử dụng phương pháp "học tăng cường" (Reinforcement Learning) để huấn luyện một hệ thống tự lái. Mục tiêu chính của phương pháp này là gì?

  • A. Phân loại dữ liệu đầu vào một cách chính xác
  • B. Huấn luyện hệ thống để đưa ra chuỗi hành động tối ưu nhằm đạt được mục tiêu cụ thể
  • C. Dự đoán giá trị của một biến số liên tục
  • D. Nhóm các đối tượng tương tự vào cùng một cụm

Câu 22: Trong Khoa học dữ liệu, "đường ống dữ liệu" (data pipeline) được sử dụng để làm gì?

  • A. Tự động hóa quy trình thu thập, xử lý và phân tích dữ liệu
  • B. Trực quan hóa dữ liệu theo thời gian thực
  • C. Bảo mật dữ liệu trong quá trình truyền tải
  • D. Tối ưu hóa truy vấn cơ sở dữ liệu

Câu 23: Để xử lý dữ liệu chuỗi thời gian (time series data), mô hình học máy nào sau đây thường được ưu tiên sử dụng?

  • A. Cây quyết định (Decision Tree)
  • B. Máy vector hỗ trợ (SVM)
  • C. Mạng nơ-ron hồi quy (RNN)
  • D. K-Nearest Neighbors (KNN)

Câu 24: Trong quá trình tiền xử lý dữ liệu, "dữ liệu ngoại lai" (outliers) là gì và tại sao cần xử lý chúng?

  • A. Dữ liệu bị thiếu giá trị và cần được điền đầy đủ
  • B. Dữ liệu không có cấu trúc và cần được chuyển đổi sang dạng có cấu trúc
  • C. Dữ liệu không nhất quán và cần được chuẩn hóa
  • D. Dữ liệu có giá trị khác biệt đáng kể so với phần lớn dữ liệu còn lại và có thể gây sai lệch kết quả phân tích

Câu 25: Ứng dụng nào sau đây của Khoa học dữ liệu có thể giúp cải thiện trải nghiệm người dùng trên các nền tảng thương mại điện tử?

  • A. Dự báo thời tiết
  • B. Hệ thống gợi ý sản phẩm cá nhân hóa
  • C. Phân tích thị trường chứng khoán
  • D. Kiểm soát chất lượng sản phẩm trong sản xuất

Câu 26: Để xây dựng một hệ thống khuyến nghị phim cho người dùng, dữ liệu nào sau đây là quan trọng nhất?

  • A. Thông tin nhân khẩu học của người dùng
  • B. Thông tin về diễn viên và đạo diễn phim
  • C. Lịch sử xem phim và đánh giá phim của người dùng
  • D. Thể loại và năm sản xuất phim

Câu 27: Trong lĩnh vực y tế, Khoa học dữ liệu có thể được ứng dụng để làm gì?

  • A. Hỗ trợ chẩn đoán bệnh dựa trên hình ảnh y tế
  • B. Quản lý hồ sơ bệnh án điện tử
  • C. Tự động hóa quy trình nhập viện
  • D. Phát triển phần mềm quản lý bệnh viện

Câu 28: Khi phân tích dữ liệu khảo sát khách hàng, kỹ thuật nào sau đây có thể giúp xác định các nhóm khách hàng có quan điểm và thái độ tương tự?

  • A. Phân tích hồi quy tuyến tính
  • B. Phân cụm (Clustering)
  • C. Phân tích chuỗi thời gian
  • D. Phân tích phương sai (ANOVA)

Câu 29: Để đảm bảo tính công bằng và tránh thiên vị trong mô hình học máy, nhà khoa học dữ liệu cần chú ý đến yếu tố nào?

  • A. Tối ưu hóa độ chính xác của mô hình
  • B. Tăng cường khả năng giải thích của mô hình
  • C. Đảm bảo dữ liệu huấn luyện không chứa thiên vị và mô hình không phân biệt đối xử
  • D. Sử dụng thuật toán học máy phức tạp nhất

Câu 30: Trong một dự án Khoa học dữ liệu, giai đoạn nào thường chiếm nhiều thời gian và công sức nhất?

  • A. Xây dựng mô hình học máy
  • B. Đánh giá mô hình
  • C. Trực quan hóa kết quả
  • D. Thu thập và tiền xử lý dữ liệu

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 1: Trong quy trình phân tích dữ liệu, bước nào sau đây tập trung vào việc làm sạch và chuyển đổi dữ liệu thô để chuẩn bị cho các phân tích tiếp theo?

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 2: Để khám phá các mẫu ẩn và mối quan hệ trong một tập dữ liệu lớn về hành vi mua sắm của khách hàng, kỹ thuật nào của Khoa học dữ liệu sẽ được áp dụng hiệu quả nhất?

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 3: Một công ty muốn dự đoán nhu cầu sản phẩm trong quý tới dựa trên dữ liệu bán hàng lịch sử và các yếu tố mùa vụ. Phương pháp nào sau đây thuộc lĩnh vực Khoa học dữ liệu có thể giúp họ đạt được mục tiêu này?

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 4: Biểu đồ nào sau đây thích hợp nhất để so sánh doanh số bán hàng của nhiều sản phẩm khác nhau trong cùng một khoảng thời gian?

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 5: Trong Khoa học dữ liệu, 'học máy' (Machine Learning) chủ yếu tập trung vào điều gì?

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 6: Một nhà khoa học dữ liệu cần kỹ năng nào sau đây để trình bày kết quả phân tích dữ liệu một cách rõ ràng và dễ hiểu cho người không chuyên môn?

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 7: Xét bài toán phân loại email rác (spam) và email không rác (non-spam). Thuật toán học máy nào sau đây thường được sử dụng cho bài toán này?

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 8: Trong bối cảnh Khoa học dữ liệu, 'dữ liệu lớn' (Big Data) được đặc trưng bởi các thuộc tính nào sau đây?

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 9: Ứng dụng nào sau đây thể hiện vai trò của Khoa học dữ liệu trong lĩnh vực tài chính?

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 10: Để giảm số chiều dữ liệu (dimensionality reduction) và loại bỏ các thuộc tính ít quan trọng, kỹ thuật nào sau đây có thể được sử dụng?

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 11: Trong quá trình xây dựng mô hình học máy, việc chia dữ liệu thành tập huấn luyện (training set) và tập kiểm tra (testing set) nhằm mục đích gì?

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 12: 'Trực quan hóa dữ liệu' (Data visualization) đóng vai trò quan trọng trong Khoa học dữ liệu vì lý do nào sau đây?

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 13: Công cụ lập trình phổ biến nào thường được sử dụng trong Khoa học dữ liệu để phân tích và xử lý dữ liệu?

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 14: Trong Khoa học dữ liệu, thuật ngữ 'feature engineering' đề cập đến quá trình nào?

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 15: Loại hình dữ liệu nào sau đây thường gặp trong các bài toán Khoa học dữ liệu liên quan đến mạng xã hội?

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 16: Để đánh giá hiệu quả của một mô hình phân loại, chỉ số nào sau đây thường được sử dụng?

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 17: Trong Khoa học dữ liệu, 'đạo đức dữ liệu' (Data ethics) đề cập đến vấn đề gì?

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 18: Loại bài toán học máy nào phù hợp để nhóm các khách hàng có đặc điểm tương đồng thành các phân khúc khác nhau?

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 19: Để xử lý dữ liệu dạng văn bản (text data) trong Khoa học dữ liệu, kỹ thuật nào sau đây thường được sử dụng để chuyển đổi văn bản thành dạng số?

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 20: Trong mô hình học máy, hiện tượng 'quá khớp' (overfitting) xảy ra khi nào?

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 21: Một nhà khoa học dữ liệu sử dụng phương pháp 'học tăng cường' (Reinforcement Learning) để huấn luyện một hệ thống tự lái. Mục tiêu chính của phương pháp này là gì?

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 22: Trong Khoa học dữ liệu, 'đường ống dữ liệu' (data pipeline) được sử dụng để làm gì?

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 23: Để xử lý dữ liệu chuỗi thời gian (time series data), mô hình học máy nào sau đây thường được ưu tiên sử dụng?

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 24: Trong quá trình tiền xử lý dữ liệu, 'dữ liệu ngoại lai' (outliers) là gì và tại sao cần xử lý chúng?

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 25: Ứng dụng nào sau đây của Khoa học dữ liệu có thể giúp cải thiện trải nghiệm người dùng trên các nền tảng thương mại điện tử?

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 26: Để xây dựng một hệ thống khuyến nghị phim cho người dùng, dữ liệu nào sau đây là quan trọng nhất?

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 27: Trong lĩnh vực y tế, Khoa học dữ liệu có thể được ứng dụng để làm gì?

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 28: Khi phân tích dữ liệu khảo sát khách hàng, kỹ thuật nào sau đây có thể giúp xác định các nhóm khách hàng có quan điểm và thái độ tương tự?

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 29: Để đảm bảo tính công bằng và tránh thiên vị trong mô hình học máy, nhà khoa học dữ liệu cần chú ý đến yếu tố nào?

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 1

Câu 30: Trong một dự án Khoa học dữ liệu, giai đoạn nào thường chiếm nhiều thời gian và công sức nhất?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 02

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 02 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong quy trình Khoa học Dữ liệu, giai đoạn nào tập trung vào việc làm sạch, chuyển đổi và cấu trúc lại dữ liệu thô để chuẩn bị cho phân tích?

  • A. Thu thập dữ liệu (Data Collection)
  • B. Chuẩn bị dữ liệu (Data Preparation)
  • C. Phân tích dữ liệu (Data Analysis)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 2: Loại dữ liệu nào sau đây thường được biểu diễn bằng các giá trị số và có thể thực hiện các phép toán số học (ví dụ: tính trung bình, tổng) một cách có ý nghĩa?

  • A. Dữ liệu định lượng (Quantitative data)
  • B. Dữ liệu định tính (Qualitative data)
  • C. Dữ liệu văn bản (Text data)
  • D. Dữ liệu hình ảnh (Image data)

Câu 3: Kỹ thuật nào trong Khoa học Dữ liệu được sử dụng để nhóm các đối tượng tương tự nhau thành cụm dựa trên các đặc điểm chung của chúng, mà không cần biết trước nhãn nhóm?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Phân cụm (Clustering)
  • D. Dự báo chuỗi thời gian (Time Series Forecasting)

Câu 4: Mục tiêu chính của việc trực quan hóa dữ liệu trong Khoa học Dữ liệu là gì?

  • A. Tăng tốc độ xử lý dữ liệu
  • B. Làm cho dữ liệu dễ hiểu và khám phá thông tin
  • C. Giảm dung lượng lưu trữ dữ liệu
  • D. Tự động hóa quá trình thu thập dữ liệu

Câu 5: Trong bối cảnh Khoa học Dữ liệu, "Big Data" đề cập đến loại dữ liệu nào?

  • A. Dữ liệu có kích thước lớn hơn 1 Gigabyte
  • B. Dữ liệu được lưu trữ trên đám mây
  • C. Dữ liệu được tạo ra bởi các thiết bị IoT
  • D. Dữ liệu có khối lượng lớn, tốc độ cao và đa dạng về loại hình

Câu 6: Ứng dụng nào sau đây thể hiện việc sử dụng Khoa học Dữ liệu để cá nhân hóa trải nghiệm người dùng trong lĩnh vực thương mại điện tử?

  • A. Phần mềm quản lý kho hàng
  • B. Hệ thống thanh toán trực tuyến
  • C. Hệ thống đề xuất sản phẩm
  • D. Công cụ tạo quảng cáo trực tuyến

Câu 7: Đâu là một thách thức đạo đức quan trọng trong Khoa học Dữ liệu liên quan đến việc thu thập và sử dụng thông tin cá nhân?

  • A. Xâm phạm quyền riêng tư và bảo mật dữ liệu
  • B. Tốc độ xử lý dữ liệu chậm
  • C. Thiếu hụt nhân lực có kỹ năng
  • D. Chi phí đầu tư cơ sở hạ tầng cao

Câu 8: Phương pháp học máy nào sau đây thuộc loại "học có giám sát" (Supervised Learning)?

  • A. Phân cụm (Clustering)
  • B. Phân loại (Classification)
  • C. Giảm chiều dữ liệu (Dimensionality Reduction)
  • D. Khai phá luật kết hợp (Association Rule Mining)

Câu 9: Trong phân tích dữ liệu văn bản, kỹ thuật "xử lý ngôn ngữ tự nhiên" (NLP) được sử dụng để làm gì?

  • A. Chuyển đổi văn bản thành hình ảnh
  • B. Mã hóa văn bản để bảo mật
  • C. Nén văn bản để giảm dung lượng
  • D. Phân tích và hiểu ý nghĩa của văn bản

Câu 10: Công cụ nào sau đây thường được sử dụng để thực hiện phân tích thống kê và trực quan hóa dữ liệu trong Khoa học Dữ liệu?

  • A. Adobe Photoshop
  • B. Microsoft Word
  • C. Python
  • D. Microsoft PowerPoint

Câu 11: Giả sử bạn có một tập dữ liệu về thông tin khách hàng và lịch sử mua hàng. Bạn muốn dự đoán khả năng một khách hàng có rời bỏ dịch vụ hay không. Bài toán này thuộc loại nào trong Khoa học Dữ liệu?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Phân cụm (Clustering)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 12: Trong quá trình khám phá dữ liệu (Exploratory Data Analysis - EDA), biểu đồ nào sau đây thường được sử dụng để kiểm tra phân phối của một biến số định lượng?

  • A. Biểu đồ tròn (Pie chart)
  • B. Biểu đồ Histogram (Histogram)
  • C. Biểu đồ đường (Line chart)
  • D. Biểu đồ hộp (Box plot)

Câu 13: Thuật ngữ "feature engineering" trong Khoa học Dữ liệu chỉ hoạt động nào?

  • A. Thu thập dữ liệu từ nhiều nguồn khác nhau
  • B. Làm sạch dữ liệu bị thiếu hoặc nhiễu
  • C. Chọn thuật toán học máy phù hợp nhất
  • D. Chọn lọc và biến đổi các thuộc tính dữ liệu để cải thiện mô hình

Câu 14: Trong Khoa học Dữ liệu, "mô hình hóa dữ liệu" (Data Modeling) có vai trò gì?

  • A. Lưu trữ dữ liệu một cách hiệu quả
  • B. Trực quan hóa dữ liệu để dễ hiểu hơn
  • C. Biểu diễn và khám phá các mối quan hệ trong dữ liệu
  • D. Bảo mật dữ liệu khỏi truy cập trái phép

Câu 15: Một nhà khoa học dữ liệu cần có kỹ năng nào sau đây để giao tiếp hiệu quả kết quả phân tích dữ liệu với những người không chuyên về kỹ thuật?

  • A. Lập trình thành thạo bằng nhiều ngôn ngữ
  • B. Giao tiếp và kể chuyện bằng dữ liệu (Data Storytelling)
  • C. Xây dựng mô hình học máy phức tạp
  • D. Quản lý cơ sở dữ liệu lớn

Câu 16: Trong lĩnh vực y tế, Khoa học Dữ liệu có thể được ứng dụng để làm gì?

  • A. Tự động hóa phẫu thuật
  • B. Sản xuất thuốc mới nhanh hơn
  • C. Đào tạo bác sĩ và y tá
  • D. Dự đoán nguy cơ bệnh tật và cá nhân hóa chăm sóc sức khỏe

Câu 17: Đâu là một ví dụ về ứng dụng của Khoa học Dữ liệu trong lĩnh vực tài chính?

  • A. Phát hiện gian lận giao dịch thẻ tín dụng
  • B. Quản lý chi nhánh ngân hàng
  • C. Thiết kế giao diện người dùng ATM
  • D. In hóa đơn và báo cáo tài chính

Câu 18: Trong quy trình xây dựng mô hình học máy, bước "đánh giá mô hình" (Model Evaluation) nhằm mục đích gì?

  • A. Chọn thuật toán học máy phù hợp
  • B. Chuẩn bị dữ liệu huấn luyện
  • C. Đo lường hiệu suất và độ tin cậy của mô hình
  • D. Triển khai mô hình vào ứng dụng thực tế

Câu 19: "Bias" (thiên vị) trong dữ liệu huấn luyện mô hình học máy có thể dẫn đến hậu quả gì?

  • A. Mô hình chạy chậm hơn
  • B. Mô hình dự đoán không công bằng hoặc không chính xác
  • C. Mô hình khó giải thích hơn
  • D. Mô hình cần nhiều dữ liệu hơn để huấn luyện

Câu 20: Kỹ thuật "giảm chiều dữ liệu" (Dimensionality Reduction) được sử dụng khi dữ liệu có đặc điểm gì?

  • A. Dữ liệu bị thiếu giá trị
  • B. Dữ liệu có nhiều ngoại lệ
  • C. Dữ liệu có quá nhiều thuộc tính (chiều)
  • D. Dữ liệu không có cấu trúc rõ ràng

Câu 21: Trong Khoa học Dữ liệu, "API" (Application Programming Interface) được sử dụng để làm gì?

  • A. Lưu trữ dữ liệu trên đám mây
  • B. Trực quan hóa dữ liệu trên web
  • C. Bảo mật dữ liệu truyền qua mạng
  • D. Kết nối và trao đổi dữ liệu giữa các ứng dụng

Câu 22: Giả sử bạn muốn phân tích cảm xúc của khách hàng từ các bình luận trực tuyến về sản phẩm. Kỹ thuật nào của Khoa học Dữ liệu sẽ phù hợp nhất?

  • A. Phân tích hồi quy (Regression Analysis)
  • B. Phân tích cảm xúc (Sentiment Analysis)
  • C. Phân tích chuỗi thời gian (Time Series Analysis)
  • D. Phân tích phương sai (ANOVA)

Câu 23: "Overfitting" (quá khớp) là một vấn đề thường gặp trong học máy. Nó xảy ra khi nào?

  • A. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu mới
  • B. Mô hình học quá chậm trên dữ liệu lớn
  • C. Mô hình không thể học được từ dữ liệu huấn luyện
  • D. Mô hình cần quá nhiều tài nguyên tính toán

Câu 24: Để đánh giá hiệu suất của một mô hình phân loại nhị phân (binary classification), chỉ số nào sau đây thường được sử dụng?

  • A. Độ lệch chuẩn (Standard Deviation)
  • B. Giá trị trung bình (Mean)
  • C. Độ chính xác (Accuracy) và Độ thu hồi (Recall)
  • D. Phương sai (Variance)

Câu 25: Trong Khoa học Dữ liệu, "dữ liệu có cấu trúc" (structured data) khác với "dữ liệu phi cấu trúc" (unstructured data) như thế nào?

  • A. Dữ liệu có cấu trúc luôn lớn hơn dữ liệu phi cấu trúc
  • B. Dữ liệu có cấu trúc được tổ chức theo định dạng rõ ràng, dữ liệu phi cấu trúc thì không
  • C. Dữ liệu có cấu trúc chỉ chứa số, dữ liệu phi cấu trúc chứa văn bản
  • D. Dữ liệu có cấu trúc dễ bị mất hơn dữ liệu phi cấu trúc

Câu 26: Ứng dụng nào sau đây của Khoa học Dữ liệu giúp cải thiện hiệu quả hoạt động trong lĩnh vực logistics và vận tải?

  • A. Dự báo thời tiết
  • B. Quản lý nhân sự
  • C. Tối ưu hóa lộ trình vận chuyển và giao hàng
  • D. Chăm sóc khách hàng tự động

Câu 27: Trong Khoa học Dữ liệu, "metadata" (siêu dữ liệu) là gì?

  • A. Dữ liệu mô tả dữ liệu khác
  • B. Dữ liệu đã được mã hóa
  • C. Dữ liệu đã được trực quan hóa
  • D. Dữ liệu đã được làm sạch

Câu 28: Một nhà khoa học dữ liệu thường sử dụng quy trình làm việc nào để giải quyết một vấn đề?

  • A. Lập trình → Kiểm thử → Triển khai → Bảo trì
  • B. Xác định vấn đề → Thu thập → Chuẩn bị → Phân tích → Mô hình hóa → Đánh giá → Truyền đạt
  • C. Thiết kế → Xây dựng → Kiểm thử → Phát hành
  • D. Nghiên cứu → Thử nghiệm → Đánh giá → Kết luận

Câu 29: Công cụ nào sau đây thường được sử dụng để quản lý và truy vấn dữ liệu lớn trong môi trường Big Data?

  • A. Microsoft Excel
  • B. Microsoft Access
  • C. SPSS Modeler
  • D. Hadoop và Spark

Câu 30: Trong Khoa học Dữ liệu, "dashboard" (bảng điều khiển) được sử dụng để làm gì?

  • A. Làm sạch và chuẩn bị dữ liệu
  • B. Xây dựng mô hình học máy
  • C. Hiển thị trực quan các chỉ số và thông tin quan trọng
  • D. Thu thập dữ liệu từ nhiều nguồn khác nhau

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 1: Trong quy trình Khoa học Dữ liệu, giai đoạn nào tập trung vào việc làm sạch, chuyển đổi và cấu trúc lại dữ liệu thô để chuẩn bị cho phân tích?

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 2: Loại dữ liệu nào sau đây thường được biểu diễn bằng các giá trị số và có thể thực hiện các phép toán số học (ví dụ: tính trung bình, tổng) một cách có ý nghĩa?

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 3: Kỹ thuật nào trong Khoa học Dữ liệu được sử dụng để nhóm các đối tượng tương tự nhau thành cụm dựa trên các đặc điểm chung của chúng, mà không cần biết trước nhãn nhóm?

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 4: Mục tiêu chính của việc trực quan hóa dữ liệu trong Khoa học Dữ liệu là gì?

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 5: Trong bối cảnh Khoa học Dữ liệu, 'Big Data' đề cập đến loại dữ liệu nào?

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 6: Ứng dụng nào sau đây thể hiện việc sử dụng Khoa học Dữ liệu để cá nhân hóa trải nghiệm người dùng trong lĩnh vực thương mại điện tử?

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 7: Đâu là một thách thức đạo đức quan trọng trong Khoa học Dữ liệu liên quan đến việc thu thập và sử dụng thông tin cá nhân?

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 8: Phương pháp học máy nào sau đây thuộc loại 'học có giám sát' (Supervised Learning)?

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 9: Trong phân tích dữ liệu văn bản, kỹ thuật 'xử lý ngôn ngữ tự nhiên' (NLP) được sử dụng để làm gì?

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 10: Công cụ nào sau đây thường được sử dụng để thực hiện phân tích thống kê và trực quan hóa dữ liệu trong Khoa học Dữ liệu?

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 11: Giả sử bạn có một tập dữ liệu về thông tin khách hàng và lịch sử mua hàng. Bạn muốn dự đoán khả năng một khách hàng có rời bỏ dịch vụ hay không. Bài toán này thuộc loại nào trong Khoa học Dữ liệu?

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 12: Trong quá trình khám phá dữ liệu (Exploratory Data Analysis - EDA), biểu đồ nào sau đây thường được sử dụng để kiểm tra phân phối của một biến số định lượng?

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 13: Thuật ngữ 'feature engineering' trong Khoa học Dữ liệu chỉ hoạt động nào?

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 14: Trong Khoa học Dữ liệu, 'mô hình hóa dữ liệu' (Data Modeling) có vai trò gì?

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 15: Một nhà khoa học dữ liệu cần có kỹ năng nào sau đây để giao tiếp hiệu quả kết quả phân tích dữ liệu với những người không chuyên về kỹ thuật?

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 16: Trong lĩnh vực y tế, Khoa học Dữ liệu có thể được ứng dụng để làm gì?

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 17: Đâu là một ví dụ về ứng dụng của Khoa học Dữ liệu trong lĩnh vực tài chính?

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 18: Trong quy trình xây dựng mô hình học máy, bước 'đánh giá mô hình' (Model Evaluation) nhằm mục đích gì?

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 19: 'Bias' (thiên vị) trong dữ liệu huấn luyện mô hình học máy có thể dẫn đến hậu quả gì?

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 20: Kỹ thuật 'giảm chiều dữ liệu' (Dimensionality Reduction) được sử dụng khi dữ liệu có đặc điểm gì?

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 21: Trong Khoa học Dữ liệu, 'API' (Application Programming Interface) được sử dụng để làm gì?

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 22: Giả sử bạn muốn phân tích cảm xúc của khách hàng từ các bình luận trực tuyến về sản phẩm. Kỹ thuật nào của Khoa học Dữ liệu sẽ phù hợp nhất?

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 23: 'Overfitting' (quá khớp) là một vấn đề thường gặp trong học máy. Nó xảy ra khi nào?

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 24: Để đánh giá hiệu suất của một mô hình phân loại nhị phân (binary classification), chỉ số nào sau đây thường được sử dụng?

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 25: Trong Khoa học Dữ liệu, 'dữ liệu có cấu trúc' (structured data) khác với 'dữ liệu phi cấu trúc' (unstructured data) như thế nào?

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 26: Ứng dụng nào sau đây của Khoa học Dữ liệu giúp cải thiện hiệu quả hoạt động trong lĩnh vực logistics và vận tải?

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 27: Trong Khoa học Dữ liệu, 'metadata' (siêu dữ liệu) là gì?

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 28: Một nhà khoa học dữ liệu thường sử dụng quy trình làm việc nào để giải quyết một vấn đề?

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 29: Công cụ nào sau đây thường được sử dụng để quản lý và truy vấn dữ liệu lớn trong môi trường Big Data?

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 2

Câu 30: Trong Khoa học Dữ liệu, 'dashboard' (bảng điều khiển) được sử dụng để làm gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 03

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 03 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Khoa học dữ liệu được mô tả là sự kết hợp của nhiều lĩnh vực. Yếu tố cốt lõi nào dưới đây giải thích tại sao Khoa học dữ liệu cần tích hợp kiến thức từ Thống kê và Toán học?

  • A. Để xây dựng giao diện người dùng thân thiện cho các ứng dụng dữ liệu lớn.
  • B. Để quản lý cơ sở dữ liệu phân tán và tối ưu hóa truy vấn.
  • C. Để phân tích dữ liệu, hiểu các mẫu, xu hướng và xây dựng mô hình dự đoán dựa trên xác suất.
  • D. Để viết mã nguồn hiệu quả cho các thuật toán học máy.

Câu 2: Một cửa hàng bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để đưa ra các chương trình khuyến mãi phù hợp. Họ có dữ liệu về lịch sử mua hàng của từng khách hàng. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất để phân tích dữ liệu này nhằm nhóm các khách hàng có hành vi tương tự lại với nhau?

  • A. Phân tích hồi quy (Regression Analysis)
  • B. Gom cụm (Clustering)
  • C. Phân loại (Classification)
  • D. Khai phá luật kết hợp (Association Rule Mining)

Câu 3: Giai đoạn quan trọng nhất trong quy trình Khoa học dữ liệu thường được coi là làm sạch và chuẩn bị dữ liệu. Tại sao giai đoạn này lại quan trọng đến vậy?

  • A. Vì nó giúp trực quan hóa dữ liệu một cách nhanh chóng.
  • B. Vì nó là bước cuối cùng trước khi đưa ra quyết định kinh doanh.
  • C. Vì nó cho phép xây dựng mô hình mà không cần bất kỳ dữ liệu nào.
  • D. Vì chất lượng dữ liệu đầu vào ảnh hưởng trực tiếp đến độ chính xác và độ tin cậy của kết quả phân tích và mô hình.

Câu 4: Một công ty bảo hiểm muốn xây dựng mô hình để dự đoán khả năng một khách hàng sẽ yêu cầu bồi thường trong năm tới dựa trên các thông tin như tuổi, nghề nghiệp, lịch sử yêu cầu bồi thường trước đó, v.v. Đây là dạng bài toán Khoa học dữ liệu nào?

  • A. Bài toán Phân loại (Classification)
  • B. Bài toán Gom cụm (Clustering)
  • C. Bài toán Giảm chiều dữ liệu (Dimensionality Reduction)
  • D. Bài toán Khai phá luật kết hợp (Association Rule Mining)

Câu 5: Việc trực quan hóa dữ liệu (Data Visualization) đóng vai trò gì trong Khoa học dữ liệu?

  • A. Chỉ dùng để làm cho báo cáo trông đẹp mắt hơn.
  • B. Là bước duy nhất để xây dựng mô hình dự đoán.
  • C. Giúp con người dễ dàng khám phá các mẫu, xu hướng, ngoại lệ và hiểu thông tin từ dữ liệu phức tạp.
  • D. Là phương pháp chính để thu thập dữ liệu ban đầu.

Câu 6: Một nhà khoa học dữ liệu đang phân tích một tập dữ liệu khổng lồ về các giao dịch trực tuyến để phát hiện các giao dịch có dấu hiệu gian lận. Kỹ thuật nào sau đây có khả năng được sử dụng hiệu quả nhất cho mục đích này?

  • A. Phân tích hồi quy tuyến tính (Linear Regression)
  • B. Gom cụm K-Means (K-Means Clustering)
  • C. Phân tích thành phần chính (Principal Component Analysis - PCA)
  • D. Phát hiện ngoại lệ (Outlier Detection)

Câu 7: Một trong những ứng dụng phổ biến của Khoa học dữ liệu trong lĩnh vực y tế là hỗ trợ chẩn đoán bệnh. Điều này thường được thực hiện bằng cách nào?

  • A. Sử dụng các mô hình học máy để phân tích hình ảnh y khoa (như X-quang, MRI) hoặc dữ liệu bệnh sử của bệnh nhân.
  • B. Thu thập ý kiến của các bác sĩ chuyên khoa thông qua khảo sát trực tuyến.
  • C. Tìm kiếm thông tin về triệu chứng bệnh trên các trang web y tế công cộng.
  • D. Thực hiện các xét nghiệm máu thủ công và so sánh kết quả với giá trị tham chiếu.

Câu 8: Khi một hệ thống đề xuất phim dựa trên lịch sử xem của bạn trên một nền tảng trực tuyến (ví dụ: Netflix), hệ thống đó đang ứng dụng kỹ thuật Khoa học dữ liệu nào?

  • A. Phân tích chuỗi thời gian (Time Series Analysis)
  • B. Phát hiện ngoại lệ (Outlier Detection)
  • C. Hệ thống đề xuất (Recommender Systems)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 9: Công ty X thu thập dữ liệu về nhiệt độ hàng ngày và doanh số bán kem trong suốt một năm. Họ muốn xây dựng mô hình để dự đoán doanh số bán kem dựa trên nhiệt độ ngày hôm đó. Đây là dạng bài toán Khoa học dữ liệu nào?

  • A. Bài toán Hồi quy (Regression)
  • B. Bài toán Phân loại (Classification)
  • C. Bài toán Gom cụm (Clustering)
  • D. Bài toán Khai phá luật kết hợp (Association Rule Mining)

Câu 10: Giả sử bạn có một tập dữ liệu về các email và muốn phân loại chúng thành "Thư rác" (Spam) hoặc "Không phải thư rác" (Not Spam). Đây là một ví dụ điển hình của bài toán Khoa học dữ liệu sử dụng phương pháp học có giám sát (Supervised Learning). Tại sao lại là học có giám sát?

  • A. Vì dữ liệu email rất lớn và phức tạp.
  • B. Vì dữ liệu huấn luyện đã được gán nhãn (mỗi email được đánh dấu là Spam hoặc Not Spam).
  • C. Vì mục tiêu là tìm ra các nhóm email tương tự nhau.
  • D. Vì cần giảm số lượng từ trong mỗi email để phân tích.

Câu 11: Khai phá luật kết hợp (Association Rule Mining) là kỹ thuật thường được sử dụng để tìm ra các mối quan hệ dạng "Nếu A xảy ra thì B có khả năng cao xảy ra". Ứng dụng phổ biến nhất của kỹ thuật này là gì?

  • A. Dự đoán giá cổ phiếu trong tương lai.
  • B. Nhận dạng khuôn mặt trên ảnh.
  • C. Phân nhóm các tài liệu văn bản theo chủ đề.
  • D. Phân tích giỏ hàng mua sắm (Market Basket Analysis) để đề xuất sản phẩm.

Câu 12: Một công ty muốn tối ưu hóa chiến dịch quảng cáo trực tuyến của mình bằng cách nhắm mục tiêu đến đúng đối tượng khách hàng tiềm năng. Dữ liệu nào sau đây là hữu ích nhất cho mục đích này trong Khoa học dữ liệu?

  • A. Dữ liệu về số lượng nhân viên của công ty.
  • B. Dữ liệu về thời tiết của các thành phố khác nhau.
  • C. Dữ liệu về hành vi lướt web, lịch sử mua sắm, thông tin nhân khẩu học của người dùng.
  • D. Dữ liệu về chi phí sản xuất của các sản phẩm.

Câu 13: Trong bối cảnh Khoa học dữ liệu, "Big Data" (Dữ liệu lớn) đề cập đến các tập dữ liệu có đặc điểm nào?

  • A. Chỉ là dữ liệu có kích thước rất lớn.
  • B. Chỉ là dữ liệu có cấu trúc phức tạp.
  • C. Chỉ là dữ liệu được tạo ra với tốc độ nhanh.
  • D. Có khối lượng (Volume) lớn, đa dạng về loại (Variety), được tạo ra với tốc độ nhanh (Velocity) và đòi hỏi các công nghệ đặc biệt để xử lý và phân tích (Value/Veracity).

Câu 14: Một nhà khoa học dữ liệu đã xây dựng mô hình để dự đoán giá nhà. Sau khi huấn luyện mô hình, họ cần đánh giá xem mô hình có hoạt động tốt hay không. Tiêu chí nào sau đây thường được sử dụng để đánh giá hiệu quả của mô hình hồi quy (Regression Model)?

  • A. Độ chính xác (Accuracy)
  • B. Sai số trung bình bình phương (Mean Squared Error - MSE)
  • C. Độ phủ (Coverage)
  • D. Tỷ lệ nhấp (Click-through Rate - CTR)

Câu 15: Việc giảm chiều dữ liệu (Dimensionality Reduction) trong Khoa học dữ liệu có mục đích chính là gì?

  • A. Giảm số lượng biến (đặc trưng) trong tập dữ liệu trong khi vẫn giữ lại phần lớn thông tin quan trọng, giúp mô hình hoạt động nhanh hơn và tránh quá khớp.
  • B. Tăng số lượng bản ghi (quan sát) trong tập dữ liệu.
  • C. Chỉ áp dụng cho dữ liệu văn bản.
  • D. Biến đổi dữ liệu thành dạng âm thanh.

Câu 16: Một công ty sản xuất muốn dự đoán khi nào một thiết bị trong dây chuyền sản xuất có khả năng bị hỏng để thực hiện bảo trì phòng ngừa. Họ có dữ liệu về lịch sử hoạt động, nhiệt độ, độ rung, v.v., của thiết bị. Đây là ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

  • A. Tài chính cá nhân.
  • B. Quản lý nhân sự.
  • C. Bảo trì dự đoán (Predictive Maintenance).
  • D. Phân tích cảm xúc khách hàng.

Câu 17: Trong Khoa học dữ liệu, thuật ngữ "mô hình" (model) thường đề cập đến điều gì?

  • A. Một bản sao vật lý của dữ liệu.
  • B. Một sự trừu tượng hóa hoặc công thức toán học được xây dựng từ dữ liệu để mô tả mối quan hệ, dự đoán hoặc phân loại.
  • C. Một biểu đồ hoặc đồ thị để trực quan hóa dữ liệu.
  • D. Phần mềm được sử dụng để thu thập dữ liệu.

Câu 18: Hệ thống gợi ý sản phẩm "Những khách hàng mua X cũng mua Y" trên các trang thương mại điện tử là một ví dụ kinh điển của ứng dụng Khoa học dữ liệu. Kỹ thuật cụ thể nào thường được sử dụng để xây dựng hệ thống này?

  • A. Khai phá luật kết hợp (Association Rule Mining).
  • B. Phân tích thành phần chính (PCA).
  • C. Hồi quy logistic (Logistic Regression).
  • D. Gom cụm phân cấp (Hierarchical Clustering).

Câu 19: Đâu là một thách thức đáng kể khi làm việc với "Big Data" trong Khoa học dữ liệu?

  • A. Dữ liệu luôn có cấu trúc hoàn hảo và sạch sẽ.
  • B. Dễ dàng lưu trữ và xử lý trên một máy tính cá nhân thông thường.
  • C. Không cần quan tâm đến quyền riêng tư và bảo mật dữ liệu.
  • D. Cần có hạ tầng công nghệ và thuật toán chuyên biệt để lưu trữ, xử lý và phân tích hiệu quả.

Câu 20: Một nhà khoa học dữ liệu sau khi xây dựng xong mô hình cần trình bày kết quả và những phát hiện của mình cho các nhà quản lý không chuyên về kỹ thuật. Kỹ năng nào là quan trọng nhất trong tình huống này?

  • A. Khả năng viết mã C++ hiệu suất cao.
  • B. Khả năng giao tiếp và kể chuyện bằng dữ liệu (Data Storytelling), sử dụng trực quan hóa để giải thích kết quả phức tạp một cách đơn giản.
  • C. Khả năng cài đặt hệ điều hành máy chủ.
  • D. Khả năng thiết kế giao diện người dùng (UI Design).

Câu 21: Phân tích cảm xúc (Sentiment Analysis) là một ứng dụng của Khoa học dữ liệu trong việc xử lý dữ liệu văn bản. Mục đích chính của Phân tích cảm xúc là gì?

  • A. Tự động dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.
  • B. Tóm tắt nội dung chính của một tài liệu dài.
  • C. Xác định thái độ (tích cực, tiêu cực, trung lập) được thể hiện trong văn bản (ví dụ: đánh giá sản phẩm, bình luận trên mạng xã hội).
  • D. Kiểm tra ngữ pháp và chính tả của văn bản.

Câu 22: Khi một ngân hàng sử dụng dữ liệu về lịch sử tín dụng, thu nhập, và các thông tin khác của khách hàng để quyết định có cho vay hay không, họ đang áp dụng Khoa học dữ liệu để giải quyết bài toán gì?

  • A. Đánh giá rủi ro tín dụng (Credit Risk Assessment).
  • B. Dự báo thời tiết.
  • C. Quản lý chuỗi cung ứng.
  • D. Thiết kế kiến trúc tòa nhà.

Câu 23: Python và R là hai ngôn ngữ lập trình phổ biến nhất được sử dụng trong Khoa học dữ liệu. Tại sao chúng lại được ưa chuộng?

  • A. Vì chúng là những ngôn ngữ lập trình lâu đời nhất.
  • B. Vì chúng chỉ có thể chạy trên các siêu máy tính.
  • C. Vì chúng được thiết kế đặc biệt chỉ để xây dựng trang web.
  • D. Vì chúng có hệ sinh thái thư viện phong phú (ví dụ: Pandas, NumPy, Scikit-learn, ggplot2) hỗ trợ mạnh mẽ cho việc xử lý, phân tích dữ liệu và xây dựng mô hình học máy.

Câu 24: Mục tiêu của việc xây dựng mô hình dự đoán trong Khoa học dữ liệu là gì?

  • A. Chỉ để mô tả dữ liệu đã có.
  • B. Sử dụng dữ liệu hiện tại hoặc quá khứ để ước tính hoặc dự báo giá trị/sự kiện trong tương lai.
  • C. Tự động tạo ra dữ liệu mới hoàn toàn ngẫu nhiên.
  • D. Tìm kiếm thông tin trên internet.

Câu 25: Phân biệt giữa học có giám sát (Supervised Learning) và học không giám sát (Unsupervised Learning) trong Khoa học dữ liệu dựa trên yếu tố nào?

  • A. Tốc độ xử lý dữ liệu.
  • B. Kích thước của tập dữ liệu.
  • C. Việc dữ liệu huấn luyện có được gán nhãn (có biến mục tiêu) hay không.
  • D. Ngôn ngữ lập trình được sử dụng.

Câu 26: Một nhà khoa học dữ liệu đang làm việc với dữ liệu về hành trình di chuyển của các phương tiện trong một thành phố để tối ưu hóa luồng giao thông. Đây là ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

  • A. Nghiên cứu sinh học.
  • B. Phân tích văn học.
  • C. Thiết kế thời trang.
  • D. Thành phố thông minh và giao thông vận tải.

Câu 27: Biểu đồ tán xạ (Scatter Plot) thường được sử dụng trong Khoa học dữ liệu để trực quan hóa mối quan hệ giữa hai biến định lượng. Nếu các điểm trên biểu đồ tán xạ có xu hướng tạo thành một đường thẳng dốc lên, điều này gợi ý điều gì về mối quan hệ giữa hai biến?

  • A. Có mối tương quan dương giữa hai biến (khi biến này tăng, biến kia cũng có xu hướng tăng).
  • B. Có mối tương quan âm giữa hai biến (khi biến này tăng, biến kia có xu hướng giảm).
  • C. Không có mối quan hệ rõ ràng giữa hai biến.
  • D. Một biến là phân loại, biến kia là định lượng.

Câu 28: Khía cạnh đạo đức nào là quan trọng nhất cần xem xét khi áp dụng Khoa học dữ liệu, đặc biệt là với dữ liệu cá nhân của người dùng?

  • A. Đảm bảo mô hình luôn đạt độ chính xác 100%.
  • B. Bảo vệ quyền riêng tư, tránh phân biệt đối xử và đảm bảo tính minh bạch trong cách dữ liệu được sử dụng.
  • C. Chỉ sử dụng các thuật toán học máy phức tạp.
  • D. Thu thập càng nhiều dữ liệu càng tốt mà không cần sự đồng ý.

Câu 29: Một công ty muốn phân tích dữ liệu bán hàng của họ trong 5 năm qua để xác định xu hướng theo mùa và dự báo doanh số cho quý tiếp theo. Kỹ thuật phân tích nào phù hợp nhất cho loại dữ liệu này?

  • A. Phân tích hình ảnh (Image Analysis).
  • B. Phân tích mạng xã hội (Social Network Analysis).
  • C. Phân tích chuỗi thời gian (Time Series Analysis).
  • D. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP).

Câu 30: Đâu KHÔNG phải là một giai đoạn điển hình trong quy trình Khoa học dữ liệu?

  • A. Thu thập và hiểu dữ liệu (Data Collection and Understanding).
  • B. Làm sạch và chuẩn bị dữ liệu (Data Cleaning and Preparation).
  • C. Xây dựng và đánh giá mô hình (Model Building and Evaluation).
  • D. Thiết kế phần cứng máy tính (Computer Hardware Design).

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 1: Khoa học dữ liệu được mô tả là sự kết hợp của nhiều lĩnh vực. Yếu tố cốt lõi nào dưới đây *giải thích tại sao* Khoa học dữ liệu cần tích hợp kiến thức từ Thống kê và Toán học?

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 2: Một cửa hàng bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để đưa ra các chương trình khuyến mãi phù hợp. Họ có dữ liệu về lịch sử mua hàng của từng khách hàng. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất để phân tích dữ liệu này nhằm nhóm các khách hàng có hành vi tương tự lại với nhau?

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 3: Giai đoạn quan trọng nhất trong quy trình Khoa học dữ liệu thường được coi là làm sạch và chuẩn bị dữ liệu. Tại sao giai đoạn này lại quan trọng đến vậy?

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 4: Một công ty bảo hiểm muốn xây dựng mô hình để dự đoán khả năng một khách hàng sẽ yêu cầu bồi thường trong năm tới dựa trên các thông tin như tuổi, nghề nghiệp, lịch sử yêu cầu bồi thường trước đó, v.v. Đây là dạng bài toán Khoa học dữ liệu nào?

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 5: Việc trực quan hóa dữ liệu (Data Visualization) đóng vai trò gì trong Khoa học dữ liệu?

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 6: Một nhà khoa học dữ liệu đang phân tích một tập dữ liệu khổng lồ về các giao dịch trực tuyến để phát hiện các giao dịch có dấu hiệu gian lận. Kỹ thuật nào sau đây có khả năng được sử dụng hiệu quả nhất cho mục đích này?

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 7: Một trong những ứng dụng phổ biến của Khoa học dữ liệu trong lĩnh vực y tế là hỗ trợ chẩn đoán bệnh. Điều này thường được thực hiện bằng cách nào?

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 8: Khi một hệ thống đề xuất phim dựa trên lịch sử xem của bạn trên một nền tảng trực tuyến (ví dụ: Netflix), hệ thống đó đang ứng dụng kỹ thuật Khoa học dữ liệu nào?

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 9: Công ty X thu thập dữ liệu về nhiệt độ hàng ngày và doanh số bán kem trong suốt một năm. Họ muốn xây dựng mô hình để dự đoán doanh số bán kem dựa trên nhiệt độ ngày hôm đó. Đây là dạng bài toán Khoa học dữ liệu nào?

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 10: Giả sử bạn có một tập dữ liệu về các email và muốn phân loại chúng thành 'Thư rác' (Spam) hoặc 'Không phải thư rác' (Not Spam). Đây là một ví dụ điển hình của bài toán Khoa học dữ liệu sử dụng phương pháp học có giám sát (Supervised Learning). Tại sao lại là học có giám sát?

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 11: Khai phá luật kết hợp (Association Rule Mining) là kỹ thuật thường được sử dụng để tìm ra các mối quan hệ dạng 'Nếu A xảy ra thì B có khả năng cao xảy ra'. Ứng dụng phổ biến nhất của kỹ thuật này là gì?

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 12: Một công ty muốn tối ưu hóa chiến dịch quảng cáo trực tuyến của mình bằng cách nhắm mục tiêu đến đúng đối tượng khách hàng tiềm năng. Dữ liệu nào sau đây là hữu ích nhất cho mục đích này trong Khoa học dữ liệu?

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 13: Trong bối cảnh Khoa học dữ liệu, 'Big Data' (Dữ liệu lớn) đề cập đến các tập dữ liệu có đặc điểm nào?

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 14: Một nhà khoa học dữ liệu đã xây dựng mô hình để dự đoán giá nhà. Sau khi huấn luyện mô hình, họ cần đánh giá xem mô hình có hoạt động tốt hay không. Tiêu chí nào sau đây thường được sử dụng để đánh giá hiệu quả của mô hình hồi quy (Regression Model)?

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 15: Việc giảm chiều dữ liệu (Dimensionality Reduction) trong Khoa học dữ liệu có mục đích chính là gì?

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 16: Một công ty sản xuất muốn dự đoán khi nào một thiết bị trong dây chuyền sản xuất có khả năng bị hỏng để thực hiện bảo trì phòng ngừa. Họ có dữ liệu về lịch sử hoạt động, nhiệt độ, độ rung, v.v., của thiết bị. Đây là ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 17: Trong Khoa học dữ liệu, thuật ngữ 'mô hình' (model) thường đề cập đến điều gì?

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 18: Hệ thống gợi ý sản phẩm 'Những khách hàng mua X cũng mua Y' trên các trang thương mại điện tử là một ví dụ kinh điển của ứng dụng Khoa học dữ liệu. Kỹ thuật cụ thể nào thường được sử dụng để xây dựng hệ thống này?

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 19: Đâu là một thách thức đáng kể khi làm việc với 'Big Data' trong Khoa học dữ liệu?

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 20: Một nhà khoa học dữ liệu sau khi xây dựng xong mô hình cần trình bày kết quả và những phát hiện của mình cho các nhà quản lý không chuyên về kỹ thuật. Kỹ năng nào là quan trọng nhất trong tình huống này?

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 21: Phân tích cảm xúc (Sentiment Analysis) là một ứng dụng của Khoa học dữ liệu trong việc xử lý dữ liệu văn bản. Mục đích chính của Phân tích cảm xúc là gì?

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 22: Khi một ngân hàng sử dụng dữ liệu về lịch sử tín dụng, thu nhập, và các thông tin khác của khách hàng để quyết định có cho vay hay không, họ đang áp dụng Khoa học dữ liệu để giải quyết bài toán gì?

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 23: Python và R là hai ngôn ngữ lập trình phổ biến nhất được sử dụng trong Khoa học dữ liệu. Tại sao chúng lại được ưa chuộng?

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 24: Mục tiêu của việc xây dựng mô hình dự đoán trong Khoa học dữ liệu là gì?

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 25: Phân biệt giữa học có giám sát (Supervised Learning) và học không giám sát (Unsupervised Learning) trong Khoa học dữ liệu dựa trên yếu tố nào?

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 26: Một nhà khoa học dữ liệu đang làm việc với dữ liệu về hành trình di chuyển của các phương tiện trong một thành phố để tối ưu hóa luồng giao thông. Đây là ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 27: Biểu đồ tán xạ (Scatter Plot) thường được sử dụng trong Khoa học dữ liệu để trực quan hóa mối quan hệ giữa hai biến định lượng. Nếu các điểm trên biểu đồ tán xạ có xu hướng tạo thành một đường thẳng dốc lên, điều này gợi ý điều gì về mối quan hệ giữa hai biến?

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 28: Khía cạnh đạo đức nào là quan trọng nhất cần xem xét khi áp dụng Khoa học dữ liệu, đặc biệt là với dữ liệu cá nhân của người dùng?

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 29: Một công ty muốn phân tích dữ liệu bán hàng của họ trong 5 năm qua để xác định xu hướng theo mùa và dự báo doanh số cho quý tiếp theo. Kỹ thuật phân tích nào phù hợp nhất cho loại dữ liệu này?

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 3

Câu 30: Đâu KHÔNG phải là một giai đoạn điển hình trong quy trình Khoa học dữ liệu?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 04

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 04 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu tích hợp kiến thức và kỹ thuật từ nhiều lĩnh vực khác nhau. Lĩnh vực nào sau đây không phải là một trụ cột cốt lõi thường được kết hợp trong Khoa học dữ liệu?

  • A. Toán học và Thống kê
  • B. Khoa học máy tính và Trí tuệ nhân tạo
  • C. Kiến thức chuyên môn về lĩnh vực ứng dụng (ví dụ: y tế, kinh doanh)
  • D. Nghệ thuật điêu khắc

Câu 2: Mục tiêu chính của Khoa học dữ liệu là chuyển đổi dữ liệu thô thành thông tin và tri thức có giá trị. Quá trình này nhằm phục vụ mục đích cuối cùng nào?

  • A. Chỉ để tạo ra các báo cáo phức tạp
  • B. Lưu trữ dữ liệu trên máy tính
  • C. Hỗ trợ con người đưa ra quyết định hiệu quả và sáng suốt hơn
  • D. Thay thế hoàn toàn công việc của con người

Câu 3: Trong quy trình Khoa học dữ liệu, giai đoạn nào bao gồm việc thu thập dữ liệu từ các nguồn khác nhau, xử lý các giá trị thiếu, loại bỏ nhiễu và định dạng lại dữ liệu để chuẩn bị cho phân tích?

  • A. Xây dựng mô hình
  • B. Thu thập, khám phá và làm sạch dữ liệu
  • C. Trực quan hóa kết quả
  • D. Đưa ra quyết định

Câu 4: Một công ty bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để cải thiện chiến lược marketing. Họ sử dụng Khoa học dữ liệu để phân tích dữ liệu giao dịch và nhận thấy rằng khách hàng thường mua sản phẩm A và B cùng lúc. Kỹ thuật Khoa học dữ liệu nào có khả năng đã được sử dụng để phát hiện mối liên hệ này?

  • A. Gom cụm (Clustering)
  • B. Phát hiện ngoại lệ (Anomaly Detection)
  • C. Khai phá luật kết hợp (Association Rule Mining)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 5: Kỹ thuật "Gom cụm" (Clustering) trong Khoa học dữ liệu được sử dụng để làm gì?

  • A. Phân chia tập dữ liệu thành các nhóm (cụm) sao cho các đối tượng trong cùng một nhóm tương tự nhau hơn các đối tượng ở nhóm khác
  • B. Dự đoán một giá trị số dựa trên các dữ liệu đầu vào
  • C. Xác định các điểm dữ liệu bất thường hoặc khác biệt đáng kể
  • D. Tìm ra mối quan hệ "nếu-thì" giữa các mục dữ liệu

Câu 6: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích các giao dịch thẻ tín dụng nhằm phát hiện hoạt động gian lận. Họ tìm kiếm các giao dịch có hành vi bất thường so với lịch sử chi tiêu thông thường của khách hàng. Kỹ thuật nào phù hợp nhất cho ứng dụng này?

  • A. Khai phá luật kết hợp
  • B. Gom cụm
  • C. Giảm chiều dữ liệu
  • D. Phát hiện ngoại lệ (Anomaly Detection)

Câu 7: Trực quan hóa dữ liệu (Data Visualization) đóng vai trò quan trọng trong Khoa học dữ liệu. Mục đích chính của việc trực quan hóa dữ liệu là gì?

  • A. Chỉ để làm cho dữ liệu trông đẹp mắt hơn trong báo cáo
  • B. Giúp con người dễ dàng khám phá, hiểu và truyền đạt các mẫu hình, xu hướng và thông tin chi tiết từ dữ liệu
  • C. Thay thế hoàn toàn nhu cầu phân tích thống kê
  • D. Tự động thu thập thêm dữ liệu

Câu 8: Ứng dụng nào sau đây là ví dụ điển hình về việc sử dụng Khoa học dữ liệu để "cá nhân hóa dịch vụ"?

  • A. Phân tích doanh số bán hàng theo quý
  • B. Kiểm tra chất lượng sản phẩm trên dây chuyền lắp ráp
  • C. Hệ thống đề xuất phim/video dựa trên lịch sử xem của người dùng trên các nền tảng giải trí
  • D. Tính toán lương cho nhân viên

Câu 9: Khoa học dữ liệu có nhiều ứng dụng trong lĩnh vực y tế. Ứng dụng nào sau đây thể hiện rõ ràng việc sử dụng Khoa học dữ liệu để hỗ trợ chẩn đoán và điều trị?

  • A. Phân tích hình ảnh y khoa (như X-quang, MRI) bằng các thuật toán học máy để phát hiện dấu hiệu bệnh sớm hơn hoặc chính xác hơn
  • B. Quản lý hồ sơ bệnh án giấy
  • C. Sắp xếp lịch trực cho bác sĩ
  • D. Thiết kế nội thất bệnh viện

Câu 10: Thành tựu nào sau đây là kết quả trực tiếp của việc áp dụng Khoa học dữ liệu trong kinh doanh?

  • A. Giảm giá thành sản xuất nguyên vật liệu
  • B. Nâng cao năng lực ra quyết định dựa trên dữ liệu, giúp tối ưu hóa chiến lược kinh doanh và vận hành
  • C. Tuyển dụng số lượng lớn nhân viên
  • D. Xây dựng thêm nhiều chi nhánh mới

Câu 11: Công cụ hoặc ngôn ngữ lập trình nào sau đây thường được sử dụng rộng rãi trong Khoa học dữ liệu để phân tích, xử lý và xây dựng mô hình từ dữ liệu?

  • A. Microsoft Word
  • B. Adobe Photoshop
  • C. Python hoặc R
  • D. AutoCAD

Câu 12: Tại sao kiến thức về Thống kê lại cần thiết đối với một nhà Khoa học dữ liệu?

  • A. Thống kê giúp thiết kế giao diện người dùng tốt hơn.
  • B. Thống kê giúp viết code nhanh hơn.
  • C. Thống kê chỉ liên quan đến việc đếm số lượng đơn giản.
  • D. Thống kê cung cấp nền tảng lý thuyết và các phương pháp để hiểu dữ liệu, kiểm định giả thuyết và diễn giải kết quả phân tích.

Câu 13: Khả năng nào sau đây được xem là một thành tựu của Khoa học dữ liệu trong việc tự động hóa các tác vụ?

  • A. Xây dựng hệ thống phân loại email tự động (spam/không spam) dựa trên nội dung email
  • B. Thiết kế robot hàn trong nhà máy ô tô
  • C. In ấn tài liệu hàng loạt
  • D. Quản lý lịch làm việc thủ công

Câu 14: Khi một mô hình Khoa học dữ liệu được xây dựng để dự đoán giá nhà dựa trên diện tích, số phòng ngủ và vị trí, đây là ví dụ về bài toán thuộc loại nào?

  • A. Bài toán phân loại (Classification)
  • B. Bài toán hồi quy (Regression)
  • C. Bài toán gom cụm (Clustering)
  • D. Bài toán phát hiện ngoại lệ (Anomaly Detection)

Câu 15: Trong một dự án Khoa học dữ liệu, sau khi dữ liệu đã được làm sạch và chuẩn bị, bước tiếp theo thường là gì trước khi xây dựng mô hình?

  • A. Triển khai mô hình vào thực tế
  • B. Báo cáo kết quả cho khách hàng
  • C. Phân tích khám phá dữ liệu (Exploratory Data Analysis - EDA) và lựa chọn đặc trưng
  • D. Xóa bỏ dữ liệu gốc

Câu 16: Một công ty viễn thông sử dụng Khoa học dữ liệu để phân tích dữ liệu sử dụng dịch vụ của khách hàng nhằm xác định những khách hàng có nguy cơ cao chuyển sang nhà mạng khác. Mục tiêu này thuộc về ứng dụng nào của Khoa học dữ liệu?

  • A. Dự đoán (Prediction)
  • B. Mô tả (Description)
  • C. Trực quan hóa (Visualization)
  • D. Thu thập (Collection)

Câu 17: Việc giảm chiều dữ liệu (Dimensionality Reduction) trong Khoa học dữ liệu nhằm mục đích gì?

  • A. Làm tăng số lượng đặc trưng (biến) trong dữ liệu
  • B. Giảm số lượng đặc trưng trong dữ liệu trong khi vẫn giữ lại phần lớn thông tin quan trọng, giúp giảm nhiễu, tăng tốc độ xử lý và cải thiện hiệu suất mô hình
  • C. Thay đổi giá trị của các điểm dữ liệu
  • D. Chỉ dùng để trực quan hóa dữ liệu 2D

Câu 18: Tại sao việc hiểu rõ kiến thức chuyên môn về lĩnh vực ứng dụng (ví dụ: kinh doanh, y tế, giáo dục) lại quan trọng đối với nhà Khoa học dữ liệu?

  • A. Kiến thức chuyên môn giúp viết code tốt hơn.
  • B. Kiến thức chuyên môn giúp dữ liệu tự làm sạch.
  • C. Giúp nhà Khoa học dữ liệu hiểu ngữ cảnh của dữ liệu, đặt câu hỏi đúng, diễn giải kết quả phân tích và đưa ra các giải pháp có ý nghĩa thực tiễn.
  • D. Kiến thức chuyên môn chỉ cần thiết cho người quản lý dự án.

Câu 19: Một trong những thách thức lớn khi làm việc với dữ liệu lớn (Big Data) trong Khoa học dữ liệu là gì?

  • A. Yêu cầu về năng lực tính toán lớn, khả năng lưu trữ và xử lý dữ liệu phức tạp với tốc độ cao
  • B. Dữ liệu lớn luôn luôn sạch và hoàn hảo
  • C. Dữ liệu lớn không cần trực quan hóa
  • D. Không thể áp dụng các kỹ thuật thống kê truyền thống cho dữ liệu lớn

Câu 20: Một công ty sản xuất sử dụng dữ liệu từ các cảm biến trên máy móc để dự đoán khi nào một bộ phận có khả năng hỏng hóc, cho phép bảo trì phòng ngừa thay vì chờ đến khi hỏng hẳn. Ứng dụng này là ví dụ về thành tựu nào của Khoa học dữ liệu?

  • A. Cá nhân hóa dịch vụ
  • B. Phát hiện ngoại lệ
  • C. Khai phá luật kết hợp
  • D. Bảo trì dự đoán (Predictive Maintenance)

Câu 21: Trí tuệ nhân tạo (AI) và Học máy (Machine Learning) có mối quan hệ chặt chẽ với Khoa học dữ liệu. Phát biểu nào sau đây mô tả đúng mối quan hệ này?

  • A. Khoa học dữ liệu chỉ là một phần nhỏ của Học máy.
  • B. Học máy là một tập hợp các kỹ thuật và thuật toán quan trọng được sử dụng trong Khoa học dữ liệu để xây dựng mô hình và đưa ra dự đoán.
  • C. AI và Khoa học dữ liệu là hai lĩnh vực hoàn toàn độc lập.
  • D. Khoa học dữ liệu thay thế hoàn toàn AI.

Câu 22: Một trong những ứng dụng của Khoa học dữ liệu trong lĩnh vực giao thông vận tải là tối ưu hóa luồng giao thông. Điều này có thể được thực hiện bằng cách nào?

  • A. Chỉ đơn thuần xây dựng thêm đường mới.
  • B. Giảm số lượng phương tiện tham gia giao thông.
  • C. Phân tích dữ liệu giao thông thời gian thực từ cảm biến, camera để dự đoán tắc nghẽn và điều chỉnh tín hiệu đèn giao thông hoặc đề xuất tuyến đường thay thế.
  • D. Tăng giá xăng dầu.

Câu 23: Khi một nhà Khoa học dữ liệu trình bày kết quả phân tích cho một đối tượng không có chuyên môn sâu về kỹ thuật (ví dụ: ban lãnh đạo công ty), kỹ năng nào là quan trọng nhất?

  • A. Khả năng viết mã cực nhanh.
  • B. Khả năng sử dụng tất cả các công cụ Khoa học dữ liệu.
  • C. Khả năng tạo ra các công thức toán học phức tạp.
  • D. Khả năng truyền đạt kết quả và ý nghĩa của phân tích một cách rõ ràng, súc tích và dễ hiểu thông qua trực quan hóa và giải thích đơn giản.

Câu 24: Phát biểu nào sau đây là SAI về Khoa học dữ liệu?

  • A. Khoa học dữ liệu chỉ làm việc với dữ liệu có cấu trúc (dữ liệu dạng bảng).
  • B. Khoa học dữ liệu tìm cách trích xuất tri thức từ dữ liệu.
  • C. Khoa học dữ liệu sử dụng các phương pháp từ Thống kê và Khoa học máy tính.
  • D. Khoa học dữ liệu có thể được ứng dụng trong nhiều lĩnh vực khác nhau.

Câu 25: Một trong những lợi ích kinh tế mà Khoa học dữ liệu có thể mang lại cho doanh nghiệp là gì?

  • A. Làm giảm giá thuê mặt bằng.
  • B. Tối ưu hóa chiến dịch marketing, quản lý tồn kho hiệu quả hơn, phát hiện gian lận, từ đó tăng doanh thu và giảm chi phí.
  • C. Giúp doanh nghiệp không cần quảng cáo nữa.
  • D. Đảm bảo doanh nghiệp luôn có lợi nhuận 100%.

Câu 26: Khi xây dựng một mô hình phân loại (Classification Model) trong Khoa học dữ liệu, mục tiêu là gì?

  • A. Dự đoán một giá trị liên tục.
  • B. Tìm ra các điểm dữ liệu bất thường.
  • C. Gán các điểm dữ liệu vào một trong các lớp hoặc danh mục đã định trước (ví dụ: khách hàng tiềm năng/không tiềm năng, email spam/không spam).
  • D. Giảm số lượng đặc trưng.

Câu 27: Tại sao việc đánh giá mô hình (Model Evaluation) lại cần thiết sau khi xây dựng mô hình trong Khoa học dữ liệu?

  • A. Để xác định mức độ hiệu quả và độ tin cậy của mô hình trên dữ liệu mới, đảm bảo mô hình hoạt động tốt trước khi triển khai.
  • B. Để làm cho mô hình phức tạp hơn.
  • C. Để làm cho dữ liệu gốc biến mất.
  • D. Để trực quan hóa mô hình.

Câu 28: Một hệ thống đề xuất sản phẩm trên trang thương mại điện tử hoạt động dựa trên việc phân tích lịch sử mua hàng và xem sản phẩm của người dùng. Hệ thống này sử dụng kỹ thuật Khoa học dữ liệu nào để đưa ra các gợi ý phù hợp cho từng cá nhân?

  • A. Phát hiện ngoại lệ.
  • B. Các kỹ thuật liên quan đến hệ thống gợi ý (Recommendation Systems), thường kết hợp gom cụm, khai phá luật kết hợp hoặc học máy.
  • C. Giảm chiều dữ liệu.
  • D. Chỉ đơn giản là hiển thị các sản phẩm bán chạy nhất.

Câu 29: Khoa học dữ liệu đóng vai trò gì trong việc hỗ trợ các nhà khoa học và nghiên cứu?

  • A. Chỉ giúp họ lưu trữ tài liệu nghiên cứu.
  • B. Thay thế hoàn toàn các thí nghiệm truyền thống.
  • C. Giúp họ viết báo cáo nhanh hơn.
  • D. Giúp phân tích các tập dữ liệu lớn và phức tạp, khám phá các mối tương quan mới, kiểm định giả thuyết và đưa ra kết luận dựa trên bằng chứng dữ liệu.

Câu 30: Khả năng nào sau đây là một trong những thành tựu quan trọng của Khoa học dữ liệu trong việc dự đoán?

  • A. Dự báo nhu cầu thị trường, dự đoán thời tiết, hoặc dự đoán xu hướng lan truyền dịch bệnh dựa trên dữ liệu lịch sử và thời gian thực.
  • B. Dự đoán chính xác ngày sinh nhật của bất kỳ ai.
  • C. Dự đoán kết quả xổ số một cách chắc chắn.
  • D. Dự đoán suy nghĩ của người khác.

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu tích hợp kiến thức và kỹ thuật từ nhiều lĩnh vực khác nhau. Lĩnh vực nào sau đây *không* phải là một trụ cột cốt lõi thường được kết hợp trong Khoa học dữ liệu?

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 2: Mục tiêu chính của Khoa học dữ liệu là chuyển đổi dữ liệu thô thành thông tin và tri thức có giá trị. Quá trình này nhằm phục vụ mục đích cuối cùng nào?

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 3: Trong quy trình Khoa học dữ liệu, giai đoạn nào bao gồm việc thu thập dữ liệu từ các nguồn khác nhau, xử lý các giá trị thiếu, loại bỏ nhiễu và định dạng lại dữ liệu để chuẩn bị cho phân tích?

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 4: Một công ty bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để cải thiện chiến lược marketing. Họ sử dụng Khoa học dữ liệu để phân tích dữ liệu giao dịch và nhận thấy rằng khách hàng thường mua sản phẩm A và B cùng lúc. Kỹ thuật Khoa học dữ liệu nào có khả năng đã được sử dụng để phát hiện mối liên hệ này?

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 5: Kỹ thuật 'Gom cụm' (Clustering) trong Khoa học dữ liệu được sử dụng để làm gì?

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 6: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích các giao dịch thẻ tín dụng nhằm phát hiện hoạt động gian lận. Họ tìm kiếm các giao dịch có hành vi bất thường so với lịch sử chi tiêu thông thường của khách hàng. Kỹ thuật nào phù hợp nhất cho ứng dụng này?

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 7: Trực quan hóa dữ liệu (Data Visualization) đóng vai trò quan trọng trong Khoa học dữ liệu. Mục đích chính của việc trực quan hóa dữ liệu là gì?

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 8: Ứng dụng nào sau đây là ví dụ điển hình về việc sử dụng Khoa học dữ liệu để 'cá nhân hóa dịch vụ'?

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 9: Khoa học dữ liệu có nhiều ứng dụng trong lĩnh vực y tế. Ứng dụng nào sau đây thể hiện rõ ràng việc sử dụng Khoa học dữ liệu để hỗ trợ chẩn đoán và điều trị?

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 10: Thành tựu nào sau đây là kết quả trực tiếp của việc áp dụng Khoa học dữ liệu trong kinh doanh?

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 11: Công cụ hoặc ngôn ngữ lập trình nào sau đây thường được sử dụng rộng rãi trong Khoa học dữ liệu để phân tích, xử lý và xây dựng mô hình từ dữ liệu?

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 12: Tại sao kiến thức về Thống kê lại cần thiết đối với một nhà Khoa học dữ liệu?

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 13: Khả năng nào sau đây được xem là một thành tựu của Khoa học dữ liệu trong việc tự động hóa các tác vụ?

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 14: Khi một mô hình Khoa học dữ liệu được xây dựng để dự đoán giá nhà dựa trên diện tích, số phòng ngủ và vị trí, đây là ví dụ về bài toán thuộc loại nào?

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 15: Trong một dự án Khoa học dữ liệu, sau khi dữ liệu đã được làm sạch và chuẩn bị, bước tiếp theo thường là gì trước khi xây dựng mô hình?

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 16: Một công ty viễn thông sử dụng Khoa học dữ liệu để phân tích dữ liệu sử dụng dịch vụ của khách hàng nhằm xác định những khách hàng có nguy cơ cao chuyển sang nhà mạng khác. Mục tiêu này thuộc về ứng dụng nào của Khoa học dữ liệu?

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 17: Việc giảm chiều dữ liệu (Dimensionality Reduction) trong Khoa học dữ liệu nhằm mục đích gì?

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 18: Tại sao việc hiểu rõ kiến thức chuyên môn về lĩnh vực ứng dụng (ví dụ: kinh doanh, y tế, giáo dục) lại quan trọng đối với nhà Khoa học dữ liệu?

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 19: Một trong những thách thức lớn khi làm việc với dữ liệu lớn (Big Data) trong Khoa học dữ liệu là gì?

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 20: Một công ty sản xuất sử dụng dữ liệu từ các cảm biến trên máy móc để dự đoán khi nào một bộ phận có khả năng hỏng hóc, cho phép bảo trì phòng ngừa thay vì chờ đến khi hỏng hẳn. Ứng dụng này là ví dụ về thành tựu nào của Khoa học dữ liệu?

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 21: Trí tuệ nhân tạo (AI) và Học máy (Machine Learning) có mối quan hệ chặt chẽ với Khoa học dữ liệu. Phát biểu nào sau đây mô tả đúng mối quan hệ này?

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 22: Một trong những ứng dụng của Khoa học dữ liệu trong lĩnh vực giao thông vận tải là tối ưu hóa luồng giao thông. Điều này có thể được thực hiện bằng cách nào?

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 23: Khi một nhà Khoa học dữ liệu trình bày kết quả phân tích cho một đối tượng không có chuyên môn sâu về kỹ thuật (ví dụ: ban lãnh đạo công ty), kỹ năng nào là quan trọng nhất?

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 24: Phát biểu nào sau đây là SAI về Khoa học dữ liệu?

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 25: Một trong những lợi ích kinh tế mà Khoa học dữ liệu có thể mang lại cho doanh nghiệp là gì?

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 26: Khi xây dựng một mô hình phân loại (Classification Model) trong Khoa học dữ liệu, mục tiêu là gì?

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 27: Tại sao việc đánh giá mô hình (Model Evaluation) lại cần thiết sau khi xây dựng mô hình trong Khoa học dữ liệu?

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 28: Một hệ thống đề xuất sản phẩm trên trang thương mại điện tử hoạt động dựa trên việc phân tích lịch sử mua hàng và xem sản phẩm của người dùng. Hệ thống này sử dụng kỹ thuật Khoa học dữ liệu nào để đưa ra các gợi ý phù hợp cho từng cá nhân?

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 29: Khoa học dữ liệu đóng vai trò gì trong việc hỗ trợ các nhà khoa học và nghiên cứu?

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 4

Câu 30: Khả năng nào sau đây là một trong những thành tựu quan trọng của Khoa học dữ liệu trong việc dự đoán?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Công nghệ 10 Kết nối tri thức Bài 10: Hình cắt và mặt cắt

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 05

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 05 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Điều nào sau đây mô tả chính xác nhất sự kết hợp các lĩnh vực tạo nên Khoa học dữ liệu?

  • A. Chỉ bao gồm Khoa học máy tính và Thống kê.
  • B. Chủ yếu là Trí tuệ Nhân tạo và Phân tích kinh doanh.
  • C. Kết hợp các kỹ thuật và lý thuyết từ Toán học, Thống kê, Khoa học máy tính, cùng với kiến thức chuyên môn của lĩnh vực ứng dụng.
  • D. Là một nhánh con của Kỹ thuật phần mềm, tập trung vào cơ sở dữ liệu lớn.

Câu 2: Một công ty bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để đưa ra các chương trình khuyến mãi hiệu quả hơn. Họ thu thập dữ liệu về lịch sử mua hàng, thông tin cá nhân (tuổi, giới tính), và tương tác trên website. Mục tiêu của họ phù hợp nhất với mục tiêu nào của Khoa học dữ liệu?

  • A. Tự động hóa quy trình sản xuất.
  • B. Khám phá tri thức từ dữ liệu và tối ưu hóa quyết định kinh doanh.
  • C. Phát triển phần cứng máy tính mới.
  • D. Đảm bảo an ninh mạng cho hệ thống.

Câu 3: Trong quy trình Khoa học dữ liệu, sau khi đã thu thập và làm sạch dữ liệu, bước tiếp theo thường là khám phá dữ liệu. Bước này liên quan đến việc thực hiện hoạt động nào?

  • A. Xây dựng giao diện người dùng cho ứng dụng.
  • B. Triển khai mô hình vào môi trường sản phẩm.
  • C. Đánh giá hiệu suất của mô hình dự đoán.
  • D. Tìm kiếm các mẫu, xu hướng và mối quan hệ ẩn trong dữ liệu thông qua thống kê mô tả và trực quan hóa.

Câu 4: Một nhà khoa học dữ liệu đang làm việc với tập dữ liệu lớn về giao dịch thẻ tín dụng. Anh ấy muốn phát hiện các giao dịch bất thường có thể là gian lận. Kỹ thuật khám phá tri thức nào phù hợp nhất cho mục tiêu này?

  • A. Khai phá luật kết hợp (Association Rule Mining).
  • B. Gom cụm (Clustering).
  • C. Phát hiện ngoại lệ (Outlier Detection).
  • D. Giảm chiều dữ liệu (Dimensionality Reduction).

Câu 5: Một trang web tin tức muốn cá nhân hóa nội dung hiển thị cho từng người dùng. Dựa trên lịch sử đọc và sở thích của người dùng, hệ thống sẽ đề xuất các bài báo mà họ có khả năng quan tâm nhất. Ứng dụng này của Khoa học dữ liệu thuộc nhóm thành tựu nào?

  • A. Tự động hóa quy trình công nghiệp.
  • B. Cá nhân hóa nội dung và dịch vụ.
  • C. Dự báo thời tiết chính xác.
  • D. Phát triển vật liệu mới.

Câu 6: Trực quan hóa dữ liệu đóng vai trò quan trọng trong Khoa học dữ liệu. Công cụ hoặc kỹ thuật nào sau đây được sử dụng chủ yếu để trực quan hóa dữ liệu, giúp người phân tích dễ dàng nhận diện mẫu và xu hướng?

  • A. Biểu đồ (cột, đường, tròn, phân tán...), bảng điều khiển (dashboard).
  • B. Ngôn ngữ lập trình C++.
  • C. Hệ quản trị cơ sở dữ liệu SQL Server.
  • D. Phần mềm xử lý văn bản Microsoft Word.

Câu 7: Một bệnh viện muốn sử dụng Khoa học dữ liệu để dự đoán khả năng tái nhập viện của bệnh nhân sau khi xuất viện, nhằm can thiệp kịp thời và cải thiện chất lượng chăm sóc. Ứng dụng này thuộc lĩnh vực nào của Khoa học dữ liệu trong y tế?

  • A. Quản lý hồ sơ bệnh án giấy.
  • B. Thiết kế kiến trúc bệnh viện.
  • C. Sản xuất thiết bị y tế.
  • D. Hỗ trợ chẩn đoán, dự báo và tối ưu hóa quy trình điều trị.

Câu 8: Một công ty sản xuất muốn tối ưu hóa lượng tồn kho bằng cách dự đoán nhu cầu sản phẩm trong các tháng tới dựa trên dữ liệu bán hàng lịch sử, mùa vụ và các chiến dịch marketing. Việc sử dụng Khoa học dữ liệu trong trường hợp này nhằm mục đích gì?

  • A. Tuyển dụng nhân viên mới.
  • B. Thiết kế bao bì sản phẩm.
  • C. Phân tích dữ liệu để đưa ra quyết định tối ưu hóa hoạt động kinh doanh.
  • D. Giảm giá thành sản phẩm một cách tùy tiện.

Câu 9: Trong lĩnh vực Khoa học dữ liệu, thuật ngữ

  • A. Việc máy tính ghi nhớ một lượng lớn thông tin.
  • B. Tập hợp các thuật toán và mô hình cho phép máy tính học hỏi từ dữ liệu mà không cần được lập trình tường minh.
  • C. Quá trình con người dạy máy tính cách thực hiện một nhiệm vụ cụ thể.
  • D. Việc sử dụng robot để thực hiện các công việc lặp đi lặp lại.

Câu 10: Khi làm việc với dữ liệu, bước

  • A. Xử lý các giá trị thiếu, sai định dạng, ngoại lệ hoặc không nhất quán để đảm bảo chất lượng dữ liệu cho phân tích.
  • B. Chỉ đơn giản là xóa bỏ tất cả các bản ghi có giá trị thiếu.
  • C. Thay thế tất cả các giá trị bằng giá trị trung bình.
  • D. Trực quan hóa dữ liệu lần đầu tiên.

Câu 11: Bạn đang phân tích một tập dữ liệu về điểm thi của học sinh. Bạn muốn nhóm các học sinh có điểm số và hành vi học tập tương tự nhau lại để đề xuất phương pháp hỗ trợ phù hợp. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất để thực hiện việc này?

  • A. Phân loại (Classification).
  • B. Gom cụm (Clustering).
  • C. Hồi quy (Regression).
  • D. Phát hiện ngoại lệ (Outlier Detection).

Câu 12: Trong bối cảnh Khoa học dữ liệu, dữ liệu

  • A. Dữ liệu văn bản tự do như email, bài báo.
  • B. Dữ liệu hình ảnh và âm thanh.
  • C. Dữ liệu được tổ chức theo định dạng cố định trong các bảng (ví dụ: cơ sở dữ liệu quan hệ, tệp CSV).
  • D. Dữ liệu từ các cảm biến IoT không có định dạng rõ ràng.

Câu 13: Một công ty bảo hiểm muốn xây dựng một mô hình dự đoán khả năng một khách hàng sẽ yêu cầu bồi thường trong năm tới dựa trên thông tin về tuổi, giới tính, lịch sử sức khỏe, và loại hợp đồng. Bài toán này trong Khoa học dữ liệu thuộc loại nào?

  • A. Bài toán phân loại (Classification - dự đoán một nhãn/loại: Có/Không yêu cầu bồi thường).
  • B. Bài toán hồi quy (Regression - dự đoán một giá trị liên tục).
  • C. Bài toán gom cụm (Clustering - nhóm các khách hàng tương tự).
  • D. Bài toán giảm chiều (Dimensionality Reduction).

Câu 14: Một nhà kinh tế học sử dụng Khoa học dữ liệu để phân tích mối quan hệ giữa giá dầu thô và tỷ lệ lạm phát, nhằm dự báo xu hướng kinh tế trong tương lai. Ứng dụng này thể hiện vai trò nào của Khoa học dữ liệu?

  • A. Tự động hóa công việc văn phòng.
  • B. Tạo ra các sản phẩm vật lý mới.
  • C. Quản lý mạng máy tính.
  • D. Dự đoán xu hướng và đưa ra quyết định dựa trên dữ liệu.

Câu 15: Để xây dựng một mô hình dự đoán trong Khoa học dữ liệu, người ta thường chia tập dữ liệu ban đầu thành các tập con khác nhau. Mục đích chính của việc chia dữ liệu thành tập huấn luyện (training set) và tập kiểm tra (testing set) là gì?

  • A. Để huấn luyện mô hình trên tất cả dữ liệu có sẵn.
  • B. Để huấn luyện mô hình trên tập huấn luyện và đánh giá khả năng khái quát hóa (generalization) của mô hình trên dữ liệu chưa từng thấy (tập kiểm tra).
  • C. Để làm cho quá trình huấn luyện nhanh hơn.
  • D. Để trực quan hóa dữ liệu một cách hiệu quả hơn.

Câu 16: Một trong những thách thức lớn khi làm việc với dữ liệu lớn (Big Data) trong Khoa học dữ liệu là gì?

  • A. Đảm bảo chất lượng dữ liệu, xử lý dữ liệu đa dạng về định dạng và nguồn, cùng với yêu cầu về hạ tầng tính toán mạnh mẽ.
  • B. Dữ liệu lớn luôn có cấu trúc rõ ràng và dễ dàng xử lý.
  • C. Không cần các công cụ hoặc kỹ thuật đặc biệt để phân tích dữ liệu lớn.
  • D. Dữ liệu lớn luôn sạch sẽ và không chứa giá trị thiếu.

Câu 17: Bạn được giao nhiệm vụ phân tích một tập dữ liệu về phản hồi của khách hàng (dạng văn bản tự do) về một sản phẩm mới. Bạn muốn trích xuất các chủ đề chính và cảm xúc (tích cực, tiêu cực) từ các phản hồi này. Lĩnh vực nào của Khoa học dữ liệu hoặc Trí tuệ Nhân tạo sẽ hỗ trợ bạn thực hiện điều này?

  • A. Thị giác máy tính (Computer Vision).
  • B. Hệ thống khuyến nghị (Recommendation Systems).
  • C. Phát hiện ngoại lệ (Outlier Detection).
  • D. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP).

Câu 18: Một nhà khoa học dữ liệu đã xây dựng một mô hình dự đoán doanh số bán hàng cho quý tới. Để đánh giá mức độ tin cậy của mô hình này, anh ấy cần thực hiện bước nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập thêm dữ liệu.
  • B. Làm sạch dữ liệu lại từ đầu.
  • C. Đánh giá mô hình (Model Evaluation) bằng các chỉ số phù hợp (ví dụ: sai số dự đoán).
  • D. Thay đổi hoàn toàn thuật toán đã sử dụng.

Câu 19: Trong lĩnh vực bán lẻ trực tuyến, việc phân tích giỏ hàng của khách hàng để tìm ra các sản phẩm thường được mua cùng nhau (ví dụ: mua sữa thường mua kèm bánh mì) được gọi là gì? Ứng dụng này giúp tối ưu hóa vị trí sản phẩm hoặc đưa ra gói khuyến mãi.

  • A. Khai phá luật kết hợp (Association Rule Mining) hay Phân tích giỏ hàng (Market Basket Analysis).
  • B. Phân loại (Classification).
  • C. Hồi quy (Regression).
  • D. Phát hiện ngoại lệ (Outlier Detection).

Câu 20: Đâu là vai trò của Toán học và Thống kê trong Khoa học dữ liệu?

  • A. Cung cấp các công cụ để xây dựng giao diện người dùng.
  • B. Giúp lưu trữ dữ liệu trên máy tính.
  • C. Chủ yếu dùng để vẽ biểu đồ đơn giản.
  • D. Cung cấp nền tảng lý thuyết cho các thuật toán học máy, phân tích dữ liệu, suy luận và mô hình hóa.

Câu 21: Một nhà máy sử dụng cảm biến để thu thập dữ liệu về nhiệt độ, áp suất và rung động của máy móc. Họ áp dụng Khoa học dữ liệu để phân tích dữ liệu này nhằm dự đoán khi nào máy móc có khả năng bị hỏng, từ đó thực hiện bảo trì phòng ngừa. Ứng dụng này thuộc nhóm thành tựu nào?

  • A. Tự động hóa và tối ưu hóa quy trình vận hành.
  • B. Cá nhân hóa dịch vụ khách hàng.
  • C. Phân tích cảm xúc từ văn bản.
  • D. Phát triển trò chơi điện tử mới.

Câu 22: Khi xây dựng một mô hình dự đoán giá nhà dựa trên diện tích, số phòng ngủ, vị trí, v.v., bài toán này trong Khoa học dữ liệu thuộc loại nào?

  • A. Bài toán phân loại (Classification - dự đoán một nhãn/loại).
  • B. Bài toán hồi quy (Regression - dự đoán một giá trị liên tục).
  • C. Bài toán gom cụm (Clustering - nhóm các ngôi nhà tương tự).
  • D. Bài toán phát hiện ngoại lệ (Outlier Detection).

Câu 23: Một nhà nghiên cứu muốn giảm số lượng các biến (đặc trưng) trong tập dữ liệu mà không làm mất đi quá nhiều thông tin quan trọng, nhằm đơn giản hóa mô hình và tránh hiện tượng quá khớp (overfitting). Kỹ thuật nào trong Khoa học dữ liệu giúp thực hiện điều này?

  • A. Khai phá luật kết hợp (Association Rule Mining).
  • B. Gom cụm (Clustering).
  • C. Phát hiện ngoại lệ (Outlier Detection).
  • D. Giảm chiều dữ liệu (Dimensionality Reduction).

Câu 24: Đâu là một ví dụ về dữ liệu phi cấu trúc (unstructured data) mà Khoa học dữ liệu thường xử lý?

  • A. Bảng dữ liệu khách hàng trong cơ sở dữ liệu SQL.
  • B. Tệp CSV chứa thông tin giao dịch bán hàng.
  • C. Nội dung các bài đăng trên mạng xã hội, hình ảnh, video.
  • D. Bảng điểm của học sinh trong tệp Excel.

Câu 25: Trong quy trình Khoa học dữ liệu, bước

  • A. Đưa mô hình đã huấn luyện vào môi trường thực tế để nó có thể tạo ra dự đoán hoặc phân tích trên dữ liệu mới.
  • B. Chỉ đơn giản là lưu mô hình vào ổ cứng.
  • C. Trực quan hóa kết quả của mô hình.
  • D. Thu thập thêm dữ liệu mới.

Câu 26: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích hành vi giao dịch của khách hàng nhằm phát hiện các hoạt động đáng ngờ có thể liên quan đến rửa tiền. Ứng dụng này chủ yếu dựa trên kỹ thuật nào của Khoa học dữ liệu?

  • A. Hệ thống khuyến nghị (Recommendation Systems).
  • B. Xử lý ngôn ngữ tự nhiên (NLP).
  • C. Phân tích cảm xúc (Sentiment Analysis).
  • D. Phát hiện ngoại lệ (Outlier Detection) và phân tích mạng lưới (Network Analysis).

Câu 27: Một trong những thách thức về đạo đức và pháp lý liên quan đến Khoa học dữ liệu và dữ liệu lớn là gì?

  • A. Việc thiếu dữ liệu để phân tích.
  • B. Bảo vệ quyền riêng tư của cá nhân, nguy cơ thiên vị (bias) trong dữ liệu và mô hình, và trách nhiệm giải trình.
  • C. Dữ liệu luôn sạch sẽ và không cần làm sạch.
  • D. Các công cụ Khoa học dữ liệu quá rẻ và dễ sử dụng.

Câu 28: Trí tuệ Nhân tạo (AI) và Học máy (ML) có mối quan hệ như thế nào với Khoa học dữ liệu?

  • A. Học máy là một tập con của Trí tuệ Nhân tạo, và cả hai đều là những công cụ, kỹ thuật quan trọng được sử dụng trong Khoa học dữ liệu.
  • B. Khoa học dữ liệu là một tập con của Học máy.
  • C. AI, ML và Khoa học dữ liệu là ba lĩnh vực hoàn toàn tách biệt.
  • D. Trí tuệ Nhân tạo chỉ liên quan đến robot vật lý.

Câu 29: Một công ty truyền thông xã hội muốn phân tích dữ liệu về thời gian người dùng dành cho các loại nội dung khác nhau để hiểu hành vi tương tác và cải thiện trải nghiệm người dùng. Việc phân tích này nhằm mục tiêu nào của Khoa học dữ liệu?

  • A. Giảm thiểu chi phí sản xuất nội dung.
  • B. Tuyển dụng người kiểm duyệt nội dung.
  • C. Khám phá insight từ dữ liệu hành vi người dùng để tối ưu hóa nền tảng.
  • D. Chỉ đơn giản là đếm số lượt thích và chia sẻ.

Câu 30: Khi một nhà khoa học dữ liệu xây dựng một mô hình dự đoán và nhận thấy rằng mô hình hoạt động rất tốt trên tập huấn luyện nhưng kém hiệu quả trên tập kiểm tra, vấn đề này thường được gọi là gì?

  • A. Quá khớp (Overfitting).
  • B. Thiếu khớp (Underfitting).
  • C. Thiếu dữ liệu (Data scarcity).
  • D. Làm sạch dữ liệu chưa đúng (Incorrect data cleaning).

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Khoa học dữ liệu là một lĩnh vực liên ngành. Điều nào sau đây mô tả chính xác nhất sự kết hợp các lĩnh vực tạo nên Khoa học dữ liệu?

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Một công ty bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để đưa ra các chương trình khuyến mãi hiệu quả hơn. Họ thu thập dữ liệu về lịch sử mua hàng, thông tin cá nhân (tuổi, giới tính), và tương tác trên website. Mục tiêu của họ phù hợp nhất với mục tiêu nào của Khoa học dữ liệu?

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Trong quy trình Khoa học dữ liệu, sau khi đã thu thập và làm sạch dữ liệu, bước tiếp theo thường là khám phá dữ liệu. Bước này liên quan đến việc thực hiện hoạt động nào?

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Một nhà khoa học dữ liệu đang làm việc với tập dữ liệu lớn về giao dịch thẻ tín dụng. Anh ấy muốn phát hiện các giao dịch bất thường có thể là gian lận. Kỹ thuật khám phá tri thức nào phù hợp nhất cho mục tiêu này?

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Một trang web tin tức muốn cá nhân hóa nội dung hiển thị cho từng người dùng. Dựa trên lịch sử đọc và sở thích của người dùng, hệ thống sẽ đề xuất các bài báo mà họ có khả năng quan tâm nhất. Ứng dụng này của Khoa học dữ liệu thuộc nhóm thành tựu nào?

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Trực quan hóa dữ liệu đóng vai trò quan trọng trong Khoa học dữ liệu. Công cụ hoặc kỹ thuật nào sau đây được sử dụng chủ yếu để trực quan hóa dữ liệu, giúp người phân tích dễ dàng nhận diện mẫu và xu hướng?

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Một bệnh viện muốn sử dụng Khoa học dữ liệu để dự đoán khả năng tái nhập viện của bệnh nhân sau khi xuất viện, nhằm can thiệp kịp thời và cải thiện chất lượng chăm sóc. Ứng dụng này thuộc lĩnh vực nào của Khoa học dữ liệu trong y tế?

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Một công ty sản xuất muốn tối ưu hóa lượng tồn kho bằng cách dự đoán nhu cầu sản phẩm trong các tháng tới dựa trên dữ liệu bán hàng lịch sử, mùa vụ và các chiến dịch marketing. Việc sử dụng Khoa học dữ liệu trong trường hợp này nhằm mục đích gì?

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Trong lĩnh vực Khoa học dữ liệu, thuật ngữ "Học máy" (Machine Learning) đề cập đến điều gì?

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Khi làm việc với dữ liệu, bước "làm sạch dữ liệu" (data cleaning) là rất quan trọng. Mục đích chính của bước này là gì?

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Bạn đang phân tích một tập dữ liệu về điểm thi của học sinh. Bạn muốn nhóm các học sinh có điểm số và hành vi học tập tương tự nhau lại để đề xuất phương pháp hỗ trợ phù hợp. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất để thực hiện việc này?

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Trong bối cảnh Khoa học dữ liệu, dữ liệu "có cấu trúc" (structured data) thường đề cập đến loại dữ liệu nào?

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Một công ty bảo hiểm muốn xây dựng một mô hình dự đoán khả năng một khách hàng s?? yêu cầu bồi thường trong năm tới dựa trên thông tin về tuổi, giới tính, lịch sử sức khỏe, và loại hợp đồng. Bài toán này trong Khoa học dữ liệu thuộc loại nào?

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Một nhà kinh tế học sử dụng Khoa học dữ liệu để phân tích mối quan hệ giữa giá dầu thô và tỷ lệ lạm phát, nhằm dự báo xu hướng kinh tế trong tương lai. Ứng dụng này thể hiện vai trò nào của Khoa học dữ liệu?

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Để xây dựng một mô hình dự đoán trong Khoa học dữ liệu, người ta thường chia tập dữ liệu ban đầu thành các tập con khác nhau. Mục đích chính của việc chia dữ liệu thành tập huấn luyện (training set) và tập kiểm tra (testing set) là gì?

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Một trong những thách thức lớn khi làm việc với dữ liệu lớn (Big Data) trong Khoa học dữ liệu là gì?

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Bạn được giao nhiệm vụ phân tích một tập dữ liệu về phản hồi của khách hàng (dạng văn bản tự do) về một sản phẩm mới. Bạn muốn trích xuất các chủ đề chính và cảm xúc (tích cực, tiêu cực) từ các phản hồi này. Lĩnh vực nào của Khoa học dữ liệu hoặc Trí tuệ Nhân tạo sẽ hỗ trợ bạn thực hiện điều này?

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Một nhà khoa học dữ liệu đã xây dựng một mô hình dự đoán doanh số bán hàng cho quý tới. Để đánh giá mức độ tin cậy của mô hình này, anh ấy cần thực hiện bước nào trong quy trình Khoa học dữ liệu?

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Trong lĩnh vực bán lẻ trực tuyến, việc phân tích giỏ hàng của khách hàng để tìm ra các sản phẩm thường được mua cùng nhau (ví dụ: mua sữa thường mua kèm bánh mì) được gọi là gì? Ứng dụng này giúp tối ưu hóa vị trí sản phẩm hoặc đưa ra gói khuyến mãi.

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Đâu là vai trò của Toán học và Thống kê trong Khoa học dữ liệu?

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Một nhà máy sử dụng cảm biến để thu thập dữ liệu về nhiệt độ, áp suất và rung động của máy móc. Họ áp dụng Khoa học dữ liệu để phân tích dữ liệu này nhằm dự đoán khi nào máy móc có khả năng bị hỏng, từ đó thực hiện bảo trì phòng ngừa. Ứng dụng này thuộc nhóm thành tựu nào?

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Khi xây dựng một mô hình dự đoán giá nhà dựa trên diện tích, số phòng ngủ, vị trí, v.v., bài toán này trong Khoa học dữ liệu thuộc loại nào?

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Một nhà nghiên cứu muốn giảm số lượng các biến (đặc trưng) trong tập dữ liệu mà không làm mất đi quá nhiều thông tin quan trọng, nhằm đơn giản hóa mô hình và tránh hiện tượng quá khớp (overfitting). Kỹ thuật nào trong Khoa học dữ liệu giúp thực hiện điều này?

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Đâu là một ví dụ về dữ liệu phi cấu trúc (unstructured data) mà Khoa học dữ liệu thường xử lý?

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Trong quy trình Khoa học dữ liệu, bước "triển khai mô hình" (model deployment) đề cập đến việc gì?

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Một ngân hàng sử dụng Khoa học dữ liệu để phân tích hành vi giao dịch của khách hàng nhằm phát hiện các hoạt động đáng ngờ có thể liên quan đến rửa tiền. Ứng dụng này chủ yếu dựa trên kỹ thuật nào của Khoa học dữ liệu?

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Một trong những thách thức về đạo đức và pháp lý liên quan đến Khoa học dữ liệu và dữ liệu lớn là gì?

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Trí tuệ Nhân tạo (AI) và Học máy (ML) có mối quan hệ như thế nào với Khoa học dữ liệu?

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Một công ty truyền thông xã hội muốn phân tích dữ liệu về thời gian người dùng dành cho các loại nội dung khác nhau để hiểu hành vi tương tác và cải thiện trải nghiệm người dùng. Việc phân tích này nhằm mục tiêu nào của Khoa học dữ liệu?

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 5

Khi một nhà khoa học dữ liệu xây dựng một mô hình dự đoán và nhận thấy rằng mô hình hoạt động rất tốt trên tập huấn luyện nhưng kém hiệu quả trên tập kiểm tra, vấn đề này thường được gọi là gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 06

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 06 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Một công ty bán lẻ muốn phân tích lịch sử mua sắm của khách hàng để xác định các nhóm khách hàng có hành vi tương tự nhằm mục đích cá nhân hóa chiến dịch marketing. Kỹ thuật khoa học dữ liệu nào sau đây phù hợp nhất để giải quyết bài toán này?

  • A. Khai phá luật kết hợp (Association Rule Mining)
  • B. Phát hiện ngoại lệ (Outlier Detection)
  • C. Giảm chiều dữ liệu (Dimensionality Reduction)
  • D. Gom cụm (Clustering)

Câu 2: Trong quy trình khoa học dữ liệu, giai đoạn nào thường liên quan đến việc làm sạch dữ liệu, xử lý các giá trị thiếu, và chuyển đổi dữ liệu sang định dạng phù hợp cho phân tích?

  • A. Thu thập dữ liệu
  • B. Trực quan hóa dữ liệu
  • C. Tiền xử lý dữ liệu (Data Preprocessing)
  • D. Xây dựng mô hình

Câu 3: Một nhà khoa học dữ liệu đang xây dựng mô hình để dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, v.v. Đây là loại bài toán học máy nào?

  • A. Hồi quy (Regression)
  • B. Phân loại (Classification)
  • C. Gom cụm (Clustering)
  • D. Phát hiện ngoại lệ (Outlier Detection)

Câu 4: Khi phân tích dữ liệu bán hàng theo thời gian, nhà khoa học dữ liệu nhận thấy doanh số tăng mạnh vào cuối mỗi quý. Việc sử dụng biểu đồ đường (Line chart) để thể hiện xu hướng này thuộc về giai đoạn nào trong quy trình khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Xây dựng mô hình
  • D. Đánh giá mô hình

Câu 5: Khái niệm nào sau đây mô tả khả năng của hệ thống khoa học dữ liệu trong việc đưa ra các đề xuất sản phẩm phù hợp cho từng khách hàng dựa trên lịch sử duyệt web và mua hàng của họ?

  • A. Tự động hóa quy trình
  • B. Phát hiện ngoại lệ
  • C. Cá nhân hóa dịch vụ (Personalization)
  • D. Giảm chiều dữ liệu

Câu 6: Một ngân hàng sử dụng khoa học dữ liệu để phát hiện các giao dịch có dấu hiệu bất thường, khác biệt đáng kể so với hành vi tiêu dùng thông thường của khách hàng. Ứng dụng này thuộc nhóm kỹ thuật nào?

  • A. Hồi quy
  • B. Gom cụm
  • C. Phân loại
  • D. Phát hiện ngoại lệ (Outlier Detection)

Câu 7: Lĩnh vực nào đóng vai trò cung cấp nền tảng toán học cho các thuật toán và mô hình được sử dụng trong khoa học dữ liệu, đặc biệt là trong thống kê suy luận và tối ưu hóa?

  • A. Khoa học xã hội
  • B. Toán học và Thống kê
  • C. Thiết kế đồ họa
  • D. Vật lý học

Câu 8: Khi xây dựng mô hình dự đoán, nhà khoa học dữ liệu cần đánh giá hiệu quả của mô hình bằng cách sử dụng các chỉ số như độ chính xác (accuracy), độ nhạy (sensitivity), độ đặc hiệu (specificity), v.v. Hoạt động này thuộc giai đoạn nào trong quy trình khoa học dữ liệu?

  • A. Đánh giá mô hình (Model Evaluation)
  • B. Triển khai mô hình
  • C. Thu thập dữ liệu
  • D. Trực quan hóa dữ liệu

Câu 9: Mục tiêu cuối cùng của khoa học dữ liệu là gì, sau khi đã thu thập, xử lý, phân tích và xây dựng mô hình?

  • A. Lưu trữ dữ liệu thật lớn
  • B. Tạo ra các biểu đồ phức tạp
  • C. Viết các chương trình code
  • D. Đưa ra quyết định dựa trên dữ liệu và khám phá tri thức (Data-driven decision making)

Câu 10: Một bệnh viện muốn phân tích dữ liệu bệnh án để dự đoán khả năng tái nhập viện của bệnh nhân sau khi xuất viện. Đây là bài toán thuộc ứng dụng khoa học dữ liệu trong lĩnh vực nào?

  • A. Tài chính
  • B. Y tế (Healthcare)
  • C. Giáo dục
  • D. Bán lẻ

Câu 11: Kỹ thuật nào trong khoa học dữ liệu giúp tìm ra các mối quan hệ "nếu-thì" giữa các mặt hàng trong giỏ hàng của khách hàng, ví dụ "Nếu khách hàng mua sữa, họ có xu hướng mua bánh mì"?

  • A. Khai phá luật kết hợp (Association Rule Mining)
  • B. Hồi quy
  • C. Phân loại
  • D. Gom cụm

Câu 12: Việc sử dụng các thư viện lập trình như Pandas và NumPy trong Python để thao tác và biến đổi dữ liệu thuộc giai đoạn nào trong quy trình khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Trực quan hóa dữ liệu
  • C. Tiền xử lý dữ liệu (Data Preprocessing)
  • D. Triển khai mô hình

Câu 13: Một công ty truyền thông muốn phân tích hành vi người dùng trên website để hiểu rõ họ dành thời gian cho loại nội dung nào nhiều nhất. Dữ liệu được thu thập từ nhật ký truy cập website. Đây là ví dụ về loại dữ liệu nào?

  • A. Dữ liệu có cấu trúc
  • B. Dữ liệu bán cấu trúc
  • C. Dữ liệu định tính
  • D. Dữ liệu hành vi (Behavioral Data)

Câu 14: Thuật ngữ "Big Data" trong khoa học dữ liệu thường đề cập đến dữ liệu có những đặc điểm chính nào?

  • A. Volume (Khối lượng), Velocity (Tốc độ), Variety (Đa dạng)
  • B. Value (Giá trị), Validity (Tính hợp lệ), Visibility (Khả năng hiển thị)
  • C. Volume (Khối lượng), Value (Giá trị), Velocity (Tốc độ)
  • D. Variety (Đa dạng), Validity (Tính hợp lệ), Visibility (Khả năng hiển thị)

Câu 15: Tại sao giai đoạn tiền xử lý dữ liệu lại quan trọng trong khoa học dữ liệu?

  • A. Để tạo ra các biểu đồ đẹp mắt
  • B. Để giảm số lượng dữ liệu
  • C. Để đảm bảo chất lượng dữ liệu đầu vào cho các mô hình phân tích và học máy (Ensure data quality)
  • D. Để trực tiếp đưa ra quyết định kinh doanh

Câu 16: Một nhà khoa học dữ liệu được giao nhiệm vụ xây dựng hệ thống phân loại email thành "Thư rác" hoặc "Không phải thư rác". Đây là bài toán thuộc loại nào?

  • A. Hồi quy
  • B. Phân loại (Classification)
  • C. Gom cụm
  • D. Phát hiện ngoại lệ

Câu 17: Công ty Netflix sử dụng khoa học dữ liệu để phân tích thói quen xem phim của người dùng và gợi ý các bộ phim/chương trình truyền hình phù hợp. Ứng dụng này minh họa cho thành tựu nào của khoa học dữ liệu?

  • A. Tự động hóa sản xuất
  • B. Phát hiện gian lận
  • C. Quản lý chuỗi cung ứng
  • D. Hệ thống đề xuất (Recommendation Systems) và cá nhân hóa

Câu 18: Khi trực quan hóa dữ liệu để so sánh doanh số bán hàng giữa các vùng địa lý khác nhau, loại biểu đồ nào sau đây thường được sử dụng để hiển thị sự phân bố trên bản đồ?

  • A. Biểu đồ bản đồ (Choropleth Map)
  • B. Biểu đồ cột
  • C. Biểu đồ đường
  • D. Biểu đồ phân tán (Scatter Plot)

Câu 19: Một trong những thách thức lớn nhất khi làm việc với Big Data trong khoa học dữ liệu là gì?

  • A. Thiếu các công cụ phân tích
  • B. Dữ liệu quá sạch và dễ xử lý
  • C. Khó khăn trong việc lưu trữ, xử lý, và phân tích do khối lượng, tốc độ và sự đa dạng (Challenges in Storage, Processing, Analysis)
  • D. Không có nhu cầu phân tích dữ liệu lớn

Câu 20: Trong lĩnh vực tài chính, khoa học dữ liệu được ứng dụng để dự đoán xu hướng thị trường chứng khoán. Đây là một ví dụ về bài toán thuộc loại nào?

  • A. Dự báo chuỗi thời gian (Time Series Forecasting)
  • B. Gom cụm khách hàng
  • C. Phân loại hình ảnh
  • D. Phát hiện ngoại lệ

Câu 21: Kỹ năng nào sau đây được coi là quan trọng đối với một nhà khoa học dữ liệu, bên cạnh kiến thức về toán học, thống kê và khoa học máy tính?

  • A. Thiết kế đồ họa chuyên nghiệp
  • B. Chơi nhạc cụ
  • C. Giao tiếp ngoại ngữ không liên quan
  • D. Kỹ năng giao tiếp và kể chuyện bằng dữ liệu (Communication and Data Storytelling)

Câu 22: Một trong những mục tiêu chính của khoa học dữ liệu là "khám phá tri thức". Điều này có nghĩa là gì?

  • A. Tìm kiếm các định nghĩa trong từ điển
  • B. Trích xuất thông tin hữu ích, các mẫu (patterns) và mối quan hệ ẩn từ dữ liệu (Extracting useful information, patterns, and hidden relationships)
  • C. Chỉ đơn giản là thu thập dữ liệu
  • D. Tạo ra dữ liệu mới hoàn toàn

Câu 23: Khi một công ty sử dụng dữ liệu hành vi khách hàng để tối ưu hóa bố cục website nhằm tăng tỷ lệ chuyển đổi (conversion rate), đây là ứng dụng khoa học dữ liệu vào mục tiêu nào?

  • A. Tối ưu hóa quyết định và quy trình (Decision and Process Optimization)
  • B. Giảm kích thước dữ liệu
  • C. Tạo ra dữ liệu giả
  • D. Chỉ để lưu trữ lịch sử truy cập

Câu 24: Công cụ nào sau đây KHÔNG phải là một công cụ phổ biến được sử dụng trong khoa học dữ liệu để phân tích và trực quan hóa?

  • A. Python (với các thư viện như Pandas, Scikit-learn)
  • B. R
  • C. Microsoft Paint
  • D. SQL

Câu 25: Một nhà khoa học dữ liệu đang nghiên cứu dữ liệu về các bài báo khoa học để nhóm các bài báo có chủ đề tương tự lại với nhau mà không có nhãn phân loại trước. Kỹ thuật này thuộc loại học máy nào?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 26: Khi phân tích dữ liệu hình ảnh y tế (ví dụ: ảnh X-quang), khoa học dữ liệu có thể được sử dụng để hỗ trợ chẩn đoán bệnh. Lĩnh vực nào của khoa học máy tính đóng vai trò quan trọng trong việc xử lý và phân tích loại dữ liệu này?

  • A. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP)
  • B. Hệ thống cơ sở dữ liệu
  • C. Phân tích chuỗi thời gian
  • D. Thị giác máy tính (Computer Vision)

Câu 27: Đâu là một ví dụ về ứng dụng khoa học dữ liệu trong lĩnh vực nông nghiệp?

  • A. Dự đoán năng suất cây trồng dựa trên dữ liệu thời tiết, loại đất, và lượng phân bón.
  • B. Thiết kế máy kéo mới.
  • C. Tạo ra giống cây trồng biến đổi gen.
  • D. Lưu trữ hạt giống trong kho lạnh.

Câu 28: Một công ty viễn thông muốn phân tích dữ liệu sử dụng dịch vụ của khách hàng để xác định những khách hàng có nguy cơ cao chuyển sang nhà mạng khác (churn prediction). Đây là bài toán phân loại (classification). Đặc điểm của bài toán này là gì?

  • A. Mục tiêu là dự đoán một giá trị số liên tục.
  • B. Mục tiêu là nhóm dữ liệu thành các cụm dựa trên sự tương đồng.
  • C. Mục tiêu là gán một đối tượng vào một trong các lớp (category) đã định nghĩa trước (Predicting a categorical label).
  • D. Mục tiêu là tìm ra các quy tắc kết hợp giữa các mục.

Câu 29: Tại sao việc hiểu rõ ngữ cảnh kinh doanh hoặc lĩnh vực ứng dụng lại quan trọng đối với nhà khoa học dữ liệu?

  • A. Chỉ để biết thêm thông tin chung.
  • B. Vì nó giúp viết code nhanh hơn.
  • C. Nó không quan trọng, chỉ cần tập trung vào thuật toán.
  • D. Để đặt câu hỏi đúng, hiểu rõ dữ liệu, giải thích kết quả phân tích và đưa ra giải pháp có ý nghĩa thực tiễn (To frame the problem, understand data, interpret results, and provide actionable insights).

Câu 30: Trực quan hóa dữ liệu không chỉ giúp trình bày kết quả mà còn đóng vai trò quan trọng trong giai đoạn khám phá dữ liệu (Exploratory Data Analysis - EDA). Vai trò đó là gì?

  • A. Giúp phát hiện các mẫu (patterns), xu hướng (trends), ngoại lệ (outliers) và mối quan hệ giữa các biến trước khi xây dựng mô hình (Discovering patterns, trends, outliers).
  • B. Chỉ để làm cho báo cáo trông đẹp hơn.
  • C. Để tự động hóa hoàn toàn quy trình phân tích.
  • D. Thay thế hoàn toàn việc xây dựng mô hình.

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 1: Một công ty bán lẻ muốn phân tích lịch sử mua sắm của khách hàng để xác định các nhóm khách hàng có hành vi tương tự nhằm mục đích cá nhân hóa chiến dịch marketing. Kỹ thuật khoa học dữ liệu nào sau đây phù hợp nhất để giải quyết bài toán này?

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 2: Trong quy trình khoa học dữ liệu, giai đoạn nào thường liên quan đến việc làm sạch dữ liệu, xử lý các giá trị thiếu, và chuyển đổi dữ liệu sang định dạng phù hợp cho phân tích?

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 3: Một nhà khoa học dữ liệu đang xây dựng mô hình để dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, v.v. Đây là loại bài toán học máy nào?

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 4: Khi phân tích dữ liệu bán hàng theo thời gian, nhà khoa học dữ liệu nhận thấy doanh số tăng mạnh vào cuối mỗi quý. Việc sử dụng biểu đồ đường (Line chart) để thể hiện xu hướng này thuộc về giai đoạn nào trong quy trình khoa học dữ liệu?

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 5: Khái niệm nào sau đây mô tả khả năng của hệ thống khoa học dữ liệu trong việc đưa ra các đề xuất sản phẩm phù hợp cho từng khách hàng dựa trên lịch sử duyệt web và mua hàng của họ?

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 6: Một ngân hàng sử dụng khoa học dữ liệu để phát hiện các giao dịch có dấu hiệu bất thường, khác biệt đáng kể so với hành vi tiêu dùng thông thường của khách hàng. Ứng dụng này thuộc nhóm kỹ thuật nào?

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 7: Lĩnh vực nào đóng vai trò cung cấp nền tảng toán học cho các thuật toán và mô hình được sử dụng trong khoa học dữ liệu, đặc biệt là trong thống kê suy luận và tối ưu hóa?

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 8: Khi xây dựng mô hình dự đoán, nhà khoa học dữ liệu cần đánh giá hiệu quả của mô hình bằng cách sử dụng các chỉ số như độ chính xác (accuracy), độ nhạy (sensitivity), độ đặc hiệu (specificity), v.v. Hoạt động này thuộc giai đoạn nào trong quy trình khoa học dữ liệu?

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 9: Mục tiêu cuối cùng của khoa học dữ liệu là gì, sau khi đã thu thập, xử lý, phân tích và xây dựng mô hình?

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 10: Một bệnh viện muốn phân tích dữ liệu bệnh án để dự đoán khả năng tái nhập viện của bệnh nhân sau khi xuất viện. Đây là bài toán thuộc ứng dụng khoa học dữ liệu trong lĩnh vực nào?

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 11: Kỹ thuật nào trong khoa học dữ liệu giúp tìm ra các mối quan hệ 'nếu-thì' giữa các mặt hàng trong giỏ hàng của khách hàng, ví dụ 'Nếu khách hàng mua sữa, họ có xu hướng mua bánh mì'?

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 12: Việc sử dụng các thư viện lập trình như Pandas và NumPy trong Python để thao tác và biến đổi dữ liệu thuộc giai đoạn nào trong quy trình khoa học dữ liệu?

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 13: Một công ty truyền thông muốn phân tích hành vi người dùng trên website để hiểu rõ họ dành thời gian cho loại nội dung nào nhiều nhất. Dữ liệu được thu thập từ nhật ký truy cập website. Đây là ví dụ về loại dữ liệu nào?

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 14: Thuật ngữ 'Big Data' trong khoa học dữ liệu thường đề cập đến dữ liệu có những đặc điểm chính nào?

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 15: Tại sao giai đoạn tiền xử lý dữ liệu lại quan trọng trong khoa học dữ liệu?

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 16: Một nhà khoa học dữ liệu được giao nhiệm vụ xây dựng hệ thống phân loại email thành 'Thư rác' hoặc 'Không phải thư rác'. Đây là bài toán thuộc loại nào?

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 17: Công ty Netflix sử dụng khoa học dữ liệu để phân tích thói quen xem phim của người dùng và gợi ý các bộ phim/chương trình truyền hình phù hợp. Ứng dụng này minh họa cho thành tựu nào của khoa học dữ liệu?

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 18: Khi trực quan hóa dữ liệu để so sánh doanh số bán hàng giữa các vùng địa lý khác nhau, loại biểu đồ nào sau đây thường được sử dụng để hiển thị sự phân bố trên bản đồ?

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 19: Một trong những thách thức lớn nhất khi làm việc với Big Data trong khoa học dữ liệu là gì?

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 20: Trong lĩnh vực tài chính, khoa học dữ liệu được ứng dụng để dự đoán xu hướng thị trường chứng khoán. Đây là một ví dụ về bài toán thuộc loại nào?

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 21: Kỹ năng nào sau đây được coi là quan trọng đối với một nhà khoa học dữ liệu, bên cạnh kiến thức về toán học, thống kê và khoa học máy tính?

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 22: Một trong những mục tiêu chính của khoa học dữ liệu là 'khám phá tri thức'. Điều này có nghĩa là gì?

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 23: Khi một công ty sử dụng dữ liệu hành vi khách hàng để tối ưu hóa bố cục website nhằm tăng tỷ lệ chuyển đổi (conversion rate), đây là ứng dụng khoa học dữ liệu vào mục tiêu nào?

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 24: Công cụ nào sau đây KHÔNG phải là một công cụ phổ biến được sử dụng trong khoa học dữ liệu để phân tích và trực quan hóa?

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 25: Một nhà khoa học dữ liệu đang nghiên cứu dữ liệu về các bài báo khoa học để nhóm các bài báo có chủ đề tương tự lại với nhau mà không có nhãn phân loại trước. Kỹ thuật này thuộc loại học máy nào?

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 26: Khi phân tích dữ liệu hình ảnh y tế (ví dụ: ảnh X-quang), khoa học dữ liệu có thể được sử dụng để hỗ trợ chẩn đoán bệnh. Lĩnh vực nào của khoa học máy tính đóng vai trò quan trọng trong việc xử lý và phân tích loại dữ liệu này?

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 27: Đâu là một ví dụ về ứng dụng khoa học dữ liệu trong lĩnh vực nông nghiệp?

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 28: Một công ty viễn thông muốn phân tích dữ liệu sử dụng dịch vụ của khách hàng để xác định những khách hàng có nguy cơ cao chuyển sang nhà mạng khác (churn prediction). Đây là bài toán phân loại (classification). Đặc điểm của bài toán này là gì?

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 29: Tại sao việc hiểu rõ ngữ cảnh kinh doanh hoặc lĩnh vực ứng dụng lại quan trọng đối với nhà khoa học dữ liệu?

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 6

Câu 30: Trực quan hóa dữ liệu không chỉ giúp trình bày kết quả mà còn đóng vai trò quan trọng trong giai đoạn khám phá dữ liệu (Exploratory Data Analysis - EDA). Vai trò đó là gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 07

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 07 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Khoa học dữ liệu được định nghĩa là một lĩnh vực liên ngành. Sự liên ngành này chủ yếu kết hợp những nhóm kiến thức cốt lõi nào để trích xuất tri thức và hiểu biết từ dữ liệu?

  • A. Lịch sử, Địa lý, và Toán học.
  • B. Văn học, Nghệ thuật, và Khoa học máy tính.
  • C. Kinh tế học, Xã hội học, và Sinh học.
  • D. Toán học (bao gồm Thống kê), Khoa học máy tính (bao gồm AI và Học máy), và kiến thức chuyên môn về lĩnh vực ứng dụng.

Câu 2: Mục tiêu cốt lõi nào sau đây thể hiện rõ nhất giá trị của Khoa học dữ liệu trong việc hỗ trợ các tổ chức đưa ra quyết định dựa trên dữ liệu?

  • A. Thu thập càng nhiều dữ liệu càng tốt mà không cần xử lý.
  • B. Lưu trữ dữ liệu trên các hệ thống máy tính mạnh mẽ.
  • C. Phân tích dữ liệu để khám phá thông tin ẩn, xây dựng mô hình dự báo hoặc phân loại, từ đó tối ưu hóa các quyết định và hành động.
  • D. Chỉ tạo ra các biểu đồ đẹp mắt để trình bày.

Câu 3: Một công ty thương mại điện tử muốn hiểu rõ hành vi mua sắm của khách hàng để đưa ra các gợi ý sản phẩm phù hợp. Họ phân tích lịch sử duyệt web, các sản phẩm đã mua, và thông tin nhân khẩu học. Công việc này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Phân tích và khám phá dữ liệu (Exploratory Data Analysis) và Mô hình hóa.
  • C. Triển khai và giám sát.
  • D. Trực quan hóa dữ liệu ban đầu.

Câu 4: Tại sao giai đoạn làm sạch dữ liệu (Data Cleaning) lại quan trọng trong quy trình Khoa học dữ liệu?

  • A. Dữ liệu thực tế thường chứa sai sót, giá trị thiếu, hoặc định dạng không nhất quán, có thể ảnh hưởng nghiêm trọng đến kết quả phân tích và độ chính xác của mô hình.
  • B. Làm sạch dữ liệu giúp giảm kích thước của tập dữ liệu, tiết kiệm không gian lưu trữ.
  • C. Đây là bước bắt buộc theo quy định của pháp luật về bảo mật dữ liệu.
  • D. Làm sạch dữ liệu chỉ cần thiết đối với dữ liệu văn bản, không cần cho dữ liệu số.

Câu 5: Một nhà khoa học dữ liệu đang xem xét một tập dữ liệu về doanh số bán hàng và nhận thấy có một số giao dịch có giá trị rất cao bất thường so với phần còn lại. Việc xác định và xử lý các giao dịch này có thể thuộc kỹ thuật khám phá tri thức nào?

  • A. Khai phá luật kết hợp (Association Rule Mining).
  • B. Gom cụm (Clustering).
  • C. Phát hiện ngoại lệ (Anomaly Detection).
  • D. Giảm chiều dữ liệu (Dimensionality Reduction).

Câu 6: Kỹ thuật gom cụm (Clustering) trong Khoa học dữ liệu được sử dụng để làm gì?

  • A. Dự đoán một giá trị số dựa trên các thuộc tính khác.
  • B. Phân chia tập dữ liệu thành các nhóm (cụm) dựa trên mức độ tương đồng giữa các điểm dữ liệu mà không có nhãn được định nghĩa trước.
  • C. Phân loại các điểm dữ liệu vào các danh mục (lớp) đã được định nghĩa trước.
  • D. Tìm ra mối quan hệ "nếu-thì" giữa các mục trong tập dữ liệu.

Câu 7: Một công ty bảo hiểm muốn dự báo khả năng một khách hàng sẽ yêu cầu bồi thường trong năm tới dựa trên lịch sử yêu cầu bồi thường trước đây, tuổi, loại hợp đồng, v.v. Vấn đề này phù hợp nhất với dạng bài toán nào trong Học máy (một phần của Khoa học dữ liệu)?

  • A. Bài toán phân loại (Classification).
  • B. Bài toán hồi quy (Regression).
  • C. Bài toán gom cụm (Clustering).
  • D. Bài toán giảm chiều dữ liệu (Dimensionality Reduction).

Câu 8: Một nhà khoa học dữ liệu cần trình bày kết quả phân tích xu hướng doanh số bán hàng theo thời gian cho ban lãnh đạo. Công cụ hoặc kỹ thuật nào sau đây là hữu ích nhất để làm việc này một cách hiệu quả?

  • A. Thu thập thêm dữ liệu từ các nguồn khác.
  • B. Chạy lại mô hình dự báo với các tham số khác.
  • C. Viết một báo cáo văn bản dài chi tiết.
  • D. Sử dụng biểu đồ đường (Line chart) hoặc biểu đồ cột (Bar chart) để trực quan hóa dữ liệu.

Câu 9: Trực quan hóa dữ liệu (Data Visualization) đóng vai trò gì trong quy trình Khoa học dữ liệu?

  • A. Là bước cuối cùng và duy nhất để đưa ra quyết định.
  • B. Giúp khám phá các mẫu, xu hướng, ngoại lệ trong dữ liệu; truyền đạt kết quả phân tích một cách rõ ràng và dễ hiểu; hỗ trợ việc kiểm tra và gỡ lỗi mô hình.
  • C. Chỉ dùng để làm cho báo cáo trông hấp dẫn hơn.
  • D. Là công cụ chính để làm sạch dữ liệu.

Câu 10: Lĩnh vực nào sau đây là ứng dụng điển hình của Khoa học dữ liệu trong việc cá nhân hóa trải nghiệm người dùng?

  • A. Hệ thống gợi ý sản phẩm trên các sàn thương mại điện tử (ví dụ: "Khách hàng mua sản phẩm X cũng thường mua sản phẩm Y").
  • B. Quản lý dây chuyền sản xuất trong nhà máy.
  • C. Dự báo thời tiết hàng ngày.
  • D. Tính toán quỹ đạo bay của vệ tinh.

Câu 11: Trong y tế, Khoa học dữ liệu được ứng dụng để hỗ trợ chẩn đoán bệnh. Điều này thường liên quan đến việc phân tích loại dữ liệu nào?

  • A. Dữ liệu về thời tiết địa phương.
  • B. Dữ liệu về giá cổ phiếu của các công ty dược phẩm.
  • C. Dữ liệu về số lượng giường bệnh trống.
  • D. Dữ liệu bệnh sử bệnh nhân, kết quả xét nghiệm, hình ảnh y khoa (X-quang, MRI), dữ liệu gen.

Câu 12: Một ngân hàng muốn phát hiện các giao dịch có dấu hiệu gian lận. Họ sử dụng dữ liệu về lịch sử giao dịch, địa điểm, thời gian, và các yếu tố khác để xây dựng mô hình. Đây là một ứng dụng của Khoa học dữ liệu trong lĩnh vực nào và thường sử dụng kỹ thuật gì?

  • A. Marketing - Gom cụm.
  • B. Quản lý nhân sự - Khai phá luật kết hợp.
  • C. Tài chính - Phát hiện ngoại lệ.
  • D. Logistics - Giảm chiều dữ liệu.

Câu 13: Khi làm việc với tập dữ liệu lớn, việc giảm chiều dữ liệu (Dimensionality Reduction) có thể mang lại lợi ích gì?

  • A. Tăng số lượng các biến (thuộc tính) để mô hình học được nhiều hơn.
  • B. Giúp loại bỏ các biến không quan trọng hoặc dư thừa, giảm nhiễu, tăng tốc độ tính toán, và có thể cải thiện hiệu suất của mô hình học máy.
  • C. Làm cho dữ liệu phức tạp hơn để phân tích.
  • D. Chỉ áp dụng cho dữ liệu hình ảnh.

Câu 14: Sự khác biệt cơ bản giữa Khoa học dữ liệu và Phân tích dữ liệu truyền thống (Traditional Data Analysis) là gì?

  • A. Khoa học dữ liệu chỉ sử dụng dữ liệu số, còn phân tích truyền thống sử dụng mọi loại dữ liệu.
  • B. Khoa học dữ liệu không cần đến thống kê, còn phân tích truyền thống thì có.
  • C. Phân tích truyền thống tập trung vào dự báo, còn Khoa học dữ liệu chỉ mô tả dữ liệu quá khứ.
  • D. Khoa học dữ liệu có phạm vi rộng hơn, sử dụng các kỹ thuật phức tạp hơn từ AI/Học máy để không chỉ mô tả quá khứ mà còn dự báo, khám phá sâu và hỗ trợ ra quyết định trong các tình huống phức tạp, thường làm việc với dữ liệu lớn và đa dạng.

Câu 15: Công cụ hoặc ngôn ngữ lập trình nào sau đây được sử dụng phổ biến trong Khoa học dữ liệu để xử lý, phân tích và mô hình hóa dữ liệu?

  • A. Python (với các thư viện như Pandas, NumPy, Scikit-learn) và R.
  • B. Microsoft Word và Excel.
  • C. Adobe Photoshop và Illustrator.
  • D. HTML và CSS.

Câu 16: Giả sử bạn có một tập dữ liệu về các bài báo khoa học và muốn nhóm chúng lại thành các chủ đề khác nhau một cách tự động mà không cần biết trước các chủ đề đó là gì. Kỹ thuật nào trong Khoa học dữ liệu sẽ phù hợp nhất?

  • A. Phân loại (Classification).
  • B. Gom cụm (Clustering).
  • C. Hồi quy (Regression).
  • D. Phát hiện ngoại lệ (Anomaly Detection).

Câu 17: Khi xây dựng một mô hình dự báo trong Khoa học dữ liệu, việc đánh giá hiệu suất của mô hình là rất quan trọng. Chỉ số nào sau đây thường được sử dụng để đo lường mức độ chính xác của một mô hình phân loại?

  • A. R-squared.
  • B. Mean Squared Error (MSE).
  • C. Accuracy, Precision, Recall, F1-score.
  • D. Standard Deviation.

Câu 18: Một trong những thách thức lớn khi làm việc với dữ liệu lớn (Big Data) trong Khoa học dữ liệu là gì?

  • A. Thiếu công cụ để xử lý.
  • B. Dữ liệu lớn luôn sạch và có cấu trúc hoàn hảo.
  • C. Chi phí lưu trữ rất thấp.
  • D. Việc thu thập, lưu trữ, xử lý và phân tích dữ liệu có khối lượng, tốc độ và sự đa dạng lớn đòi hỏi hạ tầng công nghệ và kỹ thuật xử lý chuyên biệt.

Câu 19: Đạo đức trong Khoa học dữ liệu đề cập đến những vấn đề nào?

  • A. Bảo mật dữ liệu, quyền riêng tư của người dùng, tính công bằng và minh bạch của thuật toán, tránh thiên vị (bias) trong dữ liệu và mô hình.
  • B. Tốc độ xử lý dữ liệu.
  • C. Số lượng dòng trong tập dữ liệu.
  • D. Chỉ liên quan đến việc sử dụng phần mềm có bản quyền.

Câu 20: Một công ty muốn tối ưu hóa chuỗi cung ứng của mình bằng cách dự báo nhu cầu sản phẩm trong tương lai để điều chỉnh lượng hàng tồn kho. Đây là một ứng dụng của Khoa học dữ liệu thuộc lĩnh vực nào?

  • A. Tuyển dụng nhân sự.
  • B. Kinh doanh và Vận hành (Business and Operations).
  • C. Nghiên cứu khoa học cơ bản.
  • D. Sản xuất phim ảnh.

Câu 21: Vai trò của Thống kê trong Khoa học dữ liệu là gì?

  • A. Cung cấp các công cụ để viết mã phần mềm.
  • B. Chỉ để tạo ra các biểu đồ đơn giản.
  • C. Cung cấp nền tảng lý thuyết và các phương pháp để thu thập, tổ chức, phân tích, diễn giải và trình bày dữ liệu, hiểu về sự biến động và đưa ra suy luận.
  • D. Thiết kế giao diện người dùng cho các ứng dụng dữ liệu.

Câu 22: Khai phá luật kết hợp (Association Rule Mining), ví dụ như tìm ra quy tắc "Nếu khách hàng mua bỉm, họ có xu hướng mua bia", thường được ứng dụng trong lĩnh vực nào?

  • A. Phân tích giỏ hàng trong bán lẻ để tối ưu hóa vị trí sản phẩm và chiến lược khuyến mãi.
  • B. Phân tích hình ảnh y tế.
  • C. Dự báo thời tiết.
  • D. Kiểm soát chất lượng trong sản xuất.

Câu 23: Khi một nhà khoa học dữ liệu xây dựng một mô hình Học máy, bước nào sau đây thường được thực hiện sau khi dữ liệu đã được thu thập và làm sạch?

  • A. Viết báo cáo cuối cùng và trình bày kết quả.
  • B. Triển khai mô hình vào môi trường sản phẩm ngay lập tức.
  • C. Bỏ qua việc phân tích khám phá và xây dựng mô hình ngay.
  • D. Phân tích khám phá dữ liệu (EDA), chọn lọc và kỹ thuật đặc trưng (Feature Engineering), chọn mô hình và huấn luyện.

Câu 24: Một công ty truyền thông muốn phân tích cảm xúc của người dùng về một sản phẩm mới dựa trên các bình luận trên mạng xã hội. Đây là một ví dụ về việc phân tích loại dữ liệu nào và thường sử dụng kỹ thuật gì?

  • A. Dữ liệu số - Hồi quy tuyến tính.
  • B. Dữ liệu văn bản (Text Data) - Phân tích cảm xúc (Sentiment Analysis).
  • C. Dữ liệu hình ảnh - Nhận dạng đối tượng.
  • D. Dữ liệu thời gian - Dự báo chuỗi thời gian.

Câu 25: Trong bối cảnh Khoa học dữ liệu, "mô hình" (model) có thể hiểu là gì?

  • A. Một tệp Excel chứa dữ liệu thô.
  • B. Một báo cáo cuối cùng trình bày kết quả phân tích.
  • C. Sự biểu diễn toán học hoặc thuật toán về mối quan hệ giữa các biến trong dữ liệu, được xây dựng để dự báo, phân loại, hoặc khám phá cấu trúc ẩn.
  • D. Phần mềm trực quan hóa dữ liệu.

Câu 26: Một nhà bán lẻ trực tuyến muốn phân khúc khách hàng của mình thành các nhóm khác nhau (ví dụ: khách hàng chi tiêu cao, khách hàng thường xuyên, khách hàng mới) để áp dụng các chiến lược marketing riêng biệt. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho mục tiêu này?

  • A. Gom cụm (Clustering).
  • B. Hồi quy (Regression).
  • C. Phát hiện ngoại lệ (Anomaly Detection).
  • D. Phân tích chuỗi thời gian (Time Series Analysis).

Câu 27: Giả sử bạn xây dựng một mô hình dự đoán giá nhà dựa trên diện tích, số phòng ngủ, vị trí, v.v. Đây là một ví dụ về dạng bài toán nào trong Học máy?

  • A. Bài toán phân loại (Classification).
  • B. Bài toán hồi quy (Regression).
  • C. Bài toán gom cụm (Clustering).
  • D. Bài toán khai phá luật kết hợp (Association Rule Mining).

Câu 28: Khả năng nào sau đây thể hiện sự khác biệt rõ rệt giữa một chuyên gia Khoa học dữ liệu và một chuyên viên phân tích dữ liệu truyền thống (Business Analyst) trong bối cảnh hiện đại?

  • A. Chuyên viên phân tích dữ liệu truyền thống có thể sử dụng Excel, còn chuyên gia Khoa học dữ liệu thì không.
  • B. Chuyên gia Khoa học dữ liệu chỉ làm việc với dữ liệu có cấu trúc, còn chuyên viên phân tích dữ liệu làm việc với mọi loại dữ liệu.
  • C. Chuyên viên phân tích dữ liệu truyền thống có thể xây dựng mô hình Học máy phức tạp, còn chuyên gia Khoa học dữ liệu thì không.
  • D. Chuyên gia Khoa học dữ liệu thường có nền tảng sâu hơn về toán học/thống kê và khoa học máy tính, có khả năng xây dựng, tùy chỉnh, và triển khai các mô hình Học máy phức tạp để giải quyết các vấn đề dự báo/phân loại/khám phá sâu, trong khi chuyên viên phân tích dữ liệu thường tập trung vào việc báo cáo, trực quan hóa và phân tích dữ liệu quá khứ/hiện tại bằng các công cụ có sẵn.

Câu 29: Tại sao việc hiểu biết về lĩnh vực ứng dụng (Domain Knowledge) lại quan trọng đối với một nhà khoa học dữ liệu?

  • A. Giúp hiểu ngữ cảnh của dữ liệu, đặt ra câu hỏi đúng, diễn giải kết quả phân tích một cách chính xác, và xây dựng các đặc trưng (features) có ý nghĩa cho mô hình.
  • B. Chỉ để giao tiếp tốt hơn với khách hàng.
  • C. Không quan trọng, chỉ cần giỏi về thuật toán và mã hóa.
  • D. Giúp thu thập thêm dữ liệu ngẫu nhiên.

Câu 30: Công nghệ nào sau đây là nền tảng quan trọng cho việc xử lý và lưu trữ dữ liệu lớn trong các dự án Khoa học dữ liệu quy mô lớn?

  • A. Microsoft Word.
  • B. Máy tính cá nhân thông thường.
  • C. Các hệ thống xử lý phân tán như Hadoop, Spark và cơ sở dữ liệu NoSQL.
  • D. Máy in 3D.

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 1: Khoa học dữ liệu được định nghĩa là một lĩnh vực liên ngành. Sự liên ngành này chủ yếu kết hợp những nhóm kiến thức cốt lõi nào để trích xuất tri thức và hiểu biết từ dữ liệu?

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 2: Mục tiêu cốt lõi nào sau đây thể hiện rõ nhất giá trị của Khoa học dữ liệu trong việc hỗ trợ các tổ chức đưa ra quyết định dựa trên dữ liệu?

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 3: Một công ty thương mại điện tử muốn hiểu rõ hành vi mua sắm của khách hàng để đưa ra các gợi ý sản phẩm phù hợp. Họ phân tích lịch sử duyệt web, các sản phẩm đã mua, và thông tin nhân khẩu học. Công việc này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 4: Tại sao giai đoạn làm sạch dữ liệu (Data Cleaning) lại quan trọng trong quy trình Khoa học dữ liệu?

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 5: Một nhà khoa học dữ liệu đang xem xét một tập dữ liệu về doanh số bán hàng và nhận thấy có một số giao dịch có giá trị rất cao bất thường so với phần còn lại. Việc xác định và xử lý các giao dịch này có thể thuộc kỹ thuật khám phá tri thức nào?

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 6: Kỹ thuật gom cụm (Clustering) trong Khoa học dữ liệu được sử dụng để làm gì?

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 7: Một công ty bảo hiểm muốn dự báo khả năng một khách hàng sẽ yêu cầu bồi thường trong năm tới dựa trên lịch sử yêu cầu bồi thường trước đây, tuổi, loại hợp đồng, v.v. Vấn đề này phù hợp nhất với dạng bài toán nào trong Học máy (một phần của Khoa học dữ liệu)?

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 8: Một nhà khoa học dữ liệu cần trình bày kết quả phân tích xu hướng doanh số bán hàng theo thời gian cho ban lãnh đạo. Công cụ hoặc kỹ thuật nào sau đây là hữu ích nhất để làm việc này một cách hiệu quả?

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 9: Trực quan hóa dữ liệu (Data Visualization) đóng vai trò gì trong quy trình Khoa học dữ liệu?

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 10: Lĩnh vực nào sau đây là ứng dụng điển hình của Khoa học dữ liệu trong việc cá nhân hóa trải nghiệm người dùng?

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 11: Trong y tế, Khoa học dữ liệu được ứng dụng để hỗ trợ chẩn đoán bệnh. Điều này thường liên quan đến việc phân tích loại dữ liệu nào?

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 12: Một ngân hàng muốn phát hiện các giao dịch có dấu hiệu gian lận. Họ sử dụng dữ liệu về lịch sử giao dịch, địa điểm, thời gian, và các yếu tố khác để xây dựng mô hình. Đây là một ứng dụng của Khoa học dữ liệu trong lĩnh vực nào và thường sử dụng kỹ thuật gì?

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 13: Khi làm việc với tập dữ liệu lớn, việc giảm chiều dữ liệu (Dimensionality Reduction) có thể mang lại lợi ích gì?

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 14: Sự khác biệt cơ bản giữa Khoa học dữ liệu và Phân tích dữ liệu truyền thống (Traditional Data Analysis) là gì?

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 15: Công cụ hoặc ngôn ngữ lập trình nào sau đây được sử dụng phổ biến trong Khoa học dữ liệu để xử lý, phân tích và mô hình hóa dữ liệu?

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 16: Giả sử bạn có một tập dữ liệu về các bài báo khoa học và muốn nhóm chúng lại thành các chủ đề khác nhau một cách tự động mà không cần biết trước các chủ đề đó là gì. Kỹ thuật nào trong Khoa học dữ liệu sẽ phù hợp nhất?

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 17: Khi xây dựng một mô hình dự báo trong Khoa học dữ liệu, việc đánh giá hiệu suất của mô hình là rất quan trọng. Chỉ số nào sau đây thường được sử dụng để đo lường mức độ chính xác của một mô hình phân loại?

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 18: Một trong những thách thức lớn khi làm việc với dữ liệu lớn (Big Data) trong Khoa học dữ liệu là gì?

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 19: Đạo đức trong Khoa học dữ liệu đề cập đến những vấn đề nào?

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 20: Một công ty muốn tối ưu hóa chuỗi cung ứng của mình bằng cách dự báo nhu cầu sản phẩm trong tương lai để điều chỉnh lượng hàng tồn kho. Đây là một ứng dụng của Khoa học dữ liệu thuộc lĩnh vực nào?

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 21: Vai trò của Thống kê trong Khoa học dữ liệu là gì?

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 22: Khai phá luật kết hợp (Association Rule Mining), ví dụ như tìm ra quy tắc 'Nếu khách hàng mua bỉm, họ có xu hướng mua bia', thường được ứng dụng trong lĩnh vực nào?

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 23: Khi một nhà khoa học dữ liệu xây dựng một mô hình Học máy, bước nào sau đây thường được thực hiện sau khi dữ liệu đã được thu thập và làm sạch?

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 24: Một công ty truyền thông muốn phân tích cảm xúc của người dùng về một sản phẩm mới dựa trên các bình luận trên mạng xã hội. Đây là một ví dụ về việc phân tích loại dữ liệu nào và thường sử dụng kỹ thuật gì?

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 25: Trong bối cảnh Khoa học dữ liệu, 'mô hình' (model) có thể hiểu là gì?

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 26: Một nhà bán lẻ trực tuyến muốn phân khúc khách hàng của mình thành các nhóm khác nhau (ví dụ: khách hàng chi tiêu cao, khách hàng thường xuyên, khách hàng mới) để áp dụng các chiến lược marketing riêng biệt. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho mục tiêu này?

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 27: Giả sử bạn xây dựng một mô hình dự đoán giá nhà dựa trên diện tích, số phòng ngủ, vị trí, v.v. Đây là một ví dụ về dạng bài toán nào trong Học máy?

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 28: Khả năng nào sau đây thể hiện sự khác biệt rõ rệt giữa một chuyên gia Khoa học dữ liệu và một chuyên viên phân tích dữ liệu truyền thống (Business Analyst) trong bối cảnh hiện đại?

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 29: Tại sao việc hiểu biết về lĩnh vực ứng dụng (Domain Knowledge) lại quan trọng đối với một nhà khoa học dữ liệu?

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 7

Câu 30: Công nghệ nào sau đây là nền tảng quan trọng cho việc xử lý và lưu trữ dữ liệu lớn trong các dự án Khoa học dữ liệu quy mô lớn?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 08

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 08 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Một công ty bán lẻ muốn hiểu tại sao doanh số bán hàng trực tuyến của họ sụt giảm trong quý vừa qua. Họ thu thập dữ liệu về hành vi người dùng trên website, lịch sử mua hàng, chiến dịch marketing và các sự kiện kinh tế. Theo em, mục tiêu chính của việc áp dụng Khoa học dữ liệu trong trường hợp này là gì?

  • A. Xây dựng mô hình dự đoán giá cổ phiếu của công ty.
  • B. Tự động hóa quy trình đóng gói sản phẩm.
  • C. Phân tích và khám phá thông tin ẩn chứa trong dữ liệu để tìm ra nguyên nhân.
  • D. Thiết kế lại giao diện website cho đẹp hơn.

Câu 2: Một nhà khoa học dữ liệu đang làm việc với tập dữ liệu về các giao dịch ngân hàng để phát hiện hoạt động gian lận. Anh ấy sử dụng một thuật toán học máy để phân loại các giao dịch là "gian lận" hoặc "không gian lận". Đây là ví dụ về ứng dụng Khoa học dữ liệu trong lĩnh vực nào và sử dụng kỹ thuật chính nào?

  • A. Y tế - Dự đoán bệnh.
  • B. Bán lẻ - Đề xuất sản phẩm.
  • C. Giáo dục - Phân tích kết quả học tập.
  • D. Tài chính - Phát hiện bất thường (Anomaly Detection).

Câu 3: Giả sử em có một tập dữ liệu lớn về các bài báo khoa học và muốn nhóm chúng lại thành các chủ đề khác nhau mà không biết trước các chủ đề đó là gì. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất để thực hiện việc này?

  • A. Hồi quy tuyến tính (Linear Regression).
  • B. Gom cụm (Clustering).
  • C. Phân loại (Classification).
  • D. Khai phá luật kết hợp (Association Rule Mining).

Câu 4: Một công ty truyền thông muốn cá nhân hóa nội dung hiển thị cho từng người dùng trên nền tảng của họ. Họ thu thập dữ liệu về lịch sử xem, tìm kiếm, và tương tác của người dùng. Ứng dụng Khoa học dữ liệu này thuộc nhóm mục tiêu nào?

  • A. Tối ưu hóa quyết định và trải nghiệm người dùng.
  • B. Giảm chi phí vận hành máy chủ.
  • C. Tăng cường bảo mật hệ thống.
  • D. Tự động dịch ngôn ngữ nội dung.

Câu 5: Bước nào trong quy trình Khoa học dữ liệu thường chiếm nhiều thời gian và công sức nhất, bao gồm việc xử lý dữ liệu thiếu, không nhất quán hoặc sai định dạng?

  • A. Xây dựng mô hình (Modeling).
  • B. Trực quan hóa dữ liệu (Visualization).
  • C. Làm sạch và tiền xử lý dữ liệu (Data Cleaning and Preprocessing).
  • D. Triển khai mô hình (Deployment).

Câu 6: Khi một nhà khoa học dữ liệu tạo ra biểu đồ cột để hiển thị doanh số bán hàng theo từng tháng hoặc biểu đồ phân tán để xem mối quan hệ giữa hai biến, họ đang thực hiện bước nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu (Data Collection).
  • B. Xây dựng mô hình (Modeling).
  • C. Kiểm định giả thuyết (Hypothesis Testing).
  • D. Khám phá và trực quan hóa dữ liệu (Exploratory Data Analysis - EDA & Visualization).

Câu 7: Một công ty thương mại điện tử muốn dự đoán sản phẩm nào có khả năng được một khách hàng cụ thể mua trong lần truy cập tiếp theo dựa trên lịch sử mua hàng và hành vi duyệt web của họ. Kỹ thuật Khoa học dữ liệu nào thường được sử dụng cho mục đích này?

  • A. Hệ thống gợi ý (Recommendation Systems).
  • B. Phát hiện ngoại lệ (Anomaly Detection).
  • C. Giảm chiều dữ liệu (Dimensionality Reduction).
  • D. Phân tích cảm xúc (Sentiment Analysis).

Câu 8: Trong lĩnh vực y tế, Khoa học dữ liệu có thể hỗ trợ các bác sĩ trong việc chẩn đoán bệnh dựa trên phân tích hình ảnh y khoa (như X-quang, MRI). Điều này thể hiện sự kết hợp của Khoa học dữ liệu với lĩnh vực nào khác?

  • A. Kinh tế học.
  • B. Trí tuệ nhân tạo (AI) và Học máy (Machine Learning).
  • C. Vật lý học.
  • D. Luật học.

Câu 9: Giả sử em có một tập dữ liệu về nhiệt độ và lượng mưa hàng ngày trong 10 năm qua của một thành phố. Em muốn xây dựng một mô hình để dự đoán nhiệt độ cao nhất vào ngày mai. Đây là bài toán thuộc loại hình học máy nào trong Khoa học dữ liệu?

  • A. Gom cụm (Clustering).
  • B. Phát hiện ngoại lệ (Anomaly Detection).
  • C. Hồi quy (Regression).
  • D. Khai phá luật kết hợp (Association Rule Mining).

Câu 10: Đâu là một thách thức lớn khi làm việc với dữ liệu trong Khoa học dữ liệu, đặc biệt là với dữ liệu lớn (Big Data)?

  • A. Dữ liệu quá sạch và có cấu trúc hoàn hảo.
  • B. Luôn có đủ tài nguyên tính toán miễn phí.
  • C. Việc trực quan hóa dữ liệu luôn đơn giản.
  • D. Dữ liệu không đầy đủ, không nhất quán, nhiễu hoặc có định dạng phức tạp.

Câu 11: Một nhà khoa học dữ liệu cần trình bày kết quả phân tích của mình cho những người không chuyên về kỹ thuật. Bước nào trong quy trình Khoa học dữ liệu giúp truyền đạt thông tin và hiểu biết một cách hiệu quả nhất?

  • A. Thu thập dữ liệu.
  • B. Trực quan hóa dữ liệu và báo cáo kết quả.
  • C. Lựa chọn thuật toán học máy.
  • D. Huấn luyện mô hình.

Câu 12: Công nghệ tự lái của ô tô là một ví dụ điển hình về ứng dụng của Khoa học dữ liệu kết hợp với lĩnh vực nào?

  • A. Lịch sử học.
  • B. Văn học.
  • C. Thị giác máy tính (Computer Vision) và Học sâu (Deep Learning).
  • D. Triết học.

Câu 13: Khi một website tin tức sử dụng dữ liệu về các bài viết người dùng đã đọc để gợi ý các bài viết khác có chủ đề tương tự, họ đang sử dụng kỹ thuật nào của Khoa học dữ liệu?

  • A. Hệ thống gợi ý dựa trên nội dung hoặc cộng tác lọc.
  • B. Phân tích chuỗi thời gian.
  • C. Kiểm định A/B.
  • D. Tối ưu hóa tuyến tính.

Câu 14: Đâu là vai trò quan trọng của Thống kê trong Khoa học dữ liệu?

  • A. Thiết kế chip máy tính.
  • B. Xây dựng cơ sở hạ tầng mạng.
  • C. Lập trình giao diện người dùng.
  • D. Cung cấp nền tảng toán học để hiểu dữ liệu, kiểm định giả thuyết và xây dựng mô hình suy luận.

Câu 15: Một nhà bán lẻ muốn tìm hiểu xem những khách hàng mua "sữa" có thường mua kèm "bánh mì" hay không để sắp xếp hàng hóa trong siêu thị hiệu quả hơn hoặc tạo combo khuyến mãi. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho bài toán này?

  • A. Phân tích cảm xúc.
  • B. Khai phá luật kết hợp (Association Rule Mining), ví dụ thuật toán Apriori.
  • C. Hồi quy Logistic.
  • D. Phân tích thành phần chính (PCA).

Câu 16: Trong giai đoạn tiền xử lý dữ liệu, việc xử lý dữ liệu thiếu (missing data) là rất quan trọng. Nếu bỏ qua dữ liệu thiếu, điều gì có thể xảy ra đối với mô hình Khoa học dữ liệu được xây dựng sau đó?

  • A. Mô hình sẽ luôn chính xác hơn.
  • B. Quá trình huấn luyện mô hình sẽ nhanh hơn đáng kể.
  • C. Kết quả phân tích hoặc mô hình có thể bị sai lệch hoặc không đáng tin cậy.
  • D. Việc trực quan hóa dữ liệu sẽ dễ dàng hơn.

Câu 17: Một nhà khoa học dữ liệu đang phân tích dữ liệu về thói quen sử dụng mạng xã hội của thanh thiếu niên. Anh ấy phát hiện ra một số hành vi bất thường, có thể là dấu hiệu của bắt nạt trực tuyến. Kỹ thuật nào đang được áp dụng ở đây?

  • A. Phân tích hồi quy.
  • B. Gom cụm.
  • C. Phân loại.
  • D. Phát hiện ngoại lệ (Anomaly Detection).

Câu 18: Việc sử dụng dữ liệu cá nhân của người dùng (như lịch sử mua hàng, vị trí, sở thích) để phục vụ mục đích thương mại mà không có sự đồng ý rõ ràng có thể gây ra vấn đề gì?

  • A. Vi phạm quyền riêng tư và các vấn đề đạo đức, pháp lý.
  • B. Làm tăng độ chính xác của mô hình.
  • C. Giảm chi phí thu thập dữ liệu.
  • D. Luôn được người dùng đón nhận tích cực.

Câu 19: Một trường học muốn phân tích dữ liệu điểm thi của học sinh trong nhiều năm để xác định các yếu tố (như số giờ tự học, tham gia hoạt động ngoại khóa) có ảnh hưởng đến kết quả học tập. Mục tiêu này liên quan chủ yếu đến khía cạnh nào của Khoa học dữ liệu?

  • A. Tự động hóa quá trình chấm điểm.
  • B. Thiết kế lại phòng học.
  • C. Khám phá tri thức và tìm hiểu mối quan hệ giữa các biến.
  • D. Tuyển sinh giáo viên mới.

Câu 20: Công cụ nào sau đây chủ yếu được sử dụng để lập trình và xây dựng các mô hình Khoa học dữ liệu phức tạp, với nhiều thư viện hỗ trợ mạnh mẽ cho xử lý dữ liệu và học máy?

  • A. Python (với các thư viện như Pandas, NumPy, Scikit-learn, TensorFlow).
  • B. Microsoft Word.
  • C. Adobe Photoshop.
  • D. Google Chrome.

Câu 21: Một ngân hàng muốn dự đoán khả năng một khách hàng sẽ vỡ nợ khoản vay dựa trên lịch sử tín dụng, thu nhập và các thông tin khác. Đây là bài toán thuộc loại hình học máy nào trong Khoa học dữ liệu?

  • A. Gom cụm (Clustering).
  • B. Hồi quy (Regression).
  • C. Giảm chiều dữ liệu (Dimensionality Reduction).
  • D. Phân loại (Classification).

Câu 22: Giả sử em đang phân tích dữ liệu về số lượng khách truy cập website của một cửa hàng trực tuyến theo từng giờ trong ngày. Em nhận thấy có một sự tăng đột biến bất thường vào lúc 3 giờ sáng. Đây có thể là dấu hiệu của điều gì, và kỹ thuật nào giúp phát hiện nó?

  • A. Hoạt động mua sắm bình thường của khách hàng - Kỹ thuật Gom cụm.
  • B. Một sự kiện bất thường (ví dụ: tấn công bot, lỗi hệ thống) - Kỹ thuật Phát hiện ngoại lệ.
  • C. Chiến dịch quảng cáo hiệu quả - Kỹ thuật Khai phá luật kết hợp.
  • D. Dữ liệu bị thiếu - Kỹ thuật Hồi quy.

Câu 23: Một trong những thành tựu quan trọng của Khoa học dữ liệu là khả năng "tự động hóa các tác vụ lặp đi lặp lại". Ví dụ nào sau đây thể hiện rõ nhất thành tựu này?

  • A. Phát minh ra loại thuốc mới.
  • B. Tìm kiếm các hành tinh xa xôi.
  • C. Sử dụng chatbot để trả lời tự động các câu hỏi thường gặp của khách hàng.
  • D. Viết một bài thơ hay.

Câu 24: Tại sao việc hiểu rõ về lĩnh vực chuyên môn (domain knowledge) lại quan trọng đối với nhà khoa học dữ liệu, ngay cả khi họ có kỹ năng kỹ thuật tốt?

  • A. Giúp đặt câu hỏi đúng, hiểu ý nghĩa của dữ liệu và giải thích kết quả phân tích một cách chính xác.
  • B. Giúp viết code nhanh hơn.
  • C. Giúp tự động hóa toàn bộ quy trình mà không cần con người can thiệp.
  • D. Giúp giảm kích thước tập dữ liệu ban đầu.

Câu 25: Khi một công ty thử nghiệm hai phiên bản khác nhau của cùng một trang web (phiên bản A và phiên bản B) để xem phiên bản nào mang lại tỷ lệ nhấp chuột cao hơn, họ đang áp dụng phương pháp nào thường được sử dụng trong Khoa học dữ liệu để đưa ra quyết định dựa trên dữ liệu?

  • A. Gom cụm.
  • B. Phát hiện ngoại lệ.
  • C. Phân tích cảm xúc.
  • D. Kiểm định A/B (A/B Testing).

Câu 26: Một trong những mục tiêu của Khoa học dữ liệu là "trực quan hóa dữ liệu". Điều này giúp ích gì trong quá trình phân tích?

  • A. Tự động sửa lỗi trong dữ liệu.
  • B. Tăng tốc độ tính toán của máy tính.
  • C. Giúp con người dễ dàng nhận diện các mẫu, xu hướng và ngoại lệ trong dữ liệu.
  • D. Giảm số lượng dữ liệu cần phân tích.

Câu 27: Khoa học dữ liệu khác biệt với "phân tích dữ liệu truyền thống" ở điểm nào?

  • A. Khoa học dữ liệu thường tập trung vào việc khám phá, dự đoán và đưa ra quyết định dựa trên dữ liệu lớn và phức tạp, sử dụng các kỹ thuật tiên tiến hơn.
  • B. Khoa học dữ liệu chỉ sử dụng dữ liệu có cấu trúc, còn phân tích truyền thống thì không.
  • C. Khoa học dữ liệu không cần đến thống kê.
  • D. Phân tích dữ liệu truyền thống có thể xử lý dữ liệu lớn tốt hơn.

Câu 28: Khi xây dựng một mô hình học máy trong Khoa học dữ liệu, dữ liệu thường được chia thành tập huấn luyện (training set) và tập kiểm tra (test set). Mục đích của việc sử dụng tập kiểm tra là gì?

  • A. Để làm sạch dữ liệu.
  • B. Để đánh giá hiệu suất (độ chính xác,...) của mô hình trên dữ liệu chưa từng thấy.
  • C. Để huấn luyện mô hình.
  • D. Để trực quan hóa dữ liệu ban đầu.

Câu 29: Một trong những ứng dụng của Khoa học dữ liệu là giúp các công ty tối ưu hóa chuỗi cung ứng, ví dụ như dự đoán nhu cầu sản phẩm để quản lý hàng tồn kho hiệu quả hơn. Ứng dụng này thuộc nhóm mục tiêu nào của Khoa học dữ liệu?

  • A. Phát hiện gian lận.
  • B. Nhận dạng hình ảnh.
  • C. Phân tích cảm xúc.
  • D. Tối ưu hóa quy trình kinh doanh và ra quyết định.

Câu 30: Đâu là một ví dụ về cách Khoa học dữ liệu có thể được áp dụng trong lĩnh vực môi trường?

  • A. Phân tích dữ liệu cảm biến để dự báo chất lượng không khí hoặc phát hiện ô nhiễm.
  • B. Tạo ra các tác phẩm nghệ thuật kỹ thuật số.
  • C. Thiết kế các tòa nhà tiết kiệm năng lượng (đây là kỹ thuật xây dựng).
  • D. In 3D các vật liệu tái chế.

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 1: Một công ty bán lẻ muốn hiểu tại sao doanh số bán hàng trực tuyến của họ sụt giảm trong quý vừa qua. Họ thu thập dữ liệu về hành vi người dùng trên website, lịch sử mua hàng, chiến dịch marketing và các sự kiện kinh tế. Theo em, mục tiêu chính của việc áp dụng Khoa học dữ liệu trong trường hợp này là gì?

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 2: Một nhà khoa học dữ liệu đang làm việc với tập dữ liệu về các giao dịch ngân hàng để phát hiện hoạt động gian lận. Anh ấy sử dụng một thuật toán học máy để phân loại các giao dịch là 'gian lận' hoặc 'không gian lận'. Đây là ví dụ về ứng dụng Khoa học dữ liệu trong lĩnh vực nào và sử dụng kỹ thuật chính nào?

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 3: Giả sử em có một tập dữ liệu lớn về các bài báo khoa học và muốn nhóm chúng lại thành các chủ đề khác nhau mà không biết trước các chủ đề đó là gì. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất để thực hiện việc này?

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 4: Một công ty truyền thông muốn cá nhân hóa nội dung hiển thị cho từng người dùng trên nền tảng của họ. Họ thu thập dữ liệu về lịch sử xem, tìm kiếm, và tương tác của người dùng. Ứng dụng Khoa học dữ liệu này thuộc nhóm mục tiêu nào?

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 5: Bước nào trong quy trình Khoa học dữ liệu thường chiếm nhiều thời gian và công sức nhất, bao gồm việc xử lý dữ liệu thiếu, không nhất quán hoặc sai định dạng?

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 6: Khi một nhà khoa học dữ liệu tạo ra biểu đồ cột để hiển thị doanh số bán hàng theo từng tháng hoặc biểu đồ phân tán để xem mối quan hệ giữa hai biến, họ đang thực hiện bước nào trong quy trình Khoa học dữ liệu?

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 7: Một công ty thương mại điện tử muốn dự đoán sản phẩm nào có khả năng được một khách hàng cụ thể mua trong lần truy cập tiếp theo dựa trên lịch sử mua hàng và hành vi duyệt web của họ. Kỹ thuật Khoa học dữ liệu nào thường được sử dụng cho mục đích này?

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 8: Trong lĩnh vực y tế, Khoa học dữ liệu có thể hỗ trợ các bác sĩ trong việc chẩn đoán bệnh dựa trên phân tích hình ảnh y khoa (như X-quang, MRI). Điều này thể hiện sự kết hợp của Khoa học dữ liệu với lĩnh vực nào khác?

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 9: Giả sử em có một tập dữ liệu về nhiệt độ và lượng mưa hàng ngày trong 10 năm qua của một thành phố. Em muốn xây dựng một mô hình để dự đoán nhiệt độ cao nhất vào ngày mai. Đây là bài toán thuộc loại hình học máy nào trong Khoa học dữ liệu?

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 10: Đâu là một thách thức lớn khi làm việc với dữ liệu trong Khoa học dữ liệu, đặc biệt là với dữ liệu lớn (Big Data)?

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 11: Một nhà khoa học dữ liệu cần trình bày kết quả phân tích của mình cho những người không chuyên về kỹ thuật. Bước nào trong quy trình Khoa học dữ liệu giúp truyền đạt thông tin và hiểu biết một cách hiệu quả nhất?

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 12: Công nghệ tự lái của ô tô là một ví dụ điển hình về ứng dụng của Khoa học dữ liệu kết hợp với lĩnh vực nào?

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 13: Khi một website tin tức sử dụng dữ liệu về các bài viết người dùng đã đọc để gợi ý các bài viết khác có chủ đề tương tự, họ đang sử dụng kỹ thuật nào của Khoa học dữ liệu?

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 14: Đâu là vai trò quan trọng của Thống kê trong Khoa học dữ liệu?

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 15: Một nhà bán lẻ muốn tìm hiểu xem những khách hàng mua 'sữa' có thường mua kèm 'bánh mì' hay không để sắp xếp hàng hóa trong siêu thị hiệu quả hơn hoặc tạo combo khuyến mãi. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho bài toán này?

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 16: Trong giai đoạn tiền xử lý dữ liệu, việc xử lý dữ liệu thiếu (missing data) là rất quan trọng. Nếu bỏ qua dữ liệu thiếu, điều gì có thể xảy ra đối với mô hình Khoa học dữ liệu được xây dựng sau đó?

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 17: Một nhà khoa học dữ liệu đang phân tích dữ liệu về thói quen sử dụng mạng xã hội của thanh thiếu niên. Anh ấy phát hiện ra một số hành vi bất thường, có thể là dấu hiệu của bắt nạt trực tuyến. Kỹ thuật nào đang được áp dụng ở đây?

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 18: Việc sử dụng dữ liệu cá nhân của người dùng (như lịch sử mua hàng, vị trí, sở thích) để phục vụ mục đích thương mại mà không có sự đồng ý rõ ràng có thể gây ra vấn đề gì?

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 19: Một trường học muốn phân tích dữ liệu điểm thi của học sinh trong nhiều năm để xác định các yếu tố (như số giờ tự học, tham gia hoạt động ngoại khóa) có ảnh hưởng đến kết quả học tập. Mục tiêu này liên quan chủ yếu đến khía cạnh nào của Khoa học dữ liệu?

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 20: Công cụ nào sau đây chủ yếu được sử dụng để lập trình và xây dựng các mô hình Khoa học dữ liệu phức tạp, với nhiều thư viện hỗ trợ mạnh mẽ cho xử lý dữ liệu và học máy?

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 21: Một ngân hàng muốn dự đoán khả năng một khách hàng sẽ vỡ nợ khoản vay dựa trên lịch sử tín dụng, thu nhập và các thông tin khác. Đây là bài toán thuộc loại hình học máy nào trong Khoa học dữ liệu?

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 22: Giả sử em đang phân tích dữ liệu về số lượng khách truy cập website của một cửa hàng trực tuyến theo từng giờ trong ngày. Em nhận thấy có một sự tăng đột biến bất thường vào lúc 3 giờ sáng. Đây có thể là dấu hiệu của điều gì, và kỹ thuật nào giúp phát hiện nó?

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 23: Một trong những thành tựu quan trọng của Khoa học dữ liệu là khả năng 'tự động hóa các tác vụ lặp đi lặp lại'. Ví dụ nào sau đây thể hiện rõ nhất thành tựu này?

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 24: Tại sao việc hiểu rõ về lĩnh vực chuyên môn (domain knowledge) lại quan trọng đối với nhà khoa học dữ liệu, ngay cả khi họ có kỹ năng kỹ thuật tốt?

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 25: Khi một công ty thử nghiệm hai phiên bản khác nhau của cùng một trang web (phiên bản A và phiên bản B) để xem phiên bản nào mang lại tỷ lệ nhấp chuột cao hơn, họ đang áp dụng phương pháp nào thường được sử dụng trong Khoa học dữ liệu để đưa ra quyết định dựa trên dữ liệu?

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 26: Một trong những mục tiêu của Khoa học dữ liệu là 'trực quan hóa dữ liệu'. Điều này giúp ích gì trong quá trình phân tích?

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 27: Khoa học dữ liệu khác biệt với 'phân tích dữ liệu truyền thống' ở điểm nào?

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 28: Khi xây dựng một mô hình học máy trong Khoa học dữ liệu, dữ liệu thường được chia thành tập huấn luyện (training set) và tập kiểm tra (test set). Mục đích của việc sử dụng tập kiểm tra là gì?

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 29: Một trong những ứng dụng của Khoa học dữ liệu là giúp các công ty tối ưu hóa chuỗi cung ứng, ví dụ như dự đoán nhu cầu sản phẩm để quản lý hàng tồn kho hiệu quả hơn. Ứng dụng này thuộc nhóm mục tiêu nào của Khoa học dữ liệu?

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 8

Câu 30: Đâu là một ví dụ về cách Khoa học dữ liệu có thể được áp dụng trong lĩnh vực môi trường?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 09

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 09 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Khoa học dữ liệu (Data Science) được mô tả là một lĩnh vực liên ngành. Yếu tố cốt lõi nào sau đây KHÔNG phải là một trong những trụ cột chính tạo nên Khoa học dữ liệu?

  • A. Toán học và Thống kê
  • B. Khoa học máy tính và Lập trình
  • C. Kiến thức chuyên môn về lĩnh vực ứng dụng
  • D. Nghệ thuật và Thiết kế đồ họa chuyên nghiệp

Câu 2: Mục tiêu chính của Khoa học dữ liệu là biến dữ liệu thô thành thông tin có giá trị và tri thức sâu sắc. Quá trình này thường được thực hiện nhằm mục đích cuối cùng nào?

  • A. Hỗ trợ ra quyết định hiệu quả và tối ưu hóa hoạt động
  • B. Lưu trữ dữ liệu với dung lượng lớn nhất có thể
  • C. Tạo ra các báo cáo số liệu phức tạp
  • D. Tự động hóa hoàn toàn mọi công việc của con người

Câu 3: Trong quy trình xử lý dữ liệu của Khoa học dữ liệu, bước nào thường chiếm tỷ lệ thời gian và công sức lớn nhất, liên quan đến việc xử lý dữ liệu bị thiếu, không nhất quán hoặc sai định dạng?

  • A. Thu thập dữ liệu
  • B. Làm sạch và tiền xử lý dữ liệu
  • C. Xây dựng mô hình
  • D. Trực quan hóa dữ liệu

Câu 4: Một nhà phân tích dữ liệu đang xem xét dữ liệu doanh số bán hàng của một cửa hàng trực tuyến để tìm ra các nhóm sản phẩm thường được mua cùng nhau trong một giao dịch. Kỹ thuật khai phá dữ liệu nào phù hợp nhất với mục tiêu này?

  • A. Phân loại (Classification)
  • B. Gom cụm (Clustering)
  • C. Khai phá luật kết hợp (Association Rule Mining)
  • D. Phát hiện ngoại lệ (Anomaly Detection)

Câu 5: Một công ty muốn dự đoán liệu một khách hàng tiềm năng có khả năng mua sản phẩm của họ dựa trên lịch sử duyệt web và thông tin nhân khẩu học hay không. Đây là một bài toán thuộc loại nào trong Khoa học dữ liệu?

  • A. Phân loại (Classification)
  • B. Gom cụm (Clustering)
  • C. Hồi quy (Regression)
  • D. Giảm chiều dữ liệu (Dimension Reduction)

Câu 6: Trực quan hóa dữ liệu là một phần quan trọng của Khoa học dữ liệu. Mục đích chính của việc trực quan hóa dữ liệu là gì?

  • A. Giảm kích thước của tập dữ liệu
  • B. Tự động làm sạch dữ liệu bị lỗi
  • C. Xây dựng mô hình dự đoán phức tạp
  • D. Truyền đạt thông tin và khám phá xu hướng, mẫu hình trong dữ liệu một cách hiệu quả

Câu 7: Một ngân hàng muốn phân tích dữ liệu giao dịch của khách hàng để xác định các hoạt động bất thường có thể là dấu hiệu của gian lận. Kỹ thuật nào trong Khoa học dữ liệu là phù hợp nhất để phát hiện các trường hợp "lạ" so với phần lớn dữ liệu bình thường?

  • A. Phân loại (Classification)
  • B. Phát hiện ngoại lệ (Anomaly Detection)
  • C. Gom cụm (Clustering)
  • D. Hồi quy (Regression)

Câu 8: Khi xây dựng một mô hình dự đoán trong Khoa học dữ liệu, việc đánh giá hiệu quả của mô hình trên tập dữ liệu mới, chưa từng thấy trước đó là rất quan trọng. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Làm sạch dữ liệu
  • C. Đánh giá mô hình
  • D. Triển khai mô hình

Câu 9: Một công ty bán lẻ sử dụng Khoa học dữ liệu để phân tích hành vi mua sắm của khách hàng và gửi các ưu đãi, quảng cáo được cá nhân hóa dựa trên sở thích của từng người. Ứng dụng này minh họa cho thành tựu nào của Khoa học dữ liệu?

  • A. Tự động hóa quy trình sản xuất
  • B. Quản lý năng lượng hiệu quả
  • C. Dự báo thời tiết chính xác
  • D. Cá nhân hóa trải nghiệm người dùng

Câu 10: Một trong những thách thức lớn nhất khi làm việc với dữ liệu trong Khoa học dữ liệu, đặc biệt là dữ liệu lớn, là gì?

  • A. Chất lượng dữ liệu (dữ liệu không đầy đủ, không chính xác, không nhất quán)
  • B. Thiếu công cụ phần mềm để phân tích
  • C. Chi phí lưu trữ dữ liệu quá thấp
  • D. Dữ liệu luôn ở định dạng chuẩn và dễ dàng sử dụng

Câu 11: Khi một nhà khoa học dữ liệu sử dụng thuật toán để nhóm các đối tượng (ví dụ: khách hàng) thành các phân khúc dựa trên sự tương đồng về đặc điểm của họ (ví dụ: hành vi mua sắm), kỹ thuật này được gọi là gì?

  • A. Phân loại (Classification)
  • B. Gom cụm (Clustering)
  • C. Hồi quy (Regression)
  • D. Phát hiện ngoại lệ (Anomaly Detection)

Câu 12: Một bác sĩ muốn sử dụng Khoa học dữ liệu để phân tích hình ảnh y tế nhằm hỗ trợ chẩn đoán bệnh ung thư. Đây là một ví dụ về ứng dụng của Khoa học dữ liệu trong lĩnh vực nào và thường sử dụng kỹ thuật học máy nào?

  • A. Tài chính - Hồi quy
  • B. Bán lẻ - Khai phá luật kết hợp
  • C. Y tế - Phân loại hoặc Nhận dạng mẫu
  • D. Giáo dục - Gom cụm

Câu 13: Công cụ nào sau đây THƯỜNG được sử dụng trong Khoa học dữ liệu để viết mã xử lý, phân tích dữ liệu và xây dựng mô hình?

  • A. Python hoặc R
  • B. Microsoft Word
  • C. Adobe Photoshop
  • D. Phần mềm kế toán

Câu 14: Dữ liệu có cấu trúc là loại dữ liệu được tổ chức theo một định dạng cố định, dễ dàng lưu trữ và truy vấn trong cơ sở dữ liệu truyền thống. Loại dữ liệu nào sau đây là ví dụ điển hình của dữ liệu có cấu trúc?

  • A. Bài viết trên mạng xã hội
  • B. Hình ảnh và video
  • C. Email
  • D. Bảng dữ liệu khách hàng trong cơ sở dữ liệu quan hệ (SQL)

Câu 15: Dữ liệu phi cấu trúc là loại dữ liệu không có định dạng cố định hoặc mô hình tổ chức rõ ràng. Ví dụ nào sau đây minh họa cho dữ liệu phi cấu trúc?

  • A. Dữ liệu giao dịch ngân hàng
  • B. Bảng lương nhân viên
  • C. Nội dung các bình luận của khách hàng trên website
  • D. Thông tin sản phẩm trong danh mục

Câu 16: Phân tích khám phá dữ liệu (Exploratory Data Analysis - EDA) là một giai đoạn quan trọng trong Khoa học dữ liệu. Mục đích chính của EDA là gì?

  • A. Hiểu rõ đặc điểm, cấu trúc, xu hướng và mối quan hệ giữa các biến trong dữ liệu
  • B. Xây dựng mô hình dự đoán cuối cùng
  • C. Triển khai mô hình vào môi trường sản xuất
  • D. Làm sạch hoàn toàn tất cả các lỗi trong dữ liệu

Câu 17: Khi một mô hình Khoa học dữ liệu được xây dựng để dự đoán một giá trị liên tục (ví dụ: giá nhà, nhiệt độ ngày mai, doanh số bán hàng), bài toán này thuộc loại nào?

  • A. Phân loại (Classification)
  • B. Gom cụm (Clustering)
  • C. Hồi quy (Regression)
  • D. Phát hiện ngoại lệ (Anomaly Detection)

Câu 18: Một công ty truyền thông muốn phân tích dữ liệu người dùng để hiểu rõ hơn về các nhóm đối tượng xem nội dung của họ, từ đó tạo ra các chiến dịch marketing phù hợp cho từng nhóm. Kỹ thuật nào trong Khoa học dữ liệu giúp phân chia người dùng thành các nhóm dựa trên sự tương đồng về hành vi xem?

  • A. Phân loại (Classification)
  • B. Gom cụm (Clustering)
  • C. Hồi quy (Regression)
  • D. Khai phá luật kết hợp (Association Rule Mining)

Câu 19: Đạo đức trong Khoa học dữ liệu là một vấn đề ngày càng quan trọng. Khía cạnh đạo đức nào sau đây là mối quan tâm lớn nhất khi sử dụng dữ liệu cá nhân của người dùng?

  • A. Tốc độ xử lý dữ liệu
  • B. Chi phí lưu trữ dữ liệu
  • C. Định dạng của dữ liệu
  • D. Quyền riêng tư, tính bảo mật và sự thiên vị (bias) trong dữ liệu hoặc mô hình

Câu 20: Nền tảng hoặc công cụ nào sau đây được thiết kế chủ yếu để tạo báo cáo tương tác và bảng điều khiển (dashboard) từ dữ liệu, hỗ trợ việc trực quan hóa và chia sẻ thông tin kinh doanh?

  • A. Power BI hoặc Tableau
  • B. Microsoft Excel (chỉ dùng tính toán đơn giản)
  • C. Phần mềm soạn thảo văn bản (ví dụ: Word)
  • D. Hệ điều hành máy tính

Câu 21: Khi một tập dữ liệu có quá nhiều thuộc tính (biến), việc này có thể gây khó khăn cho việc phân tích và xây dựng mô hình. Kỹ thuật nào trong Khoa học dữ liệu giúp giảm số lượng thuộc tính nhưng vẫn giữ lại phần lớn thông tin quan trọng?

  • A. Phân loại (Classification)
  • B. Gom cụm (Clustering)
  • C. Giảm chiều dữ liệu (Dimension Reduction)
  • D. Khai phá luật kết hợp (Association Rule Mining)

Câu 22: Sự khác biệt cơ bản giữa Khoa học dữ liệu và Thống kê truyền thống là gì?

  • A. Thống kê chỉ làm việc với dữ liệu số, còn Khoa học dữ liệu làm việc với mọi loại dữ liệu.
  • B. Khoa học dữ liệu chỉ tập trung vào dự đoán, còn Thống kê chỉ tập trung vào mô tả.
  • C. Thống kê chỉ dùng cho nghiên cứu học thuật, còn Khoa học dữ liệu chỉ dùng cho kinh doanh.
  • D. Khoa học dữ liệu có xu hướng tập trung vào quy mô dữ liệu lớn, sử dụng công cụ tính toán mạnh mẽ và kết hợp nhiều lĩnh vực (CS, AI) để xây dựng hệ thống ứng dụng, trong khi Thống kê truyền thống thường tập trung vào suy luận từ mẫu dữ liệu nhỏ hơn.

Câu 23: Một công ty muốn dự đoán số lượng sản phẩm sẽ bán được trong tháng tới dựa trên dữ liệu doanh số của các tháng trước, các chiến dịch marketing và yếu tố mùa vụ. Đây là một bài toán thuộc loại nào và thường sử dụng kỹ thuật nào?

  • A. Dự báo chuỗi thời gian (Time Series Forecasting) hoặc Hồi quy (Regression)
  • B. Phân loại (Classification)
  • C. Gom cụm (Clustering)
  • D. Phát hiện ngoại lệ (Anomaly Detection)

Câu 24: Giai đoạn "Triển khai mô hình" (Deployment) trong quy trình Khoa học dữ liệu đề cập đến việc gì?

  • A. Thu thập thêm dữ liệu để huấn luyện lại mô hình
  • B. Đưa mô hình đã xây dựng vào sử dụng trong môi trường thực tế để tạo ra giá trị
  • C. Trực quan hóa kết quả phân tích
  • D. Làm sạch dữ liệu lần cuối trước khi sử dụng

Câu 25: Tại sao việc làm sạch và tiền xử lý dữ liệu lại là một bước tốn nhiều thời gian nhưng cực kỳ quan trọng trong Khoa học dữ liệu?

  • A. Để giảm kích thước của tập dữ liệu
  • B. Để làm cho dữ liệu trông đẹp mắt hơn trên biểu đồ
  • C. Vì chất lượng dữ liệu ảnh hưởng trực tiếp đến độ chính xác và tin cậy của kết quả phân tích và mô hình
  • D. Để tự động tạo ra các thuộc tính mới

Câu 26: Một nhà khoa học dữ liệu cần trình bày kết quả phân tích phức tạp cho các nhà quản lý không chuyên về kỹ thuật. Công cụ hoặc kỹ thuật nào sẽ giúp họ truyền đạt thông tin một cách hiệu quả nhất?

  • A. Cung cấp toàn bộ mã nguồn đã viết
  • B. Trình bày các công thức toán học phức tạp
  • C. Chỉ đưa ra bảng số liệu thô
  • D. Sử dụng biểu đồ, đồ thị và bảng điều khiển (dashboard) trực quan, dễ hiểu

Câu 27: Lĩnh vực nào sau đây thường xuyên sử dụng Khoa học dữ liệu để phân tích thị trường, hành vi tiêu dùng, hiệu quả quảng cáo và dự báo xu hướng?

  • A. Marketing và Kinh doanh
  • B. Thiên văn học
  • C. Khảo cổ học
  • D. Nông nghiệp truyền thống

Câu 28: Trong Khoa học dữ liệu, thuật ngữ "Big Data" (Dữ liệu lớn) đề cập đến các tập dữ liệu có đặc điểm gì?

  • A. Chỉ đơn giản là có nhiều dòng trong bảng tính Excel
  • B. Chỉ có kích thước lớn về dung lượng lưu trữ
  • C. Có khối lượng (Volume) lớn, tốc độ (Velocity) tạo ra nhanh và đa dạng (Variety) về định dạng
  • D. Chỉ bao gồm dữ liệu có cấu trúc

Câu 29: Một trong những ứng dụng của Khoa học dữ liệu trong giáo dục là gì?

  • A. Xây dựng tòa nhà trường học mới
  • B. Quản lý căng tin trường học
  • C. Tự động hóa việc chấm điểm bài luận viết tay
  • D. Phân tích dữ liệu học tập của học sinh để cá nhân hóa lộ trình học hoặc phát hiện sớm học sinh có nguy cơ gặp khó khăn

Câu 30: Để trở thành một nhà khoa học dữ liệu, ngoài kiến thức về Toán, Thống kê, Khoa học máy tính, kỹ năng mềm nào sau đây cũng rất quan trọng?

  • A. Khả năng ghi nhớ hàng nghìn công thức
  • B. Kỹ năng giao tiếp, làm việc nhóm và khả năng đặt câu hỏi đúng về dữ liệu
  • C. Chỉ cần biết sử dụng một công cụ phân tích duy nhất
  • D. Không cần hiểu biết về lĩnh vực dữ liệu đang làm việc

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 3: Khi phân tích dữ liệu từ các nguồn đa dạng như cảm biến IoT, bài đăng mạng xã hội, video, và cơ sở dữ liệu truyền thống, đặc điểm nào của Dữ liệu lớn (Big Data) được nhấn mạnh rõ nhất?

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 4: Trong giai đoạn Chuẩn bị dữ liệu của quy trình Khoa học dữ liệu, máy tính và thuật toán thường được sử dụng để thực hiện những công việc nào sau đây?

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 5: Một công ty muốn xây dựng hệ thống phát hiện gian lận thẻ tín dụng dựa trên dữ liệu giao dịch theo thời gian thực. Yếu tố nào của Dữ liệu lớn là thách thức chính mà hệ thống máy tính cần giải quyết để đưa ra cảnh báo kịp thời?

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 6: Khả năng mở rộng (scalability) của hệ thống máy tính, đặc biệt là thông qua điện toán đám mây, có ý nghĩa quan trọng như thế nào đối với Khoa học dữ liệu?

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 7: Vai trò chính của thuật toán trong giai đoạn Xây dựng mô hình (Building Model) của quy trình Khoa học dữ liệu là gì?

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 8: Dữ liệu lớn thường bao gồm dữ liệu có cấu trúc (ví dụ: cơ sở dữ liệu quan hệ), bán cấu trúc (ví dụ: XML, JSON), và phi cấu trúc (ví dụ: văn bản, hình ảnh). Điều này liên quan trực tiếp đến đặc điểm nào?

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 9: Tại sao việc áp dụng thuật toán tự động hóa lại quan trọng trong xử lý dữ liệu lớn và Khoa học dữ liệu?

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 10: Giai đoạn Đánh giá (Evaluation) trong quy trình Khoa học dữ liệu có mục đích chính là gì?

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 11: Đặc điểm nào của máy tính hiện đại cho phép xử lý các thuật toán phức tạp như mạng nơ-ron sâu (deep learning) đòi hỏi hàng tỷ phép tính?

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 12: Khi một thuật toán được thiết kế để dự đoán hành vi khách hàng dựa trên lịch sử mua sắm khổng lồ, nó đang thực hiện chức năng chính nào của Khoa học dữ liệu?

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 13: Dữ liệu lớn thường có 'Độ tin cậy' (Veracity) không đồng đều. Điều này có nghĩa là gì và tại sao máy tính/thuật toán cần giải quyết vấn đề này?

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 14: Giai đoạn Triển khai (Deployment) trong quy trình Khoa học dữ liệu bao gồm những hoạt động nào?

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 15: Việc sử dụng các thuật toán phân tích dữ liệu trên các hệ thống máy tính phân tán (distributed computing systems) như Hadoop hoặc Spark chủ yếu nhằm mục đích gì?

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 16: Yếu tố 'Giá trị' (Value) trong mô tả Dữ liệu lớn (Big Data) đề cập đến khía cạnh nào?

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 17: Tại sao các thuật toán học máy (Machine Learning) là một phần không thể thiếu trong Khoa học dữ liệu hiện đại?

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 18: Việc trực quan hóa dữ liệu (Data Visualization) thường được thực hiện trong giai đoạn nào của quy trình Khoa học dữ liệu và mục đích chính của nó là gì?

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 19: Thách thức lớn nhất khi xử lý Dữ liệu lớn liên quan đến đặc điểm Tốc độ (Velocity) là gì?

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 20: Giả sử bạn có một tập dữ liệu về các giao dịch mua hàng trực tuyến. Bạn muốn nhóm các khách hàng có hành vi mua sắm tương tự nhau để đưa ra các chiến dịch marketing cá nhân hóa. Thuật toán thuộc nhóm nào của học máy thường được sử dụng cho bài toán này?

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 21: Vai trò của máy tính trong việc hỗ trợ giai đoạn Xác định vấn đề (Problem Definition) trong Khoa học dữ liệu là gì?

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 22: Sự tiến bộ trong công nghệ lưu trữ dữ liệu, ví dụ như hệ thống lưu trữ phân tán (distributed storage systems), đã tác động thế nào đến khả năng xử lý Dữ liệu lớn?

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 23: Khi một thuật toán được sử dụng để phân tích cảm xúc (sentiment analysis) từ hàng triệu bình luận trên mạng xã hội, nó đang xử lý loại dữ liệu nào phổ biến trong Dữ liệu lớn?

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 24: Tại sao quy trình Khoa học dữ liệu thường được mô tả là một chu trình lặp (iterative) thay vì một quy trình tuyến tính (linear)?

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 25: Một trong những thách thức của Dữ liệu lớn là việc xử lý và phân tích nó có thể tốn kém. Máy tính và thuật toán giúp giải quyết thách thức này như thế nào?

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 26: Giả sử bạn xây dựng một mô hình dự đoán giá nhà. Sau khi đánh giá, bạn nhận thấy mô hình hoạt động kém với các căn nhà có đặc điểm bất thường (ngoại lệ). Bạn cần quay lại giai đoạn nào của quy trình Khoa học dữ liệu để khắc phục vấn đề này?

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 27: Thuật toán nào thường được sử dụng để tìm ra các mối quan hệ 'Nếu-Thì' (ví dụ: Nếu khách hàng mua A thì có khả năng cao sẽ mua B) trong tập dữ liệu giao dịch lớn?

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 28: Vai trò của máy tính trong việc đảm bảo an toàn và bảo mật cho Dữ liệu lớn là gì?

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 29: Khi một mô hình Khoa học dữ liệu đã được triển khai và đang hoạt động trong thực tế, điều gì là cần thiết để đảm bảo nó tiếp tục mang lại kết quả tốt?

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 30: Tóm lại, mối quan hệ giữa Máy tính, Thuật toán và Khoa học dữ liệu được mô tả chính xác nhất như thế nào?

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Trong quy trình xử lý dữ liệu cơ bản cho khoa học dữ liệu, bước nào thường được thực hiện *trước* khi phân tích hoặc trực quan hóa dữ liệu?

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 9

Bạn đang sử dụng Power Query trong Excel để làm sạch một tập dữ liệu. Cột 'Ngày hoàn thành' chứa cả ngày và thời gian (ví dụ: '2023-10-27 14:30:00'). Để chỉ giữ lại thông tin ngày, bạn nên sử dụng thao tác chuyển đổi nào trong Power Query?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 10

Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu - Đề 10 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp kiến thức và kỹ thuật từ những lĩnh vực nào để phân tích và khám phá thông tin từ dữ liệu?

  • A. Chỉ Khoa học máy tính và Lập trình.
  • B. Chỉ Toán học và Thống kê.
  • C. Toán học, Thống kê, Khoa học máy tính, Trí tuệ nhân tạo và các lĩnh vực chuyên môn khác liên quan.
  • D. Chỉ Quản lý cơ sở dữ liệu và Bảo mật thông tin.

Câu 2: Một trong những mục tiêu cốt lõi của Khoa học dữ liệu là "khám phá tri thức từ dữ liệu". Kỹ thuật nào dưới đây là ví dụ điển hình cho việc khám phá tri thức bằng cách tìm ra các mối quan hệ thú vị giữa các mục trong tập dữ liệu lớn, thường được áp dụng trong phân tích giỏ hàng?

  • A. Phát hiện ngoại lệ (Anomaly Detection).
  • B. Khai phá luật kết hợp (Association Rule Mining).
  • C. Giảm chiều dữ liệu (Dimensionality Reduction).
  • D. Hồi quy tuyến tính (Linear Regression).

Câu 3: Một công ty thương mại điện tử muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để đưa ra các đề xuất sản phẩm phù hợp. Họ thu thập dữ liệu về lịch sử duyệt web, lịch sử mua hàng, thông tin nhân khẩu học. Mục tiêu này của công ty thuộc nhóm mục tiêu chính nào của Khoa học dữ liệu?

  • A. Tự động hóa quy trình.
  • B. Tăng cường bảo mật dữ liệu.
  • C. Giảm chi phí vận hành hệ thống.
  • D. Cá nhân hóa dịch vụ và nâng cao trải nghiệm người dùng.

Câu 4: Dữ liệu thô thường chứa nhiều lỗi, thiếu sót hoặc không nhất quán. Giai đoạn xử lý dữ liệu nào trong quy trình Khoa học dữ liệu tập trung vào việc làm sạch, biến đổi và tích hợp dữ liệu để chuẩn bị cho việc phân tích?

  • A. Tiền xử lý dữ liệu (Data Preprocessing).
  • B. Mô hình hóa dữ liệu (Data Modeling).
  • C. Trực quan hóa dữ liệu (Data Visualization).
  • D. Triển khai mô hình (Model Deployment).

Câu 5: Một nhà phân tích dữ liệu đang sử dụng các biểu đồ (ví dụ: biểu đồ cột, biểu đồ đường, biểu đồ phân tán) để trình bày kết quả phân tích cho một nhóm không chuyên về kỹ thuật. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu và có mục đích gì?

  • A. Tiền xử lý dữ liệu, nhằm loại bỏ dữ liệu nhiễu.
  • B. Mô hình hóa dữ liệu, nhằm xây dựng thuật toán dự đoán.
  • C. Trực quan hóa dữ liệu, nhằm truyền đạt thông tin và khám phá xu hướng một cách dễ hiểu.
  • D. Thu thập dữ liệu, nhằm thu thập thêm dữ liệu cần thiết.

Câu 6: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích các giao dịch của khách hàng nhằm phát hiện những hoạt động bất thường, có khả năng là gian lận. Kỹ thuật nào trong Khoa học dữ liệu được áp dụng chủ yếu trong trường hợp này để xác định các điểm dữ liệu khác biệt đáng kể so với phần lớn dữ liệu?

  • A. Phát hiện ngoại lệ (Anomaly Detection).
  • B. Gom cụm (Clustering).
  • C. Khai phá luật kết hợp (Association Rule Mining).
  • D. Phân loại (Classification).

Câu 7: Trong lĩnh vực y tế, Khoa học dữ liệu được ứng dụng để dự đoán khả năng mắc bệnh của bệnh nhân dựa trên các triệu chứng, lịch sử y tế và kết quả xét nghiệm. Ứng dụng này thuộc nhóm mục tiêu chính nào của Khoa học dữ liệu?

  • A. Tối ưu hóa quy trình vận hành.
  • B. Hỗ trợ ra quyết định (ví dụ: chẩn đoán và điều trị).
  • C. Tự động hóa công việc hành chính.
  • D. Tìm kiếm nguồn nhân lực.

Câu 8: Một nhà khoa học dữ liệu đang xây dựng một mô hình Học máy để phân loại email thành "spam" hoặc "không spam". Quá trình này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Mô hình hóa dữ liệu (Xây dựng và huấn luyện mô hình).
  • C. Triển khai mô hình.
  • D. Trực quan hóa kết quả.

Câu 9: Khi phân tích một tập dữ liệu có rất nhiều thuộc tính (chiều), việc giảm số lượng thuộc tính xuống mà vẫn giữ được thông tin quan trọng là cần thiết để đơn giản hóa mô hình và tránh hiện tượng quá khớp (overfitting). Kỹ thuật nào trong Khoa học dữ liệu giúp thực hiện việc này?

  • A. Gom cụm (Clustering).
  • B. Phát hiện ngoại lệ (Anomaly Detection).
  • C. Giảm chiều dữ liệu (Dimensionality Reduction).
  • D. Khai phá luật kết hợp (Association Rule Mining).

Câu 10: Một cửa hàng bán lẻ sử dụng dữ liệu bán hàng lịch sử để dự đoán nhu cầu của từng mặt hàng trong tuần tới, từ đó tối ưu hóa lượng hàng tồn kho. Ứng dụng này của Khoa học dữ liệu thuộc nhóm mục tiêu chính nào?

  • A. Tối ưu hóa quyết định và quy trình.
  • B. Cá nhân hóa dịch vụ.
  • C. Phát hiện hành vi gian lận.
  • D. Tăng cường bảo mật hệ thống.

Câu 11: Công cụ nào dưới đây chủ yếu được biết đến là một ngôn ngữ lập trình phổ biến được sử dụng rộng rãi trong Khoa học dữ liệu để xử lý, phân tích và mô hình hóa dữ liệu?

  • A. Microsoft Word.
  • B. Adobe Photoshop.
  • C. Google Chrome.
  • D. Python.

Câu 12: Trong quy trình Khoa học dữ liệu, sau khi đã tiền xử lý và khám phá dữ liệu, giai đoạn tiếp theo thường là xây dựng các mô hình (ví dụ: mô hình dự đoán, mô hình phân loại). Giai đoạn này được gọi là gì?

  • A. Thu thập dữ liệu.
  • B. Trực quan hóa dữ liệu.
  • C. Mô hình hóa dữ liệu.
  • D. Triển khai mô hình.

Câu 13: Một nhà khoa học dữ liệu cần trình bày một cách trực quan mối quan hệ giữa hai biến số liên tục (ví dụ: chi tiêu quảng cáo và doanh thu). Biểu đồ nào sau đây là phù hợp nhất để thể hiện mối quan hệ này?

  • A. Biểu đồ phân tán (Scatter plot).
  • B. Biểu đồ cột (Bar chart).
  • C. Biểu đồ tròn (Pie chart).
  • D. Biểu đồ tần suất (Histogram).

Câu 14: Một công ty viễn thông muốn phân tích dữ liệu cuộc gọi của khách hàng để xác định các nhóm khách hàng có hành vi sử dụng tương tự nhau nhằm mục đích tiếp thị mục tiêu. Kỹ thuật nào trong Khoa học dữ liệu phù hợp nhất để nhóm các đối tượng (khách hàng) dựa trên sự tương đồng về đặc điểm (hành vi sử dụng)?

  • A. Phân loại (Classification).
  • B. Gom cụm (Clustering).
  • C. Hồi quy (Regression).
  • D. Phát hiện ngoại lệ (Anomaly Detection).

Câu 15: Khi một mô hình Khoa học dữ liệu đã được xây dựng và kiểm thử thành công, bước tiếp theo là đưa mô hình đó vào sử dụng trong môi trường thực tế để tạo ra giá trị (ví dụ: tích hợp vào ứng dụng web, hệ thống nội bộ). Bước này được gọi là gì?

  • A. Khám phá dữ liệu.
  • B. Tiền xử lý dữ liệu.
  • C. Đánh giá mô hình.
  • D. Triển khai mô hình (Model Deployment).

Câu 16: Hệ thống gợi ý sản phẩm trên các trang thương mại điện tử (ví dụ: "Những khách hàng mua X cũng mua Y") là một ví dụ điển hình của ứng dụng Khoa học dữ liệu sử dụng kỹ thuật nào?

  • A. Khai phá luật kết hợp (Association Rule Mining).
  • B. Phát hiện ngoại lệ (Anomaly Detection).
  • C. Giảm chiều dữ liệu (Dimensionality Reduction).
  • D. Phân loại (Classification).

Câu 17: Công cụ nào dưới đây KHÔNG phải là công cụ/nền tảng phổ biến được sử dụng trong Khoa học dữ liệu để phân tích và trực quan hóa dữ liệu?

  • A. Power BI.
  • B. Tableau.
  • C. Microsoft Paint.
  • D. Google Data Studio.

Câu 18: Một trong những thách thức lớn nhất trong Khoa học dữ liệu, đặc biệt khi làm việc với dữ liệu lớn, là đảm bảo chất lượng dữ liệu. Dữ liệu kém chất lượng có thể dẫn đến kết quả phân tích sai lệch. Bước nào trong quy trình Khoa học dữ liệu được thiết kế để giải quyết vấn đề này?

  • A. Tiền xử lý dữ liệu (Data Preprocessing).
  • B. Triển khai mô hình (Model Deployment).
  • C. Đánh giá mô hình (Model Evaluation).
  • D. Thu thập dữ liệu (Data Collection).

Câu 19: Một nhà khoa học dữ liệu được giao nhiệm vụ dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, v.v. Bài toán này thuộc loại mô hình học máy nào trong Khoa học dữ liệu?

  • A. Bài toán phân loại (Classification).
  • B. Bài toán gom cụm (Clustering).
  • C. Bài toán phát hiện ngoại lệ (Anomaly Detection).
  • D. Bài toán hồi quy (Regression).

Câu 20: Lĩnh vực Trí tuệ nhân tạo (AI), đặc biệt là Học máy (Machine Learning), đóng vai trò quan trọng trong Khoa học dữ liệu. Mối quan hệ chính giữa Học máy và Khoa học dữ liệu là gì?

  • A. Khoa học dữ liệu là một nhánh con của Học máy.
  • B. Học máy là một tập hợp các kỹ thuật và công cụ mạnh mẽ được Khoa học dữ liệu sử dụng để xây dựng mô hình và khám phá tri thức.
  • C. Học máy và Khoa học dữ liệu là hai lĩnh vực hoàn toàn độc lập.
  • D. Khoa học dữ liệu chỉ sử dụng Học máy để trực quan hóa dữ liệu.

Câu 21: Một trong những thành tựu đáng chú ý của Khoa học dữ liệu là khả năng tự động hóa các tác vụ lặp đi lặp lại dựa trên phân tích dữ liệu. Ví dụ nào sau đây thể hiện rõ nhất thành tựu này?

  • A. Tạo ra một báo cáo bán hàng thủ công hàng tháng.
  • B. Tổ chức cuộc họp nhóm để thảo luận về chiến lược.
  • C. Hệ thống phân loại email tự động vào các thư mục khác nhau.
  • D. Thiết kế giao diện người dùng cho một ứng dụng mới.

Câu 22: Để một mô hình Khoa học dữ liệu hoạt động hiệu quả trong thực tế, nó cần được đánh giá cẩn thận trên dữ liệu chưa từng thấy trong quá trình huấn luyện. Mục đích chính của việc đánh giá mô hình là gì?

  • A. Đo lường hiệu suất và độ chính xác của mô hình trên dữ liệu mới.
  • B. Thu thập thêm dữ liệu để huấn luyện mô hình.
  • C. Biến đổi dữ liệu để phù hợp với mô hình.
  • D. Trực quan hóa cấu trúc bên trong của mô hình.

Câu 23: Một công ty truyền thông muốn phân tích dữ liệu người dùng trên nền tảng của họ để hiểu loại nội dung nào được xem nhiều nhất vào những thời điểm nào trong ngày. Mục tiêu này giúp công ty tối ưu hóa lịch đăng bài. Ứng dụng này thuộc nhóm mục tiêu chính nào của Khoa học dữ liệu?

  • A. Phát hiện gian lận.
  • B. Cá nhân hóa quảng cáo.
  • C. Phát triển phần mềm mới.
  • D. Khám phá tri thức và đưa ra quyết định kinh doanh.

Câu 24: Trong quá trình tiền xử lý dữ liệu, việc xử lý các giá trị bị thiếu (missing values) là rất quan trọng. Phương pháp nào sau đây KHÔNG phải là một cách phổ biến để xử lý giá trị thiếu?

  • A. Xóa bỏ các dòng hoặc cột chứa giá trị thiếu.
  • B. Nhân đôi các dòng không chứa giá trị thiếu.
  • C. Điền giá trị thiếu bằng giá trị trung bình, trung vị hoặc mode của cột.
  • D. Sử dụng các mô hình học máy để dự đoán giá trị thiếu.

Câu 25: Phân tích cảm xúc (Sentiment Analysis) từ các bài đăng trên mạng xã hội hoặc đánh giá sản phẩm là một ứng dụng phổ biến của Khoa học dữ liệu. Bài toán này thường được giải quyết bằng loại mô hình học máy nào?

  • A. Bài toán phân loại (Classification) (ví dụ: tích cực, tiêu cực, trung tính).
  • B. Bài toán hồi quy (Regression).
  • C. Bài toán gom cụm (Clustering).
  • D. Bài toán giảm chiều dữ liệu (Dimensionality Reduction).

Câu 26: Khi trình bày kết quả phân tích dữ liệu, việc lựa chọn biểu đồ phù hợp có vai trò quan trọng trong việc truyền tải thông điệp hiệu quả. Biểu đồ nào sau đây phù hợp nhất để so sánh giá trị của một biến số giữa các danh mục khác nhau (ví dụ: doanh thu theo từng loại sản phẩm)?

  • A. Biểu đồ phân tán (Scatter plot).
  • B. Biểu đồ đường (Line chart).
  • C. Biểu đồ cột (Bar chart).
  • D. Biểu đồ miền (Area chart).

Câu 27: Khoa học dữ liệu giúp doanh nghiệp đưa ra quyết định dựa trên dữ liệu thay vì chỉ dựa vào kinh nghiệm hoặc trực giác. Điều này thường dẫn đến kết quả nào?

  • A. Giảm khả năng tự động hóa.
  • B. Nâng cao hiệu quả và tính chính xác của quyết định kinh doanh.
  • C. Tăng chi phí hoạt động.
  • D. Giảm sự cần thiết của các chuyên gia phân tích.

Câu 28: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu văn bản lớn (ví dụ: email, bài báo). Bước tiền xử lý dữ liệu nào thường được thực hiện để chuyển đổi văn bản thành định dạng số hóa mà mô hình học máy có thể xử lý?

  • A. Phát hiện ngoại lệ.
  • B. Gom cụm.
  • C. Trực quan hóa dữ liệu.
  • D. Vector hóa văn bản (Text Vectorization) hoặc Trích xuất đặc trưng văn bản (Text Feature Extraction).

Câu 29: Trong ứng dụng y tế, Khoa học dữ liệu có thể phân tích hình ảnh y khoa (ví dụ: X-quang, MRI) để hỗ trợ bác sĩ phát hiện các dấu hiệu bệnh lý. Đây là một ví dụ về việc ứng dụng Học máy trong lĩnh vực nào?

  • A. Thị giác máy tính (Computer Vision).
  • B. Xử lý ngôn ngữ tự nhiên (Natural Language Processing).
  • C. Hệ thống gợi ý (Recommendation Systems).
  • D. Phát hiện gian lận (Fraud Detection).

Câu 30: Một công ty muốn xây dựng một chatbot trả lời tự động các câu hỏi thường gặp của khách hàng dựa trên dữ liệu các cuộc trò chuyện trước đây. Ứng dụng này của Khoa học dữ liệu chủ yếu sử dụng kỹ thuật từ lĩnh vực nào?

  • A. Thị giác máy tính (Computer Vision).
  • B. Xử lý ngôn ngữ tự nhiên (Natural Language Processing).
  • C. Phát hiện ngoại lệ (Anomaly Detection).
  • D. Giảm chiều dữ liệu (Dimensionality Reduction).

1 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp kiến thức và kỹ thuật từ những lĩnh vực nào để phân tích và khám phá thông tin từ dữ liệu?

2 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 2: Một trong những mục tiêu cốt lõi của Khoa học dữ liệu là 'khám phá tri thức từ dữ liệu'. Kỹ thuật nào dưới đây là ví dụ điển hình cho việc khám phá tri thức bằng cách tìm ra các mối quan hệ thú vị giữa các mục trong tập dữ liệu lớn, thường được áp dụng trong phân tích giỏ hàng?

3 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 3: Một công ty thương mại điện tử muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để đưa ra các đề xuất sản phẩm phù hợp. Họ thu thập dữ liệu về lịch sử duyệt web, lịch sử mua hàng, thông tin nhân khẩu học. Mục tiêu này của công ty thuộc nhóm mục tiêu chính nào của Khoa học dữ liệu?

4 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 4: Dữ liệu thô thường chứa nhiều lỗi, thiếu sót hoặc không nhất quán. Giai đoạn xử lý dữ liệu nào trong quy trình Khoa học dữ liệu tập trung vào việc làm sạch, biến đổi và tích hợp dữ liệu để chuẩn bị cho việc phân tích?

5 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 5: Một nhà phân tích dữ liệu đang sử dụng các biểu đồ (ví dụ: biểu đồ cột, biểu đồ đường, biểu đồ phân tán) để trình bày kết quả phân tích cho một nhóm không chuyên về kỹ thuật. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu và có mục đích gì?

6 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 6: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích các giao dịch của khách hàng nhằm phát hiện những hoạt động bất thường, có khả năng là gian lận. Kỹ thuật nào trong Khoa học dữ liệu được áp dụng chủ yếu trong trường hợp này để xác định các điểm dữ liệu khác biệt đáng kể so với phần lớn dữ liệu?

7 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 7: Trong lĩnh vực y tế, Khoa học dữ liệu được ứng dụng để dự đoán khả năng mắc bệnh của bệnh nhân dựa trên các triệu chứng, lịch sử y tế và kết quả xét nghiệm. Ứng dụng này thuộc nhóm mục tiêu chính nào của Khoa học dữ liệu?

8 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 8: Một nhà khoa học dữ liệu đang xây dựng một mô hình Học máy để phân loại email thành 'spam' hoặc 'không spam'. Quá trình này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

9 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 9: Khi phân tích một tập dữ liệu có rất nhiều thuộc tính (chiều), việc giảm số lượng thuộc tính xuống mà vẫn giữ được thông tin quan trọng là cần thiết để đơn giản hóa mô hình và tránh hiện tượng quá khớp (overfitting). Kỹ thuật nào trong Khoa học dữ liệu giúp thực hiện việc này?

10 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 10: Một cửa hàng bán lẻ sử dụng dữ liệu bán hàng lịch sử để dự đoán nhu cầu của từng mặt hàng trong tuần tới, từ đó tối ưu hóa lượng hàng tồn kho. Ứng dụng này của Khoa học dữ liệu thuộc nhóm mục tiêu chính nào?

11 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 11: Công cụ nào dưới đây chủ yếu được biết đến là một ngôn ngữ lập trình phổ biến được sử dụng rộng rãi trong Khoa học dữ liệu để xử lý, phân tích và mô hình hóa dữ liệu?

12 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 12: Trong quy trình Khoa học dữ liệu, sau khi đã tiền xử lý và khám phá dữ liệu, giai đoạn tiếp theo thường là xây dựng các mô hình (ví dụ: mô hình dự đoán, mô hình phân loại). Giai đoạn này được gọi là gì?

13 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 13: Một nhà khoa học dữ liệu cần trình bày một cách trực quan mối quan hệ giữa hai biến số liên tục (ví dụ: chi tiêu quảng cáo và doanh thu). Biểu đồ nào sau đây là phù hợp nhất để thể hiện mối quan hệ này?

14 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 14: Một công ty viễn thông muốn phân tích dữ liệu cuộc gọi của khách hàng để xác định các nhóm khách hàng có hành vi sử dụng tương tự nhau nhằm mục đích tiếp thị mục tiêu. Kỹ thuật nào trong Khoa học dữ liệu phù hợp nhất để nhóm các đối tượng (khách hàng) dựa trên sự tương đồng v??? đặc điểm (hành vi sử dụng)?

15 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 15: Khi một mô hình Khoa học dữ liệu đã được xây dựng và kiểm thử thành công, bước tiếp theo là đưa mô hình đó vào sử dụng trong môi trường thực tế để tạo ra giá trị (ví dụ: tích hợp vào ứng dụng web, hệ thống nội bộ). Bước này được gọi là gì?

16 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 16: Hệ thống gợi ý sản phẩm trên các trang thương mại điện tử (ví dụ: 'Những khách hàng mua X cũng mua Y') là một ví dụ điển hình của ứng dụng Khoa học dữ liệu sử dụng kỹ thuật nào?

17 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 17: Công cụ nào dưới đây KHÔNG phải là công cụ/nền tảng phổ biến được sử dụng trong Khoa học dữ liệu để phân tích và trực quan hóa dữ liệu?

18 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 18: Một trong những thách thức lớn nhất trong Khoa học dữ liệu, đặc biệt khi làm việc với dữ liệu lớn, là đảm bảo chất lượng dữ liệu. Dữ liệu kém chất lượng có thể dẫn đến kết quả phân tích sai lệch. Bước nào trong quy trình Khoa học dữ liệu được thiết kế để giải quyết vấn đề này?

19 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 19: Một nhà khoa học dữ liệu được giao nhiệm vụ dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, v.v. Bài toán này thuộc loại mô hình học máy nào trong Khoa học dữ liệu?

20 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 20: Lĩnh vực Trí tuệ nhân tạo (AI), đặc biệt là Học máy (Machine Learning), đóng vai trò quan trọng trong Khoa học dữ liệu. Mối quan hệ chính giữa Học máy và Khoa học dữ liệu là gì?

21 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 21: Một trong những thành tựu đáng chú ý của Khoa học dữ liệu là khả năng tự động hóa các tác vụ lặp đi lặp lại dựa trên phân tích dữ liệu. Ví dụ nào sau đây thể hiện rõ nhất thành tựu này?

22 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 22: Để một mô hình Khoa học dữ liệu hoạt động hiệu quả trong thực tế, nó cần được đánh giá cẩn thận trên dữ liệu chưa từng thấy trong quá trình huấn luyện. Mục đích chính của việc đánh giá mô hình là gì?

23 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 23: Một công ty truyền thông muốn phân tích dữ liệu người dùng trên nền tảng của họ để hiểu loại nội dung nào được xem nhiều nhất vào những thời điểm nào trong ngày. Mục tiêu này giúp công ty tối ưu hóa lịch đăng bài. Ứng dụng này thuộc nhóm mục tiêu chính nào của Khoa học dữ liệu?

24 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 24: Trong quá trình tiền xử lý dữ liệu, việc xử lý các giá trị bị thiếu (missing values) là rất quan trọng. Phương pháp nào sau đây KHÔNG phải là một cách phổ biến để xử lý giá trị thiếu?

25 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 25: Phân tích cảm xúc (Sentiment Analysis) từ các bài đăng trên mạng xã hội hoặc đánh giá sản phẩm là một ứng dụng phổ biến của Khoa học dữ liệu. Bài toán này thường được giải quyết bằng loại mô hình học máy nào?

26 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 26: Khi trình bày kết quả phân tích dữ liệu, việc lựa chọn biểu đồ phù hợp có vai trò quan trọng trong việc truyền tải thông điệp hiệu quả. Biểu đồ nào sau đây phù hợp nhất để so sánh giá trị của một biến số giữa các danh mục khác nhau (ví dụ: doanh thu theo từng loại sản phẩm)?

27 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 27: Khoa học dữ liệu giúp doanh nghiệp đưa ra quyết định dựa trên dữ liệu thay vì chỉ dựa vào kinh nghiệm hoặc trực giác. Điều này thường dẫn đến kết quả nào?

28 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 28: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu văn bản lớn (ví dụ: email, bài báo). Bước tiền xử lý dữ liệu nào thường được thực hiện để chuyển đổi văn bản thành định dạng số hóa mà mô hình học máy có thể xử lý?

29 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 29: Trong ứng dụng y tế, Khoa học dữ liệu có thể phân tích hình ảnh y khoa (ví dụ: X-quang, MRI) để hỗ trợ bác sĩ phát hiện các dấu hiệu bệnh lý. Đây là một ví dụ về việc ứng dụng Học máy trong lĩnh vực nào?

30 / 30

Category: Trắc nghiệm Tin học 12 Chân trời sáng tạo Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 30: Một công ty muốn xây dựng một chatbot trả lời tự động các câu hỏi thường gặp của khách hàng dựa trên dữ liệu các cuộc trò chuyện trước đây. Ứng dụng này của Khoa học dữ liệu chủ yếu sử dụng kỹ thuật từ lĩnh vực nào?

Xem kết quả