15+ Đề Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Đề 01

Đề 02

Đề 03

Đề 04

Đề 05

Đề 06

Đề 07

Đề 08

Đề 09

Đề 10

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 01

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 01 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong quy trình Khoa học Dữ liệu, giai đoạn nào tập trung vào việc làm sạch, chuyển đổi và cấu trúc lại dữ liệu thô để chuẩn bị cho phân tích?

  • A. Thu thập dữ liệu
  • B. Chuẩn bị dữ liệu
  • C. Phân tích dữ liệu
  • D. Trực quan hóa dữ liệu

Câu 2: "Vận tốc" (Velocity) trong đặc điểm "5V" của Dữ liệu lớn đề cập đến khía cạnh nào?

  • A. Độ tin cậy của nguồn dữ liệu
  • B. Sự đa dạng của các loại dữ liệu
  • C. Tốc độ tạo ra và xử lý dữ liệu
  • D. Giá trị kinh tế của dữ liệu

Câu 3: Đâu là mục tiêu chính của việc trực quan hóa dữ liệu trong Khoa học Dữ liệu?

  • A. Giúp nhận diện mẫu và hiểu dữ liệu dễ dàng hơn
  • B. Tăng dung lượng lưu trữ dữ liệu
  • C. Mã hóa dữ liệu để bảo mật
  • D. Tự động thu thập dữ liệu từ nhiều nguồn

Câu 4: Ứng dụng nào sau đây thể hiện rõ nhất vai trò của Khoa học Dữ liệu trong việc cải thiện trải nghiệm khách hàng?

  • A. Phát triển phần mềm quản lý kho hàng
  • B. Đề xuất sản phẩm cá nhân hóa trên trang thương mại điện tử
  • C. Tối ưu hóa quy trình sản xuất trong nhà máy
  • D. Nghiên cứu và phát triển vật liệu mới

Câu 5: Học máy (Machine Learning) đóng vai trò gì trong Khoa học Dữ liệu?

  • A. Công cụ chính để thu thập dữ liệu từ internet
  • B. Phương pháp duy nhất để trực quan hóa dữ liệu phức tạp
  • C. Nguyên tắc cơ bản để đảm bảo tính xác thực của dữ liệu
  • D. Công cụ để xây dựng mô hình dự đoán và phân tích dữ liệu tự động

Câu 6: Trong các lĩnh vực sau, lĩnh vực nào ít có khả năng ứng dụng Khoa học Dữ liệu nhất?

  • A. Y tế và chăm sóc sức khỏe
  • B. Ngân hàng và tài chính
  • C. Nghệ thuật biểu diễn truyền thống
  • D. Giao thông vận tải và logistics

Câu 7: "Giá trị" (Value) trong "5V" của Dữ liệu lớn muốn nhấn mạnh điều gì?

  • A. Khả năng tạo ra lợi ích và tri thức từ dữ liệu
  • B. Kích thước khổng lồ của tập dữ liệu
  • C. Tốc độ dữ liệu được tạo ra
  • D. Sự đa dạng về nguồn gốc dữ liệu

Câu 8: Phát biểu nào sau đây mô tả đúng nhất mối quan hệ giữa Khoa học Dữ liệu và Trí tuệ Nhân tạo (AI)?

  • A. Khoa học Dữ liệu bao gồm Trí tuệ Nhân tạo và Học máy
  • B. Khoa học Dữ liệu sử dụng các kỹ thuật của Trí tuệ Nhân tạo và Học máy
  • C. Trí tuệ Nhân tạo là một nhánh nhỏ của Khoa học Dữ liệu
  • D. Khoa học Dữ liệu và Trí tuệ Nhân tạo là hai lĩnh vực hoàn toàn độc lập

Câu 9: Khi một nhà khoa học dữ liệu "khám phá dữ liệu" (data exploration), họ thường thực hiện công việc gì?

  • A. Xây dựng mô hình máy học phức tạp
  • B. Viết báo cáo phân tích dữ liệu chi tiết
  • C. Tìm kiếm các xu hướng, mẫu và bất thường trong dữ liệu
  • D. Thiết kế hệ thống lưu trữ dữ liệu hiệu quả

Câu 10: Trong bối cảnh Khoa học Dữ liệu, "dữ liệu có cấu trúc" khác biệt với "dữ liệu phi cấu trúc" như thế nào?

  • A. Dữ liệu có cấu trúc luôn có kích thước lớn hơn
  • B. Dữ liệu phi cấu trúc dễ dàng phân tích hơn
  • C. Dữ liệu có cấu trúc chỉ tồn tại ở dạng văn bản
  • D. Dữ liệu có cấu trúc được tổ chức theo định dạng rõ ràng, dễ dàng truy vấn

Câu 11: "Tính xác thực" (Veracity) của Dữ liệu lớn đề cập đến vấn đề gì?

  • A. Sự đa dạng của các loại dữ liệu
  • B. Độ tin cậy và chính xác của dữ liệu
  • C. Tốc độ xử lý dữ liệu
  • D. Dung lượng lưu trữ dữ liệu

Câu 12: Một công ty thương mại điện tử sử dụng Khoa học Dữ liệu để dự đoán sản phẩm nào khách hàng có khả năng mua tiếp theo. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học Dữ liệu?

  • A. Thu thập dữ liệu
  • B. Chuẩn bị dữ liệu
  • C. Phân tích dữ liệu và mô hình hóa
  • D. Triển khai và giám sát mô hình

Câu 13: Đâu là kỹ năng quan trọng nhất đối với một nhà khoa học dữ liệu?

  • A. Kỹ năng lập trình web nâng cao
  • B. Khả năng quản lý dự án phần mềm
  • C. Kiến thức sâu rộng về phần cứng máy tính
  • D. Khả năng phân tích vấn đề và giải quyết bằng dữ liệu

Câu 14: "Variety" (Sự đa dạng) trong "5V" của Dữ liệu lớn ám chỉ điều gì?

  • A. Số lượng nguồn dữ liệu khác nhau
  • B. Tốc độ thay đổi của dữ liệu
  • C. Nhiều loại hình dữ liệu khác nhau như văn bản, hình ảnh, video
  • D. Mức độ chi tiết của dữ liệu

Câu 15: Trong quá trình phân tích dữ liệu, khi nào thì việc sử dụng biểu đồ phân tán (scatter plot) là phù hợp nhất?

  • A. So sánh giá trị trung bình của nhiều nhóm
  • B. Xem xét mối quan hệ giữa hai biến số liên tục
  • C. Hiển thị phân phối tần suất của một biến số
  • D. Biểu diễn dữ liệu theo thời gian

Câu 16: Mục đích của việc "làm sạch dữ liệu" (data cleaning) trong Khoa học Dữ liệu là gì?

  • A. Loại bỏ dữ liệu nhiễu, sai sót và không nhất quán
  • B. Tăng kích thước tập dữ liệu
  • C. Mã hóa dữ liệu để bảo mật thông tin
  • D. Chuyển đổi dữ liệu sang định dạng hình ảnh

Câu 17: Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của Khoa học Dữ liệu?

  • A. Hệ thống phát hiện gian lận trong giao dịch ngân hàng
  • B. Công cụ phân tích tâm lý khách hàng trên mạng xã hội
  • C. Thuật toán đề xuất phim cho dịch vụ xem video trực tuyến
  • D. Phần mềm soạn thảo văn bản

Câu 18: "Tri thức chuyên ngành" (domain knowledge) có vai trò như thế nào trong Khoa học Dữ liệu?

  • A. Không cần thiết vì Khoa học Dữ liệu là lĩnh vực độc lập
  • B. Giúp hiểu rõ ngữ cảnh và ý nghĩa của dữ liệu, đưa ra phân tích sâu sắc hơn
  • C. Chỉ cần thiết ở giai đoạn thu thập dữ liệu
  • D. Làm phức tạp hóa quá trình phân tích dữ liệu

Câu 19: Loại biểu đồ nào sau đây phù hợp nhất để so sánh tỷ lệ phần trăm của các danh mục khác nhau trong một tổng thể?

  • A. Biểu đồ đường (line chart)
  • B. Biểu đồ cột (bar chart)
  • C. Biểu đồ tròn (pie chart)
  • D. Biểu đồ hộp (box plot)

Câu 20: Trong quy trình Khoa học Dữ liệu, giai đoạn "triển khai và giám sát mô hình" (deployment and monitoring) nhằm mục đích gì?

  • A. Thu thập thêm dữ liệu mới để cải thiện mô hình
  • B. Đánh giá hiệu suất của mô hình trên dữ liệu lịch sử
  • C. Làm sạch dữ liệu đầu vào cho mô hình
  • D. Đưa mô hình vào sử dụng thực tế và theo dõi hiệu quả

Câu 21: Khi phân tích dữ liệu về doanh số bán hàng theo thời gian, loại biểu đồ nào sau đây thường được sử dụng để thể hiện xu hướng?

  • A. Biểu đồ đường (line chart)
  • B. Biểu đồ cột (bar chart)
  • C. Biểu đồ tròn (pie chart)
  • D. Biểu đồ phân tán (scatter plot)

Câu 22: "Volume" (Khối lượng) trong "5V" của Dữ liệu lớn đề cập đến đặc điểm nào của dữ liệu?

  • A. Tốc độ tạo ra dữ liệu
  • B. Kích thước của tập dữ liệu
  • C. Sự đa dạng của loại dữ liệu
  • D. Độ chính xác của dữ liệu

Câu 23: Công cụ hoặc kỹ thuật nào sau đây thường được sử dụng trong giai đoạn "chuẩn bị dữ liệu" của quy trình Khoa học Dữ liệu?

  • A. Xây dựng mô hình học máy
  • B. Phân tích hồi quy
  • C. Làm sạch dữ liệu và xử lý giá trị thiếu
  • D. Trực quan hóa dữ liệu bằng biểu đồ

Câu 24: Trong Khoa học Dữ liệu, việc "dự báo" (prediction) thường dựa trên kỹ thuật nào?

  • A. Trực quan hóa dữ liệu
  • B. Làm sạch dữ liệu
  • C. Thống kê mô tả
  • D. Mô hình học máy

Câu 25: Lợi ích chính của việc ứng dụng Khoa học Dữ liệu trong kinh doanh là gì?

  • A. Giảm chi phí lưu trữ dữ liệu
  • B. Đưa ra quyết định dựa trên bằng chứng và tối ưu hóa hiệu quả hoạt động
  • C. Tăng cường bảo mật dữ liệu
  • D. Tự động hóa hoàn toàn quy trình sản xuất

Câu 26: Để phân tích mối quan hệ giữa thu nhập và trình độ học vấn, loại biểu đồ nào sau đây có thể hữu ích?

  • A. Biểu đồ tròn (pie chart)
  • B. Biểu đồ cột (bar chart)
  • C. Biểu đồ đường (line chart)
  • D. Biểu đồ hộp (box plot) hoặc biểu đồ violin (violin plot)

Câu 27: Phát biểu nào sau đây KHÔNG đúng về Khoa học Dữ liệu?

  • A. Khoa học Dữ liệu là một lĩnh vực liên ngành
  • B. Khoa học Dữ liệu tập trung vào khai thác tri thức từ dữ liệu
  • C. Khoa học Dữ liệu chỉ giới hạn trong việc phân tích dữ liệu số
  • D. Khoa học Dữ liệu có ứng dụng rộng rãi trong nhiều lĩnh vực

Câu 28: Trong Khoa học Dữ liệu, "mô hình hóa" (modeling) dữ liệu là quá trình như thế nào?

  • A. Xây dựng các biểu diễn toán học hoặc thuật toán để hiểu và dự đoán dữ liệu
  • B. Thu thập dữ liệu từ nhiều nguồn khác nhau
  • C. Trực quan hóa dữ liệu bằng các công cụ đồ họa
  • D. Làm sạch và chuẩn hóa dữ liệu

Câu 29: Yếu tố nào sau đây là quan trọng nhất để đảm bảo thành công của một dự án Khoa học Dữ liệu?

  • A. Sử dụng công nghệ và công cụ phân tích dữ liệu mới nhất
  • B. Hiểu rõ vấn đề nghiệp vụ và mục tiêu cần đạt được
  • C. Có đội ngũ khoa học dữ liệu đông đảo
  • D. Thu thập được lượng dữ liệu khổng lồ

Câu 30: Để trình bày kết quả phân tích dữ liệu cho người không chuyên môn, nhà khoa học dữ liệu nên ưu tiên phương pháp nào?

  • A. Sử dụng ngôn ngữ chuyên ngành và thuật ngữ kỹ thuật
  • B. Trình bày chi tiết các thuật toán và mô hình đã sử dụng
  • C. Sử dụng trực quan hóa dữ liệu và giải thích đơn giản, dễ hiểu
  • D. Cung cấp bảng số liệu thống kê chi tiết và phức tạp

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 1: Trong quy trình Khoa học Dữ liệu, giai đoạn nào tập trung vào việc làm sạch, chuyển đổi và cấu trúc lại dữ liệu thô để chuẩn bị cho phân tích?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 2: 'Vận tốc' (Velocity) trong đặc điểm '5V' của Dữ liệu lớn đề cập đến khía cạnh nào?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 3: Đâu là mục tiêu chính của việc trực quan hóa dữ liệu trong Khoa học Dữ liệu?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 4: Ứng dụng nào sau đây thể hiện rõ nhất vai trò của Khoa học Dữ liệu trong việc cải thiện trải nghiệm khách hàng?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 5: Học máy (Machine Learning) đóng vai trò gì trong Khoa học Dữ liệu?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 6: Trong các lĩnh vực sau, lĩnh vực nào ít có khả năng ứng dụng Khoa học Dữ liệu nhất?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 7: 'Giá trị' (Value) trong '5V' của Dữ liệu lớn muốn nhấn mạnh điều gì?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 8: Phát biểu nào sau đây mô tả đúng nhất mối quan hệ giữa Khoa học Dữ liệu và Trí tuệ Nhân tạo (AI)?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 9: Khi một nhà khoa học dữ liệu 'khám phá dữ liệu' (data exploration), họ thường thực hiện công việc gì?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 10: Trong bối cảnh Khoa học Dữ liệu, 'dữ liệu có cấu trúc' khác biệt với 'dữ liệu phi cấu trúc' như thế nào?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 11: 'Tính xác thực' (Veracity) của Dữ liệu lớn đề cập đến vấn đề gì?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 12: Một công ty thương mại điện tử sử dụng Khoa học Dữ liệu để dự đoán sản phẩm nào khách hàng có khả năng mua tiếp theo. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học Dữ liệu?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 13: Đâu là kỹ năng quan trọng nhất đối với một nhà khoa học dữ liệu?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 14: 'Variety' (Sự đa dạng) trong '5V' của Dữ liệu lớn ám chỉ điều gì?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 15: Trong quá trình phân tích dữ liệu, khi nào thì việc sử dụng biểu đồ phân tán (scatter plot) là phù hợp nhất?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 16: Mục đích của việc 'làm sạch dữ liệu' (data cleaning) trong Khoa học Dữ liệu là gì?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 17: Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của Khoa học Dữ liệu?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 18: 'Tri thức chuyên ngành' (domain knowledge) có vai trò như thế nào trong Khoa học Dữ liệu?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 19: Loại biểu đồ nào sau đây phù hợp nhất để so sánh tỷ lệ phần trăm của các danh mục khác nhau trong một tổng thể?

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 20: Trong quy trình Khoa học Dữ liệu, giai đoạn 'triển khai và giám sát mô hình' (deployment and monitoring) nhằm mục đích gì?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 21: Khi phân tích dữ liệu về doanh số bán hàng theo thời gian, loại biểu đồ nào sau đây thường được sử dụng để thể hiện xu hướng?

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 22: 'Volume' (Khối lượng) trong '5V' của Dữ liệu lớn đề cập đến đặc điểm nào của dữ liệu?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 23: Công cụ hoặc kỹ thuật nào sau đây thường được sử dụng trong giai đoạn 'chuẩn bị dữ liệu' của quy trình Khoa học Dữ liệu?

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 24: Trong Khoa học Dữ liệu, việc 'dự báo' (prediction) thường dựa trên kỹ thuật nào?

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 25: Lợi ích chính của việc ứng dụng Khoa học Dữ liệu trong kinh doanh là gì?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 26: Để phân tích mối quan hệ giữa thu nhập và trình độ học vấn, loại biểu đồ nào sau đây có thể hữu ích?

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 27: Phát biểu nào sau đây KHÔNG đúng về Khoa học Dữ liệu?

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 28: Trong Khoa học Dữ liệu, 'mô hình hóa' (modeling) dữ liệu là quá trình như thế nào?

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 29: Yếu tố nào sau đây là quan trọng nhất để đảm bảo thành công của một dự án Khoa học Dữ liệu?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 1

Câu 30: Để trình bày kết quả phân tích dữ liệu cho người không chuyên môn, nhà khoa học dữ liệu nên ưu tiên phương pháp nào?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 02

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 02 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Khoa học dữ liệu chủ yếu tập trung vào giai đoạn nào trong vòng đời của dữ liệu?

  • A. Thu thập và lưu trữ dữ liệu
  • B. Bảo mật và quản lý dữ liệu
  • C. Phân tích, xử lý và khai thác giá trị từ dữ liệu
  • D. Trình bày và báo cáo dữ liệu

Câu 2: Yếu tố nào sau đây KHÔNG phải là đặc trưng của dữ liệu lớn (Big Data) theo mô hình 5V?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Security (Tính bảo mật)

Câu 3: Trong khoa học dữ liệu, kỹ thuật trực quan hóa dữ liệu (Data Visualization) đóng vai trò quan trọng nhất ở giai đoạn nào của quy trình phân tích?

  • A. Thu thập và làm sạch dữ liệu
  • B. Phân tích khám phá và truyền đạt kết quả
  • C. Xây dựng mô hình dự đoán
  • D. Đánh giá và triển khai mô hình

Câu 4: Ứng dụng nào sau đây thể hiện rõ nhất vai trò của khoa học dữ liệu trong việc cải thiện trải nghiệm người dùng?

  • A. Hệ thống gợi ý sản phẩm cá nhân hóa trên các trang thương mại điện tử
  • B. Phần mềm quản lý kho hàng tự động
  • C. Mạng xã hội kết nối bạn bè trên toàn cầu
  • D. Công cụ tìm kiếm thông tin trên Internet

Câu 5: Học máy (Machine Learning) được xem là một phần của khoa học dữ liệu, vậy mối quan hệ chính xác nhất giữa chúng là gì?

  • A. Khoa học dữ liệu là một nhánh của học máy
  • B. Học máy là một công cụ quan trọng trong khoa học dữ liệu
  • C. Khoa học dữ liệu và học máy là hai lĩnh vực hoàn toàn độc lập
  • D. Học máy bao gồm tất cả các lĩnh vực của khoa học dữ liệu

Câu 6: Phát biểu nào sau đây mô tả đúng nhất về "tính đa dạng" (Variety) trong đặc điểm 5V của dữ liệu lớn?

  • A. Tốc độ dữ liệu được tạo ra và xử lý rất nhanh
  • B. Kích thước dữ liệu cực kỳ lớn, vượt quá khả năng xử lý thông thường
  • C. Dữ liệu đến từ nhiều nguồn khác nhau và có nhiều định dạng khác nhau
  • D. Độ tin cậy và chính xác của dữ liệu có thể không được đảm bảo

Câu 7: Một nhà khoa học dữ liệu cần kỹ năng nào sau đây để làm việc hiệu quả với dữ liệu phi cấu trúc?

  • A. Lập trình cơ sở dữ liệu quan hệ (SQL)
  • B. Thống kê mô tả và suy luận
  • C. Xây dựng mô hình hồi quy tuyến tính
  • D. Xử lý ngôn ngữ tự nhiên (NLP) và phân tích hình ảnh

Câu 8: Trong quy trình khoa học dữ liệu, giai đoạn "làm sạch dữ liệu" (Data Cleaning) nhằm mục đích chính là gì?

  • A. Tăng tốc độ truy cập dữ liệu
  • B. Nâng cao chất lượng và độ tin cậy của dữ liệu
  • C. Giảm dung lượng lưu trữ dữ liệu
  • D. Trực quan hóa dữ liệu một cách hiệu quả hơn

Câu 9: Một công ty muốn dự đoán doanh số bán hàng trong quý tới dựa trên dữ liệu lịch sử bán hàng và các yếu tố thị trường. Loại bài toán nào trong khoa học dữ liệu phù hợp nhất để giải quyết vấn đề này?

  • A. Phân cụm dữ liệu (Clustering)
  • B. Phân loại dữ liệu (Classification)
  • C. Bài toán dự đoán (Prediction/Regression)
  • D. Bài toán phát hiện bất thường (Anomaly Detection)

Câu 10: Đâu là thách thức lớn nhất về mặt đạo đức khi ứng dụng khoa học dữ liệu trong việc phân tích dữ liệu cá nhân?

  • A. Xâm phạm quyền riêng tư và lộ thông tin cá nhân
  • B. Thiếu công cụ phân tích dữ liệu hiệu quả
  • C. Chi phí lưu trữ dữ liệu quá lớn
  • D. Khó khăn trong việc tuyển dụng nhân lực khoa học dữ liệu

Câu 11: Trong ngữ cảnh khoa học dữ liệu, "tính xác thực" (Veracity) của dữ liệu đề cập đến khía cạnh nào?

  • A. Tốc độ thu thập và xử lý dữ liệu
  • B. Độ tin cậy và chính xác của nguồn dữ liệu
  • C. Sự đa dạng về loại hình dữ liệu
  • D. Giá trị kinh tế mà dữ liệu mang lại

Câu 12: Công cụ nào sau đây thường được sử dụng để trực quan hóa dữ liệu trong khoa học dữ liệu?

  • A. Microsoft Word
  • B. Adobe Photoshop
  • C. Python (với thư viện Matplotlib, Seaborn)
  • D. Phần mềm diệt virus

Câu 13: Một nhà khoa học dữ liệu sử dụng thuật toán phân cụm (Clustering) để phân tích dữ liệu khách hàng. Mục tiêu chính của việc này là gì?

  • A. Dự đoán hành vi mua hàng của từng khách hàng cụ thể
  • B. Phân loại khách hàng vào các nhóm đã được định nghĩa trước
  • C. Đánh giá mức độ hài lòng của khách hàng
  • D. Nhóm khách hàng thành các phân khúc dựa trên đặc điểm chung

Câu 14: Để đánh giá hiệu quả của một mô hình dự đoán trong khoa học dữ liệu, người ta thường sử dụng các chỉ số đánh giá. Chỉ số nào sau đây thường dùng để đo lường độ chính xác của mô hình phân loại?

  • A. Độ chính xác (Accuracy)
  • B. Sai số bình phương trung bình (Mean Squared Error)
  • C. Hệ số tương quan (Correlation Coefficient)
  • D. Giá trị P (P-value)

Câu 15: Trong bối cảnh dữ liệu lớn, "tốc độ" (Velocity) đề cập đến khía cạnh nào quan trọng?

  • A. Kích thước tổng thể của tập dữ liệu
  • B. Sự đa dạng của các loại dữ liệu
  • C. Tần suất và tốc độ tạo ra và xử lý dữ liệu
  • D. Độ tin cậy của nguồn gốc dữ liệu

Câu 16: Ví dụ nào sau đây thể hiện ứng dụng của khoa học dữ liệu trong lĩnh vực y tế?

  • A. Tự động hóa quy trình sản xuất thuốc
  • B. Dự đoán nguy cơ mắc bệnh tim mạch dựa trên dữ liệu bệnh sử
  • C. Quản lý hồ sơ bệnh án điện tử
  • D. Nghiên cứu và phát triển thuốc mới

Câu 17: Để phân tích mối quan hệ giữa các biến số trong một tập dữ liệu, nhà khoa học dữ liệu thường sử dụng phương pháp thống kê nào?

  • A. Thống kê mô tả (Descriptive statistics)
  • B. Kiểm định giả thuyết (Hypothesis testing)
  • C. Phân tích hồi quy (Regression analysis)
  • D. Phân tích tương quan (Correlation analysis)

Câu 18: Trong khoa học dữ liệu, "giá trị" (Value) của dữ liệu được hiểu là gì?

  • A. Kích thước của tập dữ liệu
  • B. Tốc độ xử lý dữ liệu
  • C. Khả năng tạo ra thông tin hữu ích và lợi ích từ dữ liệu
  • D. Độ chính xác của dữ liệu

Câu 19: Quy trình khoa học dữ liệu thường bắt đầu bằng giai đoạn nào?

  • A. Xác định vấn đề và mục tiêu
  • B. Thu thập dữ liệu
  • C. Phân tích dữ liệu
  • D. Trình bày kết quả

Câu 20: Loại dữ liệu nào sau đây được xem là dữ liệu có cấu trúc?

  • A. Văn bản bài báo
  • B. Dữ liệu trong bảng tính Excel
  • C. Hình ảnh kỹ thuật số
  • D. Video trực tuyến

Câu 21: Để xử lý và phân tích dữ liệu hiệu quả, nhà khoa học dữ liệu cần có kiến thức nền tảng vững chắc về lĩnh vực nào?

  • A. Chỉ khoa học máy tính
  • B. Chỉ toán học và thống kê
  • C. Khoa học máy tính, toán học và thống kê, và kiến thức chuyên ngành
  • D. Chỉ kiến thức về lập trình

Câu 22: Ứng dụng nào sau đây KHÔNG phải là thành tựu trực tiếp của khoa học dữ liệu?

  • A. Hệ thống phát hiện gian lận trong giao dịch ngân hàng
  • B. Công cụ chẩn đoán bệnh dựa trên hình ảnh y tế
  • C. Các thuật toán gợi ý nội dung trên mạng xã hội
  • D. Chế tạo robot hình người có khả năng giao tiếp

Câu 23: Trong quá trình trực quan hóa dữ liệu, loại biểu đồ nào phù hợp nhất để so sánh giá trị của các danh mục khác nhau?

  • A. Biểu đồ cột (Bar chart)
  • B. Biểu đồ đường (Line chart)
  • C. Biểu đồ tròn (Pie chart)
  • D. Biểu đồ phân tán (Scatter plot)

Câu 24: Mục tiêu của việc "tối ưu hóa quyết định" trong khoa học dữ liệu là gì?

  • A. Tăng cường khả năng lưu trữ dữ liệu
  • B. Đưa ra quyết định tốt nhất dựa trên phân tích dữ liệu
  • C. Giảm thiểu sai sót trong quá trình thu thập dữ liệu
  • D. Cải thiện tốc độ xử lý dữ liệu

Câu 25: Phát biểu nào sau đây KHÔNG đúng về khoa học dữ liệu?

  • A. Khoa học dữ liệu sử dụng các phương pháp khoa học để khai thác tri thức từ dữ liệu.
  • B. Khoa học dữ liệu giúp cải thiện quá trình ra quyết định trong nhiều lĩnh vực.
  • C. Khoa học dữ liệu chỉ ứng dụng hiệu quả trong lĩnh vực kinh doanh và marketing.
  • D. Khoa học dữ liệu kết hợp kiến thức từ khoa học máy tính, toán học và thống kê.

Câu 26: Trong khoa học dữ liệu, thuật ngữ "feature" (đặc trưng) thường được dùng để chỉ điều gì?

  • A. Một loại lỗi dữ liệu phổ biến
  • B. Một thuộc tính hoặc biến số của dữ liệu
  • C. Một phương pháp trực quan hóa dữ liệu
  • D. Một giai đoạn trong quy trình làm sạch dữ liệu

Câu 27: Khi nói về "tính giá trị" (Value) của dữ liệu lớn, yếu tố nào sau đây quan trọng nhất?

  • A. Dung lượng lưu trữ dữ liệu khổng lồ
  • B. Tốc độ thu thập dữ liệu nhanh chóng
  • C. Sự đa dạng về nguồn và loại dữ liệu
  • D. Khả năng tạo ra thông tin và tri thức hữu ích

Câu 28: Để khám phá các mẫu và xu hướng ẩn trong dữ liệu, nhà khoa học dữ liệu thường sử dụng kỹ thuật phân tích nào?

  • A. Phân tích mô tả (Descriptive analysis)
  • B. Phân tích dự đoán (Predictive analysis)
  • C. Phân tích khám phá dữ liệu (Exploratory Data Analysis)
  • D. Phân tích quy chuẩn (Prescriptive analysis)

Câu 29: Trong khoa học dữ liệu, việc đảm bảo tính "minh bạch" của mô hình học máy có ý nghĩa gì về mặt đạo đức?

  • A. Tăng tốc độ xử lý của mô hình
  • B. Đảm bảo tính công bằng và trách nhiệm giải trình của mô hình
  • C. Nâng cao độ chính xác của mô hình dự đoán
  • D. Giảm thiểu dung lượng lưu trữ của mô hình

Câu 30: Khi một nhà khoa học dữ liệu trình bày kết quả phân tích cho người không chuyên môn, phương pháp truyền đạt hiệu quả nhất thường là gì?

  • A. Sử dụng báo cáo kỹ thuật chi tiết với nhiều thuật ngữ chuyên ngành
  • B. Chỉ trình bày kết quả dưới dạng bảng số liệu thống kê
  • C. Sử dụng trực quan hóa dữ liệu và ngôn ngữ đơn giản, dễ hiểu
  • D. Gửi mã nguồn chương trình phân tích dữ liệu

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 1: Khoa học dữ liệu chủ yếu tập trung vào giai đoạn nào trong vòng đời của dữ liệu?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 2: Yếu tố nào sau đây KHÔNG phải là đặc trưng của dữ liệu lớn (Big Data) theo mô hình 5V?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 3: Trong khoa học dữ liệu, kỹ thuật trực quan hóa dữ liệu (Data Visualization) đóng vai trò quan trọng nhất ở giai đoạn nào của quy trình phân tích?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 4: Ứng dụng nào sau đây thể hiện rõ nhất vai trò của khoa học dữ liệu trong việc cải thiện trải nghiệm người dùng?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 5: Học máy (Machine Learning) được xem là một phần của khoa học dữ liệu, vậy mối quan hệ chính xác nhất giữa chúng là gì?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 6: Phát biểu nào sau đây mô tả đúng nhất về 'tính đa dạng' (Variety) trong đặc điểm 5V của dữ liệu lớn?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 7: Một nhà khoa học dữ liệu cần kỹ năng nào sau đây để làm việc hiệu quả với dữ liệu phi cấu trúc?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 8: Trong quy trình khoa học dữ liệu, giai đoạn 'làm sạch dữ liệu' (Data Cleaning) nhằm mục đích chính là gì?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 9: Một công ty muốn dự đoán doanh số bán hàng trong quý tới dựa trên dữ liệu lịch sử bán hàng và các yếu tố thị trường. Loại bài toán nào trong khoa học dữ liệu phù hợp nhất để giải quyết vấn đề này?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 10: Đâu là thách thức lớn nhất về mặt đạo đức khi ứng dụng khoa học dữ liệu trong việc phân tích dữ liệu cá nhân?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 11: Trong ngữ cảnh khoa học dữ liệu, 'tính xác thực' (Veracity) của dữ liệu đề cập đến khía cạnh nào?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 12: Công cụ nào sau đây thường được sử dụng để trực quan hóa dữ liệu trong khoa học dữ liệu?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 13: Một nhà khoa học dữ liệu sử dụng thuật toán phân cụm (Clustering) để phân tích dữ liệu khách hàng. Mục tiêu chính của việc này là gì?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 14: Để đánh giá hiệu quả của một mô hình dự đoán trong khoa học dữ liệu, người ta thường sử dụng các chỉ số đánh giá. Chỉ số nào sau đây thường dùng để đo lường độ chính xác của mô hình phân loại?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 15: Trong bối cảnh dữ liệu lớn, 'tốc độ' (Velocity) đề cập đến khía cạnh nào quan trọng?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 16: Ví dụ nào sau đây thể hiện ứng dụng của khoa học dữ liệu trong lĩnh vực y tế?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 17: Để phân tích mối quan hệ giữa các biến số trong một tập dữ liệu, nhà khoa học dữ liệu thường sử dụng phương pháp thống kê nào?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 18: Trong khoa học dữ liệu, 'giá trị' (Value) của dữ liệu được hiểu là gì?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 19: Quy trình khoa học dữ liệu thường bắt đầu bằng giai đoạn nào?

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 20: Loại dữ liệu nào sau đây được xem là dữ liệu có cấu trúc?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 21: Để xử lý và phân tích dữ liệu hiệu quả, nhà khoa học dữ liệu cần có kiến thức nền tảng vững chắc về lĩnh vực nào?

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 22: Ứng dụng nào sau đây KHÔNG phải là thành tựu trực tiếp của khoa học dữ liệu?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 23: Trong quá trình trực quan hóa dữ liệu, loại biểu đồ nào phù hợp nhất để so sánh giá trị của các danh mục khác nhau?

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 24: Mục tiêu của việc 'tối ưu hóa quyết định' trong khoa học dữ liệu là gì?

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 25: Phát biểu nào sau đây KHÔNG đúng về khoa học dữ liệu?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 26: Trong khoa học dữ liệu, thuật ngữ 'feature' (đặc trưng) thường được dùng để chỉ điều gì?

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 27: Khi nói về 'tính giá trị' (Value) của dữ liệu lớn, yếu tố nào sau đây quan trọng nhất?

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 28: Để khám phá các mẫu và xu hướng ẩn trong dữ liệu, nhà khoa học dữ liệu thường sử dụng kỹ thuật phân tích nào?

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 29: Trong khoa học dữ liệu, việc đảm bảo tính 'minh bạch' của mô hình học máy có ý nghĩa gì về mặt đạo đức?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 2

Câu 30: Khi một nhà khoa học dữ liệu trình bày kết quả phân tích cho người không chuyên môn, phương pháp truyền đạt hiệu quả nhất thường là gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 03

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 03 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Khoa học dữ liệu (Data Science) được định nghĩa là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp các phương pháp và công cụ từ nhiều ngành khác nhau để đạt được mục tiêu của mình. Theo kiến thức đã học, sự kết hợp nào sau đây thể hiện rõ nhất bản chất liên ngành cốt lõi của Khoa học dữ liệu?

  • A. Vật lý, Hóa học, và Sinh học.
  • B. Khoa học máy tính, Toán học, và Thống kê.
  • C. Triết học, Lịch sử, và Văn học.
  • D. Kinh tế học, Xã hội học, và Luật học.

Câu 2: Mục tiêu cuối cùng mà Khoa học dữ liệu hướng tới là gì, vượt qua việc chỉ đơn thuần thu thập và lưu trữ dữ liệu?

  • A. Tăng tốc độ truyền dữ liệu qua mạng internet.
  • B. Giảm dung lượng lưu trữ của các tập dữ liệu lớn.
  • C. Khai thác tri thức, tạo ra hiểu biết sâu sắc và hỗ trợ ra quyết định hiệu quả từ dữ liệu.
  • D. Thiết kế giao diện người dùng thân thiện cho các ứng dụng dữ liệu.

Câu 3: Một công ty thương mại điện tử ghi nhận hàng triệu giao dịch mua bán mỗi ngày, cùng với lịch sử duyệt web và tìm kiếm của hàng chục triệu người dùng. Lượng dữ liệu này tăng lên liên tục với tốc độ rất nhanh. Đặc điểm nào của Dữ liệu lớn (Big Data) được mô tả nổi bật nhất trong tình huống này?

  • A. Velocity (Vận tốc)
  • B. Variety (Đa dạng)
  • C. Veracity (Tính xác thực)
  • D. Value (Giá trị)

Câu 4: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu bao gồm các bài đăng trên mạng xã hội (text), hình ảnh sản phẩm (image), và bản ghi âm cuộc gọi của khách hàng (audio). Đặc điểm nào của Dữ liệu lớn được thể hiện rõ ràng nhất qua các loại dữ liệu này?

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Veracity (Tính xác thực)
  • D. Variety (Đa dạng)

Câu 5: Giai đoạn nào trong quy trình Khoa học dữ liệu thường tập trung vào việc làm sạch dữ liệu bị thiếu, không nhất quán hoặc chứa lỗi, cũng như chuyển đổi dữ liệu sang định dạng phù hợp cho phân tích?

  • A. Thu thập dữ liệu (Data Collection)
  • B. Tiền xử lý dữ liệu (Data Preprocessing)
  • C. Xây dựng mô hình (Modeling)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 6: Một công ty muốn dự đoán xem một khách hàng tiềm năng có khả năng mua sản phẩm của họ hay không dựa trên lịch sử duyệt web và thông tin nhân khẩu học. Nhiệm vụ này trong Khoa học dữ liệu thuộc dạng bài toán nào?

  • A. Phân cụm (Clustering)
  • B. Hồi quy (Regression)
  • C. Phân loại (Classification)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 7: Để hiểu rõ hơn về xu hướng bán hàng theo từng quý trong năm của một cửa hàng, nhà phân tích dữ liệu nên sử dụng kỹ thuật nào để biểu diễn dữ liệu một cách dễ hiểu và trực quan?

  • A. Trực quan hóa dữ liệu (Data Visualization)
  • B. Mã hóa dữ liệu (Data Encryption)
  • C. Nén dữ liệu (Data Compression)
  • D. Sao lưu dữ liệu (Data Backup)

Câu 8: Vai trò của Toán học và Thống kê trong Khoa học dữ liệu là gì?

  • A. Thiết kế cơ sở dữ liệu hiệu quả.
  • B. Phát triển phần cứng máy tính chuyên dụng cho dữ liệu lớn.
  • C. Xây dựng giao diện người dùng tương tác.
  • D. Cung cấp các phương pháp phân tích, mô hình hóa và suy luận từ dữ liệu.

Câu 9: Học máy (Machine Learning) là một lĩnh vực con quan trọng của Khoa học dữ liệu và Trí tuệ nhân tạo. Mối quan hệ giữa Khoa học dữ liệu và Học máy được thể hiện rõ nhất qua khía cạnh nào?

  • A. Khoa học dữ liệu chỉ sử dụng kết quả của Học máy mà không đóng góp ngược lại.
  • B. Học máy cung cấp các thuật toán và mô hình mạnh mẽ để Khoa học dữ liệu khai thác tri thức và đưa ra dự đoán từ dữ liệu.
  • C. Học máy và Khoa học dữ liệu là hai lĩnh vực hoàn toàn độc lập và không liên quan đến nhau.
  • D. Khoa học dữ liệu chỉ tập trung vào dữ liệu có cấu trúc, trong khi Học máy chỉ xử lý dữ liệu phi cấu trúc.

Câu 10: Một trong những ứng dụng thực tế phổ biến của Khoa học dữ liệu là phát hiện gian lận trong giao dịch tài chính. Khoa học dữ liệu giúp giải quyết vấn đề này bằng cách nào?

  • A. Chỉ đơn giản là lưu trữ lịch sử giao dịch.
  • B. Tăng cường bảo mật vật lý cho các trung tâm dữ liệu.
  • C. Phân tích các mẫu giao dịch bất thường, xây dựng mô hình dự báo nguy cơ gian lận dựa trên hành vi người dùng.
  • D. Giảm số lượng giao dịch hàng ngày để dễ kiểm soát hơn.

Câu 11: Tại sao tri thức chuyên ngành (Domain Expertise) lại quan trọng đối với một nhà khoa học dữ liệu, ngay cả khi họ có kỹ năng mạnh về toán học và lập trình?

  • A. Giúp hiểu ý nghĩa của dữ liệu, xác định các câu hỏi cần trả lời và diễn giải kết quả phân tích trong bối cảnh thực tế.
  • B. Chỉ cần thiết để thu thập dữ liệu ban đầu.
  • C. Không ảnh hưởng đến quá trình xây dựng mô hình.
  • D. Chỉ quan trọng khi làm việc với dữ liệu văn bản.

Câu 12: Khi làm việc với Dữ liệu lớn, khái niệm "Veracity" (Tính xác thực) đề cập đến khía cạnh nào của dữ liệu?

  • A. Tốc độ dữ liệu được tạo ra.
  • B. Độ chính xác, đáng tin cậy và trung thực của dữ liệu.
  • C. Số lượng dữ liệu được thu thập.
  • D. Sự đa dạng về định dạng của dữ liệu.

Câu 13: Một nhà khoa học dữ liệu được yêu cầu phân tích dữ liệu bán hàng của một siêu thị để tìm ra các nhóm sản phẩm thường được mua cùng nhau (ví dụ: sữa và bánh mì). Đây là ví dụ về bài toán nào trong Khoa học dữ liệu?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Phát hiện bất thường (Anomaly Detection)
  • D. Phân tích luật kết hợp (Association Rule Mining)

Câu 14: Trong quy trình Khoa học dữ liệu, sau khi đã thu thập và tiền xử lý dữ liệu, bước tiếp theo thường là gì để bắt đầu khám phá các mẫu hình và hiểu biết ban đầu?

  • A. Phân tích khám phá dữ liệu (Exploratory Data Analysis - EDA).
  • B. Triển khai mô hình vào sản xuất (Deployment).
  • C. Thu thập thêm dữ liệu mới.
  • D. Viết báo cáo cuối cùng.

Câu 15: Khi xây dựng một mô hình học máy để dự đoán, việc lựa chọn và thiết kế các đặc trưng (features) từ dữ liệu gốc có ảnh hưởng lớn đến hiệu suất của mô hình. Công việc này thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Trực quan hóa kết quả.
  • C. Kỹ thuật đặc trưng (Feature Engineering).
  • D. Triển khai mô hình.

Câu 16: Một công ty truyền thông xã hội muốn phân tích cảm xúc (tích cực, tiêu cực, trung lập) từ hàng triệu bình luận của người dùng về một sản phẩm mới. Đây là một bài toán ứng dụng Khoa học dữ liệu thuộc loại nào?

  • A. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP).
  • B. Thị giác máy tính (Computer Vision).
  • C. Phân tích chuỗi thời gian (Time Series Analysis).
  • D. Hệ thống khuyến nghị (Recommender Systems).

Câu 17: Biểu đồ đường (Line chart) thường được sử dụng trong trực quan hóa dữ liệu để thể hiện điều gì?

  • A. So sánh tỷ lệ phần trăm của các danh mục khác nhau.
  • B. Phân bố tần suất của một biến duy nhất.
  • C. Mối quan hệ giữa hai biến rời rạc.
  • D. Xu hướng của dữ liệu theo thời gian hoặc một biến liên tục khác.

Câu 18: Một công ty vận tải sử dụng Khoa học dữ liệu để phân tích dữ liệu giao thông, thời tiết và lịch trình xe để tìm ra tuyến đường tối ưu nhất cho các xe tải của mình. Ứng dụng này minh họa cho thành tựu nào của Khoa học dữ liệu?

  • A. Phát hiện gian lận.
  • B. Tối ưu hóa quyết định và quy trình.
  • C. Cải thiện trải nghiệm khách hàng.
  • D. Tự động hóa công việc lặp đi lặp lại.

Câu 19: Trong bối cảnh Khoa học dữ liệu, cụm từ "pipeline dữ liệu" (data pipeline) thường dùng để chỉ điều gì?

  • A. Một loại cáp mạng tốc độ cao để truyền dữ liệu lớn.
  • B. Phần mềm dùng để trực quan hóa dữ liệu.
  • C. Chuỗi các bước xử lý dữ liệu, từ thu thập, làm sạch, chuyển đổi, đến phân tích và lưu trữ.
  • D. Một phương pháp mã hóa dữ liệu để bảo mật.

Câu 20: Việc thu thập dữ liệu từ nhiều nguồn khác nhau như cơ sở dữ liệu nội bộ, API công cộng, mạng xã hội, và cảm biến IoT là một phần của giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu (Data Collection).
  • B. Phân tích khám phá dữ liệu (EDA).
  • C. Đánh giá mô hình (Model Evaluation).
  • D. Báo cáo kết quả (Reporting).

Câu 21: Khi một nhà khoa học dữ liệu sử dụng dữ liệu lịch sử về giá nhà, diện tích, số phòng ngủ và vị trí để xây dựng mô hình dự đoán giá của một ngôi nhà mới, họ đang giải quyết bài toán thuộc dạng nào?

  • A. Phân loại (Classification).
  • B. Hồi quy (Regression).
  • C. Phân cụm (Clustering).
  • D. Phát hiện bất thường (Anomaly Detection).

Câu 22: Tại sao việc hiểu rõ mục tiêu kinh doanh hoặc vấn đề cần giải quyết lại là bước quan trọng nhất trước khi bắt đầu thu thập và phân tích dữ liệu trong Khoa học dữ liệu?

  • A. Để quyết định nên sử dụng ngôn ngữ lập trình nào.
  • B. Để xác định số lượng dữ liệu cần thu thập.
  • C. Để chọn phần mềm trực quan hóa phù hợp.
  • D. Giúp xác định loại dữ liệu cần thiết, phương pháp phân tích phù hợp và đảm bảo kết quả mang lại giá trị thực tế.

Câu 23: Sự khác biệt cốt lõi giữa Khoa học dữ liệu và Trí tuệ nhân tạo (AI) là gì?

  • A. Khoa học dữ liệu tập trung vào việc khai thác hiểu biết từ dữ liệu, trong khi AI tập trung vào việc tạo ra các hệ thống có thể thực hiện các nhiệm vụ đòi hỏi trí thông minh.
  • B. Khoa học dữ liệu chỉ làm việc với dữ liệu có cấu trúc, còn AI chỉ làm việc với dữ liệu phi cấu trúc.
  • C. Khoa học dữ liệu là một phần của AI.
  • D. AI là một phần của Khoa học dữ liệu.

Câu 24: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích hành vi chi tiêu của khách hàng nhằm đưa ra các gói dịch vụ tài chính hoặc ưu đãi phù hợp cho từng cá nhân. Đây là ví dụ về thành tựu nào của Khoa học dữ liệu?

  • A. Tự động hóa quy trình sản xuất.
  • B. Dự báo thời tiết chính xác hơn.
  • C. Phát hiện hoạt động tội phạm công nghệ cao.
  • D. Cải thiện trải nghiệm khách hàng thông qua cá nhân hóa dịch vụ.

Câu 25: Khi một nhà khoa học dữ liệu sử dụng biểu đồ cột (Bar chart) để so sánh doanh thu của các danh mục sản phẩm khác nhau trong một tháng, mục đích chính của việc trực quan hóa này là gì?

  • A. Tìm mối tương quan giữa hai biến liên tục.
  • B. So sánh giá trị giữa các nhóm hoặc danh mục rời rạc.
  • C. Hiển thị phân bố của một biến liên tục.
  • D. Theo dõi sự thay đổi của một biến theo thời gian.

Câu 26: Thử thách lớn nhất khi làm việc với Dữ liệu lớn liên quan đến "Veracity" (Tính xác thực) là gì?

  • A. Tốc độ xử lý dữ liệu quá nhanh.
  • B. Lượng dữ liệu quá lớn để lưu trữ.
  • C. Đảm bảo độ tin cậy, chính xác và loại bỏ sai lệch, nhiễu trong dữ liệu từ nhiều nguồn khác nhau.
  • D. Khó khăn trong việc kết hợp các loại dữ liệu khác nhau.

Câu 27: Việc xây dựng các hệ thống khuyến nghị (Recommender Systems) trên các nền tảng như Netflix (gợi ý phim) hoặc Spotify (gợi ý nhạc) là một ứng dụng nổi bật của Khoa học dữ liệu nhằm mục đích gì?

  • A. Cải thiện trải nghiệm người dùng và tăng mức độ tương tác.
  • B. Giảm chi phí lưu trữ dữ liệu.
  • C. Tăng cường bảo mật tài khoản người dùng.
  • D. Tự động dịch ngôn ngữ nội dung.

Câu 28: Trong quy trình Khoa học dữ liệu, giai đoạn "Đánh giá mô hình" (Model Evaluation) nhằm mục đích gì?

  • A. Thu thập thêm dữ liệu để huấn luyện mô hình.
  • B. Làm sạch dữ liệu đầu vào.
  • C. Chọn loại biểu đồ phù hợp để trực quan hóa.
  • D. Đo lường hiệu suất và độ chính xác của mô hình đã xây dựng, đảm bảo nó phù hợp với mục tiêu đề ra.

Câu 29: Một nhà khoa học dữ liệu sử dụng kỹ thuật phân cụm (Clustering) để phân tích dữ liệu khách hàng. Mục tiêu chính của việc này là gì?

  • A. Dự đoán giá trị chính xác cho một biến liên tục (ví dụ: doanh thu).
  • B. Phân loại khách hàng vào các nhóm định trước (ví dụ: nhóm mua hàng A, nhóm mua hàng B).
  • C. Tìm và nhóm các khách hàng có hành vi hoặc đặc điểm tương tự nhau mà không có nhãn định trước.
  • D. Xác định mối quan hệ nguyên nhân - kết quả giữa các yếu tố.

Câu 30: Tại sao việc trình bày kết quả (Reporting/Presentation) lại là một giai đoạn quan trọng trong quy trình Khoa học dữ liệu?

  • A. Truyền đạt những phát hiện, hiểu biết và khuyến nghị từ dữ liệu cho những người ra quyết định một cách rõ ràng và thuyết phục.
  • B. Để kiểm tra lại mã nguồn đã viết.
  • C. Chỉ đơn giản là liệt kê các bước đã thực hiện.
  • D. Để thu thập phản hồi từ khách hàng cuối cùng.

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Khoa học dữ liệu (Data Science) được định nghĩa là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp các phương pháp và công cụ từ nhiều ngành khác nhau để đạt được mục tiêu của mình. Theo kiến thức đã học, sự kết hợp nào sau đây thể hiện rõ nhất bản chất liên ngành cốt lõi của Khoa học dữ liệu?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Mục tiêu cuối cùng mà Khoa học dữ liệu hướng tới là gì, vượt qua việc chỉ đơn thuần thu thập và lưu trữ dữ liệu?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Một công ty thương mại điện tử ghi nhận hàng triệu giao dịch mua bán mỗi ngày, cùng với lịch sử duyệt web và tìm kiếm của hàng chục triệu người dùng. Lượng dữ liệu này tăng lên liên tục với tốc độ rất nhanh. Đặc điểm nào của Dữ liệu lớn (Big Data) được mô tả nổi bật nhất trong tình huống này?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu bao gồm các bài đăng trên mạng xã hội (text), hình ảnh sản phẩm (image), và bản ghi âm cuộc gọi của khách hàng (audio). Đặc điểm nào của Dữ liệu lớn được thể hiện rõ ràng nhất qua các loại dữ liệu này?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Giai đoạn nào trong quy trình Khoa học dữ liệu thường tập trung vào việc làm sạch dữ liệu bị thiếu, không nhất quán hoặc chứa lỗi, cũng như chuyển đổi dữ liệu sang định dạng phù hợp cho phân tích?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Một công ty muốn dự đoán xem một khách hàng tiềm năng có khả năng mua sản phẩm của họ hay không dựa trên lịch sử duyệt web và thông tin nhân khẩu học. Nhiệm vụ này trong Khoa học dữ liệu thuộc dạng bài toán nào?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Để hiểu rõ hơn về xu hướng bán hàng theo từng quý trong năm của một cửa hàng, nhà phân tích dữ liệu nên sử dụng kỹ thuật nào để biểu diễn dữ liệu một cách dễ hiểu và trực quan?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Vai trò của Toán học và Thống kê trong Khoa học dữ liệu là gì?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Học máy (Machine Learning) là một lĩnh vực con quan trọng của Khoa học dữ liệu và Trí tuệ nhân tạo. Mối quan hệ giữa Khoa học dữ liệu và Học máy được thể hiện rõ nhất qua khía cạnh nào?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Một trong những ứng dụng thực tế phổ biến của Khoa học dữ liệu là phát hiện gian lận trong giao dịch tài chính. Khoa học dữ liệu giúp giải quyết vấn đề này bằng cách nào?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Tại sao tri thức chuyên ngành (Domain Expertise) lại quan trọng đối với một nhà khoa học dữ liệu, ngay cả khi họ có kỹ năng mạnh về toán học và lập trình?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Khi làm việc với Dữ liệu lớn, khái niệm 'Veracity' (Tính xác thực) đề cập đến khía cạnh nào của dữ liệu?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Một nhà khoa học dữ liệu được yêu cầu phân tích dữ liệu bán hàng của một siêu thị để tìm ra các nhóm sản phẩm thường được mua cùng nhau (ví dụ: sữa và bánh mì). Đây là ví dụ về bài toán nào trong Khoa học dữ liệu?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Trong quy trình Khoa học dữ liệu, sau khi đã thu thập và tiền xử lý dữ liệu, bước tiếp theo thường là gì để bắt đầu khám phá các mẫu hình và hiểu biết ban đầu?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Khi xây dựng một mô hình học máy để dự đoán, việc lựa chọn và thiết kế các đặc trưng (features) từ dữ liệu gốc có ảnh hưởng lớn đến hiệu suất của mô hình. Công việc này thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Một công ty truyền thông xã hội muốn phân tích cảm xúc (tích cực, tiêu cực, trung lập) từ hàng triệu bình luận của người dùng về một sản phẩm mới. Đây là một bài toán ứng dụng Khoa học dữ liệu thuộc loại nào?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Biểu đồ đường (Line chart) thường được sử dụng trong trực quan hóa dữ liệu để thể hiện điều gì?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Một công ty vận tải sử dụng Khoa học dữ liệu để phân tích dữ liệu giao thông, thời tiết và lịch trình xe để tìm ra tuyến đường tối ưu nhất cho các xe tải của mình. Ứng dụng này minh họa cho thành tựu nào của Khoa học dữ liệu?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Trong bối cảnh Khoa học dữ liệu, cụm từ 'pipeline dữ liệu' (data pipeline) thường dùng để chỉ điều gì?

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Việc thu thập dữ liệu từ nhiều nguồn khác nhau như cơ sở dữ liệu nội bộ, API công cộng, mạng xã hội, và cảm biến IoT là một phần của giai đoạn nào trong quy trình Khoa học dữ liệu?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Khi một nhà khoa học dữ liệu sử dụng dữ liệu lịch sử về giá nhà, diện tích, số phòng ngủ và vị trí để xây dựng mô hình dự đoán giá của một ngôi nhà mới, họ đang giải quyết bài toán thuộc dạng nào?

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Tại sao việc hiểu rõ mục tiêu kinh doanh hoặc vấn đề cần giải quyết lại là bước quan trọng nhất trước khi bắt đầu thu thập và phân tích dữ liệu trong Khoa học dữ liệu?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Sự khác biệt cốt lõi giữa Khoa học dữ liệu và Trí tuệ nhân tạo (AI) là gì?

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Một ngân hàng sử dụng Khoa học dữ liệu để phân tích hành vi chi tiêu của khách hàng nhằm đưa ra các gói dịch vụ tài chính hoặc ưu đãi phù hợp cho từng cá nhân. Đây là ví dụ về thành tựu nào của Khoa học dữ liệu?

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Khi một nhà khoa học dữ liệu sử dụng biểu đồ cột (Bar chart) để so sánh doanh thu của các danh mục sản phẩm khác nhau trong một tháng, mục đích chính của việc trực quan hóa này là gì?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Thử thách lớn nhất khi làm việc với Dữ liệu lớn liên quan đến 'Veracity' (Tính xác thực) là gì?

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Việc xây dựng các hệ thống khuyến nghị (Recommender Systems) trên các nền tảng như Netflix (gợi ý phim) hoặc Spotify (gợi ý nhạc) là một ứng dụng nổi bật của Khoa học dữ liệu nhằm mục đích gì?

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Trong quy trình Khoa học dữ liệu, giai đoạn 'Đánh giá mô hình' (Model Evaluation) nhằm mục đích gì?

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Một nhà khoa học dữ liệu sử dụng kỹ thuật phân cụm (Clustering) để phân tích dữ liệu khách hàng. Mục tiêu chính của việc này là gì?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 3

Tại sao việc trình bày kết quả (Reporting/Presentation) lại là một giai đoạn quan trọng trong quy trình Khoa học dữ liệu?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 04

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 04 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Sự kết hợp các phương pháp và công cụ từ những lĩnh vực nào giúp khoa học dữ liệu đạt được mục tiêu khai thác tri thức từ dữ liệu hiệu quả nhất?

  • A. Khoa học máy tính, Toán học, Thống kê và Tri thức chuyên ngành.
  • B. Vật lý học, Sinh học, Hóa học và Kỹ thuật.
  • C. Lịch sử, Địa lý, Triết học và Ngôn ngữ học.
  • D. Kinh tế học, Xã hội học, Tâm lý học và Luật học.

Câu 2: Mục tiêu cốt lõi của Khoa học dữ liệu, vượt ra ngoài việc chỉ lưu trữ hay hiển thị dữ liệu đơn thuần, là gì?

  • A. Chỉ tập trung vào việc thu thập và làm sạch dữ liệu.
  • B. Tạo ra các phần mềm và ứng dụng máy tính mới.
  • C. Phân tích, khai phá dữ liệu để tạo ra tri thức mới và hỗ trợ ra quyết định thông minh.
  • D. Xây dựng cơ sở dữ liệu lớn và phức tạp.

Câu 3: Khi phân tích dữ liệu bán hàng của một sàn thương mại điện tử, các nhà khoa học dữ liệu nhận thấy rằng khách hàng mua sản phẩm A thường có xu hướng mua thêm sản phẩm B trong cùng giao dịch. Việc phát hiện mối liên hệ này minh họa cho mục tiêu nào của khoa học dữ liệu?

  • A. Lưu trữ dữ liệu an toàn.
  • B. Tăng tốc độ truy cập dữ liệu.
  • C. Trực quan hóa dữ liệu.
  • D. Khai thác tri thức từ dữ liệu.

Câu 4: Một công ty muốn dự đoán lượng cầu về sản phẩm của mình trong quý tới dựa trên dữ liệu bán hàng lịch sử, các chiến dịch marketing đã triển khai và xu hướng thị trường. Quá trình này sử dụng các kỹ thuật của khoa học dữ liệu nhằm mục đích gì?

  • A. Giảm thiểu chi phí lưu trữ dữ liệu.
  • B. Hỗ trợ ra quyết định dựa trên dữ liệu (Data-driven decision making).
  • C. Thiết kế giao diện người dùng thân thiện hơn.
  • D. Bảo vệ dữ liệu khỏi các cuộc tấn công mạng.

Câu 5: Dữ liệu lớn (Big Data) được đặc trưng bởi nhiều yếu tố. Yếu tố nào đề cập đến tốc độ dữ liệu được tạo ra, thu thập và xử lý, thường là rất nhanh theo thời gian thực?

  • A. Velocity (Vận tốc).
  • B. Volume (Khối lượng).
  • C. Variety (Sự đa dạng).
  • D. Veracity (Tính xác thực).

Câu 6: Một tập dữ liệu bao gồm các loại thông tin khác nhau như văn bản từ mạng xã hội, hình ảnh từ camera giám sát, dữ liệu số từ cảm biến IoT và âm thanh từ cuộc gọi điện thoại. Đặc điểm này của tập dữ liệu lớn được gọi là gì?

  • A. Volume (Khối lượng).
  • B. Velocity (Vận tốc).
  • C. Variety (Sự đa dạng).
  • D. Value (Giá trị).

Câu 7: Yếu tố nào trong các đặc trưng của Dữ liệu lớn đề cập đến khả năng trích xuất thông tin hữu ích và có thể hành động được từ dữ liệu, biến nó thành lợi ích thực tế?

  • A. Velocity (Vận tốc).
  • B. Volume (Khối lượng).
  • C. Variety (Sự đa dạng).
  • D. Value (Giá trị).

Câu 8: Trong quy trình khoa học dữ liệu, sau khi thu thập dữ liệu thô, bước tiếp theo thường là làm sạch và chuẩn bị dữ liệu. Mục đích chính của bước này là gì?

  • A. Trực quan hóa dữ liệu để trình bày cho người khác.
  • B. Xử lý các giá trị thiếu, loại bỏ dữ liệu nhiễu hoặc không nhất quán để đảm bảo chất lượng dữ liệu cho phân tích.
  • C. Xây dựng mô hình học máy ngay lập tức.
  • D. Lưu trữ dữ liệu vào cơ sở dữ liệu đám mây.

Câu 9: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khách hàng. Anh ấy tạo ra biểu đồ phân tán (scatter plot) để xem mối quan hệ giữa tuổi và chi tiêu hàng tháng của khách hàng. Hoạt động này thuộc giai đoạn nào trong quy trình khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Làm sạch dữ liệu.
  • C. Khám phá và trực quan hóa dữ liệu.
  • D. Triển khai mô hình.

Câu 10: Một công ty muốn xây dựng một hệ thống để tự động phát hiện các giao dịch thẻ tín dụng có dấu hiệu gian lận. Họ sử dụng dữ liệu lịch sử về các giao dịch đã được xác nhận là gian lận hoặc hợp lệ để huấn luyện một mô hình. Công việc này thuộc giai đoạn nào trong quy trình khoa học dữ liệu?

  • A. Xây dựng mô hình (Modeling).
  • B. Thu thập dữ liệu.
  • C. Trực quan hóa dữ liệu.
  • D. Triển khai mô hình.

Câu 11: Sau khi xây dựng và kiểm thử mô hình dự đoán gian lận giao dịch (ở Câu 10), công ty tích hợp mô hình này vào hệ thống xử lý giao dịch trực tuyến để nó tự động phân tích và gắn cờ các giao dịch đáng ngờ theo thời gian thực. Đây là giai đoạn nào của quy trình khoa học dữ liệu?

  • A. Làm sạch dữ liệu.
  • B. Khám phá dữ liệu.
  • C. Xây dựng mô hình.
  • D. Triển khai (Deployment).

Câu 12: Trực quan hóa dữ liệu đóng vai trò quan trọng trong khoa học dữ liệu vì nó giúp:

  • A. Tăng kích thước của tập dữ liệu.
  • B. Truyền đạt kết quả phân tích một cách rõ ràng, dễ hiểu cho cả những người không chuyên về dữ liệu.
  • C. Tự động thu thập dữ liệu từ nhiều nguồn khác nhau.
  • D. Giảm thời gian cần thiết để làm sạch dữ liệu.

Câu 13: Mối quan hệ giữa Trí tuệ nhân tạo (AI), Học máy (Machine Learning - ML) và Khoa học dữ liệu (Data Science) thường được mô tả như thế nào?

  • A. Học máy là một tập con của AI, và Khoa học dữ liệu sử dụng các kỹ thuật từ cả AI và ML để phân tích dữ liệu và trích xuất tri thức.
  • B. AI, ML và Khoa học dữ liệu là ba lĩnh vực hoàn toàn độc lập và không liên quan đến nhau.
  • C. Khoa học dữ liệu là một tập con của Học máy, và Học máy là một tập con của AI.
  • D. AI chỉ tập trung vào robot, ML chỉ tập trung vào thuật toán, còn Khoa học dữ liệu chỉ tập trung vào dữ liệu.

Câu 14: Học máy (Machine Learning) hỗ trợ khoa học dữ liệu chủ yếu bằng cách nào?

  • A. Cung cấp khả năng lưu trữ dữ liệu không giới hạn.
  • B. Tự động tạo ra các biểu đồ và đồ thị phức tạp.
  • C. Cung cấp các thuật toán để xây dựng mô hình dự đoán hoặc phân loại từ dữ liệu, cho phép máy tính "học" từ dữ liệu mà không cần được lập trình tường minh.
  • D. Đảm bảo tính bảo mật tuyệt đối cho dữ liệu.

Câu 15: Một công ty dịch vụ xem phim trực tuyến sử dụng dữ liệu về lịch sử xem của người dùng để đề xuất các bộ phim hoặc chương trình truyền hình mới mà họ có thể thích. Đây là một ứng dụng phổ biến của khoa học dữ liệu, cụ thể là sử dụng kỹ thuật nào?

  • A. Phân tích cảm xúc (Sentiment Analysis).
  • B. Hệ thống gợi ý (Recommendation Systems).
  • C. Nhận dạng hình ảnh (Image Recognition).
  • D. Xử lý ngôn ngữ tự nhiên (Natural Language Processing).

Câu 16: Trong lĩnh vực y tế, khoa học dữ liệu có thể được ứng dụng để phân tích dữ liệu bệnh án, hình ảnh y khoa và kết quả xét nghiệm nhằm mục đích gì?

  • A. Hỗ trợ chẩn đoán bệnh sớm và chính xác hơn.
  • B. Thay thế hoàn toàn vai trò của bác sĩ.
  • C. Lưu trữ dữ liệu bệnh nhân giấy tờ.
  • D. Giảm số lượng bệnh nhân đến khám.

Câu 17: Một trong những thách thức lớn nhất khi làm việc với dữ liệu lớn (Big Data) liên quan đến đặc điểm "Variety" (Sự đa dạng) là gì?

  • A. Chi phí lưu trữ quá cao.
  • B. Tốc độ dữ liệu chảy về quá nhanh.
  • C. Khối lượng dữ liệu vượt quá khả năng xử lý của máy tính thông thường.
  • D. Việc tích hợp, làm sạch và chuẩn hóa dữ liệu đến từ nhiều nguồn khác nhau với định dạng và cấu trúc không đồng nhất.

Câu 18: Yếu tố "Veracity" (Tính xác thực) trong Dữ liệu lớn đề cập đến khía cạnh nào của dữ liệu?

  • A. Tốc độ thu thập dữ liệu.
  • B. Kích thước của tập dữ liệu.
  • C. Độ tin cậy, chính xác, nhất quán và đáng tin cậy của dữ liệu.
  • D. Khả năng trích xuất giá trị từ dữ liệu.

Câu 19: Khi một nhà khoa học dữ liệu sử dụng các kỹ thuật thống kê để tìm ra mối tương quan giữa hai biến trong tập dữ liệu (ví dụ: mối liên quan giữa số giờ học và điểm thi), hoạt động này thuộc nhóm phương pháp nào được sử dụng trong khoa học dữ liệu?

  • A. Thống kê và Phân tích dữ liệu.
  • B. Phát triển phần cứng máy tính.
  • C. Thiết kế giao diện người dùng.
  • D. Quản lý mạng máy tính.

Câu 20: Vai trò của "Tri thức chuyên ngành" (Domain Knowledge) trong khoa học dữ liệu là gì?

  • A. Giúp tăng tốc độ tính toán của mô hình.
  • B. Cung cấp các thuật toán học máy mới.
  • C. Tự động hóa toàn bộ quy trình phân tích.
  • D. Giúp hiểu rõ ngữ cảnh của dữ liệu, đặt ra câu hỏi phân tích phù hợp, diễn giải kết quả một cách chính xác và đưa ra giải pháp thiết thực trong lĩnh vực cụ thể.

Câu 21: Một công ty bảo hiểm muốn phân tích dữ liệu khách hàng để xác định những yếu tố nào (tuổi, giới tính, nghề nghiệp, lịch sử bệnh án...) ảnh hưởng nhiều nhất đến khả năng yêu cầu bồi thường. Kết quả phân tích này giúp họ điều chỉnh mức phí bảo hiểm cho phù hợp. Đây là ví dụ về ứng dụng khoa học dữ liệu trong lĩnh vực nào?

  • A. Giáo dục.
  • B. Tài chính và Bảo hiểm.
  • C. Nông nghiệp.
  • D. Nghệ thuật.

Câu 22: Việc sử dụng khoa học dữ liệu để phân tích thói quen tiêu dùng của khách hàng và từ đó đưa ra các chiến lược marketing cá nhân hóa, hiển thị quảng cáo phù hợp với sở thích từng người dùng là một ứng dụng trong lĩnh vực nào?

  • A. Marketing và Bán hàng.
  • B. Kiểm soát không lưu.
  • C. Dự báo động đất.
  • D. Thiết kế chip máy tính.

Câu 23: Một trong những thách thức đạo đức (ethical challenges) phổ biến trong khoa học dữ liệu là gì?

  • A. Làm thế nào để thu thập đủ dữ liệu.
  • B. Làm thế nào để chọn thuật toán tốt nhất.
  • C. Làm thế nào để trực quan hóa dữ liệu đẹp mắt.
  • D. Bảo vệ quyền riêng tư của dữ liệu cá nhân và tránh thiên vị (bias) trong các mô hình phân tích/dự đoán.

Câu 24: Khi một mô hình khoa học dữ liệu được xây dựng dựa trên dữ liệu lịch sử có sự thiên vị về một nhóm người nhất định (ví dụ: dữ liệu cho vay ưu tiên nam giới), mô hình này có thể dẫn đến kết quả phân tích hoặc quyết định không công bằng cho các nhóm khác. Thách thức này liên quan trực tiếp đến khía cạnh đạo đức nào?

  • A. Tốc độ xử lý.
  • B. Tính công bằng và tránh thiên vị (Fairness and Bias).
  • C. Chi phí lưu trữ.
  • D. Khả năng mở rộng (Scalability).

Câu 25: Để giải quyết vấn đề "Variety" (Sự đa dạng) của dữ liệu lớn, các nhà khoa học dữ liệu thường cần sử dụng các công cụ và kỹ thuật nào?

  • A. Các hệ thống quản lý dữ liệu NoSQL, công cụ ETL (Extract, Transform, Load) tiên tiến và kỹ thuật xử lý dữ liệu phi cấu trúc/bán cấu trúc.
  • B. Chỉ cần sử dụng các công cụ bảng tính truyền thống như Excel.
  • C. Tăng cường sức mạnh xử lý của CPU đơn lẻ.
  • D. Giảm bớt số lượng loại dữ liệu cần phân tích.

Câu 26: Một trong những lợi ích chính của việc áp dụng khoa học dữ liệu trong doanh nghiệp là gì?

  • A. Loại bỏ hoàn toàn nhu cầu về nhân viên.
  • B. Chỉ áp dụng được cho các công ty công nghệ lớn.
  • C. Cải thiện hiệu quả hoạt động, tối ưu hóa quy trình và đưa ra quyết định chiến lược dựa trên bằng chứng từ dữ liệu.
  • D. Giảm giá thành sản phẩm xuống mức tối thiểu.

Câu 27: Khi phân tích dữ liệu từ các cảm biến trong một nhà máy để dự đoán khi nào một thiết bị có khả năng bị hỏng (bảo trì dự đoán - predictive maintenance), khoa học dữ liệu đang giúp giải quyết vấn đề nào?

  • A. Marketing sản phẩm.
  • B. Quản lý nhân sự.
  • C. Kế toán và kiểm toán.
  • D. Quản lý vận hành và sản xuất.

Câu 28: Yếu tố "Volume" (Khối lượng) của Dữ liệu lớn không chỉ đơn giản là nhiều dữ liệu, mà còn tạo ra thách thức lớn về mặt kỹ thuật nào?

  • A. Yêu cầu hạ tầng lưu trữ và xử lý phân tán, mạnh mẽ vượt xa khả năng của các hệ thống truyền thống.
  • B. Làm cho dữ liệu trở nên kém đa dạng hơn.
  • C. Giảm tốc độ dữ liệu chảy về.
  • D. Khiến dữ liệu trở nên hoàn toàn chính xác và không có sai sót.

Câu 29: Một dự án khoa học dữ liệu liên quan đến việc phân tích hàng triệu tweet trên Twitter để hiểu ý kiến công chúng về một sản phẩm mới. Loại dữ liệu này chủ yếu thuộc dạng nào?

  • A. Dữ liệu có cấu trúc (Structured Data).
  • B. Dữ liệu số (Numerical Data).
  • C. Dữ liệu phi cấu trúc (Unstructured Data).
  • D. Dữ liệu hình ảnh (Image Data).

Câu 30: Bước cuối cùng và quan trọng không kém trong quy trình khoa học dữ liệu là "Truyền thông kết quả" (Communication). Tại sao bước này lại cần thiết?

  • A. Để thu thập thêm dữ liệu mới.
  • B. Để chia sẻ những phát hiện, hiểu biết sâu sắc và đề xuất hành động dựa trên phân tích dữ liệu cho các bên liên quan (quản lý, khách hàng...), giúp họ đưa ra quyết định.
  • C. Để làm sạch dữ liệu một lần nữa.
  • D. Để xây dựng mô hình dự đoán phức tạp hơn.

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Sự kết hợp các phương pháp và công cụ từ những lĩnh vực nào giúp khoa học dữ liệu đạt được mục tiêu khai thác tri thức từ dữ liệu hiệu quả nhất?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 2: Mục tiêu cốt lõi của Khoa học dữ liệu, vượt ra ngoài việc chỉ lưu trữ hay hiển thị dữ liệu đơn thuần, là gì?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 3: Khi phân tích dữ liệu bán hàng của một sàn thương mại điện tử, các nhà khoa học dữ liệu nhận thấy rằng khách hàng mua sản phẩm A thường có xu hướng mua thêm sản phẩm B trong cùng giao dịch. Việc phát hiện mối liên hệ này minh họa cho mục tiêu nào của khoa học dữ liệu?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 4: Một công ty muốn dự đoán lượng cầu về sản phẩm của mình trong quý tới dựa trên dữ liệu bán hàng lịch sử, các chiến dịch marketing đã triển khai và xu hướng thị trường. Quá trình này sử dụng các kỹ thuật của khoa học dữ liệu nhằm mục đích gì?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 5: Dữ liệu lớn (Big Data) được đặc trưng bởi nhiều yếu tố. Yếu tố nào đề cập đến tốc độ dữ liệu được tạo ra, thu thập và xử lý, thường là rất nhanh theo thời gian thực?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 6: Một tập dữ liệu bao gồm các loại thông tin khác nhau như văn bản từ mạng xã hội, hình ảnh từ camera giám sát, dữ liệu số từ cảm biến IoT và âm thanh từ cuộc gọi điện thoại. Đặc điểm này của tập dữ liệu lớn được gọi là gì?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 7: Yếu tố nào trong các đặc trưng của Dữ liệu lớn đề cập đến khả năng trích xuất thông tin hữu ích và có thể hành động được từ dữ liệu, biến nó thành lợi ích thực tế?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 8: Trong quy trình khoa học dữ liệu, sau khi thu thập dữ liệu thô, bước tiếp theo thường là làm sạch và chuẩn bị dữ liệu. Mục đích chính của bước này là gì?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 9: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khách hàng. Anh ấy tạo ra biểu đồ phân tán (scatter plot) để xem mối quan hệ giữa tuổi và chi tiêu hàng tháng của khách hàng. Hoạt động này thuộc giai đoạn nào trong quy trình khoa học dữ liệu?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 10: Một công ty muốn xây dựng một hệ thống để tự động phát hiện các giao dịch thẻ tín dụng có dấu hiệu gian lận. Họ sử dụng dữ liệu lịch sử về các giao dịch đã được xác nhận là gian lận hoặc hợp lệ để huấn luyện một mô hình. Công việc này thuộc giai đoạn nào trong quy trình khoa học dữ liệu?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 11: Sau khi xây dựng và kiểm thử mô hình dự đoán gian lận giao dịch (ở Câu 10), công ty tích hợp mô hình này vào hệ thống xử lý giao dịch trực tuyến để nó tự động phân tích và gắn cờ các giao dịch đáng ngờ theo thời gian thực. Đây là giai đoạn nào của quy trình khoa học dữ liệu?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 12: Trực quan hóa dữ liệu đóng vai trò quan trọng trong khoa học dữ liệu vì nó giúp:

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 13: Mối quan hệ giữa Trí tuệ nhân tạo (AI), Học máy (Machine Learning - ML) và Khoa học dữ liệu (Data Science) thường được mô tả như thế nào?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 14: Học máy (Machine Learning) hỗ trợ khoa học dữ liệu chủ yếu bằng cách nào?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 15: Một công ty dịch vụ xem phim trực tuyến sử dụng dữ liệu về lịch sử xem của người dùng để đề xuất các bộ phim hoặc chương trình truyền hình mới mà họ có thể thích. Đây là một ứng dụng phổ biến của khoa học dữ liệu, cụ thể là sử dụng kỹ thuật nào?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 16: Trong lĩnh vực y tế, khoa học dữ liệu có thể được ứng dụng để phân tích dữ liệu bệnh án, hình ảnh y khoa và kết quả xét nghiệm nhằm mục đích gì?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 17: Một trong những thách thức lớn nhất khi làm việc với dữ liệu lớn (Big Data) liên quan đến đặc điểm 'Variety' (Sự đa dạng) là gì?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 18: Yếu tố 'Veracity' (Tính xác thực) trong Dữ liệu lớn đề cập đến khía cạnh nào của dữ liệu?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 19: Khi một nhà khoa học dữ liệu sử dụng các kỹ thuật thống kê để tìm ra mối tương quan giữa hai biến trong tập dữ liệu (ví dụ: mối liên quan giữa số giờ học và điểm thi), hoạt động này thuộc nhóm phương pháp nào được sử dụng trong khoa học dữ liệu?

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 20: Vai trò của 'Tri thức chuyên ngành' (Domain Knowledge) trong khoa học dữ liệu là gì?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 21: Một công ty bảo hiểm muốn phân tích dữ liệu khách hàng để xác định những yếu tố nào (tuổi, giới tính, nghề nghiệp, lịch sử bệnh án...) ảnh hưởng nhiều nhất đến khả năng yêu cầu bồi thường. Kết quả phân tích này giúp họ điều chỉnh mức phí bảo hiểm cho phù hợp. Đây là ví dụ về ứng dụng khoa học dữ liệu trong lĩnh vực nào?

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 22: Việc sử dụng khoa học dữ liệu để phân tích thói quen tiêu dùng của khách hàng và từ đó đưa ra các chiến lược marketing cá nhân hóa, hiển thị quảng cáo phù hợp với sở thích từng người dùng là một ứng dụng trong lĩnh vực nào?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 23: Một trong những thách thức đạo đức (ethical challenges) phổ biến trong khoa học dữ liệu là gì?

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 24: Khi một mô hình khoa học dữ liệu được xây dựng dựa trên dữ liệu lịch sử có sự thiên vị về một nhóm người nhất định (ví dụ: dữ liệu cho vay ưu tiên nam giới), mô hình này có thể dẫn đến kết quả phân tích hoặc quyết định không công bằng cho các nhóm khác. Thách thức này liên quan trực tiếp đến khía cạnh đạo đức nào?

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 25: Để giải quyết vấn đề 'Variety' (Sự đa dạng) của dữ liệu lớn, các nhà khoa học dữ liệu thường cần sử dụng các công cụ và kỹ thuật nào?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 26: Một trong những lợi ích chính của việc áp dụng khoa học dữ liệu trong doanh nghiệp là gì?

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 27: Khi phân tích dữ liệu từ các cảm biến trong một nhà máy để dự đoán khi nào một thiết bị có khả năng bị hỏng (bảo trì dự đoán - predictive maintenance), khoa học dữ liệu đang giúp giải quyết vấn đề nào?

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 28: Yếu tố 'Volume' (Khối lượng) của Dữ liệu lớn không chỉ đơn giản là nhiều dữ liệu, mà còn tạo ra thách thức lớn về mặt kỹ thuật nào?

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 29: Một dự án khoa học dữ liệu liên quan đến việc phân tích hàng triệu tweet trên Twitter để hiểu ý kiến công chúng về một sản phẩm mới. Loại dữ liệu này chủ yếu thuộc dạng nào?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 4

Câu 30: Bước cuối cùng và quan trọng không kém trong quy trình khoa học dữ liệu là 'Truyền thông kết quả' (Communication). Tại sao bước này lại cần thiết?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Công nghệ 10 Kết nối tri thức Bài 8: Bản vẽ kĩ thuật và tiêu chuẩn trình bày bản vẽ kĩ thuật

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 05

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 05 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Khoa học dữ liệu (Data Science) được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu tích hợp các phương pháp và công cụ từ những lĩnh vực chính nào để làm việc với dữ liệu?

  • A. Khoa học máy tính, Toán học và Thống kê.
  • B. Vật lý, Hóa học và Sinh học.
  • C. Lịch sử, Địa lý và Văn học.
  • D. Kinh tế học, Xã hội học và Tâm lý học.

Câu 2: Mục tiêu cốt lõi nhất của Khoa học dữ liệu là gì?

  • A. Chỉ đơn thuần thu thập và lưu trữ lượng dữ liệu khổng lồ.
  • B. Tạo ra các phần mềm và ứng dụng mới cho máy tính.
  • C. Khai thác tri thức, thông tin có giá trị từ dữ liệu để hỗ trợ ra quyết định.
  • D. Thiết kế phần cứng máy tính hiệu suất cao.

Câu 3: Khái niệm

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 4: Một công ty thương mại điện tử thu thập dữ liệu về hành vi mua sắm của khách hàng: lịch sử xem sản phẩm, sản phẩm đã thêm vào giỏ hàng, sản phẩm đã mua, đánh giá, v.v. Họ sử dụng Khoa học dữ liệu để dự đoán sản phẩm nào khách hàng có khả năng mua tiếp theo và hiển thị các gợi ý phù hợp. Đây là ví dụ về ứng dụng nào của Khoa học dữ liệu?

  • A. Cá nhân hóa trải nghiệm người dùng.
  • B. Phát hiện gian lận trong thanh toán.
  • C. Tự động hóa quy trình sản xuất.
  • D. Dự báo thời tiết chính xác hơn.

Câu 5: Trong quy trình Khoa học dữ liệu, bước nào thường tốn nhiều thời gian và công sức nhất, liên quan đến việc xử lý dữ liệu bị thiếu, không nhất quán hoặc sai định dạng?

  • A. Thu thập dữ liệu.
  • B. Xây dựng mô hình phân tích.
  • C. Trực quan hóa kết quả.
  • D. Làm sạch và tiền xử lý dữ liệu.

Câu 6: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích các giao dịch tài chính bất thường, các mẫu chi tiêu không điển hình hoặc các hoạt động đáng ngờ nhằm ngăn chặn thất thoát. Đây là ứng dụng nào của Khoa học dữ liệu?

  • A. Quản lý rủi ro đầu tư.
  • B. Tối ưu hóa chiến dịch marketing.
  • C. Phát hiện gian lận.
  • D. Chăm sóc khách hàng tự động.

Câu 7: Khi làm việc với

  • A. Dữ liệu đến từ nhiều nguồn khác nhau và có nhiều định dạng khác nhau (có cấu trúc, bán cấu trúc, không cấu trúc).
  • B. Dữ liệu được tạo ra với tốc độ rất nhanh.
  • C. Kích thước của tập dữ liệu là rất lớn.
  • D. Độ tin cậy và chính xác của dữ liệu.

Câu 8: Tại sao trực quan hóa dữ liệu (Data Visualization) lại là một bước quan trọng trong quy trình Khoa học dữ liệu?

  • A. Giúp giảm kích thước của tập dữ liệu để dễ lưu trữ.
  • B. Giúp con người dễ dàng hiểu, khám phá các mẫu hình, xu hướng và thông tin từ dữ liệu phức tạp.
  • C. Là cách duy nhất để làm sạch dữ liệu bị lỗi.
  • D. Tự động hóa toàn bộ quá trình phân tích dữ liệu.

Câu 9: Học máy (Machine Learning) có mối quan hệ như thế nào với Khoa học dữ liệu?

  • A. Học máy là một lĩnh vực hoàn toàn độc lập với Khoa học dữ liệu.
  • B. Học máy chỉ là một công cụ cũ không còn được sử dụng trong Khoa học dữ liệu hiện đại.
  • C. Khoa học dữ liệu là một nhánh nhỏ của Học máy.
  • D. Học máy là một tập hợp các kỹ thuật và thuật toán quan trọng được sử dụng trong Khoa học dữ liệu để xây dựng mô hình dự đoán và phân tích dữ liệu.

Câu 10: Một nhà khoa học dữ liệu đang phân tích dữ liệu khảo sát ý kiến khách hàng về một sản phẩm mới. Sau khi thu thập và làm sạch dữ liệu, bước tiếp theo cô ấy nên làm gì để tìm ra các xu hướng và hiểu rõ hơn về phản hồi của khách hàng trước khi xây dựng mô hình dự đoán?

  • A. Chuyển thẳng dữ liệu vào mô hình học máy phức tạp nhất.
  • B. Xóa bỏ tất cả các dữ liệu không chứa số.
  • C. Thực hiện phân tích khám phá dữ liệu (Exploratory Data Analysis - EDA) và trực quan hóa dữ liệu.
  • D. Lưu trữ dữ liệu vào một cơ sở dữ liệu mới mà không cần xem xét nội dung.

Câu 11: Khía cạnh

  • A. Tốc độ xử lý dữ liệu.
  • B. Độ tin cậy, chính xác và nhất quán của dữ liệu.
  • C. Kích thước khổng lồ của dữ liệu.
  • D. Số lượng các định dạng dữ liệu khác nhau.

Câu 12: Một công ty sử dụng dữ liệu bán hàng lịch sử, dữ liệu về các chiến dịch khuyến mãi và dữ liệu về các ngày lễ để xây dựng mô hình dự báo doanh số cho quý tiếp theo. Đây là ví dụ về loại phân tích nào trong Khoa học dữ liệu?

  • A. Phân tích dự đoán (Predictive Analytics).
  • B. Phân tích mô tả (Descriptive Analytics).
  • C. Phân tích chẩn đoán (Diagnostic Analytics).
  • D. Phân tích đề xuất (Prescriptive Analytics).

Câu 13: Khía cạnh

  • A. Dữ liệu phải được lưu trữ trên các máy chủ đắt tiền.
  • B. Dữ liệu chỉ có giá trị khi được thu thập từ mạng xã hội.
  • C. Dữ liệu phải được xử lý và phân tích để trích xuất thông tin có ý nghĩa và mang lại lợi ích.
  • D. Giá trị của dữ liệu tỷ lệ nghịch với khối lượng của nó.

Câu 14: Một trong những thách thức lớn khi làm việc với dữ liệu không có cấu trúc (ví dụ: văn bản từ email, bài đăng mạng xã hội, hình ảnh) trong Khoa học dữ liệu là gì?

  • A. Kích thước của dữ liệu luôn nhỏ.
  • B. Dữ liệu không có cấu trúc luôn chính xác 100%.
  • C. Rất dễ dàng để lưu trữ trong các cơ sở dữ liệu truyền thống.
  • D. Khó khăn trong việc trích xuất thông tin có ý nghĩa và chuẩn hóa để phân tích bằng các phương pháp truyền thống.

Câu 15: Một công ty dược phẩm sử dụng Khoa học dữ liệu để phân tích dữ liệu từ các thử nghiệm lâm sàng, dữ liệu gen và dữ liệu bệnh nhân để xác định các ứng cử viên thuốc tiềm năng hoặc cá nhân hóa phương pháp điều trị. Đây là ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

  • A. Giáo dục.
  • B. Y tế/Chăm sóc sức khỏe.
  • C. Năng lượng.
  • D. Nghệ thuật.

Câu 16: Phân tích mô tả (Descriptive Analytics) trong Khoa học dữ liệu tập trung vào việc trả lời câu hỏi nào?

  • A. Điều gì đã xảy ra trong quá khứ?
  • B. Tại sao điều đó lại xảy ra?
  • C. Điều gì có thể xảy ra trong tương lai?
  • D. Chúng ta nên làm gì?

Câu 17: Phân tích đề xuất (Prescriptive Analytics) trong Khoa học dữ liệu nhằm mục đích gì?

  • A. Chỉ tóm tắt dữ liệu quá khứ.
  • B. Giải thích nguyên nhân của một sự kiện.
  • C. Dự báo kết quả có thể xảy ra.
  • D. Đưa ra các khuyến nghị về hành động tốt nhất cần thực hiện để đạt được mục tiêu cụ thể.

Câu 18: Tại sao kiến thức chuyên ngành (domain knowledge) lại quan trọng đối với một nhà khoa học dữ liệu?

  • A. Chỉ để biết cách sử dụng các công cụ phần mềm.
  • B. Giúp thu thập dữ liệu nhanh hơn.
  • C. Giúp hiểu ngữ cảnh của dữ liệu, đặt câu hỏi phù hợp, giải thích kết quả phân tích và áp dụng chúng vào thực tế.
  • D. Không có vai trò gì, chỉ cần kỹ năng lập trình và thống kê là đủ.

Câu 19: Một thách thức đạo đức tiềm ẩn trong Khoa học dữ liệu, đặc biệt khi sử dụng dữ liệu cá nhân, là gì?

  • A. Bảo vệ quyền riêng tư và tránh phân biệt đối xử dựa trên dữ liệu.
  • B. Tốc độ xử lý dữ liệu quá chậm.
  • C. Không đủ công cụ trực quan hóa.
  • D. Số lượng dữ liệu quá ít để phân tích.

Câu 20: Hệ thống gợi ý sản phẩm trên các trang thương mại điện tử (ví dụ:

  • A. Dữ liệu thời tiết.
  • B. Dữ liệu địa lý.
  • C. Dữ liệu về giá cổ phiếu.
  • D. Dữ liệu về hành vi và sở thích của người dùng.

Câu 21: Khi nói về Dữ liệu lớn,

  • A. Tốc độ dữ liệu thay đổi.
  • B. Độ đa dạng của dữ liệu.
  • C. Kích thước khổng lồ của tập dữ liệu, thường tính bằng Petabyte hoặc Exabyte.
  • D. Độ chính xác của dữ liệu.

Câu 22: Một công ty vận tải sử dụng dữ liệu từ cảm biến trên xe, dữ liệu giao thông và dữ liệu thời tiết để tối ưu hóa lộ trình giao hàng, giảm thời gian vận chuyển và tiết kiệm nhiên liệu. Đây là ví dụ về ứng dụng nào của Khoa học dữ liệu?

  • A. Tối ưu hóa hoạt động.
  • B. Phân tích cảm xúc khách hàng.
  • C. Nhận dạng hình ảnh.
  • D. Xử lý ngôn ngữ tự nhiên.

Câu 23: Đâu là sự khác biệt cơ bản giữa dữ liệu (data) và thông tin (information) trong bối cảnh Khoa học dữ liệu?

  • A. Dữ liệu luôn có cấu trúc, còn thông tin thì không.
  • B. Dữ liệu là các sự kiện, số liệu thô; thông tin là dữ liệu đã được xử lý, tổ chức và có ý nghĩa.
  • C. Thông tin luôn là số, còn dữ liệu có thể là văn bản.
  • D. Dữ liệu chỉ có giá trị trong quá khứ, thông tin có giá trị cho tương lai.

Câu 24: Khi một nhà khoa học dữ liệu sử dụng các kỹ thuật thống kê để tìm hiểu các đặc điểm chính của tập dữ liệu (ví dụ: giá trị trung bình, độ lệch chuẩn, phân phối dữ liệu), họ đang thực hiện loại phân tích nào?

  • A. Phân tích mô tả (Descriptive Analytics).
  • B. Phân tích dự đoán (Predictive Analytics).
  • C. Phân tích đề xuất (Prescriptive Analytics).
  • D. Phân tích nhân quả (Causal Analytics).

Câu 25: Mối quan hệ giữa Trí tuệ nhân tạo (AI) và Khoa học dữ liệu là gì?

  • A. AI là một lĩnh vực hoàn toàn riêng biệt, không liên quan đến Khoa học dữ liệu.
  • B. Khoa học dữ liệu là một tập hợp con của AI.
  • C. AI chỉ là công cụ để thu thập dữ liệu cho Khoa học dữ liệu.
  • D. Khoa học dữ liệu sử dụng các kỹ thuật của AI (bao gồm Học máy) để phân tích dữ liệu và trích xuất tri thức, trong khi AI thường cần dữ liệu lớn để "học".

Câu 26: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại là bước quan trọng và thường tốn nhiều thời gian trong quy trình Khoa học dữ liệu?

  • A. Chỉ để làm cho dữ liệu trông đẹp hơn trên biểu đồ.
  • B. Dữ liệu thực tế thường chứa lỗi, giá trị thiếu, không nhất quán, gây ảnh hưởng nghiêm trọng đến kết quả phân tích nếu không được xử lý.
  • C. Để giảm kích thước tập dữ liệu xuống mức nhỏ nhất có thể.
  • D. Để chuyển đổi tất cả dữ liệu thành dạng văn bản.

Câu 27: Khi một mô hình Khoa học dữ liệu được xây dựng để tự động phân loại email thành

  • A. Trực quan hóa dữ liệu.
  • B. Quản trị cơ sở dữ liệu.
  • C. Học máy (cụ thể là bài toán phân loại).
  • D. Thu thập dữ liệu.

Câu 28: Khía cạnh nào của

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Veracity (Tính xác thực)
  • D. Variety (Đa dạng)

Câu 29: Một nhà khoa học dữ liệu phát hiện ra rằng một tập dữ liệu khách hàng chứa nhiều dòng bị trùng lặp hoặc thiếu thông tin quan trọng ở một số cột. Bước đầu tiên và cần thiết nhất để xử lý vấn đề này là gì?

  • A. Thực hiện các kỹ thuật làm sạch dữ liệu (Data Cleaning).
  • B. Xây dựng ngay một mô hình dự đoán.
  • C. Trực quan hóa dữ liệu dưới dạng biểu đồ phức tạp.
  • D. Lưu trữ dữ liệu vào một định dạng nén.

Câu 30: Ứng dụng nào sau đây thể hiện rõ nhất việc sử dụng Khoa học dữ liệu để đổi mới quá trình ra quyết định trong một tổ chức?

  • A. Lưu trữ tất cả các tài liệu giấy thành dạng điện tử.
  • B. Sử dụng phân tích dữ liệu để xác định chiến lược giá tối ưu cho sản phẩm dựa trên hành vi mua sắm và giá của đối thủ.
  • C. Tự động hóa việc trả lời email khách hàng bằng các câu trả lời mẫu.
  • D. Thiết kế lại logo của công ty dựa trên ý kiến chủ quan của ban lãnh đạo.

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 1: Khoa học dữ liệu (Data Science) được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu tích hợp các phương pháp và công cụ từ những lĩnh vực chính nào để làm việc với dữ liệu?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 2: Mục tiêu cốt lõi nhất của Khoa học dữ liệu là gì?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 3: Khái niệm "Dữ liệu lớn" (Big Data) thường được đặc trưng bởi nhiều khía cạnh, được gọi là các "V". Chữ V nào sau đây mô tả tốc độ tạo ra, thu thập và xử lý dữ liệu?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 4: Một công ty thương mại điện tử thu thập dữ liệu về hành vi mua sắm của khách hàng: lịch sử xem sản phẩm, sản phẩm đã thêm vào giỏ hàng, sản phẩm đã mua, đánh giá, v.v. Họ sử dụng Khoa học dữ liệu để dự đoán sản phẩm nào khách hàng có khả năng mua tiếp theo và hiển thị các gợi ý phù hợp. Đây là ví dụ về ứng dụng nào của Khoa học dữ liệu?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 5: Trong quy trình Khoa học dữ liệu, bước nào thường tốn nhiều thời gian và công sức nhất, liên quan đến việc xử lý dữ liệu bị thiếu, không nhất quán hoặc sai định dạng?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 6: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích các giao dịch tài chính bất thường, các mẫu chi tiêu không điển hình hoặc các hoạt động đáng ngờ nhằm ngăn chặn thất thoát. Đây là ứng dụng nào của Khoa học dữ liệu?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 7: Khi làm việc với "Dữ liệu lớn", khía cạnh "Variety" (Đa dạng) đề cập đến điều gì?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 8: Tại sao trực quan hóa dữ liệu (Data Visualization) lại là một bước quan trọng trong quy trình Khoa học dữ liệu?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 9: Học máy (Machine Learning) có mối quan hệ như thế nào với Khoa học dữ liệu?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 10: Một nhà khoa học dữ liệu đang phân tích dữ liệu khảo sát ý kiến khách hàng về một sản phẩm mới. Sau khi thu thập và làm sạch dữ liệu, bước tiếp theo cô ấy nên làm gì để tìm ra các xu hướng và hiểu rõ hơn về phản hồi của khách hàng trước khi xây dựng mô hình dự đoán?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 11: Khía cạnh "Veracity" (Tính xác thực) trong "Dữ liệu lớn" đề cập đến thách thức nào?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 12: Một công ty sử dụng dữ liệu bán hàng lịch sử, dữ liệu về các chiến dịch khuyến mãi và dữ liệu về các ngày lễ để xây dựng mô hình dự báo doanh số cho quý tiếp theo. Đây là ví dụ về loại phân tích nào trong Khoa học dữ liệu?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 13: Khía cạnh "Value" (Giá trị) trong "Dữ liệu lớn" nhấn mạnh điều gì?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 14: Một trong những thách thức lớn khi làm việc với dữ liệu không có cấu trúc (ví dụ: văn bản từ email, bài đăng mạng xã hội, hình ảnh) trong Khoa học dữ liệu là gì?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 15: Một công ty dược phẩm sử dụng Khoa học dữ liệu để phân tích dữ liệu từ các thử nghiệm lâm sàng, dữ liệu gen và dữ liệu bệnh nhân để xác định các ứng cử viên thuốc tiềm năng hoặc cá nhân hóa phương pháp điều trị. Đây là ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 16: Phân tích mô tả (Descriptive Analytics) trong Khoa học dữ liệu tập trung vào việc trả lời câu hỏi nào?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 17: Phân tích đề xuất (Prescriptive Analytics) trong Khoa học dữ liệu nhằm mục đích gì?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 18: Tại sao kiến thức chuyên ngành (domain knowledge) lại quan trọng đối với một nhà khoa học dữ liệu?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 19: Một thách thức đạo đức tiềm ẩn trong Khoa học dữ liệu, đặc biệt khi sử dụng dữ liệu cá nhân, là gì?

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 20: Hệ thống gợi ý sản phẩm trên các trang thương mại điện tử (ví dụ: "Những khách hàng mua sản phẩm X cũng đã mua sản phẩm Y") là một ứng dụng phổ biến của Khoa học dữ liệu. Hệ thống này chủ yếu dựa vào việc phân tích loại dữ liệu nào?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 21: Khi nói về Dữ liệu lớn, "Volume" (Khối lượng) đề cập đến:

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 22: Một công ty vận tải sử dụng dữ liệu từ cảm biến trên xe, dữ liệu giao thông và dữ liệu thời tiết để tối ưu hóa lộ trình giao hàng, giảm thời gian vận chuyển và tiết kiệm nhiên liệu. Đây là ví dụ về ứng dụng nào của Khoa học dữ liệu?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 23: Đâu là sự khác biệt cơ bản giữa dữ liệu (data) và thông tin (information) trong bối cảnh Khoa học dữ liệu?

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 24: Khi một nhà khoa học dữ liệu sử dụng các kỹ thuật thống kê để tìm hiểu các đặc điểm chính của tập dữ liệu (ví dụ: giá trị trung bình, độ lệch chuẩn, phân phối dữ liệu), họ đang thực hiện loại phân tích nào?

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 25: Mối quan hệ giữa Trí tuệ nhân tạo (AI) và Khoa học dữ liệu là gì?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 26: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại là bước quan trọng và thường tốn nhiều thời gian trong quy trình Khoa học dữ liệu?

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 27: Khi một mô hình Khoa học dữ liệu được xây dựng để tự động phân loại email thành "thư rác" hoặc "không phải thư rác", nó đang thực hiện một nhiệm vụ thuộc lĩnh vực nào?

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 28: Khía cạnh nào của "Dữ liệu lớn" đề cập đến việc dữ liệu có thể là các con số, văn bản, hình ảnh, âm thanh, video, dữ liệu cảm biến, v.v.?

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 29: Một nhà khoa học dữ liệu phát hiện ra rằng một tập dữ liệu khách hàng chứa nhiều dòng bị trùng lặp hoặc thiếu thông tin quan trọng ở một số cột. Bước đầu tiên và cần thiết nhất để xử lý vấn đề này là gì?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 5

Câu 30: Ứng dụng nào sau đây thể hiện rõ nhất việc sử dụng Khoa học dữ liệu để đổi mới quá trình ra quyết định trong một tổ chức?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 06

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 06 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Một công ty bán lẻ muốn dự đoán sản phẩm nào có khả năng được khách hàng mua cùng nhau dựa trên lịch sử giao dịch. Lĩnh vực nào của khoa học dữ liệu có thể hỗ trợ công ty giải quyết bài toán này hiệu quả nhất?

  • A. Trực quan hóa dữ liệu
  • B. Kỹ thuật dữ liệu (Data Engineering)
  • C. Quản trị cơ sở dữ liệu
  • D. Học máy (Machine Learning)

Câu 2: Dữ liệu từ các cảm biến IoT trong nhà máy, dữ liệu giao dịch trực tuyến theo thời gian thực, và dữ liệu từ mạng xã hội là những ví dụ điển hình minh họa cho đặc điểm nào của Dữ liệu lớn (Big Data)?

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 3: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khổng lồ chứa thông tin từ nhiều nguồn khác nhau như văn bản, hình ảnh, video và số liệu thống kê. Thử thách chính mà người này đang đối mặt liên quan đến đặc điểm nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Variety (Đa dạng)
  • D. Value (Giá trị)

Câu 4: Bước nào trong quy trình xử lý khoa học dữ liệu giúp chuyển đổi dữ liệu thô, không đồng nhất thành định dạng phù hợp cho việc phân tích và mô hình hóa?

  • A. Làm sạch và tiền xử lý dữ liệu
  • B. Trực quan hóa dữ liệu
  • C. Xây dựng mô hình
  • D. Triển khai và đánh giá

Câu 5: Một biểu đồ phân tán (scatter plot) được sử dụng để hiển thị mối quan hệ giữa hai biến số trong tập dữ liệu. Hoạt động này thuộc bước nào trong quy trình khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Làm sạch và tiền xử lý dữ liệu
  • C. Phân tích khám phá và trực quan hóa dữ liệu
  • D. Xây dựng mô hình

Câu 6: Mục tiêu cốt lõi nhất của Khoa học dữ liệu, vượt ra ngoài việc chỉ xử lý và lưu trữ dữ liệu, là gì?

  • A. Thiết kế cơ sở dữ liệu hiệu quả
  • B. Khai thác tri thức và hỗ trợ ra quyết định
  • C. Tăng tốc độ tính toán cho máy tính
  • D. Phát triển các ngôn ngữ lập trình mới

Câu 7: Để một mô hình học máy có thể đưa ra dự đoán chính xác, dữ liệu đầu vào cần đảm bảo đặc điểm nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 8: Một hệ thống gợi ý sản phẩm trên trang thương mại điện tử sử dụng lịch sử mua hàng của người dùng để đề xuất các mặt hàng tiềm năng. Đây là ứng dụng thực tế của lĩnh vực nào?

  • A. Học máy và khoa học dữ liệu
  • B. Phát triển phần cứng máy tính
  • C. Thiết kế giao diện người dùng
  • D. Quản lý mạng máy tính

Câu 9: Việc sử dụng các thuật toán để tìm ra tuyến đường vận chuyển hàng hóa tối ưu nhất nhằm giảm chi phí và thời gian thuộc về ứng dụng nào của khoa học dữ liệu?

  • A. Phát hiện gian lận
  • B. Tối ưu hóa quyết định
  • C. Cải thiện trải nghiệm khách hàng
  • D. Tự động hóa công việc lặp đi lặp lại

Câu 10: Ngôn ngữ lập trình nào phổ biến nhất được sử dụng trong cộng đồng khoa học dữ liệu nhờ vào hệ sinh thái thư viện phong phú cho phân tích, trực quan hóa và học máy?

  • A. Java
  • B. C++
  • C. Python
  • D. HTML

Câu 11: Tại sao kiến thức về thống kê lại quan trọng đối với một nhà khoa học dữ liệu?

  • A. Để thiết kế giao diện người dùng hấp dẫn
  • B. Để viết mã nguồn hiệu quả
  • C. Để quản lý cơ sở dữ liệu phân tán
  • D. Để hiểu cấu trúc dữ liệu, đánh giá mô hình và diễn giải kết quả phân tích

Câu 12: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn là việc xử lý và lưu trữ lượng dữ liệu vượt quá khả năng của các công cụ truyền thống. Thách thức này liên quan trực tiếp đến đặc điểm nào?

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Variety (Đa dạng)
  • D. Value (Giá trị)

Câu 13: Hoạt động nào sau đây KHÔNG phải là một phần của quy trình khoa học dữ liệu điển hình?

  • A. Thu thập và làm sạch dữ liệu
  • B. Xây dựng và đánh giá mô hình
  • C. Trực quan hóa và truyền đạt kết quả
  • D. Thiết kế chip xử lý đồ họa (GPU)

Câu 14: Một tổ chức y tế muốn phân tích dữ liệu bệnh án điện tử để xác định các yếu tố nguy cơ gây bệnh tim mạch. Việc phân tích này cần kết hợp kiến thức từ lĩnh vực nào ngoài khoa học dữ liệu?

  • A. Kỹ thuật xây dựng
  • B. Y học và sinh học
  • C. Lịch sử và văn hóa
  • D. Thiết kế đồ họa

Câu 15: Khái niệm nào mô tả khả năng của máy tính học hỏi từ dữ liệu và đưa ra quyết định hoặc dự đoán mà không cần được lập trình rõ ràng?

  • A. Học máy (Machine Learning)
  • B. Trực quan hóa dữ liệu
  • C. Quản lý dữ liệu
  • D. Kỹ thuật phần mềm

Câu 16: Khi một nhà khoa học dữ liệu tạo ra các biểu đồ, đồ thị, hoặc dashboard tương tác để trình bày kết quả phân tích cho người không chuyên, họ đang thực hiện bước nào trong quy trình khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Làm sạch dữ liệu
  • C. Xây dựng mô hình
  • D. Trực quan hóa và truyền đạt kết quả

Câu 17: Công ty bảo hiểm muốn phát hiện các yêu cầu bồi thường giả mạo bằng cách phân tích các mẫu dữ liệu bất thường. Ứng dụng này thuộc về lĩnh vực nào của khoa học dữ liệu?

  • A. Tối ưu hóa chuỗi cung ứng
  • B. Phân tích cảm xúc khách hàng
  • C. Phát hiện gian lận (Fraud Detection)
  • D. Dự báo thời tiết

Câu 18: Đặc điểm nào của Dữ liệu lớn đề cập đến mức độ chính xác, đáng tin cậy và trung thực của dữ liệu?

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 19: Một nhà khoa học dữ liệu đang sử dụng các kỹ thuật thống kê để xác định xem sự thay đổi của một biến có mối liên hệ đáng kể với sự thay đổi của biến khác hay không. Hoạt động này thuộc giai đoạn nào của quy trình khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Phân tích khám phá dữ liệu (EDA)
  • C. Triển khai mô hình
  • D. Thu thập phản hồi người dùng

Câu 20: Mối quan hệ giữa Trí tuệ nhân tạo (AI), Học máy (ML) và Khoa học dữ liệu (DS) thường được mô tả như thế nào?

  • A. ML là một tập con của AI, và DS sử dụng cả AI và ML cùng với các kỹ thuật khác để khai thác tri thức từ dữ liệu.
  • B. AI là một tập con của ML, và ML là một tập con của DS.
  • C. AI, ML, và DS là ba lĩnh vực hoàn toàn độc lập và không liên quan.
  • D. DS là một tập con của AI, và AI là một tập con của ML.

Câu 21: Một công ty muốn phân khúc khách hàng dựa trên hành vi mua sắm và nhân khẩu học để đưa ra các chiến dịch marketing cá nhân hóa. Kỹ thuật nào trong khoa học dữ liệu thường được sử dụng cho mục đích này?

  • A. Hồi quy tuyến tính
  • B. Phát hiện bất thường (Anomaly Detection)
  • C. Phân cụm (Clustering)
  • D. Nhận dạng ký tự quang học (OCR)

Câu 22: Việc thu thập dữ liệu từ các nguồn khác nhau như cơ sở dữ liệu, file văn bản, API web, và cảm biến là bước đầu tiên và quan trọng trong quy trình khoa học dữ liệu. Bước này được gọi là gì?

  • A. Thu thập dữ liệu
  • B. Làm sạch dữ liệu
  • C. Phân tích dữ liệu
  • D. Triển khai mô hình

Câu 23: Đặc điểm nào của Dữ liệu lớn phản ánh tiềm năng thu được thông tin chi tiết và lợi ích kinh tế từ việc phân tích dữ liệu?

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Variety (Đa dạng)
  • D. Value (Giá trị)

Câu 24: Một mô hình học máy đã được xây dựng để dự đoán doanh số bán hàng. Sau khi triển khai, nhà khoa học dữ liệu cần tiếp tục theo dõi hiệu suất của mô hình và cập nhật nó khi cần thiết. Hoạt động này thuộc giai đoạn nào?

  • A. Làm sạch dữ liệu
  • B. Phân tích khám phá
  • C. Triển khai và bảo trì mô hình
  • D. Thu thập dữ liệu

Câu 25: Lĩnh vực nào trong khoa học dữ liệu tập trung vào việc xây dựng và quản lý hạ tầng, quy trình để dữ liệu có thể được thu thập, lưu trữ và xử lý một cách hiệu quả?

  • A. Phân tích dữ liệu
  • B. Kỹ thuật dữ liệu (Data Engineering)
  • C. Trực quan hóa dữ liệu
  • D. Học máy

Câu 26: Khi chuẩn bị dữ liệu cho mô hình học máy, nhà khoa học dữ liệu thường phải xử lý các giá trị thiếu, loại bỏ dữ liệu ngoại lai, và chuẩn hóa dữ liệu. Các hoạt động này thuộc về bước nào?

  • A. Làm sạch và tiền xử lý dữ liệu
  • B. Thu thập dữ liệu
  • C. Xây dựng mô hình
  • D. Trực quan hóa dữ liệu

Câu 27: Một trong những ứng dụng quan trọng của khoa học dữ liệu trong lĩnh vực sản xuất là dự đoán thời điểm máy móc có thể gặp sự cố để tiến hành bảo trì kịp thời. Ứng dụng này được gọi là gì?

  • A. Phân tích rủi ro tài chính
  • B. Phân tích cảm xúc
  • C. Quản lý quan hệ khách hàng
  • D. Bảo trì dự đoán (Predictive Maintenance)

Câu 28: Giả sử bạn có một tập dữ liệu về khách hàng bao gồm tuổi, giới tính, vị trí địa lý và tổng chi tiêu. Bạn muốn tìm hiểu xem có nhóm khách hàng nào chi tiêu nhiều hơn đáng kể dựa trên các yếu tố này không. Kỹ thuật phân tích nào phù hợp nhất?

  • A. Phân tích chuỗi thời gian
  • B. Phân tích phân khúc (Segmentation Analysis)
  • C. Phân tích văn bản
  • D. Phân tích mạng xã hội

Câu 29: Khoa học dữ liệu khác biệt với phân tích dữ liệu truyền thống ở điểm nào?

  • A. Chỉ sử dụng dữ liệu có cấu trúc
  • B. Chỉ tập trung vào việc mô tả dữ liệu quá khứ
  • C. Tích hợp sâu hơn các kỹ thuật từ khoa học máy tính, học máy và xử lý dữ liệu phi cấu trúc để dự báo và đưa ra hành động.
  • D. Không yêu cầu kiến thức thống kê

Câu 30: Tại sao khả năng giao tiếp và truyền đạt kết quả lại quan trọng đối với một nhà khoa học dữ liệu?

  • A. Để viết mã nguồn nhanh hơn
  • B. Để thu thập dữ liệu hiệu quả hơn
  • C. Để làm sạch dữ liệu tự động
  • D. Để giúp các bên liên quan (không chuyên về kỹ thuật) hiểu được ý nghĩa của phân tích và đưa ra quyết định dựa trên dữ liệu.

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 1: Một công ty bán lẻ muốn dự đoán sản phẩm nào có khả năng được khách hàng mua cùng nhau dựa trên lịch sử giao dịch. Lĩnh vực nào của khoa học dữ liệu có thể hỗ trợ công ty giải quyết bài toán này hiệu quả nhất?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 2: Dữ liệu từ các cảm biến IoT trong nhà máy, dữ liệu giao dịch trực tuyến theo thời gian thực, và dữ liệu từ mạng xã hội là những ví dụ điển hình minh họa cho đặc điểm nào của Dữ liệu lớn (Big Data)?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 3: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khổng lồ chứa thông tin từ nhiều nguồn khác nhau như văn bản, hình ảnh, video và số liệu thống kê. Thử thách chính mà người này đang đối mặt liên quan đến đặc điểm nào của Dữ liệu lớn?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 4: Bước nào trong quy trình xử lý khoa học dữ liệu giúp chuyển đổi dữ liệu thô, không đồng nhất thành định dạng phù hợp cho việc phân tích và mô hình hóa?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 5: Một biểu đồ phân tán (scatter plot) được sử dụng để hiển thị mối quan hệ giữa hai biến số trong tập dữ liệu. Hoạt động này thuộc bước nào trong quy trình khoa học dữ liệu?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 6: Mục tiêu cốt lõi nhất của Khoa học dữ liệu, vượt ra ngoài việc chỉ xử lý và lưu trữ dữ liệu, là gì?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 7: Để một mô hình học máy có thể đưa ra dự đoán chính xác, dữ liệu đầu vào cần đảm bảo đặc điểm nào của Dữ liệu lớn?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 8: Một hệ thống gợi ý sản phẩm trên trang thương mại điện tử sử dụng lịch sử mua hàng của người dùng để đề xuất các mặt hàng tiềm năng. Đây là ứng dụng thực tế của lĩnh vực nào?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 9: Việc sử dụng các thuật toán để tìm ra tuyến đường vận chuyển hàng hóa tối ưu nhất nhằm giảm chi phí và thời gian thuộc về ứng dụng nào của khoa học dữ liệu?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 10: Ngôn ngữ lập trình nào phổ biến nhất được sử dụng trong cộng đồng khoa học dữ liệu nhờ vào hệ sinh thái thư viện phong phú cho phân tích, trực quan hóa và học máy?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 11: Tại sao kiến thức về thống kê lại quan trọng đối với một nhà khoa học dữ liệu?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 12: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn là việc xử lý và lưu trữ lượng dữ liệu vượt quá khả năng của các công cụ truyền thống. Thách thức này liên quan trực tiếp đến đặc điểm nào?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 13: Hoạt động nào sau đây KHÔNG phải là một phần của quy trình khoa học dữ liệu điển hình?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 14: Một tổ chức y tế muốn phân tích dữ liệu bệnh án điện tử để xác định các yếu tố nguy cơ gây bệnh tim mạch. Việc phân tích này cần kết hợp kiến thức từ lĩnh vực nào ngoài khoa học dữ liệu?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 15: Khái niệm nào mô tả khả năng của máy tính học hỏi từ dữ liệu và đưa ra quyết định hoặc dự đoán mà không cần được lập trình rõ ràng?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 16: Khi một nhà khoa học dữ liệu tạo ra các biểu đồ, đồ thị, hoặc dashboard tương tác để trình bày kết quả phân tích cho người không chuyên, họ đang thực hiện bước nào trong quy trình khoa học dữ liệu?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 17: Công ty bảo hiểm muốn phát hiện các yêu cầu bồi thường giả mạo bằng cách phân tích các mẫu dữ liệu bất thường. Ứng dụng này thuộc về lĩnh vực nào của khoa học dữ liệu?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 18: Đặc điểm nào của Dữ liệu lớn đề cập đến mức độ chính xác, đáng tin cậy và trung thực của dữ liệu?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 19: Một nhà khoa học dữ liệu đang sử dụng các kỹ thuật thống kê để xác định xem sự thay đổi của một biến có mối liên hệ đáng kể với sự thay đổi của biến khác hay không. Hoạt động này thuộc giai đoạn nào của quy trình khoa học dữ liệu?

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 20: Mối quan hệ giữa Trí tuệ nhân tạo (AI), Học máy (ML) và Khoa học dữ liệu (DS) thường được mô tả như thế nào?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 21: Một công ty muốn phân khúc khách hàng dựa trên hành vi mua sắm và nhân khẩu học để đưa ra các chiến dịch marketing cá nhân hóa. Kỹ thuật nào trong khoa học dữ liệu thường được sử dụng cho mục đích này?

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 22: Việc thu thập dữ liệu từ các nguồn khác nhau như cơ sở dữ liệu, file văn bản, API web, và cảm biến là bước đầu tiên và quan trọng trong quy trình khoa học dữ liệu. Bước này được gọi là gì?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 23: Đặc điểm nào của Dữ liệu lớn phản ánh tiềm năng thu được thông tin chi tiết và lợi ích kinh tế từ việc phân tích dữ liệu?

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 24: Một mô hình học máy đã được xây dựng để dự đoán doanh số bán hàng. Sau khi triển khai, nhà khoa học dữ liệu cần tiếp tục theo dõi hiệu suất của mô hình và cập nhật nó khi cần thiết. Hoạt động này thuộc giai đoạn nào?

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 25: Lĩnh vực nào trong khoa học dữ liệu tập trung vào việc xây dựng và quản lý hạ tầng, quy trình để dữ liệu có thể được thu thập, lưu trữ và xử lý một cách hiệu quả?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 26: Khi chuẩn bị dữ liệu cho mô hình học máy, nhà khoa học dữ liệu thường phải xử lý các giá trị thiếu, loại bỏ dữ liệu ngoại lai, và chuẩn hóa dữ liệu. Các hoạt động này thuộc về bước nào?

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 27: Một trong những ứng dụng quan trọng của khoa học dữ liệu trong lĩnh vực sản xuất là dự đoán thời điểm máy móc có thể gặp sự cố để tiến hành bảo trì kịp thời. Ứng dụng này được gọi là gì?

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 28: Giả sử bạn có một tập dữ liệu về khách hàng bao gồm tuổi, giới tính, vị trí địa lý và tổng chi tiêu. Bạn muốn tìm hiểu xem có nhóm khách hàng nào chi tiêu nhiều hơn đáng kể dựa trên các yếu tố này không. Kỹ thuật phân tích nào phù hợp nhất?

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 29: Khoa học dữ liệu khác biệt với phân tích dữ liệu truyền thống ở điểm nào?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 6

Câu 30: Tại sao khả năng giao tiếp và truyền đạt kết quả lại quan trọng đối với một nhà khoa học dữ liệu?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 07

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 07 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Lĩnh vực nào sau đây KHÔNG phải là nền tảng cốt lõi của Khoa học dữ liệu?

  • A. Khoa học máy tính
  • B. Toán học
  • C. Thống kê
  • D. Văn học

Câu 2: Mục tiêu chính của Khoa học dữ liệu là gì?

  • A. Chỉ thu thập và lưu trữ dữ liệu số lượng lớn.
  • B. Phát triển các ngôn ngữ lập trình mới cho máy tính.
  • C. Khai thác tri thức, hiểu biết sâu sắc từ dữ liệu để hỗ trợ đưa ra quyết định.
  • D. Thiết kế giao diện người dùng cho các ứng dụng phần mềm.

Câu 3: Đặc điểm nào của Dữ liệu lớn (Big Data) đề cập đến việc dữ liệu được tạo ra và cập nhật liên tục với tốc độ rất nhanh, đòi hỏi khả năng xử lý theo thời gian thực hoặc gần thời gian thực?

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 4: Một công ty bán lẻ trực tuyến thu thập dữ liệu từ nhiều nguồn khác nhau như lịch sử mua hàng của khách, lượt xem sản phẩm trên website, tương tác trên mạng xã hội, và dữ liệu từ các cảm biến trong kho hàng. Đặc điểm nào của Dữ liệu lớn được thể hiện rõ nhất trong tình huống này?

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Variety (Đa dạng)
  • D. Value (Giá trị)

Câu 5: Trong quy trình Khoa học dữ liệu, bước nào thường bao gồm việc làm sạch dữ liệu, xử lý các giá trị thiếu hoặc không nhất quán, và chuyển đổi dữ liệu sang định dạng phù hợp cho phân tích?

  • A. Thu thập và tiền xử lý dữ liệu
  • B. Phân tích và mô hình hóa
  • C. Trực quan hóa dữ liệu
  • D. Triển khai và đánh giá

Câu 6: Một nhà khoa học dữ liệu đang sử dụng biểu đồ, đồ thị và bản đồ để trình bày kết quả phân tích dữ liệu bán hàng cho đội ngũ quản lý. Hoạt động này thuộc bước nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập và tiền xử lý dữ liệu
  • B. Phân tích và mô hình hóa
  • C. Trực quan hóa dữ liệu
  • D. Triển khai và đánh giá

Câu 7: Học máy (Machine Learning) có mối quan hệ như thế nào với Khoa học dữ liệu?

  • A. Học máy là một lĩnh vực hoàn toàn độc lập với Khoa học dữ liệu.
  • B. Học máy là một tập con hoặc một kỹ thuật quan trọng được sử dụng trong Khoa học dữ liệu để xây dựng mô hình và đưa ra dự đoán.
  • C. Khoa học dữ liệu là một phần nhỏ của Học máy.
  • D. Học máy chỉ liên quan đến việc lưu trữ dữ liệu, không phải phân tích.

Câu 8: Trí tuệ nhân tạo (AI), Học máy (ML) và Khoa học dữ liệu (DS) có mối quan hệ chặt chẽ. Mối quan hệ nào sau đây mô tả đúng nhất sự tương quan giữa ba lĩnh vực này?

  • A. AI là lĩnh vực rộng nhất, ML là một tập con của AI, và DS sử dụng các kỹ thuật từ ML (và AI) cùng với thống kê, toán học, tri thức chuyên ngành để giải quyết các bài toán dựa trên dữ liệu.
  • B. ML là lĩnh vực rộng nhất, AI là một tập con của ML, và DS là một phần nhỏ của AI.
  • C. DS là lĩnh vực rộng nhất, bao gồm cả AI và ML như các công cụ phụ trợ.
  • D. Ba lĩnh vực này hoàn toàn tách biệt và không có sự giao thoa.

Câu 9: Một ngân hàng sử dụng các thuật toán Khoa học dữ liệu để phân tích lịch sử giao dịch của khách hàng nhằm phát hiện các hoạt động bất thường, có dấu hiệu gian lận. Ứng dụng này của Khoa học dữ liệu thuộc nhóm nào?

  • A. Cải thiện trải nghiệm khách hàng
  • B. Tối ưu hóa quyết định
  • C. Tự động hóa
  • D. Phát hiện gian lận

Câu 10: Một công ty thương mại điện tử phân tích dữ liệu duyệt web và lịch sử mua hàng của từng khách hàng để đưa ra các gợi ý sản phẩm phù hợp. Ứng dụng này của Khoa học dữ liệu nhằm mục đích gì?

  • A. Cải thiện trải nghiệm khách hàng
  • B. Phát hiện gian lận
  • C. Tự động hóa quy trình sản xuất
  • D. Dự báo thời tiết

Câu 11: Đặc điểm nào của Dữ liệu lớn liên quan đến mức độ đáng tin cậy và chính xác của dữ liệu, vốn có thể bị ảnh hưởng bởi các yếu tố như lỗi thu thập, sai lệch hoặc định dạng không chuẩn?

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 12: Tại sao tri thức chuyên ngành (Domain Knowledge) lại quan trọng trong Khoa học dữ liệu?

  • A. Chỉ để giúp thu thập dữ liệu nhanh hơn.
  • B. Chỉ cần thiết khi trực quan hóa dữ liệu.
  • C. Giúp hiểu ngữ cảnh của dữ liệu, đặt câu hỏi đúng, giải thích kết quả phân tích và áp dụng tri thức thu được một cách hiệu quả.
  • D. Không quan trọng, chỉ cần kỹ năng về toán học và lập trình.

Câu 13: Một công ty sản xuất muốn dự báo nhu cầu thị trường cho sản phẩm mới dựa trên dữ liệu bán hàng lịch sử, xu hướng kinh tế và các yếu tố mùa vụ. Hoạt động này sử dụng Khoa học dữ liệu chủ yếu để làm gì?

  • A. Phát hiện gian lận
  • B. Tối ưu hóa quyết định (trong lập kế hoạch sản xuất, marketing)
  • C. Tự động hóa dây chuyền lắp ráp
  • D. Cải thiện giao diện website bán hàng

Câu 14: Bước "Phân tích và mô hình hóa" trong quy trình Khoa học dữ liệu thường bao gồm những hoạt động nào?

  • A. Chỉ thu thập dữ liệu từ các nguồn khác nhau.
  • B. Chỉ tạo ra các biểu đồ và đồ thị.
  • C. Chỉ làm sạch và định dạng lại dữ liệu.
  • D. Áp dụng các kỹ thuật thống kê, học máy để tìm ra mối quan hệ, mẫu hình trong dữ liệu và xây dựng mô hình dự báo hoặc phân loại.

Câu 15: Khi nói đến "Value" (Giá trị) trong 5 chữ V của Dữ liệu lớn, điều này ám chỉ gì?

  • A. Khả năng trích xuất thông tin hữu ích và tạo ra lợi ích kinh tế/xã hội từ dữ liệu.
  • B. Chi phí để lưu trữ dữ liệu khổng lồ.
  • C. Số lượng người dùng tạo ra dữ liệu.
  • D. Tính hợp pháp của việc sử dụng dữ liệu.

Câu 16: Một nhà khoa học dữ liệu phát triển một mô hình học máy để phân loại email thành "thư rác" và "không phải thư rác". Sau khi mô hình được xây dựng, bước tiếp theo quan trọng nhất để đưa nó vào sử dụng thực tế là gì?

  • A. Tìm kiếm thêm dữ liệu để làm sạch.
  • B. Tạo thêm nhiều biểu đồ hơn.
  • C. Viết báo cáo khoa học về mô hình.
  • D. Triển khai mô hình vào hệ thống lọc email và theo dõi hiệu quả hoạt động của nó.

Câu 17: Tại sao việc trực quan hóa dữ liệu lại là một bước quan trọng trong Khoa học dữ liệu, ngay cả khi đã có kết quả phân tích bằng số?

  • A. Để làm cho báo cáo trông đẹp mắt hơn.
  • B. Giúp con người dễ dàng hiểu, phát hiện xu hướng, mẫu hình và outliers (giá trị bất thường) trong dữ liệu phức tạp một cách trực quan.
  • C. Để tăng tốc độ tính toán của mô hình.
  • D. Đây là bước cuối cùng và không cần thiết cho việc ra quyết định.

Câu 18: Lĩnh vực nào sau đây là ứng dụng phổ biến của Khoa học dữ liệu trong đời sống hàng ngày của bạn?

  • A. Việc in sách giáo khoa.
  • B. Xây dựng các tòa nhà cao tầng.
  • C. Hệ thống gợi ý phim, nhạc, sản phẩm trên các nền tảng trực tuyến.
  • D. Hoạt động sản xuất thủ công truyền thống.

Câu 19: Đặc điểm nào của Dữ liệu lớn thể hiện sự đa dạng về định dạng (có cấu trúc, bán cấu trúc, phi cấu trúc), nguồn gốc và loại dữ liệu (văn bản, hình ảnh, âm thanh, số liệu)?

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 20: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn có đặc điểm "Veracity" thấp là gì?

  • A. Kết quả phân tích có thể không chính xác hoặc sai lệch, dẫn đến quyết định sai lầm.
  • B. Tốc độ xử lý dữ liệu bị chậm lại.
  • C. Không thể trực quan hóa dữ liệu.
  • D. Cần ít không gian lưu trữ hơn.

Câu 21: Quy trình Khoa học dữ liệu thường được mô tả bằng một vòng lặp. Điều này ngụ ý điều gì về quy trình này?

  • A. Quy trình chỉ thực hiện một lần duy nhất.
  • B. Quy trình là lặp đi lặp lại, có thể cần quay lại các bước trước đó để tinh chỉnh, cải thiện dựa trên kết quả ban đầu.
  • C. Các bước trong quy trình không có mối liên hệ với nhau.
  • D. Chỉ có thể bắt đầu từ bước trực quan hóa.

Câu 22: Công cụ nào sau đây là phổ biến được sử dụng trong Khoa học dữ liệu để xử lý, phân tích và xây dựng mô hình?

  • A. Microsoft Word
  • B. Adobe Photoshop
  • C. Phần mềm soạn nhạc
  • D. Ngôn ngữ lập trình Python với các thư viện như Pandas, NumPy, Scikit-learn.

Câu 23: Một ứng dụng của Khoa học dữ liệu trong lĩnh vực y tế là gì?

  • A. Phân tích dữ liệu bệnh nhân để hỗ trợ chẩn đoán và dự báo bệnh.
  • B. Xây dựng bệnh viện mới.
  • C. Sản xuất thiết bị y tế thủ công.
  • D. Viết lịch sử y học.

Câu 24: Khi phân tích dữ liệu từ các cảm biến IoT (Internet of Things) trong một nhà máy thông minh, đặc điểm "Velocity" của dữ liệu lớn trở nên đặc biệt quan trọng vì:

  • A. Dữ liệu từ cảm biến thường có cấu trúc rất phức tạp.
  • B. Lượng dữ liệu từ cảm biến thường không lớn.
  • C. Dữ liệu được tạo ra liên tục và cần được xử lý nhanh chóng để giám sát hoạt động, phát hiện sự cố kịp thời.
  • D. Độ chính xác của dữ liệu cảm biến luôn rất cao.

Câu 25: Lợi ích chính của việc tự động hóa các tác vụ lặp đi lặp lại bằng cách sử dụng Khoa học dữ liệu và Học máy là gì?

  • A. Làm cho công việc trở nên nhàm chán hơn.
  • B. Tiết kiệm thời gian, giảm chi phí và tăng hiệu quả.
  • C. Yêu cầu con người phải làm việc thủ công nhiều hơn.
  • D. Làm giảm độ chính xác của kết quả.

Câu 26: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn chứa nhiều giá trị bị thiếu và các định dạng không nhất quán. Bước đầu tiên cần làm để chuẩn bị dữ liệu cho phân tích là gì?

  • A. Thực hiện các kỹ thuật tiền xử lý và làm sạch dữ liệu.
  • B. Bắt đầu xây dựng mô hình dự báo ngay lập tức.
  • C. Tạo các biểu đồ phức tạp từ dữ liệu thô.
  • D. Chia sẻ dữ liệu cho tất cả mọi người mà không cần kiểm tra.

Câu 27: Trong bối cảnh Khoa học dữ liệu, "mô hình" (model) thường được hiểu là gì?

  • A. Một bản sao vật lý của đối tượng nghiên cứu.
  • B. Một bản vẽ kỹ thuật chi tiết.
  • C. Một biểu diễn toán học hoặc thuật toán học máy học được từ dữ liệu, có khả năng nhận diện mẫu hình, đưa ra dự đoán hoặc phân loại.
  • D. Một bản tóm tắt ngắn gọn về dữ liệu.

Câu 28: Việc sử dụng Khoa học dữ liệu để phân tích hành vi người dùng và tối ưu hóa chiến dịch quảng cáo trực tuyến là một ví dụ về ứng dụng trong lĩnh vực nào?

  • A. Nghiên cứu khoa học cơ bản.
  • B. Marketing và kinh doanh.
  • C. Quản lý tài nguyên nước.
  • D. Phát triển vật liệu mới.

Câu 29: Khi một công ty sử dụng Khoa học dữ liệu để phân tích dữ liệu lịch sử và dự báo xu hướng thị trường tương lai, họ đang tập trung vào mục tiêu chính nào của Khoa học dữ liệu?

  • A. Đưa ra quyết định dựa trên dữ liệu (Data-driven decision making).
  • B. Chỉ đơn thuần lưu trữ dữ liệu.
  • C. Giảm thiểu số lượng dữ liệu cần xử lý.
  • D. Làm cho dữ liệu trở nên ngẫu nhiên hơn.

Câu 30: Đặc điểm nào của Dữ liệu lớn (Big Data) liên quan đến kích thước khổng lồ của tập dữ liệu, vượt quá khả năng xử lý của các công cụ cơ sở dữ liệu truyền thống?

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Khoa học dữ liệu là một lĩnh vực liên ngành. Lĩnh vực nào sau đây KHÔNG phải là nền tảng cốt lõi của Khoa học dữ liệu?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Mục tiêu chính của Khoa học dữ liệu là gì?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Đặc điểm nào của Dữ liệu lớn (Big Data) đề cập đến việc dữ liệu được tạo ra và cập nhật liên tục với tốc độ rất nhanh, đòi hỏi khả năng xử lý theo thời gian thực hoặc gần thời gian thực?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Một công ty bán lẻ trực tuyến thu thập dữ liệu từ nhiều nguồn khác nhau như lịch sử mua hàng của khách, lượt xem sản phẩm trên website, tương tác trên mạng xã hội, và dữ liệu từ các cảm biến trong kho hàng. Đặc điểm nào của Dữ liệu lớn được thể hiện rõ nhất trong tình huống này?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Trong quy trình Khoa học dữ liệu, bước nào thường bao gồm việc làm sạch dữ liệu, xử lý các giá trị thiếu hoặc không nhất quán, và chuyển đổi dữ liệu sang định dạng phù hợp cho phân tích?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Một nhà khoa học dữ liệu đang sử dụng biểu đồ, đồ thị và bản đồ để trình bày kết quả phân tích dữ liệu bán hàng cho đội ngũ quản lý. Hoạt động này thuộc bước nào trong quy trình Khoa học dữ liệu?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Học máy (Machine Learning) có mối quan hệ như thế nào với Khoa học dữ liệu?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Trí tuệ nhân tạo (AI), Học máy (ML) và Khoa học dữ liệu (DS) có mối quan hệ chặt chẽ. Mối quan hệ nào sau đây mô tả đúng nhất sự tương quan giữa ba lĩnh vực này?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Một ngân hàng sử dụng các thuật toán Khoa học dữ liệu để phân tích lịch sử giao dịch của khách hàng nhằm phát hiện các hoạt động bất thường, có dấu hiệu gian lận. Ứng dụng này của Khoa học dữ liệu thuộc nhóm nào?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Một công ty thương mại điện tử phân tích dữ liệu duyệt web và lịch sử mua hàng của từng khách hàng để đưa ra các gợi ý sản phẩm phù hợp. Ứng dụng này của Khoa học dữ liệu nhằm mục đích gì?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Đặc điểm nào của Dữ liệu lớn liên quan đến mức độ đáng tin cậy và chính xác của dữ liệu, vốn có thể bị ảnh hưởng bởi các yếu tố như lỗi thu thập, sai lệch hoặc định dạng không chuẩn?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Tại sao tri thức chuyên ngành (Domain Knowledge) lại quan trọng trong Khoa học dữ liệu?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Một công ty sản xuất muốn dự báo nhu cầu thị trường cho sản phẩm mới dựa trên dữ liệu bán hàng lịch sử, xu hướng kinh tế và các yếu tố mùa vụ. Hoạt động này sử dụng Khoa học dữ liệu chủ yếu để làm gì?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Bước 'Phân tích và mô hình hóa' trong quy trình Khoa học dữ liệu thường bao gồm những hoạt động nào?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Khi nói đến 'Value' (Giá trị) trong 5 chữ V của Dữ liệu lớn, điều này ám chỉ gì?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Một nhà khoa học dữ liệu phát triển một mô hình học máy để phân loại email thành 'thư rác' và 'không phải thư rác'. Sau khi mô hình được xây dựng, bước tiếp theo quan trọng nhất để đưa nó vào sử dụng thực tế là gì?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Tại sao việc trực quan hóa dữ liệu lại là một bước quan trọng trong Khoa học dữ liệu, ngay cả khi đã có kết quả phân tích bằng số?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Lĩnh vực nào sau đây là ứng dụng phổ biến của Khoa học dữ liệu trong đời sống hàng ngày của bạn?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Đặc điểm nào của Dữ liệu lớn thể hiện sự đa dạng về định dạng (có cấu trúc, bán cấu trúc, phi cấu trúc), nguồn gốc và loại dữ liệu (văn bản, hình ảnh, âm thanh, số liệu)?

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Một trong những thách thức lớn khi làm việc với Dữ liệu lớn có đặc điểm 'Veracity' thấp là gì?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Quy trình Khoa học dữ liệu thường được mô tả bằng một vòng lặp. Điều này ngụ ý điều gì về quy trình này?

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Công cụ nào sau đây là phổ biến được sử dụng trong Khoa học dữ liệu để xử lý, phân tích và xây dựng mô hình?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Một ứng dụng của Khoa học dữ liệu trong lĩnh vực y tế là gì?

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Khi phân tích dữ liệu từ các cảm biến IoT (Internet of Things) trong một nhà máy thông minh, đặc điểm 'Velocity' của dữ liệu lớn trở nên đặc biệt quan trọng vì:

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Lợi ích chính của việc tự động hóa các tác vụ lặp đi lặp lại bằng cách sử dụng Khoa học dữ liệu và Học máy là gì?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn chứa nhiều giá trị bị thiếu và các định dạng không nhất quán. Bước đầu tiên cần làm để chuẩn bị dữ liệu cho phân tích là gì?

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Trong bối cảnh Khoa học dữ liệu, 'mô hình' (model) thường được hiểu là gì?

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Việc sử dụng Khoa học dữ liệu để phân tích hành vi người dùng và tối ưu hóa chiến dịch quảng cáo trực tuyến là một ví dụ về ứng dụng trong lĩnh vực nào?

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Khi một công ty sử dụng Khoa học dữ liệu để phân tích dữ liệu lịch sử và dự báo xu hướng thị trường tương lai, họ đang tập trung vào mục tiêu chính nào của Khoa học dữ liệu?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 7

Đặc điểm nào của Dữ liệu lớn (Big Data) liên quan đến kích thước khổng lồ của tập dữ liệu, vượt quá khả năng xử lý của các công cụ cơ sở dữ liệu truyền thống?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 08

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 08 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Một công ty bán lẻ đang phân tích dữ liệu giao dịch khổng lồ từ hàng triệu khách hàng mỗi ngày để dự đoán xu hướng mua sắm và tối ưu hóa tồn kho. Lĩnh vực nào kết hợp các kỹ thuật từ khoa học máy tính, toán học và thống kê để xử lý và khai thác loại dữ liệu này?

  • A. Trí tuệ nhân tạo (AI)
  • B. Khoa học dữ liệu (Data Science)
  • C. Kỹ thuật phần mềm (Software Engineering)
  • D. Hệ thống cơ sở dữ liệu (Database Systems)

Câu 2: Trong bối cảnh khoa học dữ liệu, mục tiêu chính của việc phân tích và khai phá dữ liệu là gì?

  • A. Chỉ đơn thuần lưu trữ dữ liệu một cách an toàn.
  • B. Giảm kích thước tập dữ liệu càng nhỏ càng tốt.
  • C. Biến đổi dữ liệu sang một định dạng khác.
  • D. Tạo ra tri thức mới, hiểu biết sâu sắc và hỗ trợ đưa ra quyết định phù hợp.

Câu 3: Dữ liệu lớn (Big Data) thường được mô tả dựa trên các đặc điểm bắt đầu bằng chữ "V". Đặc điểm nào đề cập đến tốc độ dữ liệu được tạo ra, thu thập và xử lý?

  • A. Volume (Khối lượng)
  • B. Variety (Sự đa dạng)
  • C. Velocity (Vận tốc)
  • D. Veracity (Tính xác thực)

Câu 4: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu chứa thông tin từ nhiều nguồn khác nhau như văn bản từ mạng xã hội, hình ảnh từ camera an ninh và số liệu từ cảm biến. Đặc điểm nào của dữ liệu lớn thể hiện rõ nhất thách thức này?

  • A. Variety (Sự đa dạng)
  • B. Volume (Khối lượng)
  • C. Velocity (Vận tốc)
  • D. Value (Giá trị)

Câu 5: Bước nào trong quy trình khoa học dữ liệu thường liên quan đến việc xử lý các giá trị bị thiếu, loại bỏ nhiễu hoặc định dạng lại dữ liệu để chuẩn bị cho phân tích?

  • A. Thu thập dữ liệu
  • B. Làm sạch dữ liệu (Data Cleaning)
  • C. Mô hình hóa dữ liệu (Data Modeling)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 6: Một nhóm khoa học dữ liệu đã xây dựng một mô hình dự đoán tỷ lệ khách hàng rời bỏ dịch vụ (churn rate) cho một công ty viễn thông. Sau khi mô hình được triển khai và sử dụng để hỗ trợ bộ phận chăm sóc khách hàng, nhóm đang ở bước nào của quy trình khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Khám phá dữ liệu (Data Exploration)
  • C. Mô hình hóa dữ liệu (Data Modeling)
  • D. Triển khai và đánh giá (Deployment and Evaluation)

Câu 7: Tại sao tri thức chuyên ngành (Domain Knowledge) lại quan trọng đối với một nhà khoa học dữ liệu, ngay cả khi họ có kỹ năng toán học và lập trình xuất sắc?

  • A. Tri thức chuyên ngành giúp viết code hiệu quả hơn.
  • B. Tri thức chuyên ngành là bắt buộc để sử dụng các công cụ trực quan hóa.
  • C. Tri thức chuyên ngành giúp hiểu ngữ cảnh của dữ liệu, đặt câu hỏi đúng và diễn giải kết quả phân tích một cách chính xác.
  • D. Tri thức chuyên ngành chỉ cần thiết cho việc thu thập dữ liệu ban đầu.

Câu 8: Một trong những ứng dụng phổ biến của khoa học dữ liệu là xây dựng các hệ thống gợi ý sản phẩm (recommendation systems) trên các nền tảng thương mại điện tử. Ứng dụng này thuộc nhóm thành tựu nào của khoa học dữ liệu?

  • A. Tự động hóa công việc lặp đi lặp lại
  • B. Cải thiện trải nghiệm khách hàng
  • C. Phát hiện hoạt động gian lận
  • D. Tối ưu hóa quyết định trong chuỗi cung ứng

Câu 9: Học máy (Machine Learning) có mối quan hệ như thế nào với Khoa học dữ liệu?

  • A. Học máy là một lĩnh vực hoàn toàn tách biệt với khoa học dữ liệu.
  • B. Khoa học dữ liệu là một nhánh nhỏ của học máy.
  • C. Học máy là mục tiêu cuối cùng của mọi dự án khoa học dữ liệu.
  • D. Học máy là một tập hợp các kỹ thuật và công cụ quan trọng được sử dụng trong quy trình khoa học dữ liệu để xây dựng mô hình từ dữ liệu.

Câu 10: Đặc điểm "Value" trong 5 chữ V của Dữ liệu lớn đề cập đến điều gì?

  • A. Chi phí để lưu trữ dữ liệu.
  • B. Số lượng người sử dụng dữ liệu.
  • C. Khả năng trích xuất thông tin hữu ích và giá trị kinh doanh từ dữ liệu.
  • D. Độ phức tạp của cấu trúc dữ liệu.

Câu 11: Một ngân hàng sử dụng khoa học dữ liệu để phân tích các giao dịch bất thường nhằm phát hiện các hành vi gian lận thẻ tín dụng. Ứng dụng này thuộc nhóm thành tựu nào?

  • A. Phát hiện hoạt động gian lận
  • B. Tối ưu hóa quy trình sản xuất
  • C. Cải thiện hiệu quả marketing
  • D. Dự báo nhu cầu năng lượng

Câu 12: Trực quan hóa dữ liệu (Data Visualization) đóng vai trò gì trong quy trình khoa học dữ liệu?

  • A. Chỉ dùng để trình bày kết quả cuối cùng cho người không chuyên.
  • B. Giúp khám phá dữ liệu, nhận diện xu hướng, mẫu hình và các điểm bất thường một cách trực quan.
  • C. Là bước bắt buộc phải thực hiện trước khi thu thập dữ liệu.
  • D. Thay thế hoàn toàn cho việc phân tích thống kê.

Câu 13: Khi làm việc với dữ liệu lớn, đặc điểm "Veracity" (Tính xác thực) đề cập đến điều gì?

  • A. Số lượng bản sao của dữ liệu.
  • B. Tốc độ truy cập dữ liệu.
  • C. Cách dữ liệu được lưu trữ.
  • D. Độ tin cậy, chính xác và trung thực của dữ liệu.

Câu 14: Vai trò nào trong lĩnh vực khoa học dữ liệu thường tập trung vào việc xây dựng và duy trì cơ sở hạ tầng, hệ thống và quy trình để thu thập, lưu trữ và xử lý dữ liệu lớn?

  • A. Nhà khoa học dữ liệu (Data Scientist)
  • B. Nhà phân tích dữ liệu (Data Analyst)
  • C. Kỹ sư dữ liệu (Data Engineer)
  • D. Chuyên gia trực quan hóa dữ liệu

Câu 15: Một công ty sản xuất sử dụng dữ liệu từ cảm biến trên dây chuyền lắp ráp để dự đoán khi nào một bộ phận máy móc có khả năng bị hỏng, cho phép bảo trì chủ động. Đây là ví dụ về ứng dụng nào của khoa học dữ liệu?

  • A. Bảo trì dự đoán (Predictive Maintenance)
  • B. Phân tích tình cảm (Sentiment Analysis)
  • C. Nhận dạng hình ảnh (Image Recognition)
  • D. Xử lý ngôn ngữ tự nhiên (Natural Language Processing)

Câu 16: Khi một nhà khoa học dữ liệu sử dụng các thuật toán thống kê để kiểm tra mối quan hệ giữa hai biến trong tập dữ liệu, họ đang thực hiện bước nào của quy trình khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Khám phá và phân tích dữ liệu (Data Exploration and Analysis)
  • C. Triển khai mô hình
  • D. Làm sạch dữ liệu

Câu 17: Đặc điểm nào của Dữ liệu lớn thể hiện sự đa dạng về cấu trúc dữ liệu, bao gồm dữ liệu có cấu trúc (ví dụ: bảng cơ sở dữ liệu), bán cấu trúc (ví dụ: JSON, XML) và phi cấu trúc (ví dụ: văn bản, hình ảnh, video)?

  • A. Velocity
  • B. Volume
  • C. Value
  • D. Variety

Câu 18: Lĩnh vực nào đóng góp nền tảng lý thuyết về xác suất, suy luận thống kê và các phương pháp phân tích dữ liệu dựa trên bằng chứng trong khoa học dữ liệu?

  • A. Khoa học máy tính
  • B. Tri thức chuyên ngành
  • C. Thống kê
  • D. Kỹ thuật phần mềm

Câu 19: Một trong những thách thức lớn nhất khi làm việc với Dữ liệu lớn liên quan đến "Veracity" (Tính xác thực) là gì?

  • A. Tốc độ xử lý dữ liệu quá nhanh.
  • B. Đảm bảo dữ liệu chính xác, đáng tin cậy và không bị sai lệch.
  • C. Số lượng dữ liệu quá ít.
  • D. Chi phí lưu trữ dữ liệu thấp.

Câu 20: Khi một nhà khoa học dữ liệu xây dựng một mô hình hồi quy để dự báo giá nhà dựa trên các đặc điểm như diện tích, số phòng ngủ và vị trí, họ đang thực hiện bước nào của quy trình khoa học dữ liệu?

  • A. Mô hình hóa dữ liệu (Data Modeling)
  • B. Thu thập dữ liệu
  • C. Làm sạch dữ liệu
  • D. Trực quan hóa dữ liệu

Câu 21: AI (Trí tuệ nhân tạo) và Khoa học dữ liệu có mối quan hệ như thế nào?

  • A. AI và Khoa học dữ liệu là hai lĩnh vực hoàn toàn khác biệt và không liên quan.
  • B. Khoa học dữ liệu là một dạng của AI.
  • C. Khoa học dữ liệu thường sử dụng các kỹ thuật từ AI (bao gồm học máy) để trích xuất tri thức và xây dựng các hệ thống thông minh từ dữ liệu.
  • D. AI chỉ sử dụng dữ liệu nhỏ, còn Khoa học dữ liệu chỉ xử lý dữ liệu lớn.

Câu 22: Bước nào trong quy trình khoa học dữ liệu giúp người phân tích và người ra quyết định dễ dàng nhận diện các mẫu hình, xu hướng và thông tin quan trọng từ dữ liệu thông qua biểu đồ, đồ thị và bản đồ?

  • A. Thu thập dữ liệu
  • B. Làm sạch dữ liệu
  • C. Mô hình hóa dữ liệu
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 23: Khi một công ty sử dụng khoa học dữ liệu để phân tích hành vi trực tuyến của khách hàng và gửi email quảng cáo được cá nhân hóa dựa trên sở thích của họ, đây là một ví dụ về việc sử dụng khoa học dữ liệu để:

  • A. Cải thiện trải nghiệm khách hàng
  • B. Tự động hóa quy trình sản xuất
  • C. Phát hiện gian lận
  • D. Quản lý chuỗi cung ứng

Câu 24: Đặc điểm "Volume" trong 5 chữ V của Dữ liệu lớn đề cập đến điều gì?

  • A. Tốc độ xử lý dữ liệu.
  • B. Kích thước khổng lồ của tập dữ liệu.
  • C. Sự đa dạng của các loại dữ liệu.
  • D. Giá trị tiềm năng của dữ liệu.

Câu 25: Khoa học dữ liệu giúp đổi mới quá trình ra quyết định trong các tổ chức bằng cách nào?

  • A. Thay thế hoàn toàn con người trong việc ra quyết định.
  • B. Chỉ cung cấp dữ liệu thô mà không cần phân tích.
  • C. Cung cấp hiểu biết sâu sắc dựa trên dữ liệu, dự báo xu hướng và đánh giá các kịch bản khác nhau.
  • D. Chỉ áp dụng cho các quyết định mang tính chiến lược, không áp dụng cho quyết định hàng ngày.

Câu 26: Lĩnh vực nào cung cấp các thuật toán, cấu trúc dữ liệu và kỹ thuật lập trình cần thiết để xử lý, lưu trữ và phân tích hiệu quả các tập dữ liệu lớn trong khoa học dữ liệu?

  • A. Khoa học máy tính
  • B. Toán học
  • C. Thống kê
  • D. Tri thức chuyên ngành

Câu 27: Bước nào trong quy trình khoa học dữ liệu liên quan đến việc thu thập dữ liệu từ các nguồn khác nhau, có thể là cơ sở dữ liệu, tệp tin, API hoặc website?

  • A. Làm sạch dữ liệu
  • B. Mô hình hóa dữ liệu
  • C. Triển khai mô hình
  • D. Thu thập dữ liệu (Data Acquisition)

Câu 28: Phân tích dữ liệu để hiểu điều gì đã xảy ra trong quá khứ (ví dụ: phân tích doanh số bán hàng tháng trước) được gọi là loại phân tích nào trong khoa học dữ liệu?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Phân tích chẩn đoán (Diagnostic Analytics)

Câu 29: Một hệ thống sử dụng học máy để tự động phân loại email thành "Hộp thư đến", "Thư rác" hoặc "Quảng cáo" là một ví dụ về ứng dụng nào của khoa học dữ liệu?

  • A. Phát hiện gian lận
  • B. Tự động hóa công việc lặp đi lặp lại
  • C. Tối ưu hóa chuỗi cung ứng
  • D. Cải thiện trải nghiệm khách hàng

Câu 30: Tại sao bước làm sạch dữ liệu (Data Cleaning) lại là một trong những bước tốn thời gian nhất nhưng lại cực kỳ quan trọng trong quy trình khoa học dữ liệu?

  • A. Vì đây là bước duy nhất cần sử dụng công cụ phần mềm chuyên dụng.
  • B. Vì nó giúp giảm kích thước dữ liệu xuống mức tối thiểu.
  • C. Vì chất lượng của dữ liệu đầu vào ảnh hưởng trực tiếp đến độ tin cậy và tính chính xác của kết quả phân tích và mô hình sau này.
  • D. Vì nó tạo ra các biểu đồ và báo cáo cuối cùng.

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 1: Một công ty bán lẻ đang phân tích dữ liệu giao dịch khổng lồ từ hàng triệu khách hàng mỗi ngày để dự đoán xu hướng mua sắm và tối ưu hóa tồn kho. Lĩnh vực nào kết hợp các kỹ thuật từ khoa học máy tính, toán học và thống kê để xử lý và khai thác loại dữ liệu này?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 2: Trong bối cảnh khoa học dữ liệu, mục tiêu chính của việc phân t??ch và khai phá dữ liệu là gì?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 3: Dữ liệu lớn (Big Data) thường được mô tả dựa trên các đặc điểm bắt đầu bằng chữ 'V'. Đặc điểm nào đề cập đến tốc độ dữ liệu được tạo ra, thu thập và xử lý?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 4: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu chứa thông tin từ nhiều nguồn khác nhau như văn bản từ mạng xã hội, hình ảnh từ camera an ninh và số liệu từ cảm biến. Đặc điểm nào của dữ liệu lớn thể hiện rõ nhất thách thức này?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 5: Bước nào trong quy trình khoa học dữ liệu thường liên quan đến việc xử lý các giá trị bị thiếu, loại bỏ nhiễu hoặc định dạng lại dữ liệu để chuẩn bị cho phân tích?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 6: Một nhóm khoa học dữ liệu đã xây dựng một mô hình dự đoán tỷ lệ khách hàng rời bỏ dịch vụ (churn rate) cho một công ty viễn thông. Sau khi mô hình được triển khai và sử dụng để hỗ trợ bộ phận chăm sóc khách hàng, nhóm đang ở bước nào của quy trình khoa học dữ liệu?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 7: Tại sao tri thức chuyên ngành (Domain Knowledge) lại quan trọng đối với một nhà khoa học dữ liệu, ngay cả khi họ có kỹ năng toán học và lập trình xuất sắc?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 8: Một trong những ứng dụng phổ biến của khoa học dữ liệu là xây dựng các hệ thống gợi ý sản phẩm (recommendation systems) trên các nền tảng thương mại điện tử. Ứng dụng này thuộc nhóm thành tựu nào của khoa học dữ liệu?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 9: Học máy (Machine Learning) có mối quan hệ như thế nào với Khoa học dữ liệu?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 10: Đặc điểm 'Value' trong 5 chữ V của Dữ liệu lớn đề cập đến điều gì?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 11: Một ngân hàng sử dụng khoa học dữ liệu để phân tích các giao dịch bất thường nhằm phát hiện các hành vi gian lận thẻ tín dụng. Ứng dụng này thuộc nhóm thành tựu nào?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 12: Trực quan hóa dữ liệu (Data Visualization) đóng vai trò gì trong quy trình khoa học dữ liệu?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 13: Khi làm việc với dữ liệu lớn, đặc điểm 'Veracity' (Tính xác thực) đề cập đến điều gì?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 14: Vai trò nào trong lĩnh vực khoa học dữ liệu thường tập trung vào việc xây dựng và duy trì cơ sở hạ tầng, hệ thống và quy trình để thu thập, lưu trữ và xử lý dữ liệu lớn?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 15: Một công ty sản xuất sử dụng dữ liệu từ cảm biến trên dây chuyền lắp ráp để dự đoán khi nào một bộ phận máy móc có khả năng bị hỏng, cho phép bảo trì chủ động. Đây là ví dụ về ứng dụng nào của khoa học dữ liệu?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 16: Khi một nhà khoa học dữ liệu sử dụng các thuật toán thống kê để kiểm tra mối quan hệ giữa hai biến trong tập dữ liệu, họ đang thực hiện bước nào của quy trình khoa học dữ liệu?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 17: Đặc điểm nào của Dữ liệu lớn thể hiện sự đa dạng về cấu trúc dữ liệu, bao gồm dữ liệu có cấu trúc (ví dụ: bảng cơ sở dữ liệu), bán cấu trúc (ví dụ: JSON, XML) và phi cấu trúc (ví dụ: văn bản, hình ảnh, video)?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 18: Lĩnh vực nào đóng góp nền tảng lý thuyết về xác suất, suy luận thống kê và các phương pháp phân tích dữ liệu dựa trên bằng chứng trong khoa học dữ liệu?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 19: Một trong những thách thức lớn nhất khi làm việc với Dữ liệu lớn liên quan đến 'Veracity' (Tính xác thực) là gì?

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 20: Khi một nhà khoa học dữ liệu xây dựng một mô hình hồi quy để dự báo giá nhà dựa trên các đặc điểm như diện tích, số phòng ngủ và vị trí, họ đang thực hiện bước nào của quy trình khoa học dữ liệu?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 21: AI (Trí tuệ nhân tạo) và Khoa học dữ liệu có mối quan hệ như thế nào?

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 22: Bước nào trong quy trình khoa học dữ liệu giúp người phân tích và người ra quyết định dễ dàng nhận diện các mẫu hình, xu hướng và thông tin quan trọng từ dữ liệu thông qua biểu đồ, đồ thị và bản đồ?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 23: Khi một công ty sử dụng khoa học dữ liệu để phân tích hành vi trực tuyến của khách hàng và gửi email quảng cáo được cá nhân hóa dựa trên sở thích của họ, đây là một ví dụ về việc sử dụng khoa học dữ liệu để:

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 24: Đặc điểm 'Volume' trong 5 chữ V của Dữ liệu lớn đề cập đến điều gì?

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 25: Khoa học dữ liệu giúp đổi mới quá trình ra quyết định trong các tổ chức bằng cách nào?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 26: Lĩnh vực nào cung cấp các thuật toán, cấu trúc dữ liệu và kỹ thuật lập trình cần thiết để xử lý, lưu trữ và phân tích hiệu quả các tập dữ liệu lớn trong khoa học dữ liệu?

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 27: Bước nào trong quy trình khoa học dữ liệu liên quan đến việc thu thập dữ liệu từ các nguồn khác nhau, có thể là cơ sở dữ liệu, tệp tin, API hoặc website?

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 28: Phân tích dữ liệu để hiểu điều gì đã xảy ra trong quá khứ (ví dụ: phân tích doanh số bán hàng tháng trước) được gọi là loại phân tích nào trong khoa học dữ liệu?

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 29: Một hệ thống sử dụng học máy để tự động phân loại email thành 'Hộp thư đến', 'Thư rác' hoặc 'Quảng cáo' là một ví dụ về ứng dụng nào của khoa học dữ liệu?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 8

Câu 30: Tại sao bước làm sạch dữ liệu (Data Cleaning) lại là một trong những bước tốn thời gian nhất nhưng lại cực kỳ quan trọng trong quy trình khoa học dữ liệu?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 09

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 09 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Nó tích hợp các phương pháp và công cụ từ những lĩnh vực chính nào để xử lý, phân tích và khai thác dữ liệu?

  • A. Vật lý, Hóa học, và Sinh học.
  • B. Khoa học máy tính, Toán học, và Thống kê.
  • C. Lịch sử, Địa lý, và Giáo dục công dân.
  • D. Nghệ thuật, Âm nhạc, và Văn học.

Câu 2: Mục tiêu cốt lõi và quan trọng nhất của Khoa học dữ liệu là gì?

  • A. Chỉ đơn thuần thu thập và lưu trữ dữ liệu với số lượng lớn.
  • B. Tạo ra các thuật toán phức tạp nhất có thể.
  • C. Phát triển phần cứng máy tính mạnh mẽ hơn.
  • D. Khai thác tri thức và đưa ra quyết định dựa trên dữ liệu.

Câu 3: Quá trình Khoa học dữ liệu thường bao gồm nhiều giai đoạn. Giai đoạn nào sau đây thường diễn ra trước giai đoạn Phân tích dữ liệu?

  • A. Thu thập và làm sạch dữ liệu.
  • B. Triển khai mô hình vào thực tế.
  • C. Trực quan hóa kết quả.
  • D. Ra quyết định dựa trên kết quả.

Câu 4: Trong bối cảnh Khoa học dữ liệu, thuật ngữ "Big Data" (Dữ liệu lớn) thường được đặc trưng bởi "năm chữ V". Chữ V nào đề cập đến tốc độ mà dữ liệu được tạo ra, thu thập và xử lý?

  • A. Volume (Khối lượng).
  • B. Variety (Đa dạng).
  • C. Velocity (Vận tốc).
  • D. Veracity (Tính xác thực).

Câu 5: Một công ty thương mại điện tử muốn hiểu rõ hành vi mua sắm của khách hàng để đề xuất sản phẩm phù hợp. Họ thu thập dữ liệu về lịch sử xem, lịch sử mua hàng, thông tin cá nhân, và tương tác trên website. Công việc này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Trực quan hóa dữ liệu.
  • C. Triển khai mô hình.
  • D. Đánh giá mô hình.

Câu 6: Tại sao giai đoạn "Làm sạch dữ liệu" (Data Cleaning) lại rất quan trọng trong quy trình Khoa học dữ liệu?

  • A. Để tăng tốc độ thu thập dữ liệu.
  • B. Để giảm khối lượng dữ liệu.
  • C. Để làm cho dữ liệu phức tạp hơn.
  • D. Để đảm bảo tính chính xác và nhất quán của dữ liệu cho phân tích.

Câu 7: Một nhà khoa học dữ liệu sử dụng các thuật toán thống kê và học máy để tìm kiếm các mẫu (patterns), xu hướng (trends) và mối quan hệ (relationships) ẩn trong một tập dữ liệu lớn. Công việc này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Phân tích dữ liệu/Xây dựng mô hình.
  • C. Triển khai mô hình.
  • D. Trực quan hóa dữ liệu.

Câu 8: Trực quan hóa dữ liệu (Data Visualization) đóng vai trò gì trong Khoa học dữ liệu?

  • A. Lưu trữ dữ liệu lâu dài.
  • B. Tự động hóa hoàn toàn quy trình phân tích.
  • C. Biểu diễn dữ liệu và kết quả phân tích dưới dạng đồ họa để dễ hiểu và truyền đạt.
  • D. Chỉ dùng để trang trí cho báo cáo.

Câu 9: Khi một mô hình Khoa học dữ liệu (ví dụ: mô hình dự đoán giá nhà) đã được xây dựng và đánh giá là tốt, giai đoạn tiếp theo quan trọng là đưa mô hình đó vào sử dụng trong môi trường thực tế (ví dụ: tích hợp vào một ứng dụng bất động sản). Giai đoạn này được gọi là gì?

  • A. Làm sạch dữ liệu.
  • B. Phân tích khám phá dữ liệu (EDA).
  • C. Đánh giá mô hình.
  • D. Triển khai mô hình (Deployment).

Câu 10: Trong "năm chữ V" của Big Data, chữ V nào đề cập đến sự đa dạng về định dạng và nguồn gốc của dữ liệu (ví dụ: văn bản, hình ảnh, video, dữ liệu cảm biến, dữ liệu cấu trúc, dữ liệu phi cấu trúc)?

  • A. Volume (Khối lượng).
  • B. Variety (Đa dạng).
  • C. Velocity (Vận tốc).
  • D. Value (Giá trị).

Câu 11: Mối quan hệ giữa Khoa học dữ liệu, Trí tuệ nhân tạo (AI) và Học máy (Machine Learning - ML) thường được mô tả như thế nào?

  • A. Khoa học dữ liệu là một phần nhỏ của Học máy.
  • B. Học máy và AI hoàn toàn độc lập với Khoa học dữ liệu.
  • C. Học máy là một tập con của AI, và Khoa học dữ liệu sử dụng cả AI và Học máy như các công cụ để phân tích dữ liệu và trích xuất tri thức.
  • D. AI là một tập con của Khoa học dữ liệu.

Câu 12: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích các giao dịch của khách hàng nhằm phát hiện ra các hoạt động bất thường, có khả năng là gian lận. Ứng dụng này của Khoa học dữ liệu thuộc về mục tiêu nào?

  • A. Phát hiện gian lận và rủi ro.
  • B. Cải thiện trải nghiệm khách hàng.
  • C. Tự động hóa quy trình sản xuất.
  • D. Nghiên cứu khoa học cơ bản.

Câu 13: Khi một công ty sử dụng Khoa học dữ liệu để phân tích dữ liệu khách hàng (tuổi, giới tính, sở thích, lịch sử mua hàng) nhằm đưa ra các quảng cáo hoặc đề xuất sản phẩm phù hợp nhất cho từng cá nhân, đây là một ví dụ về việc ứng dụng Khoa học dữ liệu để:

  • A. Giảm khối lượng dữ liệu.
  • B. Cải thiện trải nghiệm khách hàng thông qua cá nhân hóa.
  • C. Chỉ để lưu trữ dữ liệu an toàn.
  • D. Tăng tốc độ kết nối Internet.

Câu 14: Trong "năm chữ V" của Big Data, chữ V nào liên quan đến độ tin cậy, độ chính xác và tính xác thực của dữ liệu? Điều này rất quan trọng vì dữ liệu không chính xác có thể dẫn đến phân tích sai lầm.

  • A. Volume (Khối lượng).
  • B. Variety (Đa dạng).
  • C. Velocity (Vận tốc).
  • D. Veracity (Tính xác thực).

Câu 15: Sử dụng các thuật toán học máy để tự động phân loại email thành "Hộp thư đến" và "Thư rác" dựa trên nội dung và người gửi là một ứng dụng thực tế của Khoa học dữ liệu. Điều này minh họa cho khả năng nào của Khoa học dữ liệu?

  • A. Chỉ thu thập dữ liệu.
  • B. Chỉ trực quan hóa dữ liệu.
  • C. Tự động hóa các tác vụ phức tạp dựa trên dữ liệu.
  • D. Chỉ để lưu trữ dữ liệu an toàn.

Câu 16: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn (Big Data) là gì?

  • A. Thiếu nguồn dữ liệu để thu thập.
  • B. Yêu cầu cơ sở hạ tầng mạnh mẽ và các kỹ thuật xử lý phức tạp để phân tích hiệu quả.
  • C. Dữ liệu luôn có cấu trúc rõ ràng và dễ xử lý.
  • D. Không cần quan tâm đến chất lượng dữ liệu.

Câu 17: Trong "năm chữ V" của Big Data, chữ V nào đề cập đến khả năng biến dữ liệu thành thông tin có ý nghĩa và có thể sử dụng để đưa ra quyết định hoặc tạo ra lợi ích?

  • A. Value (Giá trị).
  • B. Volume (Khối lượng).
  • C. Variety (Đa dạng).
  • D. Velocity (Vận tốc).

Câu 18: Tại sao kiến thức chuyên ngành (business domain knowledge) lại quan trọng đối với một nhà khoa học dữ liệu, ngay cả khi họ có kỹ năng mạnh về toán học và khoa học máy tính?

  • A. Kiến thức chuyên ngành không liên quan gì đến Khoa học dữ liệu.
  • B. Chỉ cần kỹ năng lập trình là đủ.
  • C. Giúp hiểu ngữ cảnh của dữ liệu, đặt câu hỏi đúng, diễn giải kết quả phân tích một cách chính xác và áp dụng chúng vào vấn đề thực tế.
  • D. Chỉ để làm cho công việc trở nên khó khăn hơn.

Câu 19: Một công ty năng lượng sử dụng dữ liệu từ hàng ngàn cảm biến trên các tuabin gió để dự đoán khi nào một bộ phận có khả năng bị hỏng, cho phép bảo trì phòng ngừa. Đây là một ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

  • A. Marketing và bán hàng.
  • B. Y tế và chăm sóc sức khỏe.
  • C. Tài chính ngân hàng.
  • D. Công nghiệp và sản xuất (Bảo trì dự đoán).

Câu 20: Việc sử dụng dữ liệu cá nhân của người dùng mà không có sự đồng ý rõ ràng hoặc sử dụng các mô hình có chứa sự thiên vị (bias) dẫn đến phân biệt đối xử là những vấn đề thuộc khía cạnh nào của Khoa học dữ liệu?

  • A. Đạo đức và pháp lý.
  • B. Hiệu suất xử lý dữ liệu.
  • C. Khả năng trực quan hóa.
  • D. Tốc độ thu thập dữ liệu.

Câu 21: So với phân tích dữ liệu truyền thống, Khoa học dữ liệu thường có điểm khác biệt nổi bật nào?

  • A. Chỉ làm việc với dữ liệu có cấu trúc.
  • B. Xử lý tập dữ liệu lớn hơn, đa dạng hơn và thường tập trung vào các phương pháp dự đoán và khám phá tự động.
  • C. Không sử dụng bất kỳ công cụ thống kê nào.
  • D. Chỉ tạo ra báo cáo mô tả những gì đã xảy ra trong quá khứ.

Câu 22: Khi một nhà khoa học dữ liệu tạo ra một biểu đồ đường (line chart) để hiển thị xu hướng doanh thu của công ty qua các tháng, họ đang thực hiện giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Làm sạch dữ liệu.
  • C. Xây dựng mô hình.
  • D. Trực quan hóa dữ liệu.

Câu 23: Một dự án Khoa học dữ liệu thành công thường bắt đầu bằng việc hiểu rõ vấn đề cần giải quyết và mục tiêu kinh doanh. Bước này thường được gọi là gì trong quy trình Khoa học dữ liệu?

  • A. Xác định vấn đề/Mục tiêu.
  • B. Triển khai mô hình.
  • C. Đánh giá mô hình.
  • D. Trực quan hóa dữ liệu.

Câu 24: Trong Khoa học dữ liệu, "Mô hình" (Model) là gì?

  • A. Chỉ là một bảng tính Excel lớn.
  • B. Một biểu diễn toán học hoặc thuật toán học máy được xây dựng từ dữ liệu để tìm hiểu mẫu, dự đoán hoặc phân loại.
  • C. Một hình ảnh đồ họa của dữ liệu.
  • D. Một phần cứng máy tính đặc biệt.

Câu 25: Khi một công ty sử dụng Khoa học dữ liệu để phân tích dữ liệu bán hàng trong quá khứ và dự báo doanh số cho quý tiếp theo, đây là một ví dụ về ứng dụng nào của Khoa học dữ liệu?

  • A. Phát hiện gian lận.
  • B. Tự động hóa công việc lặp đi lặp lại.
  • C. Dự báo và lập kế hoạch.
  • D. Cải thiện trải nghiệm khách hàng.

Câu 26: Việc thu thập dữ liệu từ các nguồn khác nhau như cơ sở dữ liệu nội bộ, mạng xã hội, cảm biến, v.v., và kết hợp chúng lại để phân tích liên quan trực tiếp đến chữ V nào của Big Data?

  • A. Volume (Khối lượng).
  • B. Variety (Đa dạng).
  • C. Velocity (Vận tốc).
  • D. Veracity (Tính xác thực).

Câu 27: Tại sao việc đánh giá mô hình (Model Evaluation) là một bước cần thiết trong quy trình Khoa học dữ liệu?

  • A. Để làm cho mô hình phức tạp hơn.
  • B. Để giảm kích thước của dữ liệu huấn luyện.
  • C. Để trực quan hóa dữ liệu đầu vào.
  • D. Để xác định xem mô hình có hoạt động tốt như mong đợi hay không và sẵn sàng để triển khai.

Câu 28: Khi một nhà khoa học dữ liệu sử dụng biểu đồ phân tán (scatter plot) để kiểm tra mối quan hệ giữa hai biến số (ví dụ: số giờ học và điểm thi), họ đang thực hiện loại phân tích nào ở giai đoạn đầu của quy trình?

  • A. Phân tích khám phá dữ liệu (Exploratory Data Analysis - EDA).
  • B. Triển khai mô hình.
  • C. Thu thập dữ liệu.
  • D. Làm sạch dữ liệu.

Câu 29: Một trong những lợi ích chính mà Khoa học dữ liệu mang lại cho các tổ chức là gì?

  • A. Loại bỏ hoàn toàn nhu cầu về con người trong quá trình ra quyết định.
  • B. Chỉ giúp giải quyết các bài toán học thuật.
  • C. Giúp đưa ra các quyết định dựa trên bằng chứng và dữ liệu, từ đó nâng cao hiệu quả hoạt động và khả năng cạnh tranh.
  • D. Tăng chi phí hoạt động một cách không cần thiết.

Câu 30: Để thực hiện các tác vụ trong Khoa học dữ liệu, các nhà khoa học dữ liệu thường sử dụng các ngôn ngữ lập trình phổ biến nào có thư viện hỗ trợ mạnh mẽ cho xử lý, phân tích và học máy?

  • A. HTML và CSS.
  • B. Pascal và C++.
  • C. SQL (chỉ là ngôn ngữ truy vấn cơ sở dữ liệu).
  • D. Python và R.

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 9

Khi một nhà khoa học dữ liệu tạo ra một biểu đồ đường (line chart) để hiển thị xu hướng doanh thu của công ty qua các tháng, họ đang thực hiện giai đoạn nào trong quy trình Khoa học dữ liệu?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 9

Một dự án Khoa học dữ liệu thành công thường bắt đầu bằng việc hiểu rõ vấn đề cần giải quyết và mục tiêu kinh doanh. Bước này thường được gọi là gì trong quy trình Khoa học dữ liệu?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 9

Trong Khoa học dữ liệu, 'Mô hình' (Model) là gì?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 9

Khi một công ty sử dụng Khoa học dữ liệu để phân tích dữ liệu bán hàng trong quá khứ và dự báo doanh số cho quý tiếp theo, đây là một ví dụ về ứng dụng nào của Khoa học dữ liệu?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 9

Việc thu thập dữ liệu từ các nguồn khác nhau như cơ sở dữ liệu nội bộ, mạng xã hội, cảm biến, v.v., và kết hợp chúng lại để phân tích liên quan trực tiếp đến chữ V nào của Big Data?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 9

Tại sao việc đánh giá mô hình (Model Evaluation) là một bước cần thiết trong quy trình Khoa học dữ liệu?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 9

Khi một nhà khoa học dữ liệu sử dụng biểu đồ phân tán (scatter plot) để kiểm tra mối quan hệ giữa hai biến số (ví dụ: số giờ học và điểm thi), họ đang thực hiện loại phân tích nào ở giai đoạn đầu của quy trình?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 9

Một trong những lợi ích chính mà Khoa học dữ liệu mang lại cho các tổ chức là gì?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 9

Để thực hiện các tác vụ trong Khoa học dữ liệu, các nhà khoa học dữ liệu thường sử dụng các ngôn ngữ lập trình phổ biến nào có thư viện hỗ trợ mạnh mẽ cho xử lý, phân tích và học máy?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Liên kết và thanh điều hướng

Tags: Bộ đề 9

Câu 1: Trong cấu trúc một trang web, liên kết (hyperlink) đóng vai trò quan trọng nhất trong việc gì?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Liên kết và thanh điều hướng

Tags: Bộ đề 9

Câu 2: Xem xét đoạn mã HTML sau: `Truy cập VietJack`. Khi người dùng nhấp vào liên kết này, điều gì sẽ xảy ra?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Liên kết và thanh điều hướng

Tags: Bộ đề 9

Câu 3: Để tạo một liên kết đến một phần cụ thể (ví dụ: phần Liên hệ với `id="contact"`) trên cùng một trang web, cú pháp `href` nào sau đây là đúng?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Liên kết và thanh điều hướng

Tags: Bộ đề 9

Câu 4: Thanh điều hướng (navigation bar) trên một trang web thường được đặt ở vị trí nào và có mục đích chính là gì?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Liên kết và thanh điều hướng

Tags: Bộ đề 9

Câu 5: Một website có cấu trúc hình cây với trang chủ là gốc. Trang 'Giới thiệu' là trang con trực tiếp của trang chủ. Trang 'Lịch sử phát triển' là trang con của trang 'Giới thiệu'. Mối quan hệ giữa trang 'Lịch sử phát triển' và trang chủ là gì?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Liên kết và thanh điều hướng

Tags: Bộ đề 9

Câu 6: Khi thiết kế thanh điều hướng cho một website có nhiều trang, việc nhóm các liên kết liên quan lại với nhau (ví dụ: tất cả các liên kết về 'Sản phẩm' nằm trong một mục) mang lại lợi ích gì cho người dùng?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Liên kết và thanh điều hướng

Tags: Bộ đề 9

Câu 7: Đoạn mã HTML nào sau đây tạo ra một liên kết đến địa chỉ email `info@example.com`?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Liên kết và thanh điều hướng

Tags: Bộ đề 9

Câu 8: Trong ngữ cảnh của liên kết, URL tương đối (relative URL) khác với URL tuyệt đối (absolute URL) ở điểm nào?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Liên kết và thanh điều hướng

Tags: Bộ đề 9

Câu 9: Nếu bạn đang ở trang `/products/categoryA/page1.html` và muốn tạo liên kết đến trang `/products/categoryB/page2.html`, thuộc tính `href` nào sau đây sử dụng URL tương đối là đúng?

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Liên kết và thanh điều hướng

Tags: Bộ đề 9

Câu 16: Xem xét đoạn mã HTML cho một thanh điều hướng: `

`. Nếu bạn muốn làm cho liên kết 'Sản phẩm' nổi bật hơn khi người dùng đang ở trang sản phẩm, bạn sẽ chủ yếu sử dụng ngôn ngữ nào?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Liên kết và thanh điều hướng

Tags: Bộ đề 9

Câu 21: Để tạo liên kết đến một số điện thoại cụ thể (ví dụ: `+84123456789`) sao cho người dùng trên thiết bị di động có thể nhấp để gọi, cú pháp `href` nào sau đây là đúng?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 10

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu - Đề 10 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về hành vi duyệt web, lịch sử mua hàng và thông tin nhân khẩu học của hàng triệu khách hàng mỗi ngày. Họ muốn sử dụng dữ liệu này để đề xuất sản phẩm phù hợp cho từng khách hàng và dự đoán xu hướng mua sắm. Lĩnh vực nào giúp công ty đạt được mục tiêu này một cách hiệu quả nhất?

  • A. Hệ điều hành
  • B. Thiết kế đồ họa
  • C. Khoa học dữ liệu
  • D. Phát triển phần cứng

Câu 2: Khoa học dữ liệu là một lĩnh vực liên ngành. Ba trụ cột kiến thức chính tạo nên nền tảng của Khoa học dữ liệu là gì?

  • A. Ngôn ngữ học, Lịch sử, Triết học
  • B. Vật lý, Hóa học, Sinh học
  • C. Kỹ thuật cơ khí, Kiến trúc, Xây dựng
  • D. Khoa học máy tính, Toán học, Thống kê

Câu 3: Mục tiêu cốt lõi và cuối cùng của Khoa học dữ liệu là gì?

  • A. Khai thác tri thức và hỗ trợ đưa ra quyết định dựa trên dữ liệu
  • B. Chỉ đơn thuần là lưu trữ và bảo quản dữ liệu một cách an toàn
  • C. Phát triển các thuật toán nén dữ liệu hiệu quả
  • D. Tạo ra các giao diện người dùng thân thiện cho cơ sở dữ liệu

Câu 4: Một tổ chức y tế thu thập một lượng lớn dữ liệu từ các cảm biến theo dõi sức khỏe đeo tay, hồ sơ bệnh án điện tử và kết quả xét nghiệm gen. Đặc điểm nào của dữ liệu này thể hiện rõ nhất tính "Variety" (Đa dạng) trong khái niệm Dữ liệu lớn (Big Data)?

  • A. Số lượng bệnh nhân rất lớn
  • B. Dữ liệu đến từ nhiều nguồn và định dạng khác nhau (cảm biến, văn bản, số liệu)
  • C. Dữ liệu được cập nhật liên tục theo thời gian thực
  • D. Dữ liệu chứa đựng thông tin có giá trị cho nghiên cứu y học

Câu 5: Một sàn giao dịch chứng khoán xử lý hàng triệu giao dịch mỗi giây. Dữ liệu từ các giao dịch này cần được phân tích gần như ngay lập tức để phát hiện các hoạt động bất thường hoặc đưa ra quyết định giao dịch tự động. Đặc điểm nào của dữ liệu này thể hiện rõ nhất tính "Velocity" (Vận tốc) trong khái niệm Dữ liệu lớn (Big Data)?

  • A. Kích thước của tập dữ liệu ngày càng tăng
  • B. Dữ liệu bao gồm nhiều loại thông tin khác nhau (giá, khối lượng, thời gian)
  • C. Tốc độ dữ liệu được tạo ra, thu thập và xử lý là cực kỳ nhanh
  • D. Dữ liệu có thể chứa sai sót hoặc không chính xác

Câu 6: Một công ty nghiên cứu thị trường thu thập dữ liệu từ các bài đăng trên mạng xã hội, bình luận của khách hàng và các bài báo trực tuyến để phân tích cảm xúc của công chúng về một sản phẩm mới. Họ nhận thấy rằng dữ liệu này thường chứa ngôn ngữ không chuẩn, viết tắt, hoặc thông tin mâu thuẫn. Đặc điểm nào của dữ liệu này thể hiện rõ nhất tính "Veracity" (Tính xác thực) trong khái niệm Dữ liệu lớn (Big Data)?

  • A. Độ tin cậy, tính chính xác và tính nhất quán của dữ liệu
  • B. Tốc độ xử lý dữ liệu nhanh chóng
  • C. Số lượng dữ liệu được thu thập
  • D. Khả năng tạo ra lợi ích kinh tế từ dữ liệu

Câu 7: Trong quy trình Khoa học dữ liệu, bước nào thường bao gồm việc xử lý các giá trị thiếu, loại bỏ dữ liệu ngoại lai (outliers), và chuẩn hóa định dạng dữ liệu?

  • A. Thu thập dữ liệu
  • B. Làm sạch và tiền xử lý dữ liệu
  • C. Trực quan hóa dữ liệu
  • D. Xây dựng mô hình

Câu 8: Một nhà khoa học dữ liệu tạo ra một biểu đồ cột cho thấy doanh số bán hàng theo từng tháng trong năm và một biểu đồ phân tán biểu diễn mối quan hệ giữa chi phí quảng cáo và doanh thu. Hoạt động này thuộc bước nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Làm sạch dữ liệu
  • C. Trực quan hóa và khám phá dữ liệu
  • D. Triển khai mô hình

Câu 9: Bước nào trong quy trình Khoa học dữ liệu tập trung vào việc áp dụng các thuật toán thống kê hoặc học máy để tìm ra các mẫu, mối quan hệ hoặc xây dựng khả năng dự đoán từ dữ liệu đã được làm sạch?

  • A. Thu thập dữ liệu
  • B. Làm sạch dữ liệu
  • C. Trực quan hóa dữ liệu
  • D. Xây dựng mô hình và phân tích chuyên sâu

Câu 10: Sau khi xây dựng và đánh giá một mô hình dự đoán, bước tiếp theo trong quy trình Khoa học dữ liệu thường là đưa mô hình đó vào sử dụng trong thực tế, ví dụ như tích hợp nó vào một ứng dụng web hoặc hệ thống kinh doanh. Bước này được gọi là gì?

  • A. Triển khai và giám sát
  • B. Thu thập thêm dữ liệu
  • C. Thay đổi thuật toán
  • D. Viết báo cáo tổng kết

Câu 11: Tại sao việc có kiến thức chuyên ngành (domain knowledge) lại quan trọng đối với một nhà Khoa học dữ liệu, đặc biệt khi làm việc với dữ liệu trong một lĩnh vực cụ thể như y tế, tài chính hoặc giáo dục?

  • A. Chỉ để hiểu cách sử dụng các phần mềm chuyên dụng
  • B. Để hiểu ý nghĩa của dữ liệu, đặt câu hỏi đúng và diễn giải kết quả phân tích một cách chính xác trong ngữ cảnh của lĩnh vực đó
  • C. Để có thể tự động thu thập dữ liệu mà không cần sự hỗ trợ
  • D. Chỉ cần thiết khi làm việc với dữ liệu cấu trúc

Câu 12: Một trong những thành tựu nổi bật của Khoa học dữ liệu là khả năng phát hiện các giao dịch tài chính đáng ngờ hoặc các hành vi bất thường trong hệ thống. Ứng dụng này thuộc về lĩnh vực nào?

  • A. Dự báo thời tiết
  • B. Thiết kế kiến trúc
  • C. Phát hiện gian lận
  • D. Nghiên cứu ngôn ngữ cổ

Câu 13: Việc sử dụng Khoa học dữ liệu để phân tích hành vi của khách hàng trên website, từ đó đưa ra các gợi ý sản phẩm hoặc nội dung phù hợp với sở thích cá nhân của họ, là một ví dụ về ứng dụng nào?

  • A. Cải thiện trải nghiệm khách hàng
  • B. Tự động hóa quy trình sản xuất
  • C. Quản lý chuỗi cung ứng
  • D. Phân tích hình ảnh y tế

Câu 14: Học máy (Machine Learning) là một tập con quan trọng của AI, cho phép hệ thống học từ dữ liệu mà không cần được lập trình tường minh. Mối quan hệ giữa Học máy và Khoa học dữ liệu là gì?

  • A. Học máy là một lĩnh vực hoàn toàn độc lập với Khoa học dữ liệu
  • B. Khoa học dữ liệu chỉ là một ứng dụng nhỏ của Học máy
  • C. Học máy đã thay thế hoàn toàn Khoa học dữ liệu
  • D. Học máy là một công cụ, kỹ thuật cốt lõi được sử dụng rộng rãi trong Khoa học dữ liệu để xây dựng mô hình và trích xuất tri thức

Câu 15: Trí tuệ nhân tạo (AI), Học máy (ML) và Khoa học dữ liệu (DS) là ba lĩnh vực có mối liên hệ chặt chẽ. Phát biểu nào sau đây mô tả đúng nhất mối quan hệ này?

  • A. AI là tập con của ML, ML là tập con của DS
  • B. DS sử dụng các kỹ thuật từ ML và AI để đạt được mục tiêu của mình; ML là tập con của AI và là công cụ quan trọng trong DS
  • C. DS, ML, AI là ba lĩnh vực hoàn toàn tách biệt và không liên quan
  • D. AI và ML chỉ tập trung vào robot, còn DS chỉ tập trung vào số liệu thống kê

Câu 16: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn từ các cảm biến IoT trong nhà máy. Anh ấy nhận thấy rằng dữ liệu từ một số cảm biến bị nhiễu nặng và có nhiều giá trị không hợp lệ. Công việc xử lý loại bỏ hoặc sửa chữa những dữ liệu này thuộc về giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Làm sạch dữ liệu (Data Cleaning)
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Xây dựng mô hình (Modeling)
  • D. Triển khai mô hình (Deployment)

Câu 17: Khi phân tích dữ liệu bán hàng, một nhà khoa học dữ liệu nhận thấy rằng có mối tương quan mạnh mẽ giữa việc khách hàng mua sản phẩm A và sau đó mua sản phẩm B trong vòng một tuần. Việc tìm ra mối quan hệ này thuộc về hoạt động nào trong Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Làm sạch dữ liệu
  • C. Triển khai mô hình
  • D. Phân tích và khám phá dữ liệu

Câu 18: Thử thách lớn nhất khi làm việc với dữ liệu lớn (Big Data) so với dữ liệu truyền thống thường nằm ở đâu?

  • A. Chỉ là việc sử dụng các phần mềm văn phòng phức tạp hơn
  • B. Yêu cầu các công cụ, hạ tầng và kỹ thuật xử lý đặc thù do kích thước, tốc độ và sự đa dạng vượt trội
  • C. Chỉ cần nhiều người nhập dữ liệu hơn
  • D. Không có khác biệt đáng kể so với dữ liệu thông thường

Câu 19: Một công ty muốn sử dụng Khoa học dữ liệu để dự đoán nhu cầu sản phẩm trong các tháng tới nhằm tối ưu hóa lượng hàng tồn kho. Ứng dụng này của Khoa học dữ liệu thuộc loại nào?

  • A. Phân tích dự đoán (Predictive Analytics)
  • B. Phân tích mô tả (Descriptive Analytics)
  • C. Trực quan hóa dữ liệu (Data Visualization)
  • D. Làm sạch dữ liệu (Data Cleaning)

Câu 20: Để hiểu rõ hơn về phân phối độ tuổi của người dùng ứng dụng di động của mình, một công ty sử dụng Khoa học dữ liệu để tạo biểu đồ tần suất hoặc histogram. Hoạt động này chủ yếu phục vụ mục đích gì trong quy trình Khoa học dữ liệu?

  • A. Xây dựng mô hình phức tạp
  • B. Triển khai hệ thống sản phẩm
  • C. Thu thập dữ liệu mới
  • D. Khám phá và hiểu dữ liệu ban đầu

Câu 21: Một trong những thách thức đạo đức quan trọng nhất trong Khoa học dữ liệu là vấn đề thiên vị (bias) trong dữ liệu hoặc trong thuật toán. Điều này có thể dẫn đến hậu quả tiêu cực nào?

  • A. Giảm tốc độ xử lý dữ liệu
  • B. Đưa ra các quyết định không công bằng hoặc phân biệt đối xử đối với một nhóm người
  • C. Làm cho biểu đồ dữ liệu khó hiểu hơn
  • D. Tăng chi phí lưu trữ dữ liệu

Câu 22: Một tập dữ liệu bao gồm các bài đăng trên mạng xã hội, hình ảnh từ camera an ninh và bản ghi âm cuộc gọi. Loại dữ liệu này được phân loại chủ yếu là gì trong Khoa học dữ liệu?

  • A. Dữ liệu cấu trúc (Structured Data)
  • B. Dữ liệu bán cấu trúc (Semi-structured Data)
  • C. Dữ liệu phi cấu trúc (Unstructured Data)
  • D. Dữ liệu định lượng (Quantitative Data)

Câu 23: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại là một bước quan trọng trong cả giai đoạn khám phá dữ liệu và truyền đạt kết quả phân tích?

  • A. Giúp con người dễ dàng nhận diện xu hướng, mẫu hình và thông tin quan trọng mà khó thấy được từ dữ liệu thô hoặc bảng số
  • B. Là cách duy nhất để làm sạch dữ liệu bị lỗi
  • C. Chỉ cần thiết khi làm việc với dữ liệu số
  • D. Thay thế hoàn toàn nhu cầu xây dựng mô hình thống kê

Câu 24: Một công ty tài chính sử dụng Khoa học dữ liệu để xây dựng một hệ thống chấm điểm tín dụng tự động dựa trên lịch sử giao dịch và thông tin cá nhân của khách hàng. Hệ thống này giúp công ty nhanh chóng đưa ra quyết định cho vay. Đây là một ví dụ về thành tựu nào của Khoa học dữ liệu?

  • A. Khám phá vũ trụ
  • B. Chụp ảnh nghệ thuật
  • C. Phát triển vật liệu mới
  • D. Tự động hóa và tối ưu hóa quy trình ra quyết định

Câu 25: Trong bối cảnh Dữ liệu lớn (Big Data), "Volume" (Khối lượng) đề cập đến điều gì?

  • A. Tốc độ dữ liệu thay đổi
  • B. Quy mô và số lượng dữ liệu được tạo ra và lưu trữ
  • C. Số lượng loại dữ liệu khác nhau
  • D. Mức độ chính xác của dữ liệu

Câu 26: Công ty A muốn hiểu lý do tại sao một số khách hàng lại ngừng sử dụng dịch vụ của họ (churn). Họ thu thập dữ liệu về tương tác của khách hàng, thông tin tài khoản và phản hồi từ các cuộc khảo sát. Bằng cách phân tích dữ liệu này, họ hy vọng tìm ra các yếu tố dự báo khách hàng có khả năng rời đi. Đây là một bài toán điển hình trong Khoa học dữ liệu, thuộc loại nào?

  • A. Phân tích hình ảnh
  • B. Xử lý ngôn ngữ tự nhiên đơn giản
  • C. Phân tích dự đoán (ví dụ: dự đoán churn)
  • D. Trực quan hóa dữ liệu tĩnh

Câu 27: Giả sử bạn có một tập dữ liệu về các ngôi nhà bao gồm diện tích, số phòng ngủ, vị trí và giá bán. Bạn muốn xây dựng một mô hình để dự đoán giá bán của một ngôi nhà mới dựa trên các đặc điểm của nó. Bài toán này trong Khoa học dữ liệu thường được giải quyết bằng kỹ thuật nào?

  • A. Hồi quy (Regression)
  • B. Phân loại (Classification)
  • C. Phân cụm (Clustering)
  • D. Phát hiện luật kết hợp (Association Rule Mining)

Câu 28: Một nhà khoa học dữ liệu được yêu cầu phân nhóm các khách hàng của một siêu thị thành các phân khúc dựa trên hành vi mua sắm của họ mà không có nhãn (label) định trước về các nhóm này. Kỹ thuật học máy nào thường được sử dụng cho loại bài toán này?

  • A. Hồi quy tuyến tính (Linear Regression)
  • B. Cây quyết định (Decision Tree - Classification)
  • C. Mạng nơ-ron tích chập (Convolutional Neural Network)
  • D. Phân cụm (Clustering)

Câu 29: Khi làm việc với dữ liệu từ các cuộc khảo sát, bạn nhận thấy rằng một số người trả lời bỏ qua câu hỏi về thu nhập. Việc xử lý các "giá trị thiếu" (missing values) này đòi hỏi kỹ năng và kiến thức từ lĩnh vực nào trong nền tảng của Khoa học dữ liệu?

  • A. Thiết kế giao diện người dùng
  • B. Thống kê và tiền xử lý dữ liệu
  • C. Lập trình nhúng
  • D. Quản trị mạng

Câu 30: Công ty X muốn xây dựng một hệ thống đề xuất phim cho người dùng dựa trên lịch sử xem của họ và của những người dùng tương tự. Hệ thống này là một ứng dụng cụ thể của:

  • A. Khoa học dữ liệu và Học máy (Machine Learning)
  • B. Thiết kế cơ sở dữ liệu quan hệ
  • C. Phát triển ứng dụng di động
  • D. Bảo trì phần cứng máy tính

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về hành vi duyệt web, lịch sử mua hàng và thông tin nhân khẩu học của hàng triệu khách hàng mỗi ngày. Họ muốn sử dụng dữ liệu này để đề xuất sản phẩm phù hợp cho từng khách hàng và dự đoán xu hướng mua sắm. Lĩnh vực nào giúp công ty đạt được mục tiêu này một cách hiệu quả nhất?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 2: Khoa học dữ liệu là một lĩnh vực liên ngành. Ba trụ cột kiến thức chính tạo nên nền tảng của Khoa học dữ liệu là gì?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 3: Mục tiêu cốt lõi và cuối cùng của Khoa học dữ liệu là gì?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 4: Một tổ chức y tế thu thập một lượng lớn dữ liệu từ các cảm biến theo dõi sức khỏe đeo tay, hồ sơ bệnh án điện tử và kết quả xét nghiệm gen. Đặc điểm nào của dữ liệu này thể hiện rõ nhất tính 'Variety' (Đa dạng) trong khái niệm Dữ liệu lớn (Big Data)?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 5: Một sàn giao dịch chứng khoán xử lý hàng triệu giao dịch mỗi giây. Dữ liệu từ các giao dịch này cần được phân tích gần như ngay lập tức để phát hiện các hoạt động bất thường hoặc đưa ra quyết định giao dịch tự động. Đặc điểm nào của dữ liệu này thể hiện rõ nhất tính 'Velocity' (Vận tốc) trong khái niệm Dữ liệu lớn (Big Data)?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 6: Một công ty nghiên cứu thị trường thu thập dữ liệu từ các bài đăng trên mạng xã hội, bình luận của khách hàng và các bài báo trực tuyến để phân tích cảm xúc của công chúng về một sản phẩm mới. Họ nhận thấy rằng dữ liệu này thường chứa ngôn ngữ không chuẩn, viết tắt, hoặc thông tin mâu thuẫn. Đặc điểm nào của dữ liệu này thể hiện rõ nhất tính 'Veracity' (Tính xác thực) trong khái niệm Dữ liệu lớn (Big Data)?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 7: Trong quy trình Khoa học dữ liệu, bước nào thường bao gồm việc xử lý các giá trị thiếu, loại bỏ dữ liệu ngoại lai (outliers), và chuẩn hóa định dạng dữ liệu?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 8: Một nhà khoa học dữ liệu tạo ra một biểu đồ cột cho thấy doanh số bán hàng theo từng tháng trong năm và một biểu đồ phân tán biểu diễn mối quan hệ giữa chi phí quảng cáo và doanh thu. Hoạt động này thuộc bước nào trong quy trình Khoa học dữ liệu?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 9: Bước nào trong quy trình Khoa học dữ liệu tập trung vào việc áp dụng các thuật toán thống kê hoặc học máy để tìm ra các mẫu, mối quan hệ hoặc xây dựng khả năng dự đoán từ dữ liệu đã được làm sạch?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 10: Sau khi xây dựng và đánh giá một mô hình dự đoán, bước tiếp theo trong quy trình Khoa học dữ liệu thường là đưa mô hình đó vào sử dụng trong thực tế, ví dụ như tích hợp nó vào một ứng dụng web hoặc hệ thống kinh doanh. Bước này được gọi là gì?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 11: Tại sao việc có kiến thức chuyên ngành (domain knowledge) lại quan trọng đối với một nhà Khoa học dữ liệu, đặc biệt khi làm việc với dữ liệu trong một lĩnh vực cụ thể như y tế, tài chính hoặc giáo dục?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 12: Một trong những thành tựu nổi bật của Khoa học dữ liệu là khả năng phát hiện các giao dịch tài chính đáng ngờ hoặc các hành vi bất thường trong hệ thống. Ứng dụng này thuộc về lĩnh vực nào?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 13: Việc sử dụng Khoa học dữ liệu để phân tích hành vi của khách hàng trên website, từ đó đưa ra các gợi ý sản phẩm hoặc nội dung phù hợp với sở thích cá nhân của họ, là một ví dụ về ứng dụng nào?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 14: Học máy (Machine Learning) là một tập con quan trọng của AI, cho phép hệ thống học từ dữ liệu mà không cần được lập trình tường minh. Mối quan hệ giữa Học máy và Khoa học dữ liệu là gì?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 15: Trí tuệ nhân tạo (AI), Học máy (ML) và Khoa học dữ liệu (DS) là ba lĩnh vực có mối liên hệ chặt chẽ. Phát biểu nào sau đây mô tả đúng nhất mối quan hệ này?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 16: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn từ các cảm biến IoT trong nhà máy. Anh ấy nhận thấy rằng dữ liệu từ một số cảm biến bị nhiễu nặng và có nhiều giá trị không hợp lệ. Công việc xử lý loại bỏ hoặc sửa chữa những dữ liệu này thuộc về giai đoạn nào trong quy trình Khoa học dữ liệu?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 17: Khi phân tích dữ liệu bán hàng, một nhà khoa học dữ liệu nhận thấy rằng có mối tương quan mạnh mẽ giữa việc khách hàng mua sản phẩm A và sau đó mua sản phẩm B trong vòng một tuần. Việc tìm ra mối quan hệ này thuộc về hoạt động nào trong Khoa học dữ liệu?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 18: Thử thách lớn nhất khi làm việc với dữ liệu lớn (Big Data) so với dữ liệu truyền thống thường nằm ở đâu?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 19: Một công ty muốn sử dụng Khoa học dữ liệu để dự đoán nhu cầu sản phẩm trong các tháng tới nhằm tối ưu hóa lượng hàng tồn kho. Ứng dụng này của Khoa học dữ liệu thuộc loại nào?

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 20: Để hiểu rõ hơn về phân phối độ tuổi của người dùng ứng dụng di động của mình, một công ty sử dụng Khoa học dữ liệu để tạo biểu đồ tần suất hoặc histogram. Hoạt động này chủ yếu phục vụ mục đích gì trong quy trình Khoa học dữ liệu?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 21: Một trong những thách thức đạo đức quan trọng nhất trong Khoa học dữ liệu là vấn đề thiên vị (bias) trong dữ liệu hoặc trong thuật toán. Điều này có thể dẫn đến hậu quả tiêu cực nào?

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 22: Một tập dữ liệu bao gồm các bài đăng trên mạng xã hội, hình ảnh từ camera an ninh và bản ghi âm cuộc gọi. Loại dữ liệu này được phân loại chủ yếu là gì trong Khoa học dữ liệu?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 23: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại là một bước quan trọng trong cả giai đoạn khám phá dữ liệu và truyền đạt kết quả phân tích?

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 24: Một công ty tài chính sử dụng Khoa học dữ liệu để xây dựng một hệ thống chấm điểm tín dụng tự động dựa trên lịch sử giao dịch và thông tin cá nhân của khách hàng. Hệ thống này giúp công ty nhanh chóng đưa ra quyết định cho vay. Đây là một ví dụ về thành tựu nào của Khoa học dữ liệu?

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 25: Trong bối cảnh Dữ liệu lớn (Big Data), 'Volume' (Khối lượng) đề cập đến điều gì?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 26: Công ty A muốn hiểu lý do tại sao một số khách hàng lại ngừng sử dụng dịch vụ của họ (churn). Họ thu thập dữ liệu về tương tác của khách hàng, thông tin tài khoản và phản hồi từ các cuộc khảo sát. Bằng cách phân tích dữ liệu này, họ hy vọng tìm ra các yếu tố dự báo khách hàng có khả năng rời đi. Đây là một bài toán điển hình trong Khoa học dữ liệu, thuộc loại nào?

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 27: Giả sử bạn có một tập dữ liệu về các ngôi nhà bao gồm diện tích, số phòng ngủ, vị trí và giá bán. Bạn muốn xây dựng một mô hình để dự đoán giá bán của một ngôi nhà mới dựa trên các đặc điểm của nó. Bài toán này trong Khoa học dữ liệu thường được giải quyết bằng kỹ thuật nào?

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 28: Một nhà khoa học dữ liệu được yêu cầu phân nhóm các khách hàng của một siêu thị thành các phân khúc dựa trên hành vi mua sắm của họ mà không có nhãn (label) định trước về các nhóm này. Kỹ thuật học máy nào thường được sử dụng cho loại bài toán này?

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 29: Khi làm việc với dữ liệu từ các cuộc khảo sát, bạn nhận thấy rằng một số người trả lời bỏ qua câu hỏi về thu nhập. Việc xử lý các 'giá trị thiếu' (missing values) này đòi hỏi kỹ năng và kiến thức từ lĩnh vực nào trong nền tảng của Khoa học dữ liệu?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 30: Công ty X muốn xây dựng một hệ thống đề xuất phim cho người dùng dựa trên lịch sử xem của họ và của những người dùng tương tự. Hệ thống này là một ứng dụng cụ thể của:

Xem kết quả