15+ Đề Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Đề 01

Đề 02

Đề 03

Đề 04

Đề 05

Đề 06

Đề 07

Đề 08

Đề 09

Đề 10

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 01

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 01 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Đâu là phát biểu đúng nhất về bản chất liên ngành của Khoa học Dữ liệu?

  • A. Khoa học Dữ liệu là một nhánh của Toán học ứng dụng, tập trung vào thống kê.
  • B. Khoa học Dữ liệu chủ yếu là về lập trình máy tính để xử lý lượng lớn thông tin.
  • C. Khoa học Dữ liệu chỉ áp dụng trong lĩnh vực công nghệ thông tin và truyền thông.
  • D. Khoa học Dữ liệu kết hợp Toán học, Thống kê, Khoa học Máy tính và kiến thức предмет domain để giải quyết vấn đề.

Câu 2: Trong quy trình phân tích dữ liệu, giai đoạn "chuẩn bị dữ liệu" bao gồm công việc chủ yếu nào?

  • A. Xây dựng mô hình toán học phức tạp để phân tích dữ liệu.
  • B. Làm sạch, chuyển đổi và tích hợp dữ liệu từ nhiều nguồn khác nhau.
  • C. Trình bày kết quả phân tích dữ liệu dưới dạng đồ thị và báo cáo.
  • D. Thu thập dữ liệu thô từ các nguồn như cảm biến, khảo sát, hoặc cơ sở dữ liệu.

Câu 3: Mục tiêu quan trọng nhất của việc trực quan hóa dữ liệu trong Khoa học Dữ liệu là gì?

  • A. Làm cho báo cáo dữ liệu trở nên đẹp mắt và hấp dẫn hơn về mặt hình thức.
  • B. Giảm dung lượng lưu trữ của dữ liệu bằng cách chuyển đổi sang định dạng hình ảnh.
  • C. Giúp con người dễ dàng nhận diện xu hướng, mẫu hình và thông tin ẩn sâu trong dữ liệu.
  • D. Thay thế hoàn toàn việc phân tích dữ liệu bằng các phương pháp thống kê truyền thống.

Câu 4: Xét tình huống một công ty thương mại điện tử muốn dự đoán khả năng khách hàng hủy đơn hàng sau khi đặt. Đây là ứng dụng của kỹ thuật nào trong Khoa học Dữ liệu?

  • A. Mô hình hóa dự đoán (Predictive Modeling)
  • B. Thống kê mô tả (Descriptive Statistics)
  • C. Khai phá luật kết hợp (Association Rule Mining)
  • D. Phân cụm dữ liệu (Data Clustering)

Câu 5: Trong dự án "Bộ gen người" (HGP), Khoa học Dữ liệu đã đóng góp chủ yếu vào giai đoạn nào?

  • A. Thu thập mẫu DNA từ hàng ngàn người trên khắp thế giới.
  • B. Phân tích và giải mã trình tự gen khổng lồ để xác định chức năng gen.
  • C. Phát triển các thiết bị thí nghiệm mới để giải trình tự gen nhanh hơn.
  • D. Tổ chức và quản lý dữ liệu hành chính của dự án HGP.

Câu 6: Hệ thống "Giám sát đánh bắt cá toàn cầu" (Global Fishing Watch) ứng dụng Khoa học Dữ liệu để giải quyết vấn đề chính nào?

  • A. Dự báo trữ lượng cá ở các vùng biển khác nhau trên thế giới.
  • B. Tối ưu hóa lịch trình và tuyến đường di chuyển cho tàu đánh cá.
  • C. Phát hiện và ngăn chặn hoạt động đánh bắt cá trái phép, không báo cáo.
  • D. Nghiên cứu tác động của biến đổi khí hậu đến hệ sinh thái biển.

Câu 7: Mô hình ngôn ngữ lớn (LLM) như GPT-3 thể hiện rõ nhất thành tựu của Khoa học Dữ liệu trong lĩnh vực nào?

  • A. Phân tích hình ảnh y tế để chẩn đoán bệnh.
  • B. Dự báo thời tiết và biến đổi khí hậu.
  • C. Phát hiện gian lận trong giao dịch tài chính.
  • D. Xử lý ngôn ngữ tự nhiên và tạo sinh văn bản.

Câu 8: Trong bài toán phát hiện gian lận thẻ tín dụng, việc sử dụng mô hình học máy giúp cải thiện điều gì so với phương pháp thủ công?

  • A. Giảm chi phí thuê nhân viên kiểm tra thủ công.
  • B. Tăng tốc độ và độ chính xác trong việc xác định giao dịch gian lận.
  • C. Đảm bảo bảo mật thông tin cá nhân của khách hàng tốt hơn.
  • D. Cải thiện trải nghiệm người dùng khi sử dụng thẻ tín dụng.

Câu 9: Kính thiên văn Kepler thu thập dữ liệu chủ yếu về đặc điểm nào của các ngôi sao để tìm kiếm hành tinh?

  • A. Độ sáng
  • B. Nhiệt độ bề mặt
  • C. Thành phần hóa học
  • D. Kích thước và khối lượng

Câu 10: Giai đoạn "đánh giá và giải thích" trong quy trình Khoa học Dữ liệu tập trung vào điều gì?

  • A. Thu thập dữ liệu mới nếu dữ liệu hiện có không đủ.
  • B. Lựa chọn thuật toán phân tích dữ liệu phù hợp nhất.
  • C. Rút ra kết luận ý nghĩa từ kết quả phân tích và truyền đạt chúng.
  • D. Xây dựng giao diện người dùng để tương tác với dữ liệu.

Câu 11: Để xác định mối quan hệ giữa mức độ ô nhiễm không khí và tỷ lệ nhập viện vì bệnh hô hấp tại một thành phố, phương pháp phân tích dữ liệu nào sau đây là phù hợp nhất?

  • A. Phân cụm (Clustering)
  • B. Hồi quy (Regression)
  • C. Phân loại (Classification)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 12: Một nhà khoa học dữ liệu cần kỹ năng quan trọng nào để làm việc hiệu quả với dữ liệu phi cấu trúc (ví dụ: văn bản, hình ảnh, video)?

  • A. Thành thạo các ngôn ngữ lập trình bậc thấp như Assembly.
  • B. Có kiến thức sâu rộng về phần cứng máy tính và mạng.
  • C. Kỹ năng tiền xử lý và trích xuất đặc trưng từ dữ liệu phi cấu trúc.
  • D. Khả năng quản lý cơ sở dữ liệu quan hệ SQL phức tạp.

Câu 13: Trong quá trình xây dựng mô hình dự đoán, việc "chia dữ liệu thành tập huấn luyện và tập kiểm thử" nhằm mục đích chính gì?

  • A. Tăng tốc độ huấn luyện mô hình.
  • B. Giảm dung lượng bộ nhớ cần thiết để lưu trữ dữ liệu.
  • C. Đơn giản hóa quá trình xây dựng mô hình.
  • D. Đánh giá khả năng khái quát hóa của mô hình trên dữ liệu mới, chưa từng thấy.

Câu 14: Khi lựa chọn phương pháp trực quan hóa dữ liệu, yếu tố quan trọng nhất cần xem xét là gì?

  • A. Loại dữ liệu và thông điệp muốn truyền tải.
  • B. Sở thích cá nhân của người trình bày dữ liệu.
  • C. Độ phức tạp của công cụ trực quan hóa.
  • D. Màu sắc và hình dạng mặc định của phần mềm trực quan hóa.

Câu 15: Một công ty muốn phân loại khách hàng thành các nhóm khác nhau dựa trên hành vi mua sắm trực tuyến của họ. Kỹ thuật Khoa học Dữ liệu nào sau đây là phù hợp nhất?

  • A. Phân tích chuỗi thời gian (Time Series Analysis)
  • B. Phân tích hồi quy (Regression Analysis)
  • C. Phân cụm (Clustering)
  • D. Phân tích tương quan (Correlation Analysis)

Câu 16: Trong một dự án Khoa học Dữ liệu, việc xác định rõ "vấn đề cần giải quyết" diễn ra ở giai đoạn đầu tiên nào?

  • A. Xác định vấn đề
  • B. Thu thập dữ liệu
  • C. Phân tích dữ liệu
  • D. Trình bày kết quả

Câu 17: "Đạo đức trong Khoa học Dữ liệu" nhấn mạnh đến trách nhiệm nào của người làm khoa học dữ liệu?

  • A. Tối đa hóa lợi nhuận cho doanh nghiệp sử dụng dữ liệu.
  • B. Sử dụng dữ liệu một cách có trách nhiệm, bảo vệ quyền riêng tư và tránh gây hại.
  • C. Phát triển các thuật toán phức tạp nhất, bất kể ứng dụng của chúng.
  • D. Thu thập càng nhiều dữ liệu càng tốt, không cần quan tâm đến nguồn gốc.

Câu 18: Loại dữ liệu nào sau đây không phải là dữ liệu phi cấu trúc?

  • A. Văn bản bài báo
  • B. Hình ảnh chụp X-quang
  • C. Bản ghi âm cuộc gọi
  • D. Bảng dữ liệu bán hàng

Câu 19: Trong Khoa học Dữ liệu, thuật ngữ "feature" (đặc trưng) thường được dùng để chỉ điều gì?

  • A. Phần mềm dùng để phân tích dữ liệu.
  • B. Một thuộc tính hoặc biến số đo lường được của dữ liệu.
  • C. Kết quả phân tích dữ liệu.
  • D. Giai đoạn chuẩn bị dữ liệu.

Câu 20: "Khoa học Dữ liệu" khác biệt với "Thống kê truyền thống" chủ yếu ở điểm nào?

  • A. Thống kê truyền thống sử dụng toán học, còn Khoa học Dữ liệu thì không.
  • B. Khoa học Dữ liệu tập trung vào lý thuyết, còn Thống kê truyền thống thì ứng dụng.
  • C. Khoa học Dữ liệu làm việc với dữ liệu lớn và đa dạng hơn, sử dụng nhiều công cụ máy tính.
  • D. Thống kê truyền thống chỉ dùng cho nghiên cứu khoa học, còn Khoa học Dữ liệu cho kinh doanh.

Câu 21: Để đánh giá hiệu quả của một mô hình phân loại (classification model), chỉ số đánh giá nào sau đây thường được sử dụng?

  • A. Độ chính xác (Accuracy)
  • B. Giá trị trung bình (Mean)
  • C. Phương sai (Variance)
  • D. Độ lệch chuẩn (Standard Deviation)

Câu 22: Công cụ lập trình phổ biến nhất được sử dụng trong Khoa học Dữ liệu là gì?

  • A. Java
  • B. Python
  • C. C++
  • D. JavaScript

Câu 23: Trong quy trình "thu thập dữ liệu", nguồn dữ liệu "API" (Application Programming Interface) là gì?

  • A. Một loại cơ sở dữ liệu quan hệ.
  • B. Một định dạng tập tin văn bản.
  • C. Giao diện cho phép ứng dụng khác nhau trao đổi dữ liệu với nhau.
  • D. Một thiết bị phần cứng thu thập dữ liệu.

Câu 24: "Big Data" (Dữ liệu lớn) có những đặc điểm chính nào (thường được gọi là 3V hoặc 5V)?

  • A. Tính xác thực, bảo mật, và tốc độ.
  • B. Tính đa dạng, dễ sử dụng, và giá trị.
  • C. Dung lượng nhỏ, tốc độ chậm, và cấu trúc đơn giản.
  • D. Dung lượng lớn (Volume), tốc độ cao (Velocity), và đa dạng (Variety).

Câu 25: Kỹ năng "tư duy phản biện" đóng vai trò quan trọng như thế nào trong Khoa học Dữ liệu?

  • A. Không quan trọng, vì Khoa học Dữ liệu chủ yếu dựa vào thuật toán và máy tính.
  • B. Rất quan trọng, giúp đánh giá kết quả phân tích, nhận diện sai sót và đưa ra quyết định đúng đắn.
  • C. Chỉ cần thiết ở giai đoạn trình bày kết quả, không cần trong quá trình phân tích.
  • D. Ít quan trọng hơn so với kỹ năng lập trình và thống kê.

Câu 26: Trong một dự án Khoa học Dữ liệu về y tế, việc sử dụng dữ liệu bệnh nhân cần tuân thủ nguyên tắc đạo đức nào cao nhất?

  • A. Tối đa hóa hiệu quả kinh tế của dự án.
  • B. Công khai dữ liệu để cộng đồng cùng nghiên cứu.
  • C. Bảo vệ quyền riêng tư và bảo mật thông tin cá nhân của bệnh nhân.
  • D. Sử dụng dữ liệu cho mọi mục đích nghiên cứu khoa học.

Câu 27: "Mô hình hộp đen" (black box model) trong học máy có đặc điểm chính nào?

  • A. Dễ dàng giải thích cách thức mô hình đưa ra dự đoán.
  • B. Chỉ hoạt động tốt với dữ liệu cấu trúc.
  • C. Luôn cho kết quả chính xác tuyệt đối.
  • D. Khó hoặc không thể giải thích được cơ chế bên trong và lý do đưa ra dự đoán.

Câu 28: Để xử lý dữ liệu văn bản lớn (ví dụ: bình luận trên mạng xã hội), kỹ thuật nào sau đây thường được sử dụng trong Khoa học Dữ liệu?

  • A. Phân tích hồi quy tuyến tính.
  • B. Xử lý ngôn ngữ tự nhiên (NLP).
  • C. Phân tích chuỗi thời gian.
  • D. Phân tích phương sai (ANOVA).

Câu 29: Trong quá trình "trực quan hóa dữ liệu", biểu đồ "heatmap" (bản đồ nhiệt) thường được sử dụng để thể hiện điều gì?

  • A. Sự thay đổi của một biến số theo thời gian.
  • B. Phân phối tần suất của một biến số.
  • C. Mức độ tương quan hoặc mật độ giữa hai hoặc nhiều biến số.
  • D. So sánh giá trị trung bình giữa các nhóm khác nhau.

Câu 30: Vai trò chính của "người phiên dịch dữ liệu" (data translator) trong một dự án Khoa học Dữ liệu là gì?

  • A. Giải thích kết quả phân tích dữ liệu cho những người không chuyên môn và kết nối với quyết định kinh doanh.
  • B. Viết mã chương trình để phân tích dữ liệu.
  • C. Thu thập và chuẩn bị dữ liệu cho phân tích.
  • D. Xây dựng mô hình học máy phức tạp.

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 1: Đâu là phát biểu *đúng nhất* về bản chất liên ngành của Khoa học Dữ liệu?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 2: Trong quy trình phân tích dữ liệu, giai đoạn 'chuẩn bị dữ liệu' bao gồm công việc *chủ yếu* nào?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 3: Mục tiêu *quan trọng nhất* của việc trực quan hóa dữ liệu trong Khoa học Dữ liệu là gì?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 4: Xét tình huống một công ty thương mại điện tử muốn *dự đoán* khả năng khách hàng hủy đơn hàng sau khi đặt. Đây là ứng dụng của kỹ thuật nào trong Khoa học Dữ liệu?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 5: Trong dự án 'Bộ gen người' (HGP), Khoa học Dữ liệu đã đóng góp *chủ yếu* vào giai đoạn nào?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 6: Hệ thống 'Giám sát đánh bắt cá toàn cầu' (Global Fishing Watch) ứng dụng Khoa học Dữ liệu để giải quyết vấn đề *chính* nào?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 7: Mô hình ngôn ngữ lớn (LLM) như GPT-3 *thể hiện rõ nhất* thành tựu của Khoa học Dữ liệu trong lĩnh vực nào?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 8: Trong bài toán phát hiện gian lận thẻ tín dụng, việc sử dụng mô hình học máy giúp cải thiện *điều gì* so với phương pháp thủ công?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 9: Kính thiên v??n Kepler thu thập dữ liệu *chủ yếu* về đặc điểm nào của các ngôi sao để tìm kiếm hành tinh?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 10: Giai đoạn 'đánh giá và giải thích' trong quy trình Khoa học Dữ liệu *tập trung vào* điều gì?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 11: Để xác định mối quan hệ giữa mức độ ô nhiễm không khí và tỷ lệ nhập viện vì bệnh hô hấp tại một thành phố, phương pháp phân tích dữ liệu nào sau đây là *phù hợp nhất*?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 12: Một nhà khoa học dữ liệu cần kỹ năng *quan trọng* nào để làm việc hiệu quả với dữ liệu phi cấu trúc (ví dụ: văn bản, hình ảnh, video)?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 13: Trong quá trình xây dựng mô hình dự đoán, việc 'chia dữ liệu thành tập huấn luyện và tập kiểm thử' nhằm mục đích *chính* gì?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 14: Khi lựa chọn phương pháp trực quan hóa dữ liệu, yếu tố *quan trọng nhất* cần xem xét là gì?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 15: Một công ty muốn phân loại khách hàng thành các nhóm khác nhau dựa trên hành vi mua sắm trực tuyến của họ. Kỹ thuật Khoa học Dữ liệu nào sau đây là *phù hợp nhất*?

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 16: Trong một dự án Khoa học Dữ liệu, việc xác định rõ 'vấn đề cần giải quyết' diễn ra ở giai đoạn *đầu tiên* nào?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 17: 'Đạo đức trong Khoa học Dữ liệu' nhấn mạnh đến *trách nhiệm* nào của người làm khoa học dữ liệu?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 18: Loại dữ liệu nào sau đây *không phải* là dữ liệu phi cấu trúc?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 19: Trong Khoa học Dữ liệu, thuật ngữ 'feature' (đặc trưng) thường được dùng để chỉ điều gì?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 20: 'Khoa học Dữ liệu' khác biệt với 'Thống kê truyền thống' *chủ yếu* ở điểm nào?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 21: Để đánh giá hiệu quả của một mô hình phân loại (classification model), chỉ số đánh giá nào sau đây thường được sử dụng?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 22: Công cụ lập trình phổ biến *nhất* được sử dụng trong Khoa học Dữ liệu là gì?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 23: Trong quy trình 'thu thập dữ liệu', nguồn dữ liệu 'API' (Application Programming Interface) là gì?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 24: 'Big Data' (Dữ liệu lớn) có những đặc điểm *chính* nào (thường được gọi là 3V hoặc 5V)?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 25: Kỹ năng 'tư duy phản biện' đóng vai trò *quan trọng* như thế nào trong Khoa học Dữ liệu?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 26: Trong một dự án Khoa học Dữ liệu về y tế, việc sử dụng dữ liệu bệnh nhân cần tuân thủ nguyên tắc *đạo đức* nào *cao nhất*?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 27: 'Mô hình hộp đen' (black box model) trong học máy có đặc điểm *chính* nào?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 28: Để xử lý dữ liệu văn bản lớn (ví dụ: bình luận trên mạng xã hội), kỹ thuật nào sau đây thường được sử dụng trong Khoa học Dữ liệu?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 29: Trong quá trình 'trực quan hóa dữ liệu', biểu đồ 'heatmap' (bản đồ nhiệt) thường được sử dụng để thể hiện điều gì?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 1

Câu 30: Vai trò *chính* của 'người phiên dịch dữ liệu' (data translator) trong một dự án Khoa học Dữ liệu là gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 02

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 02 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Đâu là phát biểu chính xác nhất về khoa học dữ liệu?

  • A. Khoa học dữ liệu là ngành hẹp của toán học ứng dụng, tập trung vào thống kê.
  • B. Khoa học dữ liệu chủ yếu sử dụng các công cụ phần mềm để quản lý cơ sở dữ liệu lớn.
  • C. Khoa học dữ liệu là lĩnh vực nghiên cứu thuật toán máy tính nhanh hơn.
  • D. Khoa học dữ liệu là một lĩnh vực liên ngành, kết hợp toán học, thống kê, khoa học máy tính và kiến thức предмет để trích xuất tri thức và giá trị từ dữ liệu.

Câu 2: Trong quy trình dự án khoa học dữ liệu, giai đoạn nào tập trung vào việc làm sạch, chuyển đổi và cấu trúc lại dữ liệu thô để chuẩn bị cho phân tích?

  • A. Xác định vấn đề
  • B. Chuẩn bị dữ liệu
  • C. Phân tích và khai phá dữ liệu
  • D. Đánh giá và giải thích kết quả

Câu 3: Mục tiêu chính của khoa học dữ liệu là gì?

  • A. Tạo ra các phần mềm ứng dụng phức tạp.
  • B. Xây dựng cơ sở dữ liệu lớn và hiệu quả.
  • C. Phát hiện tri thức mới, đưa ra quyết định sáng suốt dựa trên dữ liệu.
  • D. Thay thế hoàn toàn các phương pháp thống kê truyền thống.

Câu 4: Dự án "Bộ gen người" (Human Genome Project - HGP) là một ví dụ điển hình về ứng dụng khoa học dữ liệu trong lĩnh vực nào?

  • A. Sinh học và Y tế
  • B. Vật lý thiên văn
  • C. Khoa học xã hội
  • D. Kinh tế và Tài chính

Câu 5: Kính thiên văn Kepler đã thu thập một lượng lớn dữ liệu về độ sáng của các ngôi sao. Hoạt động này minh họa vai trò của khoa học dữ liệu trong việc nào?

  • A. Phát triển phần cứng máy tính mới.
  • B. Nghiên cứu và khám phá vũ trụ thông qua phân tích dữ liệu.
  • C. Cải thiện chất lượng hình ảnh thiên văn.
  • D. Xây dựng các mô hình mô phỏng vũ trụ.

Câu 6: Hệ thống "Giám sát đánh bắt cá toàn cầu" (Global Fishing Watch) sử dụng dữ liệu vệ tinh để theo dõi tàu thuyền và phát hiện hoạt động đánh bắt cá trái phép. Đây là một ví dụ về ứng dụng khoa học dữ liệu trong lĩnh vực nào?

  • A. Nông nghiệp thông minh
  • B. Giao thông vận tải
  • C. Quản lý đô thị
  • D. Bảo tồn môi trường và quản lý tài nguyên thiên nhiên

Câu 7: Mô hình ngôn ngữ lớn (LLM) như GPT-3 thể hiện thành tựu của khoa học dữ liệu trong lĩnh vực nào?

  • A. Thị giác máy tính
  • B. Robot học
  • C. Xử lý ngôn ngữ tự nhiên (NLP)
  • D. Hệ thống khuyến nghị

Câu 8: American Express sử dụng mô hình học máy để phát hiện gian lận giao dịch thẻ tín dụng. Điều này thể hiện vai trò của khoa học dữ liệu trong việc nào?

  • A. Nâng cao hiệu quả hoạt động và giảm thiểu rủi ro trong kinh doanh.
  • B. Tăng cường bảo mật hệ thống mạng.
  • C. Cải thiện trải nghiệm người dùng.
  • D. Phát triển các phương thức thanh toán mới.

Câu 9: Trong dự án "Bộ gen người", kỹ thuật "giải trình tự gen" đóng vai trò quan trọng trong giai đoạn nào của quy trình khoa học dữ liệu?

  • A. Phân tích và khai phá dữ liệu
  • B. Thu thập dữ liệu
  • C. Chuẩn bị dữ liệu
  • D. Đánh giá và giải thích kết quả

Câu 10: Thuật ngữ nào mô tả dữ liệu có khối lượng lớn, tốc độ tạo ra nhanh và đa dạng về loại hình, đòi hỏi công nghệ và phương pháp xử lý đặc biệt?

  • A. Dữ liệu nhỏ (Small Data)
  • B. Dữ liệu tĩnh (Static Data)
  • C. Dữ liệu lớn (Big Data)
  • D. Dữ liệu thời gian thực (Real-time Data)

Câu 11: Đâu là kỹ năng quan trọng nhất đối với một nhà khoa học dữ liệu?

  • A. Lập trình web chuyên nghiệp
  • B. Thiết kế đồ họa 3D
  • C. Quản trị hệ thống mạng
  • D. Khả năng phân tích, giải quyết vấn đề và giao tiếp hiệu quả

Câu 12: Trong quá trình phân tích dữ liệu, việc "trực quan hóa dữ liệu" (data visualization) có vai trò gì?

  • A. Tăng tốc độ xử lý dữ liệu.
  • B. Giúp con người dễ dàng hiểu và nhận diện các mẫu, xu hướng trong dữ liệu.
  • C. Thay thế các phương pháp thống kê truyền thống.
  • D. Đảm bảo tính bảo mật của dữ liệu.

Câu 13: Phát biểu nào sau đây thể hiện sự khác biệt chính giữa khoa học dữ liệu và thống kê truyền thống?

  • A. Thống kê truyền thống sử dụng máy tính, khoa học dữ liệu thì không.
  • B. Khoa học dữ liệu chỉ làm việc với dữ liệu số, thống kê làm việc với mọi loại dữ liệu.
  • C. Khoa học dữ liệu có phạm vi rộng hơn, kết hợp thống kê với khoa học máy tính và kiến thức предмет, để xử lý dữ liệu đa dạng và quy mô lớn.
  • D. Thống kê truyền thống tập trung vào dự đoán, khoa học dữ liệu tập trung vào mô tả dữ liệu.

Câu 14: Trong giai đoạn "đánh giá và giải thích kết quả" của dự án khoa học dữ liệu, nhà khoa học dữ liệu cần làm gì?

  • A. Thu thập thêm dữ liệu nếu kết quả chưa rõ ràng.
  • B. Lựa chọn thuật toán phân tích dữ liệu phù hợp nhất.
  • C. Chuẩn bị dữ liệu cho bước phân tích tiếp theo.
  • D. Diễn giải ý nghĩa của kết quả phân tích, đưa ra kết luận và khuyến nghị.

Câu 15: Đâu là một thách thức đạo đức lớn trong khoa học dữ liệu?

  • A. Sự phức tạp của thuật toán học máy.
  • B. Sử dụng dữ liệu cá nhân mà không có sự đồng ý hoặc gây ra phân biệt đối xử.
  • C. Khó khăn trong việc trực quan hóa dữ liệu đa chiều.
  • D. Chi phí đầu tư cho hạ tầng công nghệ thông tin.

Câu 16: Kiểu dữ liệu nào sau đây thường khó phân tích hơn bằng các phương pháp truyền thống và đòi hỏi kỹ thuật của khoa học dữ liệu?

  • A. Dữ liệu dạng bảng (structured data) trong cơ sở dữ liệu.
  • B. Dữ liệu số (numerical data) từ cảm biến.
  • C. Dữ liệu phi cấu trúc (unstructured data) như văn bản, hình ảnh, video.
  • D. Dữ liệu thời gian chuỗi (time-series data) từ thị trường chứng khoán.

Câu 17: Trong một dự án khoa học dữ liệu về dự báo doanh số bán hàng, bước nào sau đây thể hiện giai đoạn "phân tích và khai phá dữ liệu"?

  • A. Xây dựng mô hình dự báo doanh số dựa trên dữ liệu lịch sử và các yếu tố liên quan.
  • B. Thu thập dữ liệu doanh số bán hàng từ các năm trước.
  • C. Làm sạch và chuẩn hóa dữ liệu doanh số.
  • D. Trình bày kết quả dự báo doanh số cho ban lãnh đạo.

Câu 18: Vai trò của "chuyên gia предмет" (domain expert) trong dự án khoa học dữ liệu là gì?

  • A. Viết mã chương trình phân tích dữ liệu.
  • B. Cung cấp kiến thức chuyên sâu về lĩnh vực ứng dụng, giúp định hướng phân tích và giải thích kết quả.
  • C. Quản lý cơ sở dữ liệu của dự án.
  • D. Thiết kế giao diện trực quan hóa dữ liệu.

Câu 19: Phương pháp nào sau đây thuộc về "học máy" (machine learning), một nhánh quan trọng của khoa học dữ liệu?

  • A. Thống kê mô tả (descriptive statistics)
  • B. Phân tích hồi quy tuyến tính (linear regression analysis) thủ công
  • C. Mạng nơ-ron nhân tạo (artificial neural networks)
  • D. Tính toán trung bình và độ lệch chuẩn

Câu 20: Trong bối cảnh khoa học dữ liệu, "dữ liệu mở" (open data) mang lại lợi ích gì?

  • A. Giảm chi phí lưu trữ dữ liệu.
  • B. Tăng cường bảo mật dữ liệu cá nhân.
  • C. Đơn giản hóa quy trình thu thập dữ liệu.
  • D. Thúc đẩy nghiên cứu, đổi mới và hợp tác trong cộng đồng khoa học và xã hội.

Câu 21: Công cụ nào sau đây không phải là một ngôn ngữ lập trình phổ biến được sử dụng trong khoa học dữ liệu?

  • A. Python
  • B. Pascal
  • C. R
  • D. SQL

Câu 22: Trong khoa học dữ liệu, "mô hình hóa dữ liệu" (data modeling) nhằm mục đích gì?

  • A. Sao chép dữ liệu sang một định dạng khác.
  • B. Nén dữ liệu để tiết kiệm không gian lưu trữ.
  • C. Đại diện dữ liệu một cách cấu trúc, giúp phân tích và khai thác thông tin hiệu quả hơn.
  • D. Bảo vệ dữ liệu khỏi truy cập trái phép.

Câu 23: Khi trình bày kết quả phân tích dữ liệu cho người không chuyên môn, nhà khoa học dữ liệu nên ưu tiên điều gì?

  • A. Sử dụng ngôn ngữ đơn giản, trực quan, tập trung vào ý nghĩa và ứng dụng thực tế.
  • B. Trình bày chi tiết các thuật toán và công thức toán học đã sử dụng.
  • C. Sử dụng nhiều thuật ngữ chuyên ngành để thể hiện tính chuyên nghiệp.
  • D. Chỉ tập trung vào kết quả định lượng, bỏ qua giải thích định tính.

Câu 24: Đâu là một ví dụ về ứng dụng khoa học dữ liệu trong lĩnh vực giáo dục?

  • A. Phát triển robot giáo viên.
  • B. Phân tích dữ liệu học tập để cá nhân hóa trải nghiệm học sinh và cải thiện phương pháp giảng dạy.
  • C. Xây dựng phòng thí nghiệm ảo.
  • D. Số hóa toàn bộ sách giáo khoa.

Câu 25: Trong khoa học dữ liệu, "kỹ thuật giảm chiều dữ liệu" (dimensionality reduction) được sử dụng để làm gì?

  • A. Tăng kích thước của dữ liệu để chứa được nhiều thông tin hơn.
  • B. Thay đổi định dạng dữ liệu sang dạng dễ đọc hơn.
  • C. Giảm số lượng biến (thuộc tính) của dữ liệu, giúp đơn giản hóa phân tích và trực quan hóa.
  • D. Tăng độ chính xác của dữ liệu.

Câu 26: Phát biểu nào sau đây không đúng về khoa học dữ liệu?

  • A. Khoa học dữ liệu có thể giúp giải quyết các vấn đề phức tạp trong nhiều lĩnh vực.
  • B. Khoa học dữ liệu dựa trên nền tảng của toán học, thống kê và khoa học máy tính.
  • C. Khoa học dữ liệu ngày càng trở nên quan trọng trong thế giới hiện đại.
  • D. Khoa học dữ liệu chỉ phù hợp với các công ty công nghệ lớn, không cần thiết cho doanh nghiệp nhỏ.

Câu 27: Trong một quy trình khoa học dữ liệu, sau khi "xác định vấn đề", bước tiếp theo quan trọng là gì?

  • A. Phân tích dữ liệu.
  • B. Thu thập dữ liệu liên quan đến vấn đề.
  • C. Trực quan hóa dữ liệu.
  • D. Đánh giá kết quả phân tích.

Câu 28: Đâu là một ví dụ về "dữ liệu có cấu trúc" (structured data)?

  • A. Bảng dữ liệu khách hàng trong cơ sở dữ liệu quan hệ (SQL).
  • B. Bài đăng trên mạng xã hội Facebook.
  • C. File âm thanh định dạng MP3.
  • D. Video trên Youtube.

Câu 29: Trong khoa học dữ liệu, việc "lựa chọn đặc trưng" (feature selection) có ý nghĩa gì?

  • A. Tạo ra các đặc trưng mới từ dữ liệu hiện có.
  • B. Sắp xếp các đặc trưng theo thứ tự quan trọng.
  • C. Chọn ra một tập hợp con các đặc trưng quan trọng nhất, giúp mô hình hiệu quả hơn và dễ diễn giải hơn.
  • D. Mã hóa các đặc trưng thành dạng số.

Câu 30: Để đảm bảo tính khách quan và tin cậy của kết quả phân tích khoa học dữ liệu, cần chú trọng điều gì trong quá trình thực hiện dự án?

  • A. Sử dụng các công cụ phần mềm mới nhất.
  • B. Thu thập dữ liệu từ nhiều nguồn khác nhau.
  • C. Làm việc với đội ngũ chuyên gia giàu kinh nghiệm.
  • D. Tuân thủ quy trình khoa học, kiểm tra và đánh giá kết quả một cách cẩn thận, minh bạch.

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 1: Đâu là phát biểu *chính xác nhất* về khoa học dữ liệu?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 2: Trong quy trình dự án khoa học dữ liệu, giai đoạn nào tập trung vào việc làm sạch, chuyển đổi và cấu trúc lại dữ liệu thô để chuẩn bị cho phân tích?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 3: Mục tiêu *chính* của khoa học dữ liệu là gì?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 4: Dự án 'Bộ gen người' (Human Genome Project - HGP) là một ví dụ điển hình về ứng dụng khoa học dữ liệu trong lĩnh vực nào?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 5: Kính thiên văn Kepler đã thu thập một lượng lớn dữ liệu về độ sáng của các ngôi sao. Hoạt động này minh họa vai trò của khoa học dữ liệu trong việc nào?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 6: Hệ thống 'Giám sát đánh bắt cá toàn cầu' (Global Fishing Watch) sử dụng dữ liệu vệ tinh để theo dõi tàu thuyền và phát hiện hoạt động đánh bắt cá trái phép. Đây là một ví dụ về ứng dụng khoa học dữ liệu trong lĩnh vực nào?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 7: Mô hình ngôn ngữ lớn (LLM) như GPT-3 thể hiện thành tựu của khoa học dữ liệu trong lĩnh vực nào?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 8: American Express sử dụng mô hình học máy để phát hiện gian lận giao dịch thẻ tín dụng. Điều này thể hiện vai trò của khoa học dữ liệu trong việc nào?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 9: Trong dự án 'Bộ gen người', kỹ thuật 'giải trình tự gen' đóng vai trò quan trọng trong giai đoạn nào của quy trình khoa học dữ liệu?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 10: Thuật ngữ nào mô tả dữ liệu có khối lượng lớn, tốc độ tạo ra nhanh và đa dạng về loại hình, đòi hỏi công nghệ và phương pháp xử lý đặc biệt?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 11: Đâu là *kỹ năng quan trọng nhất* đối với một nhà khoa học dữ liệu?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 12: Trong quá trình phân tích dữ liệu, việc 'trực quan hóa dữ liệu' (data visualization) có vai trò gì?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 13: Phát biểu nào sau đây thể hiện *sự khác biệt chính* giữa khoa học dữ liệu và thống kê truyền thống?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 14: Trong giai đoạn 'đánh giá và giải thích kết quả' của dự án khoa học dữ liệu, nhà khoa học dữ liệu cần làm gì?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 15: Đâu là một *thách thức đạo đức* lớn trong khoa học dữ liệu?

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 16: Kiểu dữ liệu nào sau đây thường *khó phân tích* hơn bằng các phương pháp truyền thống và đòi hỏi kỹ thuật của khoa học dữ liệu?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 17: Trong một dự án khoa học dữ liệu về dự báo doanh số bán hàng, bước nào sau đây thể hiện giai đoạn 'phân tích và khai phá dữ liệu'?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 18: Vai trò của 'chuyên gia предмет' (domain expert) trong dự án khoa học dữ liệu là gì?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 19: Phương pháp nào sau đây thuộc về 'học máy' (machine learning), một nhánh quan trọng của khoa học dữ liệu?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 20: Trong bối cảnh khoa học dữ liệu, 'dữ liệu mở' (open data) mang lại lợi ích gì?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 21: Công cụ nào sau đây *không phải* là một ngôn ngữ lập trình phổ biến được sử dụng trong khoa học dữ liệu?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 22: Trong khoa học dữ liệu, 'mô hình hóa dữ liệu' (data modeling) nhằm mục đích gì?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 23: Khi trình bày kết quả phân tích dữ liệu cho người không chuyên môn, nhà khoa học dữ liệu nên ưu tiên điều gì?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 24: Đâu là một ví dụ về ứng dụng khoa học dữ liệu trong lĩnh vực giáo dục?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 25: Trong khoa học dữ liệu, 'kỹ thuật giảm chiều dữ liệu' (dimensionality reduction) được sử dụng để làm gì?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 26: Phát biểu nào sau đây *không đúng* về khoa học dữ liệu?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 27: Trong một quy trình khoa học dữ liệu, sau khi 'xác định vấn đề', bước tiếp theo quan trọng là gì?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 28: Đâu là một ví dụ về 'dữ liệu có cấu trúc' (structured data)?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 29: Trong khoa học dữ liệu, việc 'lựa chọn đặc trưng' (feature selection) có ý nghĩa gì?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 2

Câu 30: Để đảm bảo tính khách quan và tin cậy của kết quả phân tích khoa học dữ liệu, cần chú trọng điều gì trong quá trình thực hiện dự án?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 03

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 03 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Lĩnh vực nào sau đây không phải là một trong những trụ cột chính kết hợp lại tạo nên Khoa học dữ liệu?

  • A. Toán học và Thống kê
  • B. Khoa học máy tính
  • C. Kiến thức chuyên môn trong lĩnh vực ứng dụng
  • D. Thiết kế đồ họa và Nghệ thuật

Câu 2: Giai đoạn đầu tiên và quan trọng nhất trong quy trình của một dự án Khoa học dữ liệu là gì?

  • A. Xác định rõ vấn đề cần giải quyết
  • B. Thu thập dữ liệu
  • C. Phân tích và trực quan hóa dữ liệu
  • D. Xây dựng mô hình dự đoán

Câu 3: Một công ty bán lẻ muốn dự đoán xu hướng mua sắm của khách hàng trong 3 tháng tới dựa trên lịch sử giao dịch 5 năm qua. Hoạt động này thuộc mục tiêu nào của Khoa học dữ liệu?

  • A. Phát hiện tri thức mới
  • B. Xây dựng mô hình dự đoán
  • C. Tối ưu hóa quyết định
  • D. Trực quan hóa dữ liệu

Câu 4: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu chứa thông tin về nhiệt độ, độ ẩm, và lượng mưa để dự báo khả năng xảy ra lũ lụt. Việc làm sạch, xử lý các giá trị thiếu hoặc không chính xác trong dữ liệu này thuộc giai đoạn nào của dự án Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Phân tích và khai phá dữ liệu
  • C. Chuẩn bị dữ liệu
  • D. Đánh giá và giải thích kết quả

Câu 5: Giả sử bạn là một nhà khoa học dữ liệu được giao nhiệm vụ phân tích hiệu quả của một chiến dịch quảng cáo trực tuyến. Dữ liệu bạn có bao gồm số lần hiển thị quảng cáo, số lần nhấp chuột, và số lượt mua hàng. Hoạt động tính toán tỷ lệ nhấp chuột (CTR) hoặc tỷ lệ chuyển đổi (Conversion Rate) thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Phân tích và khai phá dữ liệu
  • C. Chuẩn bị dữ liệu
  • D. Ra quyết định và triển khai

Câu 6: Mục tiêu "Phát hiện tri thức từ dữ liệu" trong Khoa học dữ liệu thường liên quan đến việc tìm ra điều gì?

  • A. Cách thu thập dữ liệu nhanh nhất
  • B. Chi phí lưu trữ dữ liệu
  • C. Các quy tắc ngữ pháp trong văn bản
  • D. Các mẫu hình, xu hướng hoặc mối quan hệ ẩn trong dữ liệu

Câu 7: Một cửa hàng tạp hóa sử dụng dữ liệu bán hàng để xác định những sản phẩm nào thường được mua cùng nhau (ví dụ: sữa và bánh mì). Kết quả phân tích này giúp cửa hàng sắp xếp lại cách trưng bày sản phẩm để tăng doanh thu. Ứng dụng này thuộc mục tiêu nào của Khoa học dữ liệu?

  • A. Tối ưu hóa quyết định (về trưng bày sản phẩm)
  • B. Xây dựng mô hình dự đoán (về hành vi mua sắm)
  • C. Trực quan hóa dữ liệu (về doanh số)
  • D. Chuẩn bị dữ liệu (về sản phẩm)

Câu 8: Tại sao kiến thức chuyên môn trong lĩnh vực ứng dụng (ví dụ: y tế, tài chính, giáo dục) lại quan trọng trong Khoa học dữ liệu?

  • A. Giúp tự động hóa toàn bộ quy trình
  • B. Thay thế hoàn toàn vai trò của toán học và thống kê
  • C. Giúp hiểu ngữ cảnh của dữ liệu, xác định vấn đề phù hợp và diễn giải kết quả chính xác
  • D. Chỉ cần thiết ở giai đoạn thu thập dữ liệu

Câu 9: Dự án Bộ gen người (Human Genome Project - HGP) là một ví dụ điển hình về ứng dụng Khoa học dữ liệu trong lĩnh vực nào?

  • A. Y tế và Sinh học
  • B. Thiên văn học
  • C. Tài chính
  • D. Giám sát môi trường

Câu 10: Hệ thống Giám sát đánh bắt cá toàn cầu (Global Fishing Watch) chủ yếu sử dụng loại dữ liệu nào để theo dõi và phát hiện hoạt động đánh bắt bất hợp pháp?

  • A. Dữ liệu từ cảm biến dưới nước
  • B. Dữ liệu từ nhật ký của tàu thuyền
  • C. Dữ liệu vệ tinh về vị trí và hoạt động của tàu cá
  • D. Dữ liệu phỏng vấn ngư dân

Câu 11: Phát hiện gian lận trong giao dịch tài chính là một ứng dụng quan trọng của Khoa học dữ liệu. Kỹ thuật nào sau đây thường được sử dụng để xây dựng các mô hình phát hiện gian lận?

  • A. Phân tích cảm xúc văn bản
  • B. Học máy (Machine Learning)
  • C. Xử lý ảnh
  • D. Phân tích chuỗi thời gian (chỉ riêng lẻ)

Câu 12: Giả sử một công ty bảo hiểm muốn sử dụng Khoa học dữ liệu để phân tích các yêu cầu bồi thường nhằm xác định những trường hợp có khả năng gian lận cao. Bước đầu tiên trong quy trình này sẽ là gì?

  • A. Trực quan hóa tất cả các yêu cầu bồi thường
  • B. Báo cáo các trường hợp nghi ngờ cho cảnh sát
  • C. Xây dựng một mô hình dự đoán ngay lập tức
  • D. Xác định rõ "gian lận" nghĩa là gì trong bối cảnh của công ty và mục tiêu phát hiện

Câu 13: Khi một nhà khoa học dữ liệu trình bày kết quả phân tích cho người ra quyết định, việc trực quan hóa dữ liệu (ví dụ: sử dụng biểu đồ, đồ thị) đóng vai trò gì?

  • A. Giúp người không chuyên dễ dàng hiểu được các mẫu hình và thông tin quan trọng từ dữ liệu
  • B. Chỉ để làm cho báo cáo trông đẹp mắt hơn
  • C. Thay thế hoàn toàn việc phân tích số liệu
  • D. Chỉ hữu ích trong giai đoạn thu thập dữ liệu

Câu 14: Mô hình ngôn ngữ lớn (LLM) như GPT-3 là một thành tựu nổi bật của Khoa học dữ liệu và Trí tuệ nhân tạo trong lĩnh vực nào?

  • A. Phân tích hình ảnh
  • B. Xử lý ngôn ngữ tự nhiên
  • C. Phân tích chuỗi gen
  • D. Dự báo thời tiết

Câu 15: Sau khi xây dựng và đánh giá một mô hình dự đoán, giai đoạn tiếp theo trong quy trình Khoa học dữ liệu là gì, đặc biệt nếu mô hình được chứng minh là hiệu quả?

  • A. Quay lại thu thập thêm dữ liệu
  • B. Bỏ qua kết quả và bắt đầu lại
  • C. Chỉ báo cáo kết quả mà không làm gì thêm
  • D. Ra quyết định dựa trên kết quả và triển khai giải pháp

Câu 16: Một nhà nghiên cứu đang phân tích dữ liệu từ một cuộc khảo sát trực tuyến để hiểu hành vi của người dùng trên một trang web. Anh ấy nhận thấy rằng nhiều câu trả lời cho câu hỏi về tuổi không hợp lệ (ví dụ: nhập "abc" hoặc "-10"). Việc xử lý những dữ liệu không hợp lệ này thuộc bước nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Phân tích dữ liệu
  • C. Chuẩn bị dữ liệu
  • D. Trực quan hóa dữ liệu

Câu 17: Trong bối cảnh Khoa học dữ liệu, "Dữ liệu lớn" (Big Data) thường được mô tả bằng các chữ "V". Ba chữ "V" phổ biến nhất là gì?

  • A. Volume (Khối lượng), Velocity (Vận tốc), Variety (Đa dạng)
  • B. Visibility (Hiển thị), Validity (Tính hợp lệ), Value (Giá trị)
  • C. Visualization (Trực quan hóa), Verification (Xác minh), Volume (Khối lượng)
  • D. Velocity (Vận tốc), Verification (Xác minh), Value (Giá trị)

Câu 18: Một công ty muốn sử dụng dữ liệu lịch sử về sự cố máy móc để dự đoán khi nào một thiết bị cụ thể có khả năng bị hỏng. Ứng dụng này minh họa mục tiêu nào của Khoa học dữ liệu?

  • A. Trực quan hóa dữ liệu
  • B. Xây dựng mô hình dự đoán
  • C. Phát hiện tri thức mới
  • D. Tối ưu hóa quyết định sản xuất

Câu 19: Bạn đang phân tích dữ liệu bán hàng và tạo ra một biểu đồ thể hiện doanh thu theo từng tháng trong năm. Hoạt động này thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

  • A. Trực quan hóa dữ liệu
  • B. Thu thập dữ liệu
  • C. Chuẩn bị dữ liệu
  • D. Ra quyết định

Câu 20: Tại sao việc đánh giá và giải thích kết quả là một giai đoạn quan trọng trong dự án Khoa học dữ liệu?

  • A. Để làm cho dự án kéo dài hơn
  • B. Chỉ để kiểm tra xem mô hình có chạy hay không
  • C. Để hiểu ý nghĩa của kết quả, xác định tính chính xác và độ tin cậy trước khi đưa ra quyết định
  • D. Để tìm lỗi trong dữ liệu gốc

Câu 21: Khi một công ty thương mại điện tử sử dụng dữ liệu về lịch sử duyệt web và mua sắm của khách hàng để gợi ý sản phẩm phù hợp, họ đang áp dụng Khoa học dữ liệu để đạt được mục tiêu nào?

  • A. Phát hiện gian lận
  • B. Phân tích cảm xúc
  • C. Tự động hóa quy trình kế toán
  • D. Cá nhân hóa trải nghiệm người dùng và tối ưu hóa doanh số

Câu 22: Trong giai đoạn "Thu thập dữ liệu" của một dự án Khoa học dữ liệu, nguồn dữ liệu có thể đến từ đâu?

  • A. Cơ sở dữ liệu nội bộ, API công khai, các cuộc khảo sát, cảm biến IoT
  • B. Chỉ từ các tệp Excel
  • C. Chỉ từ kết quả tìm kiếm trên Google
  • D. Chỉ từ các bài báo khoa học

Câu 23: Một nhà khoa học dữ liệu đang xem xét kết quả của một mô hình dự đoán và nhận thấy rằng mô hình hoạt động rất tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới. Vấn đề này thường được gọi là gì trong học máy?

  • A. Thiếu dữ liệu
  • B. Dữ liệu nhiễu
  • C. Quá khớp (Overfitting)
  • D. Thiếu sót (Underfitting)

Câu 24: Kính thiên văn không gian Kepler đã tạo ra một lượng lớn dữ liệu về độ sáng của các ngôi sao. Dữ liệu này được sử dụng chủ yếu cho mục đích nào trong khoa học dữ liệu thiên văn?

  • A. Đo nhiệt độ của các hành tinh
  • B. Phát hiện các hành tinh ngoài hệ mặt trời (ngoại hành tinh) dựa trên sự thay đổi độ sáng của ngôi sao chủ
  • C. Xác định khoảng cách chính xác đến các thiên hà xa xôi
  • D. Chụp ảnh chi tiết bề mặt các hành tinh

Câu 25: Một tổ chức y tế công cộng muốn sử dụng Khoa học dữ liệu để phân tích dữ liệu bệnh nhân nhằm xác định các yếu tố nguy cơ hàng đầu gây ra bệnh tim mạch trong cộng đồng. Hoạt động này tập trung chủ yếu vào mục tiêu nào của Khoa học dữ liệu?

  • A. Phát hiện tri thức từ dữ liệu (về các yếu tố nguy cơ)
  • B. Trực quan hóa dữ liệu (về số ca bệnh)
  • C. Xây dựng mô hình dự đoán (về từng bệnh nhân)
  • D. Tối ưu hóa quyết định điều trị

Câu 26: Tại sao đạo đức trong Khoa học dữ liệu ngày càng trở nên quan trọng?

  • A. Chỉ để tuân thủ các quy định pháp luật
  • B. Để làm cho dữ liệu sạch hơn
  • C. Để giảm bớt khối lượng công việc cho nhà khoa học dữ liệu
  • D. Để đảm bảo việc sử dụng dữ liệu và kết quả phân tích không dẫn đến phân biệt đối xử, xâm phạm quyền riêng tư hoặc gây hại cho cá nhân/xã hội

Câu 27: Một trong những thách thức lớn khi làm việc với dữ liệu lớn (Big Data) là gì?

  • A. Dữ liệu quá sạch và chuẩn hóa
  • B. Việc lưu trữ, xử lý và phân tích đòi hỏi hạ tầng công nghệ và kỹ thuật phức tạp
  • C. Luôn có đủ công cụ miễn phí để xử lý
  • D. Dữ liệu luôn đến từ một nguồn duy nhất

Câu 28: Khi một nhà khoa học dữ liệu sử dụng thuật toán để phân nhóm khách hàng thành các phân khúc khác nhau dựa trên hành vi mua sắm của họ, kỹ thuật này thường được gọi là gì trong Khoa học dữ liệu?

  • A. Phân cụm (Clustering)
  • B. Phân loại (Classification)
  • C. Hồi quy (Regression)
  • D. Phát hiện bất thường (Anomaly Detection)

Câu 29: Giả sử bạn có một tập dữ liệu về các bức ảnh và bạn muốn xây dựng một mô hình để tự động nhận diện xem trong ảnh có chó hay mèo. Lĩnh vực con nào của Khoa học dữ liệu và AI chuyên về việc này?

  • A. Xử lý ngôn ngữ tự nhiên (NLP)
  • B. Phân tích chuỗi thời gian
  • C. Thị giác máy tính (Computer Vision)
  • D. Hệ thống gợi ý (Recommender Systems)

Câu 30: Mục tiêu "Tối ưu hóa quyết định" trong Khoa học dữ liệu có ý nghĩa là gì?

  • A. Chỉ đơn giản là đưa ra bất kỳ quyết định nào
  • B. Sử dụng kết quả phân tích dữ liệu để đưa ra lựa chọn tốt nhất nhằm đạt được mục tiêu cụ thể
  • C. Tự động hóa hoàn toàn quá trình ra quyết định mà không cần con người
  • D. Chỉ áp dụng trong lĩnh vực tài chính

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 1: Lĩnh vực nào sau đây không phải là một trong những trụ cột chính kết hợp lại tạo nên Khoa học dữ liệu?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 2: Giai đoạn đầu tiên và quan trọng nhất trong quy trình của một dự án Khoa học dữ liệu là gì?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 3: Một công ty bán lẻ muốn dự đoán xu hướng mua sắm của khách hàng trong 3 tháng tới dựa trên lịch sử giao dịch 5 năm qua. Hoạt động này thuộc mục tiêu nào của Khoa học dữ liệu?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 4: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu chứa thông tin về nhiệt độ, độ ẩm, và lượng mưa để dự báo khả năng xảy ra lũ lụt. Việc làm sạch, xử lý các giá trị thiếu hoặc không chính xác trong dữ liệu này thuộc giai đoạn nào của dự án Khoa học dữ liệu?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 5: Giả sử bạn là một nhà khoa học dữ liệu được giao nhiệm vụ phân tích hiệu quả của một chiến dịch quảng cáo trực tuyến. Dữ liệu bạn có bao gồm số lần hiển thị quảng cáo, số lần nhấp chuột, và số lượt mua hàng. Hoạt động tính toán tỷ lệ nhấp chuột (CTR) hoặc tỷ lệ chuyển đổi (Conversion Rate) thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 6: Mục tiêu 'Phát hiện tri thức từ dữ liệu' trong Khoa học dữ liệu thường liên quan đến việc tìm ra điều gì?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 7: Một cửa hàng tạp hóa sử dụng dữ liệu bán hàng để xác định những sản phẩm nào thường được mua cùng nhau (ví dụ: sữa và bánh mì). Kết quả phân tích này giúp cửa hàng sắp xếp lại cách trưng bày sản phẩm để tăng doanh thu. Ứng dụng này thuộc mục tiêu nào của Khoa học dữ liệu?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 8: Tại sao kiến thức chuyên môn trong lĩnh vực ứng dụng (ví dụ: y tế, tài chính, giáo dục) lại quan trọng trong Khoa học dữ liệu?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 9: Dự án Bộ gen người (Human Genome Project - HGP) là một ví dụ điển hình về ứng dụng Khoa học dữ liệu trong lĩnh vực nào?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 10: Hệ thống Giám sát đánh bắt cá toàn cầu (Global Fishing Watch) chủ yếu sử dụng loại dữ liệu nào để theo dõi và phát hiện hoạt động đánh bắt bất hợp pháp?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 11: Phát hiện gian lận trong giao dịch tài chính là một ứng dụng quan trọng của Khoa học dữ liệu. Kỹ thuật nào sau đây thường được sử dụng để xây dựng các mô hình phát hiện gian lận?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 12: Giả sử một công ty bảo hiểm muốn sử dụng Khoa học dữ liệu để phân tích các yêu cầu bồi thường nhằm xác định những trường hợp có khả năng gian lận cao. Bước đầu tiên trong quy trình này sẽ là gì?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 13: Khi một nhà khoa học dữ liệu trình bày kết quả phân tích cho người ra quyết định, việc trực quan hóa dữ liệu (ví dụ: sử dụng biểu đồ, đồ thị) đóng vai trò gì?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 14: Mô hình ngôn ngữ lớn (LLM) như GPT-3 là một thành tựu nổi bật của Khoa học dữ liệu và Trí tuệ nhân tạo trong lĩnh vực nào?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 15: Sau khi xây dựng và đánh giá một mô hình dự đoán, giai đoạn tiếp theo trong quy trình Khoa học dữ liệu là gì, đặc biệt nếu mô hình được chứng minh là hiệu quả?

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 16: Một nhà nghiên cứu đang phân tích dữ liệu từ một cuộc khảo sát trực tuyến để hiểu hành vi của người dùng trên một trang web. Anh ấy nhận thấy rằng nhiều câu trả lời cho câu hỏi về tuổi không hợp lệ (ví dụ: nhập 'abc' hoặc '-10'). Việc xử lý những dữ liệu không hợp lệ này thuộc bước nào trong quy trình Khoa học dữ liệu?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 17: Trong bối cảnh Khoa học dữ liệu, 'Dữ liệu lớn' (Big Data) thường được mô tả bằng các chữ 'V'. Ba chữ 'V' phổ biến nhất là gì?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 18: Một công ty muốn sử dụng dữ liệu lịch sử về sự cố máy móc để dự đoán khi nào một thiết bị cụ thể có khả năng bị hỏng. Ứng dụng này minh họa mục tiêu nào của Khoa học dữ liệu?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 19: Bạn đang phân tích dữ liệu bán hàng và tạo ra một biểu đồ thể hiện doanh thu theo từng tháng trong năm. Hoạt động này thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 20: Tại sao việc đánh giá và giải thích kết quả là một giai đoạn quan trọng trong dự án Khoa học dữ liệu?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 21: Khi một công ty thương mại điện tử sử dụng dữ liệu về lịch sử duyệt web và mua sắm của khách hàng để gợi ý sản phẩm phù hợp, họ đang áp dụng Khoa học dữ liệu để đạt được mục tiêu nào?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 22: Trong giai đoạn 'Thu thập dữ liệu' của một dự án Khoa học dữ liệu, nguồn dữ liệu có thể đến từ đâu?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 23: Một nhà khoa học dữ liệu đang xem xét kết quả của một mô hình dự đoán và nhận thấy rằng mô hình hoạt động rất tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới. Vấn đề này thường được gọi là gì trong học máy?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 24: Kính thiên văn không gian Kepler đã tạo ra một lượng lớn dữ liệu về độ sáng của các ngôi sao. Dữ liệu này được sử dụng chủ yếu cho mục đích nào trong khoa học dữ liệu thiên văn?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 25: Một tổ chức y tế công cộng muốn sử dụng Khoa học dữ liệu để phân tích dữ liệu bệnh nhân nhằm xác định các yếu tố nguy cơ hàng đầu gây ra bệnh tim mạch trong cộng đồng. Hoạt động này tập trung chủ yếu vào mục tiêu nào của Khoa học dữ liệu?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 26: Tại sao đạo đức trong Khoa học dữ liệu ngày càng trở nên quan trọng?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 27: Một trong những thách thức lớn khi làm việc với dữ liệu lớn (Big Data) là gì?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 28: Khi một nhà khoa học dữ liệu sử dụng thuật toán để phân nhóm khách hàng thành các phân khúc khác nhau dựa trên hành vi mua sắm của họ, kỹ thuật này thường được gọi là gì trong Khoa học dữ liệu?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 29: Giả sử bạn có một tập dữ liệu về các bức ảnh và bạn muốn xây dựng một mô hình để tự động nhận diện xem trong ảnh có chó hay mèo. Lĩnh vực con nào của Khoa học dữ liệu và AI chuyên về việc này?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 3

Câu 30: Mục tiêu 'Tối ưu hóa quyết định' trong Khoa học dữ liệu có ý nghĩa là gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 04

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 04 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Khoa học dữ liệu (Data Science) được mô tả là một lĩnh vực liên ngành. Yếu tố nào sau đây phản ánh rõ nhất tính liên ngành này?

  • A. Nó chỉ yêu cầu kiến thức sâu về lập trình.
  • B. Nó chủ yếu dựa vào các công cụ phần mềm có sẵn.
  • C. Nó kết hợp kiến thức từ Toán học, Thống kê, Khoa học máy tính và kiến thức chuyên môn trong lĩnh vực ứng dụng cụ thể.
  • D. Mục tiêu duy nhất của nó là tạo ra các biểu đồ và báo cáo đẹp mắt.

Câu 2: Trong quy trình dự án Khoa học dữ liệu điển hình, giai đoạn nào sau đây tập trung vào việc làm sạch, biến đổi và tổ chức dữ liệu thô để chuẩn bị cho phân tích?

  • A. Xác định vấn đề
  • B. Chuẩn bị dữ liệu
  • C. Phân tích và khai phá dữ liệu
  • D. Ra quyết định và triển khai

Câu 3: Một công ty bán lẻ muốn dự đoán doanh số bán hàng trong quý tới dựa trên dữ liệu lịch sử. Họ sẽ áp dụng mục tiêu chính nào của Khoa học dữ liệu?

  • A. Xây dựng mô hình dự đoán
  • B. Phát hiện tri thức từ dữ liệu
  • C. Tối ưu hóa quyết định
  • D. Chỉ trực quan hóa dữ liệu

Câu 4: Dự án Bộ gen người (Human Genome Project) là một ví dụ nổi bật về ứng dụng Khoa học dữ liệu. Khoa học dữ liệu đã đóng vai trò như thế nào trong dự án này?

  • A. Giúp tự động hóa quá trình lấy mẫu máu.
  • B. Chỉ đơn thuần là lưu trữ dữ liệu gen.
  • C. Giúp thiết kế các phòng thí nghiệm hiệu quả hơn.
  • D. Phân tích, sắp xếp và giải thích lượng lớn dữ liệu trình tự gen.

Câu 5: Kính thiên văn Kepler đã thu thập lượng dữ liệu khổng lồ về độ sáng của các ngôi sao. Để phát hiện các ngoại hành tinh (exoplanets) từ dữ liệu này, các nhà khoa học dữ liệu có thể sử dụng kỹ thuật phân tích nào?

  • A. Phân tích dữ liệu văn bản.
  • B. Phân tích chuỗi thời gian (time series analysis) để tìm kiếm sự sụt giảm định kỳ về độ sáng.
  • C. Phân tích hình ảnh để nhận dạng thiên hà.
  • D. Phân tích mạng xã hội của các ngôi sao.

Câu 6: Hệ thống Giám sát đánh bắt cá toàn cầu (Global Fishing Watch) sử dụng Khoa học dữ liệu và dữ liệu vệ tinh. Ứng dụng này minh họa cho khả năng của Khoa học dữ liệu trong việc gì?

  • A. Phát triển các loại tàu cá mới.
  • B. Thay thế hoàn toàn ngư dân bằng máy móc.
  • C. Theo dõi, phân tích hành vi và phát hiện hoạt động bất hợp pháp trên quy mô lớn.
  • D. Dự báo thời tiết cho các chuyến đi biển.

Câu 7: Các mô hình ngôn ngữ lớn (LLM) như GPT-3 là kết quả của sự tiến bộ trong Khoa học dữ liệu và Trí tuệ nhân tạo. Chúng thể hiện ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

  • A. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP).
  • B. Phân tích dữ liệu số học.
  • C. Tối ưu hóa chuỗi cung ứng.
  • D. Phân tích hình ảnh y tế.

Câu 8: Khi American Express áp dụng mô hình học máy để phát hiện gian lận trong giao dịch tài chính, họ đang sử dụng Khoa học dữ liệu để giải quyết vấn đề gì?

  • A. Giảm phí giao dịch cho khách hàng.
  • B. Tăng tốc độ thanh toán.
  • C. Mở rộng mạng lưới chấp nhận thẻ.
  • D. Phát hiện các mẫu hành vi bất thường và rủi ro.

Câu 9: Tại sao kiến thức về Thống kê lại quan trọng đối với một nhà Khoa học dữ liệu?

  • A. Để thiết kế phần cứng máy tính.
  • B. Để hiểu cấu trúc dữ liệu, phân tích mối quan hệ, kiểm định giả thuyết và đánh giá mô hình.
  • C. Để viết code giao diện người dùng.
  • D. Chỉ cần thiết cho việc thu thập dữ liệu ban đầu.

Câu 10: Ngoài các kỹ năng kỹ thuật (Toán, Thống kê, Lập trình), một nhà Khoa học dữ liệu cần có kỹ năng mềm nào để làm việc hiệu quả, đặc biệt khi trình bày kết quả cho những người không chuyên về kỹ thuật?

  • A. Kỹ năng sửa chữa máy in.
  • B. Kỹ năng nhớ tất cả các công thức toán học.
  • C. Kỹ năng giao tiếp và trực quan hóa dữ liệu để giải thích kết quả phức tạp một cách rõ ràng.
  • D. Kỹ năng chỉ làm việc độc lập.

Câu 11: Giai đoạn "Phân tích và khai phá dữ liệu" trong quy trình Khoa học dữ liệu bao gồm những hoạt động chính nào?

  • A. Chỉ thu thập thêm dữ liệu.
  • B. Chỉ viết báo cáo cuối cùng.
  • C. Chỉ cài đặt phần mềm.
  • D. Áp dụng các kỹ thuật thống kê, học máy để tìm kiếm mẫu hình, xu hướng và xây dựng mô hình.

Câu 12: Tại sao "kiến thức chuyên môn trong lĩnh vực ứng dụng" (domain knowledge) lại là một thành phần quan trọng của Khoa học dữ liệu?

  • A. Giúp hiểu rõ vấn đề kinh doanh hoặc khoa học, diễn giải kết quả phân tích một cách chính xác và đặt ra câu hỏi phù hợp.
  • B. Giúp viết code nhanh hơn.
  • C. Giúp thu thập dữ liệu tự động.
  • D. Chỉ cần thiết cho giai đoạn trực quan hóa.

Câu 13: Một nhà Khoa học dữ liệu đang làm việc với dữ liệu về khách hàng của một ngân hàng để xác định những khách hàng có khả năng vỡ nợ cao. Đây là một ví dụ về ứng dụng Khoa học dữ liệu để làm gì?

  • A. Tự động hóa dịch vụ khách hàng.
  • B. Thiết kế lại chi nhánh ngân hàng.
  • C. Đánh giá rủi ro và đưa ra quyết định cho vay.
  • D. Quảng cáo sản phẩm mới cho tất cả khách hàng.

Câu 14: Trong bối cảnh dữ liệu lớn (Big Data), đặc điểm "Variety" (Đa dạng) đề cập đến điều gì?

  • A. Số lượng dữ liệu rất lớn.
  • B. Tốc độ dữ liệu được tạo ra nhanh.
  • C. Tính xác thực và tin cậy của dữ liệu.
  • D. Sự tồn tại của nhiều loại dữ liệu khác nhau (có cấu trúc, bán cấu trúc, phi cấu trúc) từ nhiều nguồn khác nhau.

Câu 15: Tại sao giai đoạn "Trực quan hóa dữ liệu" lại quan trọng trong Khoa học dữ liệu?

  • A. Giúp con người dễ dàng hiểu được các mẫu hình, xu hướng và thông tin quan trọng từ dữ liệu phức tạp.
  • B. Thay thế hoàn toàn việc phân tích dữ liệu.
  • C. Chỉ để làm cho báo cáo trông đẹp hơn.
  • D. Là bước cuối cùng và không cần thiết trước khi ra quyết định.

Câu 16: Một nhà Khoa học dữ liệu muốn xây dựng một mô hình phân loại email thành "thư rác" hoặc "không phải thư rác". Đây là một ví dụ về bài toán thuộc loại nào trong học máy?

  • A. Hồi quy (Regression).
  • B. Phân loại (Classification).
  • C. Phân cụm (Clustering).
  • D. Giảm chiều (Dimensionality Reduction).

Câu 17: Khi áp dụng Khoa học dữ liệu để tối ưu hóa tuyến đường giao thông trong một thành phố, mục tiêu chính của việc này là gì?

  • A. Tăng số lượng phương tiện cá nhân trên đường.
  • B. Chỉ thu thập dữ liệu về tai nạn giao thông.
  • C. Xây thêm nhiều đường cao tốc.
  • D. Giảm tắc nghẽn, tiết kiệm thời gian di chuyển và tối ưu hóa việc sử dụng hạ tầng.

Câu 18: Đâu là một thách thức tiềm ẩn về mặt đạo đức khi sử dụng Khoa học dữ liệu trong các quyết định ảnh hưởng đến con người (ví dụ: tuyển dụng, cho vay)?

  • A. Nguy cơ thiên vị (bias) trong dữ liệu hoặc thuật toán dẫn đến phân biệt đối xử.
  • B. Dữ liệu quá sạch sẽ và hoàn hảo.
  • C. Mô hình quá đơn giản.
  • D. Thiếu dữ liệu để phân tích.

Câu 19: Giai đoạn "Xác định vấn đề" trong quy trình Khoa học dữ liệu đòi hỏi điều gì?

  • A. Chỉ cần thu thập bất kỳ dữ liệu nào có sẵn.
  • B. Hiểu rõ mục tiêu kinh doanh/khoa học, xác định câu hỏi cần trả lời và kết quả mong muốn.
  • C. Bắt đầu xây dựng mô hình ngay lập tức.
  • D. Chỉ tập trung vào việc cài đặt phần mềm phân tích.

Câu 20: Khi phân tích dữ liệu, việc xác định các giá trị ngoại lai (outliers) và xử lý chúng là một phần của giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Xác định vấn đề.
  • C. Chuẩn bị dữ liệu.
  • D. Trực quan hóa kết quả cuối cùng.

Câu 21: Đâu là một ví dụ về việc sử dụng Khoa học dữ liệu để "phát hiện tri thức từ dữ liệu"?

  • A. Tìm ra mối liên hệ bất ngờ giữa hành vi mua sắm của khách hàng và thời tiết.
  • B. Chỉ tính tổng doanh số hàng tháng.
  • C. Tạo một biểu đồ cột đơn giản.
  • D. Lưu trữ dữ liệu khách hàng vào cơ sở dữ liệu.

Câu 22: Một dự án Khoa học dữ liệu thường có tính chất lặp (iterative). Điều này có nghĩa là gì?

  • A. Mỗi giai đoạn chỉ được thực hiện một lần duy nhất.
  • B. Dự án luôn thất bại và phải bắt đầu lại từ đầu.
  • C. Chỉ có một người làm việc trên toàn bộ dự án.
  • D. Có thể quay lại các giai đoạn trước đó (ví dụ: quay lại chuẩn bị dữ liệu sau khi phân tích) để cải thiện kết quả hoặc tinh chỉnh vấn đề.

Câu 23: Tại sao việc đánh giá và giải thích kết quả phân tích là một giai đoạn quan trọng trong Khoa học dữ liệu?

  • A. Để đảm bảo mô hình chính xác, hiểu được ý nghĩa của kết quả và truyền đạt thông tin cho các bên liên quan để đưa ra quyết định đúng đắn.
  • B. Chỉ để tạo ra một báo cáo dài.
  • C. Để chứng minh rằng tất cả dữ liệu đều hoàn hảo.
  • D. Bước này không ảnh hưởng đến quyết định cuối cùng.

Câu 24: Khi làm việc với dữ liệu phi cấu trúc như văn bản hoặc hình ảnh, nhà Khoa học dữ liệu cần áp dụng các kỹ thuật đặc thù. Điều này liên quan đến đặc điểm nào của dữ liệu lớn?

  • A. Volume (Khối lượng).
  • B. Velocity (Tốc độ).
  • C. Variety (Đa dạng).
  • D. Veracity (Tính xác thực).

Câu 25: Một công ty dịch vụ trực tuyến thu thập dữ liệu về hành vi người dùng theo thời gian thực (ví dụ: số lần nhấp chuột, thời gian trên trang). Đây là ví dụ về dữ liệu có đặc điểm nào nổi bật?

  • A. Volume (Khối lượng).
  • B. Velocity (Tốc độ).
  • C. Variety (Đa dạng).
  • D. Veracity (Tính xác thực).

Câu 26: Mục tiêu "Tối ưu hóa quyết định" trong Khoa học dữ liệu có nghĩa là gì?

  • A. Chỉ đưa ra quyết định dựa trên kinh nghiệm cá nhân.
  • B. Đưa ra quyết định một cách ngẫu nhiên.
  • C. Chỉ thu thập thêm dữ liệu mà không phân tích.
  • D. Sử dụng phân tích dữ liệu và mô hình để đưa ra lựa chọn tốt nhất trong các tình huống phức tạp.

Câu 27: Tại sao việc "ra quyết định và triển khai" là giai đoạn cuối cùng nhưng cũng rất quan trọng trong một dự án Khoa học dữ liệu?

  • A. Vì đây là lúc thu thập dữ liệu ban đầu.
  • B. Vì đây là lúc làm sạch dữ liệu.
  • C. Vì kết quả phân tích chỉ có giá trị khi được áp dụng vào thực tế để tạo ra sự thay đổi hoặc cải thiện.
  • D. Vì giai đoạn này không đòi hỏi kỹ năng phân tích.

Câu 28: Một nhà Khoa học dữ liệu cần phân tích dữ liệu về thời tiết để dự báo nhiệt độ ngày mai. Đây là một ví dụ về bài toán thuộc loại nào trong học máy?

  • A. Hồi quy (Regression).
  • B. Phân loại (Classification).
  • C. Phân cụm (Clustering).
  • D. Phát hiện bất thường (Anomaly Detection).

Câu 29: Khi một công ty sử dụng Khoa học dữ liệu để hiểu rõ hơn về hành vi và sở thích của các nhóm khách hàng khác nhau, họ đang thực hiện hoạt động gì?

  • A. Tối ưu hóa giá sản phẩm.
  • B. Phân khúc khách hàng (Customer Segmentation).
  • C. Dự báo thời tiết.
  • D. Tự động hóa sản xuất.

Câu 30: Đâu là một kỹ năng tư duy bậc cao quan trọng mà Khoa học dữ liệu đòi hỏi?

  • A. Chỉ ghi nhớ công thức.
  • B. Chỉ sao chép dữ liệu.
  • C. Chỉ gõ máy nhanh.
  • D. Phân tích (Analysis) dữ liệu để tìm ra mối quan hệ và ý nghĩa tiềm ẩn.

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 1: Khoa học dữ liệu (Data Science) được mô tả là một lĩnh vực liên ngành. Yếu tố nào sau đây phản ánh rõ nhất tính liên ngành này?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 2: Trong quy trình dự án Khoa học dữ liệu điển hình, giai đoạn nào sau đây tập trung vào việc làm sạch, biến đổi và tổ chức dữ liệu thô để chuẩn bị cho phân tích?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 3: Một công ty bán lẻ muốn dự đoán doanh số bán hàng trong quý tới dựa trên dữ liệu lịch sử. Họ sẽ áp dụng mục tiêu chính nào của Khoa học dữ liệu?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 4: Dự án Bộ gen người (Human Genome Project) là một ví dụ nổi bật về ứng dụng Khoa học dữ liệu. Khoa học dữ liệu đã đóng vai trò như thế nào trong dự án này?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 5: Kính thiên văn Kepler đã thu thập lượng dữ liệu khổng lồ về độ sáng của các ngôi sao. Để phát hiện các ngoại hành tinh (exoplanets) từ dữ liệu này, các nhà khoa học dữ liệu có thể sử dụng kỹ thuật phân tích nào?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 6: Hệ thống Giám sát đánh bắt cá toàn cầu (Global Fishing Watch) sử dụng Khoa học dữ liệu và dữ liệu vệ tinh. Ứng dụng này minh họa cho khả năng của Khoa học dữ liệu trong việc gì?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 7: Các mô hình ngôn ngữ lớn (LLM) như GPT-3 là kết quả của sự tiến bộ trong Khoa học dữ liệu và Trí tuệ nhân tạo. Chúng thể hiện ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 8: Khi American Express áp dụng mô hình học máy để phát hiện gian lận trong giao dịch tài chính, họ đang sử dụng Khoa học dữ liệu để giải quyết vấn đề gì?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 9: Tại sao kiến thức về Thống kê lại quan trọng đối với một nhà Khoa học dữ liệu?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 10: Ngoài các kỹ năng kỹ thuật (Toán, Thống kê, Lập trình), một nhà Khoa học dữ liệu cần có kỹ năng mềm nào để làm việc hiệu quả, đặc biệt khi trình bày kết quả cho những người không chuyên về kỹ thuật?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 11: Giai đoạn 'Phân tích và khai phá dữ liệu' trong quy trình Khoa học dữ liệu bao gồm những hoạt động chính nào?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 12: Tại sao 'kiến thức chuyên môn trong lĩnh vực ứng dụng' (domain knowledge) lại là một thành phần quan trọng của Khoa học dữ liệu?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 13: Một nhà Khoa học dữ liệu đang làm việc với dữ liệu về khách hàng của một ngân hàng để xác định những khách hàng có khả năng vỡ nợ cao. Đây là một ví dụ về ứng dụng Khoa học dữ liệu để làm gì?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 14: Trong bối cảnh dữ liệu lớn (Big Data), đặc điểm 'Variety' (Đa dạng) đề cập đến điều gì?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 15: Tại sao giai đoạn 'Trực quan hóa dữ liệu' lại quan trọng trong Khoa học dữ liệu?

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 16: Một nhà Khoa học dữ liệu muốn xây dựng một mô hình phân loại email thành 'thư rác' hoặc 'không phải thư rác'. Đây là một ví dụ về bài toán thuộc loại nào trong học máy?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 17: Khi áp dụng Khoa học dữ liệu để tối ưu hóa tuyến đường giao thông trong một thành phố, mục tiêu chính của việc này là gì?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 18: Đâu là một thách thức tiềm ẩn về mặt đạo đức khi sử dụng Khoa học dữ liệu trong các quyết định ảnh hưởng đến con người (ví dụ: tuyển dụng, cho vay)?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 19: Giai đoạn 'Xác định vấn đề' trong quy trình Khoa học dữ liệu đòi hỏi điều gì?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 20: Khi phân tích dữ liệu, việc xác định các giá trị ngoại lai (outliers) và xử lý chúng là một phần của giai đoạn nào trong quy trình Khoa học dữ liệu?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 21: Đâu là một ví dụ về việc sử dụng Khoa học dữ liệu để 'phát hiện tri thức từ dữ liệu'?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 22: Một dự án Khoa học dữ liệu thường có tính chất lặp (iterative). Điều này có nghĩa là gì?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 23: Tại sao việc đánh giá và giải thích kết quả phân tích là một giai đoạn quan trọng trong Khoa học dữ liệu?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 24: Khi làm việc với dữ liệu phi cấu trúc như văn bản hoặc hình ảnh, nhà Khoa học dữ liệu cần áp dụng các kỹ thuật đặc thù. Điều này liên quan đến đặc điểm nào của dữ liệu lớn?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 25: Một công ty dịch vụ trực tuyến thu thập dữ liệu về hành vi người dùng theo thời gian thực (ví dụ: số lần nhấp chuột, thời gian trên trang). Đây là ví dụ về dữ liệu có đặc điểm nào nổi bật?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 26: Mục tiêu 'Tối ưu hóa quyết định' trong Khoa học dữ liệu có nghĩa là gì?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 27: Tại sao việc 'ra quyết định và triển khai' là giai đoạn cuối cùng nhưng cũng rất quan trọng trong một dự án Khoa học dữ liệu?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 28: Một nhà Khoa học dữ liệu cần phân tích dữ liệu về thời tiết để dự báo nhiệt độ ngày mai. Đây là một ví dụ về bài toán thuộc loại nào trong học máy?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 29: Khi một công ty sử dụng Khoa học dữ liệu để hiểu rõ hơn về hành vi và sở thích của các nhóm khách hàng khác nhau, họ đang thực hiện hoạt động gì?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 4

Câu 30: Đâu là một kỹ năng tư duy bậc cao quan trọng mà Khoa học dữ liệu đòi hỏi?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Công nghệ 10 Cánh diều Bài 20: Quy trình thiết kế kĩ thuật

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 05

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 05 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là khoa học dữ liệu tích hợp kiến thức và phương pháp từ những lĩnh vực chính nào?

  • A. Chỉ Tin học và Toán học.
  • B. Chỉ Thống kê và Kinh doanh.
  • C. Toán học, Thống kê và Khoa học máy tính, cùng với kiến thức chuyên môn trong lĩnh vực ứng dụng.
  • D. Chỉ Khoa học máy tính và các lĩnh vực nghệ thuật.

Câu 2: Mục tiêu cốt lõi nhất của khoa học dữ liệu là gì?

  • A. Thu thập càng nhiều dữ liệu càng tốt.
  • B. Xây dựng các phần mềm phức tạp để xử lý dữ liệu.
  • C. Trực quan hóa dữ liệu dưới dạng biểu đồ đẹp mắt.
  • D. Phát hiện tri thức, hiểu biết sâu sắc và đưa ra quyết định dựa trên dữ liệu.

Câu 3: Giả sử một công ty thương mại điện tử muốn giảm thiểu tình trạng khách hàng bỏ giỏ hàng. Họ quyết định sử dụng khoa học dữ liệu để phân tích hành vi của khách hàng. Giai đoạn đầu tiên trong quy trình dự án khoa học dữ liệu mà họ cần thực hiện là gì?

  • A. Xác định vấn đề kinh doanh cần giải quyết.
  • B. Thu thập dữ liệu lịch sử mua sắm của khách hàng.
  • C. Xây dựng mô hình dự đoán hành vi.
  • D. Trực quan hóa dữ liệu về giỏ hàng bị bỏ quên.

Câu 4: Sau khi xác định vấn đề (giảm bỏ giỏ hàng), công ty thương mại điện tử tiến hành thu thập dữ liệu về lịch sử duyệt web, sản phẩm đã xem, sản phẩm đã thêm vào giỏ hàng, thông tin cá nhân khách hàng, v.v. Giai đoạn tiếp theo trong quy trình dự án khoa học dữ liệu là gì?

  • A. Phân tích và khai phá dữ liệu.
  • B. Chuẩn bị dữ liệu (làm sạch, biến đổi, tích hợp).
  • C. Đánh giá và giải thích kết quả.
  • D. Ra quyết định và triển khai.

Câu 5: Trong giai đoạn chuẩn bị dữ liệu cho dự án giảm bỏ giỏ hàng, công ty phát hiện nhiều bản ghi khách hàng bị thiếu thông tin tuổi hoặc địa chỉ không nhất quán. Hoạt động nào sau đây thuộc về giai đoạn này?

  • A. Xây dựng biểu đồ thể hiện tỷ lệ bỏ giỏ hàng theo ngày.
  • B. Áp dụng thuật toán học máy để dự đoán.
  • C. Trình bày kết quả phân tích cho ban giám đốc.
  • D. Điền giá trị thiếu hoặc chuẩn hóa định dạng địa chỉ.

Câu 6: Giai đoạn nào trong quy trình dự án khoa học dữ liệu tập trung vào việc tìm ra các mẫu hình, xu hướng và mối quan hệ ẩn trong dữ liệu đã được chuẩn bị?

  • A. Phân tích và khai phá dữ liệu.
  • B. Thu thập dữ liệu.
  • C. Đánh giá và giải thích.
  • D. Ra quyết định và triển khai.

Câu 7: Sau khi xây dựng mô hình dự đoán khách hàng có khả năng bỏ giỏ hàng cao, công ty cần kiểm tra xem mô hình hoạt động tốt đến mức nào. Giai đoạn nào của dự án khoa học dữ liệu thực hiện việc này?

  • A. Thu thập dữ liệu.
  • B. Chuẩn bị dữ liệu.
  • C. Đánh giá và giải thích kết quả.
  • D. Ra quyết định và triển khai.

Câu 8: Tại sao giai đoạn "Ra quyết định và triển khai" lại là bước cuối cùng quan trọng trong quy trình dự án khoa học dữ liệu?

  • A. Vì đây là lúc thu thập thêm dữ liệu nếu cần.
  • B. Vì kết quả phân tích phải được chuyển đổi thành hành động cụ thể để giải quyết vấn đề ban đầu.
  • C. Vì đây là lúc xác định lại vấn đề nếu kết quả không như mong đợi.
  • D. Vì đây là lúc trực quan hóa toàn bộ quá trình.

Câu 9: Dự án Bộ gen người (Human Genome Project - HGP) là một ví dụ điển hình về ứng dụng quy mô lớn của khoa học dữ liệu trong lĩnh vực nào?

  • A. Y học và Sinh học.
  • B. Thiên văn học.
  • C. Tài chính ngân hàng.
  • D. Giám sát môi trường.

Câu 10: Thách thức lớn mà Dự án Bộ gen người (HGP) đặt ra cho khoa học dữ liệu chủ yếu liên quan đến điều gì?

  • A. Thiếu các nhà khoa học có chuyên môn.
  • B. Chi phí thu thập dữ liệu quá thấp.
  • C. Khối lượng dữ liệu khổng lồ cần lưu trữ, xử lý và phân tích.
  • D. Không có công nghệ máy tính phù hợp.

Câu 11: Kính thiên văn Kepler đã tạo ra một lượng lớn dữ liệu về độ sáng của các ngôi sao. Mục đích chính của việc thu thập dữ liệu này trong bối cảnh khoa học dữ liệu là gì?

  • A. Để tạo ra những bức ảnh đẹp về vũ trụ.
  • B. Để phát hiện và nghiên cứu các hành tinh ngoài hệ mặt trời (ngoại hành tinh) dựa trên sự thay đổi độ sáng của ngôi sao chủ.
  • C. Để đo nhiệt độ chính xác của các ngôi sao.
  • D. Để tính toán khoảng cách giữa các thiên hà.

Câu 12: Hệ thống Giám sát đánh bắt cá toàn cầu (Global Fishing Watch) sử dụng dữ liệu vệ tinh và khoa học dữ liệu để giải quyết vấn đề nào?

  • A. Dự báo thời tiết trên biển.
  • B. Theo dõi sự di cư của các loài chim biển.
  • C. Đo nhiệt độ bề mặt nước biển.
  • D. Phát hiện và ngăn chặn hoạt động đánh bắt cá bất hợp pháp, không báo cáo và không theo quy định (IUU fishing).

Câu 13: Các mô hình ngôn ngữ lớn (LLM) như GPT-3 là một thành tựu nổi bật của khoa học dữ liệu, đặc biệt trong lĩnh vực nào?

  • A. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP).
  • B. Nhận dạng hình ảnh.
  • C. Phân tích dữ liệu tài chính.
  • D. Dự báo thời tiết.

Câu 14: Khoa học dữ liệu đã giúp các tổ chức tài chính như American Express cải thiện đáng kể khả năng phát hiện gian lận bằng cách nào?

  • A. Tăng cường số lượng nhân viên kiểm tra giao dịch thủ công.
  • B. Chỉ dựa vào các quy tắc cố định để phát hiện gian lận.
  • C. Xây dựng và triển khai các mô hình học máy để phân tích hành vi giao dịch bất thường.
  • D. Yêu cầu khách hàng xác nhận mọi giao dịch nhỏ.

Câu 15: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn về giao dịch ngân hàng để tìm ra các giao dịch có dấu hiệu rửa tiền. Công việc này thuộc về giai đoạn nào trong quy trình dự án khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Phân tích và khai phá dữ liệu.
  • C. Đánh giá và giải thích kết quả.
  • D. Ra quyết định và triển khai.

Câu 16: Vai trò của Thống kê trong khoa học dữ liệu là gì?

  • A. Chỉ cung cấp các công cụ để lưu trữ dữ liệu.
  • B. Chỉ giúp thiết kế giao diện người dùng.
  • C. Chỉ liên quan đến việc thu thập dữ liệu.
  • D. Cung cấp các phương pháp để hiểu, tóm tắt dữ liệu, kiểm định giả thuyết và xây dựng mô hình dựa trên xác suất.

Câu 17: Tại sao Khoa học máy tính lại là một thành phần không thể thiếu của khoa học dữ liệu?

  • A. Vì Khoa học máy tính cung cấp kiến thức về kinh doanh.
  • B. Vì Khoa học máy tính giúp thu thập dữ liệu thủ công.
  • C. Vì Khoa học máy tính cung cấp các thuật toán, công cụ phần mềm và năng lực tính toán để xử lý và phân tích dữ liệu quy mô lớn.
  • D. Vì Khoa học máy tính chỉ liên quan đến việc tạo ra hình ảnh trực quan.

Câu 18: Khi một nhà khoa học dữ liệu sử dụng biểu đồ, đồ thị hoặc bảng tổng hợp để trình bày các phát hiện từ dữ liệu, họ đang thực hiện hoạt động nào?

  • A. Trực quan hóa dữ liệu (Data Visualization).
  • B. Thu thập dữ liệu.
  • C. Mô hình hóa dữ liệu.
  • D. Làm sạch dữ liệu.

Câu 19: Một trong những thách thức chính khi làm việc với dữ liệu lớn (Big Data) trong khoa học dữ liệu là gì?

  • A. Dữ liệu lớn luôn sạch và dễ hiểu.
  • B. Dữ liệu lớn có khối lượng nhỏ nên dễ lưu trữ.
  • C. Dữ liệu lớn thường chỉ đến từ một nguồn duy nhất.
  • D. Khối lượng, tốc độ và sự đa dạng của dữ liệu đòi hỏi các công cụ và kỹ thuật xử lý chuyên biệt.

Câu 20: Tại sao kiến thức chuyên môn về lĩnh vực ứng dụng (ví dụ: y tế, tài chính, bán lẻ) lại quan trọng đối với một nhà khoa học dữ liệu?

  • A. Để họ có thể viết code nhanh hơn.
  • B. Để họ hiểu rõ ngữ cảnh của dữ liệu, xác định vấn đề phù hợp và diễn giải kết quả phân tích một cách chính xác.
  • C. Để họ có thể thiết kế phần cứng máy tính.
  • D. Để họ có thể thu thập dữ liệu bằng tay hiệu quả hơn.

Câu 21: Khi phân tích dữ liệu về doanh số bán hàng, nhà khoa học dữ liệu nhận thấy có một số giao dịch có giá trị âm, điều này không thể xảy ra trong thực tế. Hoạt động khắc phục vấn đề này thuộc giai đoạn nào?

  • A. Chuẩn bị dữ liệu.
  • B. Thu thập dữ liệu.
  • C. Phân tích và khai phá dữ liệu.
  • D. Đánh giá và giải thích.

Câu 22: Một công ty truyền thông xã hội sử dụng khoa học dữ liệu để phân tích nội dung người dùng đăng tải và dự đoán xu hướng viral. Loại dữ liệu chính mà họ xử lý trong trường hợp này là gì?

  • A. Dữ liệu số học (numerical data) thuần túy.
  • B. Dữ liệu hình ảnh tĩnh (static image data).
  • C. Dữ liệu văn bản (text data) và có thể cả hình ảnh, video.
  • D. Dữ liệu địa lý (geographical data) thuần túy.

Câu 23: Sự khác biệt chính giữa khoa học dữ liệu và phân tích dữ liệu (data analysis) truyền thống là gì?

  • A. Khoa học dữ liệu chỉ sử dụng dữ liệu lớn, còn phân tích dữ liệu thì không.
  • B. Khoa học dữ liệu không sử dụng thống kê.
  • C. Phân tích dữ liệu chỉ tập trung vào dự báo, còn khoa học dữ liệu thì không.
  • D. Khoa học dữ liệu có phạm vi rộng hơn, bao gồm toàn bộ vòng đời dữ liệu từ thu thập, chuẩn bị, phân tích sâu, xây dựng mô hình dự đoán/tối ưu hóa, đến triển khai và ra quyết định, thường xử lý dữ liệu phức tạp và quy mô lớn hơn.

Câu 24: Tại sao việc trực quan hóa dữ liệu lại quan trọng trong giai đoạn "Phân tích và khai phá dữ liệu"?

  • A. Để làm cho báo cáo trông đẹp hơn.
  • B. Để dễ dàng phát hiện các mẫu hình, xu hướng, ngoại lệ và hiểu cấu trúc dữ liệu một cách trực quan.
  • C. Để thay thế hoàn toàn việc phân tích thống kê.
  • D. Để làm cho quá trình thu thập dữ liệu nhanh hơn.

Câu 25: Một công ty y tế sử dụng khoa học dữ liệu để phân tích hồ sơ bệnh án của bệnh nhân. Vấn đề đạo đức nào cần được đặc biệt lưu ý trong trường hợp này?

  • A. Chi phí lưu trữ dữ liệu.
  • B. Tốc độ xử lý dữ liệu.
  • C. Bảo mật và quyền riêng tư của thông tin bệnh nhân.
  • D. Lựa chọn ngôn ngữ lập trình phù hợp.

Câu 26: Khi một mô hình khoa học dữ liệu được triển khai trong thực tế (ví dụ: mô hình dự đoán gian lận thẻ tín dụng), việc giám sát hiệu suất của mô hình theo thời gian có quan trọng không? Tại sao?

  • A. Có, vì dữ liệu thực tế có thể thay đổi theo thời gian, làm giảm độ chính xác của mô hình.
  • B. Không, vì mô hình đã được đánh giá là tốt trước khi triển khai.
  • C. Chỉ quan trọng nếu dữ liệu đầu vào rất nhỏ.
  • D. Chỉ quan trọng trong giai đoạn thu thập dữ liệu.

Câu 27: Một nhà khoa học dữ liệu được giao nhiệm vụ phân tích dữ liệu cảm biến từ một nhà máy để dự đoán khi nào một thiết bị có khả năng bị hỏng (bảo trì dự đoán). Đây là một ví dụ về ứng dụng khoa học dữ liệu trong lĩnh vực nào?

  • A. Phân tích ngôn ngữ tự nhiên.
  • B. Công nghiệp và Sản xuất (Industrial Analytics).
  • C. Thương mại điện tử.
  • D. Thiên văn học.

Câu 28: Trong quy trình khoa học dữ liệu, việc "làm sạch" dữ liệu (data cleaning) nhằm mục đích gì?

  • A. Để làm cho dữ liệu có kích thước nhỏ hơn.
  • B. Để chuyển dữ liệu sang định dạng hình ảnh.
  • C. Để xử lý các giá trị thiếu, không chính xác, không nhất quán hoặc trùng lặp trong dữ liệu.
  • D. Để thêm thông tin mới vào dữ liệu.

Câu 29: Một công ty vận tải sử dụng khoa học dữ liệu để tối ưu hóa lộ trình giao hàng, nhằm giảm chi phí và thời gian. Đây là một ví dụ về việc sử dụng khoa học dữ liệu để:

  • A. Tối ưu hóa quyết định.
  • B. Phát hiện tri thức mới.
  • C. Trực quan hóa dữ liệu địa lý.
  • D. Xác định vấn đề ban đầu.

Câu 30: Lĩnh vực nào dưới đây KHÔNG phải là một thành phần cốt lõi tạo nên khoa học dữ liệu?

  • A. Toán học và Thống kê.
  • B. Khoa học máy tính.
  • C. Kiến thức chuyên môn về lĩnh vực ứng dụng.
  • D. Thiết kế đồ họa chuyên nghiệp (Graphic Design).

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là khoa học dữ liệu tích hợp kiến thức và phương pháp từ những lĩnh vực chính nào?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 2: Mục tiêu cốt lõi nhất của khoa học dữ liệu là gì?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 3: Giả sử một công ty thương mại điện tử muốn giảm thiểu tình trạng khách hàng bỏ giỏ hàng. Họ quyết định sử dụng khoa học dữ liệu để phân tích hành vi của khách hàng. Giai đoạn đầu tiên trong quy trình dự án khoa học dữ liệu mà họ cần thực hiện là gì?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 4: Sau khi xác định vấn đề (giảm bỏ giỏ hàng), công ty thương mại điện tử tiến hành thu thập dữ liệu về lịch sử duyệt web, sản phẩm đã xem, sản phẩm đã thêm vào giỏ hàng, thông tin cá nhân khách hàng, v.v. Giai đoạn tiếp theo trong quy trình dự án khoa học dữ liệu là gì?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 5: Trong giai đoạn chuẩn bị dữ liệu cho dự án giảm bỏ giỏ hàng, công ty phát hiện nhiều bản ghi khách hàng bị thiếu thông tin tuổi hoặc địa chỉ không nhất quán. Hoạt động nào sau đây thuộc về giai đoạn này?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 6: Giai đoạn nào trong quy trình dự án khoa học dữ liệu tập trung vào việc tìm ra các mẫu hình, xu hướng và mối quan hệ ẩn trong dữ liệu đã được chuẩn bị?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 7: Sau khi xây dựng mô hình dự đoán khách hàng có khả năng bỏ giỏ hàng cao, công ty cần kiểm tra xem mô hình hoạt động tốt đến mức nào. Giai đoạn nào của dự án khoa học dữ liệu thực hiện việc này?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 8: Tại sao giai đoạn 'Ra quyết định và triển khai' lại là bước cuối cùng quan trọng trong quy trình dự án khoa học dữ liệu?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 9: Dự án Bộ gen người (Human Genome Project - HGP) là một ví dụ điển hình về ứng dụng quy mô lớn của khoa học dữ liệu trong lĩnh vực nào?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 10: Thách thức lớn mà Dự án Bộ gen người (HGP) đặt ra cho khoa học dữ liệu chủ yếu liên quan đến điều gì?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 11: Kính thiên văn Kepler đã tạo ra một lượng lớn dữ liệu về độ sáng của các ngôi sao. Mục đích chính của việc thu thập dữ liệu này trong bối cảnh khoa học dữ liệu là gì?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 12: Hệ thống Giám sát đánh bắt cá toàn cầu (Global Fishing Watch) sử dụng dữ liệu vệ tinh và khoa học dữ liệu để giải quyết vấn đề nào?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 13: Các mô hình ngôn ngữ lớn (LLM) như GPT-3 là một thành tựu nổi bật của khoa học dữ liệu, đặc biệt trong lĩnh vực nào?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 14: Khoa học dữ liệu đã giúp các tổ chức tài chính như American Express cải thiện đáng kể khả năng phát hiện gian lận bằng cách nào?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 15: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn về giao dịch ngân hàng để tìm ra các giao dịch có dấu hiệu rửa tiền. Công việc này thuộc về giai đoạn nào trong quy trình dự án khoa học dữ liệu?

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 16: Vai trò của Thống kê trong khoa học dữ liệu là gì?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 17: Tại sao Khoa học máy tính lại là một thành phần không thể thiếu của khoa học dữ liệu?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 18: Khi một nhà khoa học dữ liệu sử dụng biểu đồ, đồ thị hoặc bảng tổng hợp để trình bày các phát hiện từ dữ liệu, họ đang thực hiện hoạt động nào?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 19: Một trong những thách thức chính khi làm việc với dữ liệu lớn (Big Data) trong khoa học dữ liệu là gì?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 20: Tại sao kiến thức chuyên môn về lĩnh vực ứng dụng (ví dụ: y tế, tài chính, bán lẻ) lại quan trọng đối với một nhà khoa học dữ liệu?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 21: Khi phân tích dữ liệu về doanh số bán hàng, nhà khoa học dữ liệu nhận thấy có một số giao dịch có giá trị âm, điều này không thể xảy ra trong thực tế. Hoạt động khắc phục vấn đề này thuộc giai đoạn nào?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 22: Một công ty truyền thông xã hội sử dụng khoa học dữ liệu để phân tích nội dung người dùng đăng tải và dự đoán xu hướng viral. Loại dữ liệu chính mà họ xử lý trong trường hợp này là gì?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 23: Sự khác biệt chính giữa khoa học dữ liệu và phân tích dữ liệu (data analysis) truyền thống là gì?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 24: Tại sao việc trực quan hóa dữ liệu lại quan trọng trong giai đoạn 'Phân tích và khai phá dữ liệu'?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 25: Một công ty y tế sử dụng khoa học dữ liệu để phân tích hồ sơ bệnh án của bệnh nhân. Vấn đề đạo đức nào cần được đặc biệt lưu ý trong trường hợp này?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 26: Khi một mô hình khoa học dữ liệu được triển khai trong thực tế (ví dụ: mô hình dự đoán gian lận thẻ tín dụng), việc giám sát hiệu suất của mô hình theo thời gian có quan trọng không? Tại sao?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 27: Một nhà khoa học dữ liệu được giao nhiệm vụ phân tích dữ liệu cảm biến từ một nhà máy để dự đoán khi nào một thiết bị có khả năng bị hỏng (bảo trì dự đoán). Đây là một ví dụ về ứng dụng khoa học dữ liệu trong lĩnh vực nào?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 28: Trong quy trình khoa học dữ liệu, việc 'làm sạch' dữ liệu (data cleaning) nhằm mục đích gì?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 29: Một công ty vận tải sử dụng khoa học dữ liệu để tối ưu hóa lộ trình giao hàng, nhằm giảm chi phí và thời gian. Đây là một ví dụ về việc sử dụng khoa học dữ liệu để:

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 5

Câu 30: Lĩnh vực nào dưới đây KHÔNG phải là một thành phần cốt lõi tạo nên khoa học dữ liệu?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 06

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 06 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Khoa học dữ liệu được định nghĩa là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp các kiến thức và phương pháp từ những lĩnh vực nào?

  • A. Chỉ tập trung vào Toán học và Thống kê.
  • B. Chỉ liên quan đến Khoa học máy tính và Kỹ thuật phần mềm.
  • C. Kết hợp Toán học, Thống kê, Khoa học máy tính và kiến thức chuyên môn trong lĩnh vực ứng dụng.
  • D. Chủ yếu là thu thập và lưu trữ dữ liệu lớn.

Câu 2: Mục tiêu cốt lõi của Khoa học dữ liệu là gì?

  • A. Tạo ra các thuật toán phức tạp nhất.
  • B. Chỉ để trực quan hóa dữ liệu một cách đẹp mắt.
  • C. Thu thập càng nhiều dữ liệu càng tốt.
  • D. Phát hiện tri thức, hiểu biết sâu sắc từ dữ liệu để hỗ trợ ra quyết định hoặc giải quyết vấn đề.

Câu 3: Trong quy trình dự án Khoa học dữ liệu, giai đoạn đầu tiên và quan trọng nhất là gì, giúp định hình toàn bộ quá trình sau này?

  • A. Xác định vấn đề kinh doanh hoặc mục tiêu cần đạt được.
  • B. Bắt đầu thu thập dữ liệu ngay lập tức.
  • C. Xây dựng mô hình học máy đầu tiên.
  • D. Trực quan hóa các mẫu dữ liệu ban đầu.

Câu 4: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu thô chứa nhiều giá trị bị thiếu, định dạng không nhất quán và các bản ghi trùng lặp. Anh ấy đang ở giai đoạn nào của dự án Khoa học dữ liệu và cần thực hiện công việc gì?

  • A. Giai đoạn Thu thập dữ liệu; cần tìm thêm nguồn dữ liệu.
  • B. Giai đoạn Chuẩn bị dữ liệu; cần làm sạch, biến đổi và tích hợp dữ liệu.
  • C. Giai đoạn Phân tích dữ liệu; cần chạy thuật toán học máy.
  • D. Giai đoạn Ra quyết định; cần trình bày kết quả cho người quản lý.

Câu 5: Giai đoạn "Phân tích và khai phá dữ liệu" trong dự án Khoa học dữ liệu bao gồm những hoạt động chính nào?

  • A. Chỉ vẽ biểu đồ và đồ thị.
  • B. Chỉ viết báo cáo về dữ liệu.
  • C. Áp dụng các kỹ thuật thống kê, học máy để tìm kiếm mẫu hình, xu hướng và mối quan hệ trong dữ liệu.
  • D. Chỉ lưu trữ dữ liệu vào cơ sở dữ liệu.

Câu 6: Sau khi xây dựng và kiểm tra một mô hình dự đoán trong Khoa học dữ liệu, giai đoạn tiếp theo là "Đánh giá và giải thích". Mục đích chính của giai đoạn này là gì?

  • A. Chỉ để đảm bảo mô hình chạy nhanh.
  • B. Chỉ để tìm lỗi cú pháp trong mã lệnh.
  • C. Để thu thập thêm dữ liệu mới.
  • D. Để đánh giá hiệu quả của mô hình dựa trên các tiêu chí đặt ra và giải thích ý nghĩa của kết quả cho các bên liên quan.

Câu 7: Một công ty muốn sử dụng Khoa học dữ liệu để tối ưu hóa chiến lược marketing. Sau khi phân tích dữ liệu khách hàng và xây dựng mô hình phân khúc, họ cần làm gì ở giai đoạn "Ra quyết định và triển khai"?

  • A. Bỏ qua kết quả phân tích và tiếp tục làm theo kinh nghiệm cũ.
  • B. Áp dụng các phân khúc khách hàng đã xác định vào việc thiết kế các chiến dịch quảng cáo, ưu đãi phù hợp.
  • C. Thu thập lại toàn bộ dữ liệu từ đầu.
  • D. Chỉ lưu trữ mô hình đã xây dựng mà không sử dụng.

Câu 8: Kỹ năng nào sau đây được coi là quan trọng nhất đối với một nhà khoa học dữ liệu để có thể hiểu rõ ngữ cảnh của bài toán và diễn giải kết quả phân tích một cách chính xác?

  • A. Kỹ năng thiết kế đồ họa.
  • B. Kỹ năng viết code bằng mọi ngôn ngữ lập trình.
  • C. Kiến thức chuyên môn sâu về lĩnh vực ứng dụng (domain knowledge).
  • D. Kỹ năng chơi game máy tính.

Câu 9: Tại sao kỹ năng giao tiếp và trực quan hóa dữ liệu lại quan trọng trong Khoa học dữ liệu?

  • A. Để trình bày kết quả phân tích phức tạp một cách dễ hiểu cho những người không có chuyên môn sâu về dữ liệu.
  • B. Chỉ để làm cho báo cáo trông đẹp mắt hơn.
  • C. Để làm cho dữ liệu tự động phân tích.
  • D. Để giảm bớt lượng dữ liệu cần xử lý.

Câu 10: Dự án Bộ gen người (Human Genome Project - HGP) là một ví dụ điển hình về ứng dụng Khoa học dữ liệu trong lĩnh vực Sinh học. Dự án này minh chứng cho khía cạnh nào của Khoa học dữ liệu vào thời điểm đó?

  • A. Khả năng xử lý dữ liệu nhỏ.
  • B. Khả năng quản lý và phân tích lượng dữ liệu khổng lồ, phức tạp cần sự hợp tác liên ngành.
  • C. Chủ yếu dựa vào phân tích văn bản.
  • D. Không liên quan đến việc ra quyết định.

Câu 11: Kính thiên văn Kepler, một dự án của NASA, đã thu thập dữ liệu về sự thay đổi độ sáng của hàng trăm nghìn ngôi sao. Việc sử dụng Khoa học dữ liệu để phân tích dữ liệu này giúp các nhà khoa học đạt được mục tiêu chính nào?

  • A. Chụp ảnh màu các hành tinh.
  • B. Đo nhiệt độ của các ngôi sao.
  • C. Tạo ra các mô hình 3D của dải ngân hà.
  • D. Phát hiện và xác nhận sự tồn tại của các hành tinh ngoài hệ mặt trời (ngoại hành tinh) dựa trên sự suy giảm độ sáng khi chúng đi qua phía trước ngôi sao chủ.

Câu 12: Hệ thống Giám sát đánh bắt cá toàn cầu (Global Fishing Watch) sử dụng dữ liệu vệ tinh kết hợp với Khoa học dữ liệu để phát hiện hoạt động đánh bắt cá bất hợp pháp. Công nghệ cốt lõi nào giúp xác định vị trí và hành vi của tàu cá?

  • A. Phân tích dữ liệu Hệ thống nhận dạng tự động (AIS) và dữ liệu vệ tinh.
  • B. Sử dụng máy bay không người lái để theo dõi trực tiếp.
  • C. Thu thập thông tin từ các thủy thủ.
  • D. Phân tích dữ liệu từ cảm biến nhiệt độ nước biển.

Câu 13: Mô hình ngôn ngữ lớn (Large Language Model - LLM) như GPT-3 là một thành tựu nổi bật của Khoa học dữ liệu và Trí tuệ nhân tạo. Khả năng chính của các mô hình này liên quan đến việc xử lý loại dữ liệu nào?

  • A. Dữ liệu hình ảnh và video.
  • B. Dữ liệu văn bản và ngôn ngữ tự nhiên.
  • C. Dữ liệu số và bảng tính.
  • D. Dữ liệu âm thanh và nhạc.

Câu 14: Trong lĩnh vực tài chính, Khoa học dữ liệu được ứng dụng rộng rãi để phát hiện gian lận. Kỹ thuật nào từ Khoa học dữ liệu thường được sử dụng để phân tích các giao dịch và xác định các mẫu bất thường có khả năng là gian lận?

  • A. Chỉ sử dụng các phép tính cộng trừ đơn giản.
  • B. Kiểm tra thủ công từng giao dịch.
  • C. Áp dụng các thuật toán học máy để nhận diện các mẫu hành vi đáng ngờ.
  • D. Dựa vào cảm tính của chuyên gia.

Câu 15: Phân tích sự khác biệt chính giữa Khoa học dữ liệu và Thống kê truyền thống trong bối cảnh dữ liệu lớn và phức tạp hiện nay.

  • A. Thống kê chỉ xử lý dữ liệu lớn, còn Khoa học dữ liệu chỉ xử lý dữ liệu nhỏ.
  • B. Khoa học dữ liệu chỉ tập trung vào lý thuyết, còn Thống kê tập trung vào ứng dụng.
  • C. Thống kê sử dụng công cụ hiện đại, còn Khoa học dữ liệu chỉ dùng giấy bút.
  • D. Khoa học dữ liệu có phạm vi rộng hơn, tích hợp Khoa học máy tính và kiến thức ứng dụng để giải quyết các bài toán thực tế, vượt ra ngoài suy luận dựa trên mẫu nhỏ như Thống kê truyền thống thường làm.

Câu 16: Khi làm việc với dữ liệu, việc hiểu rõ nguồn gốc, cấu trúc và ý nghĩa của từng trường dữ liệu thuộc về giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Ra quyết định.
  • B. Thu thập và hiểu dữ liệu (thường là một phần của Chuẩn bị dữ liệu).
  • C. Triển khai mô hình.
  • D. Đánh giá kết quả.

Câu 17: Giả sử bạn là nhà khoa học dữ liệu được giao nhiệm vụ phân tích dữ liệu bán hàng để dự đoán doanh số quý tới. Kỹ năng nào sau đây là ít quan trọng nhất đối với bạn trong dự án này?

  • A. Kỹ năng lập trình để xử lý dữ liệu và xây dựng mô hình.
  • B. Kiến thức về thống kê để hiểu các xu hướng bán hàng.
  • C. Khả năng sửa chữa phần cứng máy tính.
  • D. Kỹ năng giao tiếp để trình bày dự báo cho ban lãnh đạo.

Câu 18: Một thách thức lớn trong giai đoạn Chuẩn bị dữ liệu là xử lý dữ liệu không đồng nhất (dữ liệu từ nhiều nguồn với định dạng khác nhau). Để giải quyết vấn đề này, nhà khoa học dữ liệu thường sử dụng kỹ thuật nào?

  • A. Tích hợp dữ liệu (Data Integration) và biến đổi dữ liệu (Data Transformation).
  • B. Xây dựng mô hình học máy ngay lập tức.
  • C. Chỉ xóa bỏ tất cả dữ liệu không đồng nhất.
  • D. Thu thập lại dữ liệu từ một nguồn duy nhất.

Câu 19: Việc sử dụng các biểu đồ, đồ thị, bản đồ nhiệt để khám phá và trình bày các mẫu hình, xu hướng trong dữ liệu thuộc về kỹ năng và giai đoạn nào của Khoa học dữ liệu?

  • A. Kỹ năng lập trình, giai đoạn Thu thập dữ liệu.
  • B. Kỹ năng thống kê, giai đoạn Ra quyết định.
  • C. Kỹ năng quản trị cơ sở dữ liệu, giai đoạn Triển khai.
  • D. Kỹ năng trực quan hóa dữ liệu, giai đoạn Phân tích và khai phá dữ liệu hoặc Đánh giá và giải thích.

Câu 20: Một trong những ứng dụng của Khoa học dữ liệu là xây dựng hệ thống gợi ý (recommendation system) cho các trang web thương mại điện tử hoặc dịch vụ streaming. Hệ thống này hoạt động dựa trên nguyên tắc nào?

  • A. Phân tích hành vi người dùng (lịch sử xem, mua, tìm kiếm) và các đặc điểm của sản phẩm/nội dung để dự đoán sở thích và đề xuất phù hợp.
  • B. Chỉ hiển thị các sản phẩm mới nhất.
  • C. Chỉ hiển thị các sản phẩm đắt nhất.
  • D. Ngẫu nhiên hiển thị bất kỳ sản phẩm nào.

Câu 21: Tại sao Khoa học dữ liệu ngày càng trở nên quan trọng trong kỷ nguyên số?

  • A. Vì chúng ta không còn cần kinh nghiệm con người.
  • B. Vì máy tính đã thay thế hoàn toàn con người trong mọi việc.
  • C. Vì lượng dữ liệu được tạo ra và thu thập ngày càng lớn, phức tạp, đòi hỏi các phương pháp tinh vi để khai thác giá trị từ chúng.
  • D. Vì chỉ có các công ty lớn mới có dữ liệu.

Câu 22: Phân biệt giữa Trí tuệ nhân tạo (AI) và Khoa học dữ liệu (Data Science).

  • A. AI là một phần của Khoa học dữ liệu.
  • B. Khoa học dữ liệu là một phần của AI.
  • C. AI và Khoa học dữ liệu là hoàn toàn giống nhau.
  • D. Khoa học dữ liệu là lĩnh vực rộng hơn tập trung vào toàn bộ quy trình từ thu thập đến ra quyết định dựa trên dữ liệu, trong khi AI (và Học máy) là các công cụ và kỹ thuật thường được sử dụng trong giai đoạn phân tích của Khoa học dữ liệu để xây dựng các hệ thống thông minh.

Câu 23: Một nhà khoa học dữ liệu đang sử dụng các thuật toán hồi quy và phân loại để xây dựng mô hình dự đoán. Anh ấy đang áp dụng các kỹ thuật từ lĩnh vực nào, vốn là một phần quan trọng của Khoa học dữ liệu?

  • A. Học máy (Machine Learning).
  • B. Thiết kế đồ họa.
  • C. Quản lý dự án.
  • D. Phát triển web.

Câu 24: Khi một dự án Khoa học dữ liệu đã hoàn thành và mô hình dự đoán được triển khai vào hệ thống thực tế, công việc của nhà khoa học dữ liệu có kết thúc không? Nếu không, giai đoạn nào tiếp theo là cần thiết?

  • A. Có, công việc kết thúc sau khi triển khai.
  • B. Không, cần quay lại giai đoạn thu thập dữ liệu mới ngay lập tức.
  • C. Không, cần tiếp tục theo dõi, bảo trì và cập nhật mô hình theo thời gian khi có dữ liệu mới hoặc điều kiện thay đổi.
  • D. Không, chỉ cần viết báo cáo cuối cùng và không làm gì thêm.

Câu 25: Trong bối cảnh Khoa học dữ liệu, "Dữ liệu lớn" (Big Data) thường được mô tả bằng các đặc điểm nào?

  • A. Chỉ có khối lượng (Volume) lớn.
  • B. Có khối lượng (Volume), tốc độ (Velocity) và đa dạng (Variety) cao.
  • C. Chỉ có tốc độ (Velocity) rất nhanh.
  • D. Chỉ có đa dạng (Variety) về định dạng.

Câu 26: Việc đảm bảo tính riêng tư và bảo mật của dữ liệu người dùng là một thách thức quan trọng trong Khoa học dữ liệu. Điều này liên quan chủ yếu đến khía cạnh nào của Khoa học dữ liệu?

  • A. Chỉ liên quan đến tốc độ xử lý dữ liệu.
  • B. Chỉ liên quan đến việc chọn thuật toán phù hợp.
  • C. Chỉ là trách nhiệm của bộ phận IT.
  • D. Liên quan đến khía cạnh đạo đức (Ethics) và pháp lý trong xử lý dữ liệu.

Câu 27: Một nhà khoa học dữ liệu phát hiện ra rằng mô hình dự đoán của mình hoạt động rất tốt trên dữ liệu dùng để huấn luyện nhưng lại kém hiệu quả trên dữ liệu mới. Vấn đề này trong Học máy (một phần của Khoa học dữ liệu) được gọi là gì?

  • A. Quá khớp (Overfitting).
  • B. Thiếu dữ liệu (Underfitting).
  • C. Dữ liệu sạch (Clean Data).
  • D. Mô hình đơn giản (Simple Model).

Câu 28: Phân tích dữ liệu cảm biến từ các thiết bị IoT (Internet of Things) trong một nhà máy để dự đoán khi nào một máy móc có khả năng bị hỏng (bảo trì dự đoán) là một ví dụ về ứng dụng Khoa học dữ liệu trong lĩnh vực nào?

  • A. Giáo dục.
  • B. Y tế.
  • C. Công nghiệp và Sản xuất.
  • D. Nông nghiệp.

Câu 29: Một trong những lợi ích chính mà Khoa học dữ liệu mang lại cho doanh nghiệp là gì?

  • A. Chỉ làm tăng chi phí hoạt động.
  • B. Giúp đưa ra các quyết định dựa trên dữ liệu (data-driven decisions), cải thiện hiệu quả hoạt động, tăng doanh thu hoặc giảm rủi ro.
  • C. Làm chậm quá trình ra quyết định.
  • D. Chỉ tạo ra các báo cáo phức tạp khó hiểu.

Câu 30: Để thành công trong một dự án Khoa học dữ liệu, ngoài kiến thức chuyên môn và kỹ năng kỹ thuật, yếu tố nào sau đây đóng vai trò quan trọng trong việc chuyển kết quả phân tích thành hành động cụ thể?

  • A. Khả năng làm việc độc lập hoàn toàn.
  • B. Chỉ dựa vào may mắn.
  • C. Tránh mọi tương tác với các bộ phận khác.
  • D. Khả năng cộng tác hiệu quả với các bên liên quan (quản lý, chuyên gia lĩnh vực) để hiểu rõ vấn đề và triển khai giải pháp.

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 1: Khoa học dữ liệu được định nghĩa là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp các kiến thức và phương pháp từ những lĩnh vực nào?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 2: Mục tiêu cốt lõi của Khoa học dữ liệu là gì?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 3: Trong quy trình dự án Khoa học dữ liệu, giai đoạn đầu tiên và quan trọng nhất là gì, giúp định hình toàn bộ quá trình sau này?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 4: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu thô chứa nhiều giá trị bị thiếu, định dạng không nhất quán và các bản ghi trùng lặp. Anh ấy đang ở giai đoạn nào của dự án Khoa học dữ liệu và cần thực hi??n công việc gì?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 5: Giai đoạn 'Phân tích và khai phá dữ liệu' trong dự án Khoa học dữ liệu bao gồm những hoạt động chính nào?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 6: Sau khi xây dựng và kiểm tra một mô hình dự đoán trong Khoa học dữ liệu, giai đoạn tiếp theo là 'Đánh giá và giải thích'. Mục đích chính của giai đoạn này là gì?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 7: Một công ty muốn sử dụng Khoa học dữ liệu để tối ưu hóa chiến lược marketing. Sau khi phân tích dữ liệu khách hàng và xây dựng mô hình phân khúc, họ cần làm gì ở giai đoạn 'Ra quyết định và triển khai'?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 8: Kỹ năng nào sau đây được coi là quan trọng nhất đối với một nhà khoa học dữ liệu để có thể hiểu rõ ngữ cảnh của bài toán và diễn giải kết quả phân tích một cách chính xác?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 9: Tại sao kỹ năng giao tiếp và trực quan hóa dữ liệu lại quan trọng trong Khoa học dữ liệu?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 10: Dự án Bộ gen người (Human Genome Project - HGP) là một ví dụ điển hình về ứng dụng Khoa học dữ liệu trong lĩnh vực Sinh học. Dự án này minh chứng cho khía cạnh nào của Khoa học dữ liệu vào thời điểm đó?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 11: Kính thiên văn Kepler, một dự án của NASA, đã thu thập dữ liệu về sự thay đổi độ sáng của hàng trăm nghìn ngôi sao. Việc sử dụng Khoa học dữ liệu để phân tích dữ liệu này giúp các nhà khoa học đạt được mục tiêu chính nào?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 12: Hệ thống Giám sát đánh bắt cá toàn cầu (Global Fishing Watch) sử dụng dữ liệu vệ tinh kết hợp với Khoa học dữ liệu để phát hiện hoạt động đánh bắt cá bất hợp pháp. Công nghệ cốt lõi nào giúp xác định vị trí và hành vi của tàu cá?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 13: Mô hình ngôn ngữ lớn (Large Language Model - LLM) như GPT-3 là một thành tựu nổi bật của Khoa học dữ liệu và Trí tuệ nhân tạo. Khả năng chính của các mô hình này liên quan đến việc xử lý loại dữ liệu nào?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 14: Trong lĩnh vực tài chính, Khoa học dữ liệu được ứng dụng rộng rãi để phát hiện gian lận. Kỹ thuật nào từ Khoa học dữ liệu thường được sử dụng để phân tích các giao dịch và xác định các mẫu bất thường có khả năng là gian lận?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 15: Phân tích sự khác biệt chính giữa Khoa học dữ liệu và Thống kê truyền thống trong bối cảnh dữ liệu lớn và phức tạp hiện nay.

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 16: Khi làm việc với dữ liệu, việc hiểu rõ nguồn gốc, cấu trúc và ý nghĩa của từng trường dữ liệu thuộc về giai đoạn nào trong quy trình Khoa học dữ liệu?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 17: Giả sử bạn là nhà khoa học dữ liệu được giao nhiệm vụ phân tích dữ liệu bán hàng để dự đoán doanh số quý tới. Kỹ năng nào sau đây là *ít* quan trọng nhất đối với bạn trong dự án này?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 18: Một thách thức lớn trong giai đoạn Chuẩn bị dữ liệu là xử lý dữ liệu không đồng nhất (dữ liệu từ nhiều nguồn với định dạng khác nhau). Để giải quyết vấn đề này, nhà khoa học dữ liệu thường sử dụng kỹ thuật nào?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 19: Việc sử dụng các biểu đồ, đồ thị, bản đồ nhiệt để khám phá và trình bày các mẫu hình, xu hướng trong dữ liệu thuộc về kỹ năng và giai đoạn nào của Khoa học dữ liệu?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 20: Một trong những ứng dụng của Khoa học dữ liệu là xây dựng hệ thống gợi ý (recommendation system) cho các trang web thương mại điện tử hoặc dịch vụ streaming. Hệ thống này hoạt động dựa trên nguyên tắc nào?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 21: Tại sao Khoa học dữ liệu ngày càng trở nên quan trọng trong kỷ nguyên số?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 22: Phân biệt giữa Trí tuệ nhân tạo (AI) và Khoa học dữ liệu (Data Science).

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 23: Một nhà khoa học dữ liệu đang sử dụng các thuật toán hồi quy và phân loại để xây dựng mô hình dự đoán. Anh ấy đang áp dụng các kỹ thuật từ lĩnh vực nào, vốn là một phần quan trọng của Khoa học dữ liệu?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 24: Khi một dự án Khoa học dữ liệu đã hoàn thành và mô hình dự đoán được triển khai vào hệ thống thực tế, công việc của nhà khoa học dữ liệu có kết thúc không? Nếu không, giai đoạn nào tiếp theo là cần thiết?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 25: Trong bối cảnh Khoa học dữ liệu, 'Dữ liệu lớn' (Big Data) thường được mô tả bằng các đặc điểm nào?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 26: Việc đảm bảo tính riêng tư và bảo mật của dữ liệu người dùng là một thách thức quan trọng trong Khoa học dữ liệu. Điều này liên quan chủ yếu đến khía cạnh nào của Khoa học dữ liệu?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 27: Một nhà khoa học dữ liệu phát hiện ra rằng mô hình dự đoán của mình hoạt động rất tốt trên dữ liệu dùng để huấn luyện nhưng lại kém hiệu quả trên dữ liệu mới. Vấn đề này trong Học máy (một phần của Khoa học dữ liệu) được gọi là gì?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 28: Phân tích dữ liệu cảm biến từ các thiết bị IoT (Internet of Things) trong một nhà máy để dự đoán khi nào một máy móc có khả năng bị hỏng (bảo trì dự đoán) là một ví dụ về ứng dụng Khoa học dữ liệu trong lĩnh vực nào?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 29: Một trong những lợi ích chính mà Khoa học dữ liệu mang lại cho doanh nghiệp là gì?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 6

Câu 30: Để thành công trong một dự án Khoa học dữ liệu, ngoài kiến thức chuyên môn và kỹ năng kỹ thuật, yếu tố nào sau đây đóng vai trò quan trọng trong việc chuyển kết quả phân tích thành hành động cụ thể?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 07

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 07 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là khoa học dữ liệu kết hợp kiến thức và kỹ năng từ những lĩnh vực chính nào?

  • A. Chỉ Khoa học máy tính và Công nghệ thông tin.
  • B. Chỉ Toán học và Vật lý.
  • C. Chỉ Thống kê và Kinh tế học.
  • D. Toán học, Thống kê, Khoa học máy tính và kiến thức chuyên môn trong lĩnh vực ứng dụng.

Câu 2: Mục tiêu cốt lõi của khoa học dữ liệu là gì?

  • A. Chỉ để lưu trữ và quản lý dữ liệu lớn (Big Data).
  • B. Chỉ để tạo ra các báo cáo thống kê đơn giản.
  • C. Trích xuất thông tin có ý nghĩa, phát hiện tri thức và đưa ra quyết định dựa trên dữ liệu.
  • D. Chỉ để xây dựng các trang web và ứng dụng di động.

Câu 3: Giả sử bạn đang làm việc trong một dự án khoa học dữ liệu để dự đoán giá nhà. Sau khi đã thu thập dữ liệu về các ngôi nhà, giai đoạn tiếp theo quan trọng nhất trước khi xây dựng mô hình là gì?

  • A. Trực quan hóa dữ liệu cuối cùng.
  • B. Chuẩn bị và làm sạch dữ liệu (xử lý thiếu sót, loại bỏ nhiễu...).
  • C. Ra quyết định về giá bán cụ thể cho từng ngôi nhà.
  • D. Triển khai mô hình dự đoán cho người dùng cuối.

Câu 4: Một trong những giai đoạn quan trọng của quy trình khoa học dữ liệu là "Phân tích và khai phá dữ liệu". Hoạt động nào sau đây thường được thực hiện trong giai đoạn này?

  • A. Áp dụng các thuật toán học máy để tìm ra mẫu hình hoặc xây dựng mô hình dự đoán.
  • B. Xác định mục tiêu kinh doanh của dự án.
  • C. Thu thập dữ liệu từ các nguồn khác nhau.
  • D. Viết báo cáo cuối cùng trình bày kết quả cho lãnh đạo.

Câu 5: Dự án Bộ gen người (Human Genome Project - HGP) là một ví dụ điển hình về ứng dụng khoa học dữ liệu. Dự án này chủ yếu liên quan đến việc gì?

  • A. Xây dựng các mô hình dự báo thời tiết chính xác hơn.
  • B. Phát triển các thuật toán tìm kiếm trên Internet.
  • C. Phân tích dữ liệu từ các kính thiên văn để tìm kiếm hành tinh mới.
  • D. Giải trình tự và phân tích cấu trúc, chức năng của toàn bộ gen trong bộ gen người.

Câu 6: Hệ thống Giám sát đánh bắt cá toàn cầu (Global Fishing Watch) sử dụng khoa học dữ liệu như thế nào để góp phần chống lại hoạt động đánh bắt cá bất hợp pháp?

  • A. Phân tích dữ liệu về giá cá trên thị trường toàn cầu.
  • B. Theo dõi số lượng cá được đánh bắt tại các cảng.
  • C. Sử dụng dữ liệu vệ tinh và phân tích hành vi tàu cá để phát hiện các hoạt động đáng ngờ.
  • D. Tổng hợp báo cáo từ các cơ quan kiểm lâm biển.

Câu 7: Kính thiên văn Kepler thu thập một lượng lớn dữ liệu về độ sáng của các ngôi sao. Việc phân tích dữ liệu này bằng các phương pháp khoa học dữ liệu nhằm mục đích chính là gì?

  • A. Phát hiện các hành tinh ngoài hệ mặt trời (ngoại hành tinh) dựa trên sự thay đổi độ sáng của ngôi sao chủ.
  • B. Đo khoảng cách chính xác đến các thiên hà xa xôi.
  • C. Nghiên cứu thành phần hóa học của khí trong các tinh vân.
  • D. Xây dựng bản đồ chi tiết của các chòm sao.

Câu 8: Mô hình ngôn ngữ lớn (LLM) như GPT-3 là một thành tựu nổi bật của khoa học dữ liệu kết hợp với trí tuệ nhân tạo. Ứng dụng chính của các mô hình này là gì?

  • A. Phân tích hình ảnh y tế để chẩn đoán bệnh.
  • B. Xử lý và tạo ra văn bản, dịch thuật, tóm tắt nội dung.
  • C. Điều khiển robot công nghiệp trong nhà máy.
  • D. Phân tích dữ liệu tài chính để dự đoán biến động thị trường.

Câu 9: Một công ty thẻ tín dụng áp dụng khoa học dữ liệu để phát hiện gian lận. Họ sử dụng dữ liệu lịch sử giao dịch để xây dựng một mô hình có khả năng nhận diện các giao dịch bất thường. Đây là ví dụ về việc sử dụng khoa học dữ liệu để làm gì?

  • A. Xây dựng mô hình dự đoán/phân loại để nhận diện hành vi gian lận.
  • B. Chỉ để thống kê số lượng giao dịch hàng ngày.
  • C. Thiết kế giao diện người dùng cho ứng dụng ngân hàng.
  • D. Quản lý cơ sở dữ liệu khách hàng đơn thuần.

Câu 10: Tại sao việc "Chuẩn bị dữ liệu" (Data Preparation) lại là một giai đoạn tốn thời gian và quan trọng trong quy trình khoa học dữ liệu?

  • A. Vì giai đoạn này chỉ đơn giản là sao chép dữ liệu.
  • B. Vì dữ liệu luôn hoàn hảo và không cần xử lý gì thêm.
  • C. Vì dữ liệu thực tế thường bị thiếu, không nhất quán, có lỗi và cần được làm sạch, biến đổi để phù hợp cho phân tích.
  • D. Vì đây là giai đoạn cuối cùng trước khi ra quyết định.

Câu 11: Một nhà khoa học dữ liệu phát hiện mối tương quan mạnh mẽ giữa việc sử dụng mạng xã hội và mức độ căng thẳng ở thanh thiếu niên. Để biến phát hiện này thành kiến thức có giá trị và có thể ứng dụng, bước tiếp theo trong quy trình khoa học dữ liệu thường là gì?

  • A. Thu thập thêm dữ liệu một cách ngẫu nhiên.
  • B. Ngừng dự án vì đã tìm thấy mối tương quan.
  • C. Bỏ qua mối tương quan và tìm một mối quan hệ khác.
  • D. Đánh giá, giải thích kết quả và xem xét ý nghĩa thực tiễn để ra quyết định hoặc đề xuất hành động.

Câu 12: Kỹ năng nào sau đây được xem là RẤT quan trọng đối với một nhà khoa học dữ liệu, bên cạnh kiến thức về toán, thống kê và khoa học máy tính?

  • A. Kiến thức chuyên môn sâu sắc về lĩnh vực mà dữ liệu thuộc về (ví dụ: y tế, tài chính, giáo dục).
  • B. Khả năng chơi nhạc cụ thành thạo.
  • C. Kỹ năng thiết kế đồ họa chuyên nghiệp.
  • D. Khả năng sửa chữa phần cứng máy tính.

Câu 13: Khi trình bày kết quả của một dự án khoa học dữ liệu, việc "Trực quan hóa dữ liệu" (Data Visualization) đóng vai trò gì?

  • A. Chỉ làm cho báo cáo trông đẹp mắt hơn.
  • B. Giúp người xem (đặc biệt là những người không chuyên) dễ dàng hiểu được các mẫu hình, xu hướng và kết quả phân tích phức tạp.
  • C. Làm tăng độ phức tạp của kết quả.
  • D. Thay thế hoàn toàn việc phân tích thống kê.

Câu 14: Một công ty bán lẻ muốn sử dụng khoa học dữ liệu để cá nhân hóa trải nghiệm mua sắm trực tuyến cho khách hàng. Dữ liệu nào sau đây là nguồn quan trọng nhất cho mục tiêu này?

  • A. Dữ liệu về thời tiết hàng ngày.
  • B. Dữ liệu về dân số của thành phố.
  • C. Dữ liệu về lịch sử duyệt web, lịch sử mua hàng và tương tác của từng khách hàng trên trang web.
  • D. Dữ liệu về giá cổ phiếu của công ty đối thủ.

Câu 15: Tại sao đạo đức và tính riêng tư của dữ liệu là vấn đề cần quan tâm trong khoa học dữ liệu?

  • A. Vì việc xử lý dữ liệu cá nhân không có bất kỳ rủi ro nào.
  • B. Vì các mô hình khoa học dữ liệu luôn đưa ra quyết định công bằng.
  • C. Vì dữ liệu chỉ thuộc về công ty thu thập nó.
  • D. Vì việc thu thập, phân tích và sử dụng dữ liệu (đặc biệt là dữ liệu cá nhân) có thể dẫn đến thiên vị, phân biệt đối xử hoặc xâm phạm quyền riêng tư nếu không được quản lý cẩn thận.

Câu 16: Giả sử bạn được giao nhiệm vụ xây dựng một hệ thống gợi ý phim cho người dùng dựa trên lịch sử xem của họ. Bước đầu tiên theo quy trình khoa học dữ liệu là gì?

  • A. Xác định rõ vấn đề: "Làm thế nào để gợi ý phim phù hợp nhất cho từng người dùng?"
  • B. Thu thập dữ liệu về tất cả các bộ phim có sẵn.
  • C. Bắt đầu xây dựng mô hình học máy ngay lập tức.
  • D. Trực quan hóa dữ liệu về số lượt xem phim.

Câu 17: Khi phân tích dữ liệu, một nhà khoa học dữ liệu tìm thấy một mẫu hình thú vị: khách hàng mua tã trẻ em thường có xu hướng mua bia cùng lúc. Để xác nhận và hiểu rõ hơn mẫu hình này, phương pháp phân tích nào thường được sử dụng?

  • A. Phân tích chuỗi thời gian.
  • B. Phân tích luật kết hợp (Association Rule Mining).
  • C. Phân tích cảm xúc (Sentiment Analysis).
  • D. Phân tích hình ảnh.

Câu 18: Đâu là một thách thức phổ biến khi thu thập dữ liệu cho các dự án khoa học dữ liệu?

  • A. Dữ liệu luôn có sẵn ở định dạng hoàn hảo.
  • B. Không bao giờ gặp vấn đề về quyền truy cập dữ liệu.
  • C. Chi phí thu thập dữ liệu luôn rất thấp.
  • D. Dữ liệu có thể phân tán ở nhiều nguồn khác nhau, không đầy đủ, không nhất quán hoặc có định dạng không chuẩn.

Câu 19: Trong giai đoạn "Đánh giá và giải thích" của quy trình khoa học dữ liệu, hoạt động chính là gì?

  • A. Bắt đầu thu thập dữ liệu mới.
  • B. Chỉ tập trung vào việc làm sạch dữ liệu.
  • C. Kiểm tra hiệu suất của mô hình (nếu có), hiểu ý nghĩa của kết quả phân tích và rút ra kết luận liên quan đến vấn đề ban đầu.
  • D. Thiết kế giao diện người dùng cho sản phẩm cuối.

Câu 20: Việc sử dụng khoa học dữ liệu trong lĩnh vực y tế, ví dụ như phân tích hình ảnh X-quang để phát hiện bệnh, yêu cầu kiến thức chuyên môn từ lĩnh vực nào kết hợp với kỹ năng khoa học dữ liệu?

  • A. Y học và Chẩn đoán hình ảnh.
  • B. Kiến trúc và Xây dựng.
  • C. Luật pháp và Tư pháp.
  • D. Âm nhạc và Nghệ thuật.

Câu 21: Đâu là lý do chính khiến nhu cầu về các chuyên gia khoa học dữ liệu ngày càng tăng?

  • A. Vì có quá ít dữ liệu cần xử lý.
  • B. Vì máy tính đã có thể tự làm mọi thứ với dữ liệu.
  • C. Vì chỉ có các công ty công nghệ lớn mới tạo ra dữ liệu.
  • D. Vì sự bùng nổ về lượng dữ liệu được tạo ra và nhu cầu ngày càng tăng của các tổ chức trong việc khai thác giá trị từ dữ liệu để đưa ra quyết định tốt hơn.

Câu 22: Khi một dự án khoa học dữ liệu đã hoàn thành phân tích và đưa ra quyết định, giai đoạn cuối cùng thường là gì?

  • A. Quay lại bước thu thập dữ liệu ban đầu.
  • B. Triển khai kết quả hoặc mô hình vào thực tế hoạt động của tổ chức.
  • C. Loại bỏ toàn bộ dữ liệu đã sử dụng.
  • D. Bắt đầu một dự án hoàn toàn mới về một chủ đề khác.

Câu 23: Một nhà khoa học dữ liệu sử dụng các kỹ thuật thống kê để xác định xem sự khác biệt về doanh số bán hàng giữa hai nhóm khách hàng (một nhóm nhận email quảng cáo, một nhóm không) có ý nghĩa hay không. Hoạt động này thuộc giai đoạn nào của quy trình khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Chuẩn bị dữ liệu.
  • C. Phân tích và khai phá dữ liệu.
  • D. Ra quyết định và triển khai.

Câu 24: Đâu là một ví dụ về dữ liệu "phi cấu trúc" (unstructured data) mà khoa học dữ liệu thường xử lý?

  • A. Nội dung bài viết trên mạng xã hội, hình ảnh, video.
  • B. Dữ liệu trong bảng tính Excel có các cột và hàng rõ ràng.
  • C. Dữ liệu trong cơ sở dữ liệu quan hệ.
  • D. Dữ liệu địa chỉ được lưu trữ trong một định dạng cố định.

Câu 25: Tại sao "Toán học" và "Thống kê" là nền tảng quan trọng của khoa học dữ liệu?

  • A. Chỉ để thực hiện các phép tính cộng trừ đơn giản.
  • B. Chỉ để vẽ biểu đồ đẹp mắt.
  • C. Chỉ cần thiết cho việc lưu trữ dữ liệu.
  • D. Cung cấp các công cụ, mô hình và phương pháp để phân tích dữ liệu, hiểu mối quan hệ giữa các biến, đưa ra suy luận và dự đoán.

Câu 26: Một nhà khoa học dữ liệu đang làm việc với dữ liệu khách hàng và nhận thấy rằng một số bản ghi bị thiếu thông tin về tuổi. Việc quyết định điền giá trị thiếu bằng giá trị trung bình, loại bỏ bản ghi, hoặc sử dụng kỹ thuật phức tạp hơn thuộc giai đoạn nào của quy trình khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Chuẩn bị dữ liệu.
  • C. Phân tích và khai phá dữ liệu.
  • D. Đánh giá và giải thích.

Câu 27: Việc sử dụng khoa học dữ liệu để tối ưu hóa tuyến đường giao hàng nhằm giảm thiểu chi phí vận chuyển là một ví dụ về việc ứng dụng khoa học dữ liệu trong lĩnh vực nào?

  • A. Nghiên cứu khoa học cơ bản.
  • B. Phân tích ngôn ngữ tự nhiên.
  • C. Hoạt động kinh doanh và Logistics.
  • D. Phát triển game máy tính.

Câu 28: Để trở thành một nhà khoa học dữ liệu giỏi, bên cạnh kiến thức chuyên môn, kỹ năng mềm nào sau đây được coi là rất quan trọng?

  • A. Khả năng viết chữ đẹp.
  • B. Khả năng ghi nhớ số điện thoại.
  • C. Khả năng vẽ tranh sơn dầu.
  • D. Kỹ năng giao tiếp, làm việc nhóm và khả năng trình bày kết quả cho những người không chuyên.

Câu 29: Khi một nhà khoa học dữ liệu xây dựng xong một mô hình dự đoán, bước tiếp theo cần làm gì để biết mô hình đó có hữu ích hay không?

  • A. Đánh giá hiệu suất của mô hình bằng các chỉ số phù hợp và so sánh với mục tiêu ban đầu.
  • B. Chuyển ngay mô hình cho khách hàng sử dụng.
  • C. Xóa mô hình và bắt đầu lại từ đầu.
  • D. Chỉ cần lưu trữ mô hình lại.

Câu 30: Khoa học dữ liệu khác biệt với "Phân tích dữ liệu truyền thống" (Traditional Data Analysis) ở điểm nào?

  • A. Khoa học dữ liệu chỉ xử lý dữ liệu nhỏ.
  • B. Khoa học dữ liệu không sử dụng thống kê.
  • C. Khoa học dữ liệu chỉ tập trung vào việc tạo báo cáo.
  • D. Khoa học dữ liệu thường xử lý dữ liệu lớn, đa dạng, phức tạp hơn, sử dụng các công cụ và thuật toán tiên tiến hơn (bao gồm học máy, AI) để không chỉ mô tả quá khứ mà còn dự đoán tương lai và đưa ra quyết định tối ưu.

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là khoa học dữ liệu kết hợp kiến thức và kỹ năng từ những lĩnh vực chính nào?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 2: Mục tiêu cốt lõi của khoa học dữ liệu là gì?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 3: Giả sử bạn đang làm việc trong một dự án khoa học dữ liệu để dự đoán giá nhà. Sau khi đã thu thập dữ liệu về các ngôi nhà, giai đoạn tiếp theo quan trọng nhất trước khi xây dựng mô hình là gì?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 4: Một trong những giai đoạn quan trọng của quy trình khoa học dữ liệu là 'Phân tích và khai phá dữ liệu'. Hoạt động nào sau đây thường được thực hiện trong giai đoạn này?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 5: Dự án Bộ gen người (Human Genome Project - HGP) là một ví dụ điển hình về ứng dụng khoa học dữ liệu. Dự án này chủ yếu liên quan đến việc gì?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 6: Hệ thống Giám sát đánh bắt cá toàn cầu (Global Fishing Watch) sử dụng khoa học dữ liệu như thế nào để góp phần chống lại hoạt động đánh bắt cá bất hợp pháp?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 7: Kính thiên văn Kepler thu thập một lượng lớn dữ liệu về độ sáng của các ngôi sao. Việc phân tích dữ liệu này bằng các phương pháp khoa học dữ liệu nhằm mục đích chính là gì?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 8: Mô hình ngôn ngữ lớn (LLM) như GPT-3 là một thành tựu nổi bật của khoa học dữ liệu kết hợp với trí tuệ nhân tạo. Ứng dụng chính của các mô hình này là gì?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 9: Một công ty thẻ tín dụng áp dụng khoa học dữ liệu để phát hiện gian lận. Họ sử dụng dữ liệu lịch sử giao dịch để xây dựng một mô hình có khả năng nhận diện các giao dịch bất thường. Đây là ví dụ về việc sử dụng khoa học dữ liệu để làm gì?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 10: Tại sao việc 'Chuẩn bị dữ liệu' (Data Preparation) lại là một giai đoạn tốn thời gian và quan trọng trong quy trình khoa học dữ liệu?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 11: Một nhà khoa học dữ liệu phát hiện mối tương quan mạnh mẽ giữa việc sử dụng mạng xã hội và mức độ căng thẳng ở thanh thiếu niên. Để biến phát hiện này thành kiến thức có giá trị và có thể ứng dụng, bước tiếp theo trong quy trình khoa học dữ liệu thường là gì?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 12: Kỹ năng nào sau đây được xem là RẤT quan trọng đối với một nhà khoa học dữ liệu, bên cạnh kiến thức về toán, thống kê và khoa học máy tính?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 13: Khi trình bày kết quả của một dự án khoa học dữ liệu, việc 'Trực quan hóa dữ liệu' (Data Visualization) đóng vai trò gì?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 14: Một công ty bán lẻ muốn sử dụng khoa học dữ liệu để cá nhân hóa trải nghiệm mua sắm trực tuyến cho khách hàng. Dữ liệu nào sau đây là nguồn quan trọng nhất cho mục tiêu này?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 15: Tại sao đạo đức và tính riêng tư của dữ liệu là vấn đề cần quan tâm trong khoa học dữ liệu?

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 16: Giả sử bạn được giao nhiệm vụ xây dựng một hệ thống gợi ý phim cho người dùng dựa trên lịch sử xem của họ. Bước đầu tiên theo quy trình khoa học dữ liệu là gì?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 17: Khi phân tích dữ liệu, một nhà khoa học dữ liệu tìm thấy một mẫu hình thú vị: khách hàng mua tã trẻ em thường có xu hướng mua bia cùng lúc. Để xác nhận và hiểu rõ hơn mẫu hình này, phương pháp phân tích nào thường được sử dụng?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 18: Đâu là một thách thức phổ biến khi thu thập dữ liệu cho các dự án khoa học dữ liệu?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 19: Trong giai đoạn 'Đánh giá và giải thích' của quy trình khoa học dữ liệu, hoạt động chính là gì?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 20: Việc sử dụng khoa học dữ liệu trong lĩnh vực y tế, ví dụ như phân tích hình ảnh X-quang để phát hiện bệnh, yêu cầu kiến thức chuyên môn từ lĩnh vực nào kết hợp với kỹ năng khoa học dữ liệu?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 21: Đâu là lý do chính khiến nhu cầu về các chuyên gia khoa học dữ liệu ngày càng tăng?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 22: Khi một dự án khoa học dữ liệu đã hoàn thành phân tích và đưa ra quyết định, giai đoạn cuối cùng thường là gì?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 23: Một nhà khoa học dữ liệu sử dụng các kỹ thuật thống kê để xác định xem sự khác biệt về doanh số bán hàng giữa hai nhóm khách hàng (một nhóm nhận email quảng cáo, một nhóm không) có ý nghĩa hay không. Hoạt động này thuộc giai đoạn nào của quy trình khoa học dữ liệu?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 24: Đâu là một ví dụ về dữ liệu 'phi cấu trúc' (unstructured data) mà khoa học dữ liệu thường xử lý?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 25: Tại sao 'Toán học' và 'Thống kê' là nền tảng quan trọng của khoa học dữ liệu?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 26: Một nhà khoa học dữ liệu đang làm việc với dữ liệu khách hàng và nhận thấy rằng một số bản ghi bị thiếu thông tin về tuổi. Việc quyết định điền giá trị thiếu bằng giá trị trung bình, loại bỏ bản ghi, hoặc sử dụng kỹ thuật phức tạp hơn thuộc giai đoạn nào của quy trình khoa học dữ liệu?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 27: Việc sử dụng khoa học dữ liệu để tối ưu hóa tuyến đường giao hàng nhằm giảm thiểu chi phí vận chuyển là một ví dụ về việc ứng dụng khoa học dữ liệu trong lĩnh vực nào?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 28: Để trở thành một nhà khoa học dữ liệu giỏi, bên cạnh kiến thức chuyên môn, kỹ năng mềm nào sau đây được coi là rất quan trọng?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 29: Khi một nhà khoa học dữ liệu xây dựng xong một mô hình dự đoán, bước tiếp theo cần làm gì để biết mô hình đó có hữu ích hay không?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 7

Câu 30: Khoa học dữ liệu khác biệt với 'Phân tích dữ liệu truyền thống' (Traditional Data Analysis) ở điểm nào?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 08

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 08 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Sự liên ngành này chủ yếu kết hợp những lĩnh vực chính nào để phân tích và trích xuất tri thức từ dữ liệu?

  • A. Chỉ Khoa học máy tính và Trí tuệ nhân tạo.
  • B. Chỉ Thống kê và Kinh doanh.
  • C. Chỉ Toán học và Vật lý.
  • D. Toán học, Thống kê và Khoa học máy tính.

Câu 2: Mục tiêu chính của Khoa học dữ liệu là gì?

  • A. Trích xuất tri thức, hiểu biết sâu sắc và đưa ra quyết định dựa trên dữ liệu.
  • B. Chỉ để tạo ra các biểu đồ và đồ thị trực quan.
  • C. Chỉ để lưu trữ và quản lý dữ liệu lớn.
  • D. Chỉ để tự động hóa các tác vụ lặp đi lặp lại.

Câu 3: Giai đoạn đầu tiên và quan trọng nhất trong quy trình của một dự án Khoa học dữ liệu là gì?

  • A. Thu thập dữ liệu.
  • B. Xác định vấn đề kinh doanh hoặc mục tiêu nghiên cứu.
  • C. Chuẩn bị dữ liệu.
  • D. Xây dựng mô hình dự đoán.

Câu 4: Một công ty bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để đưa ra các chiến dịch khuyến mãi hiệu quả. Bước nào trong quy trình Khoa học dữ liệu sẽ tập trung vào việc thu thập dữ liệu từ các nguồn như hệ thống POS (điểm bán hàng), website và ứng dụng di động?

  • A. Thu thập dữ liệu.
  • B. Chuẩn bị dữ liệu.
  • C. Phân tích và khai phá dữ liệu.
  • D. Ra quyết định và triển khai.

Câu 5: Dữ liệu thu thập được từ các nguồn khác nhau thường không nhất quán, thiếu giá trị hoặc chứa lỗi. Giai đoạn nào trong quy trình Khoa học dữ liệu giải quyết các vấn đề như làm sạch, biến đổi và tích hợp dữ liệu?

  • A. Xác định vấn đề.
  • B. Thu thập dữ liệu.
  • C. Chuẩn bị dữ liệu.
  • D. Đánh giá và giải thích.

Câu 6: Giai đoạn nào của dự án Khoa học dữ liệu tập trung vào việc áp dụng các kỹ thuật thống kê, học máy và khai phá dữ liệu để tìm ra các mẫu, xu hướng và mối quan hệ ẩn trong dữ liệu đã được làm sạch?

  • A. Chuẩn bị dữ liệu.
  • B. Phân tích và khai phá dữ liệu.
  • C. Đánh giá và giải thích.
  • D. Ra quyết định và triển khai.

Câu 7: Sau khi xây dựng một mô hình dự đoán, việc kiểm tra hiệu quả của mô hình, hiểu rõ kết quả và rút ra kết luận có ý nghĩa được thực hiện ở giai đoạn nào?

  • A. Thu thập dữ liệu.
  • B. Chuẩn bị dữ liệu.
  • C. Phân tích và khai phá dữ liệu.
  • D. Đánh giá và giải thích.

Câu 8: Một trong những ứng dụng nổi bật của Khoa học dữ liệu trong lĩnh vực y tế là Dự án Bộ gen người (HGP). Mục tiêu chính của dự án này là gì?

  • A. Phát triển vắc-xin mới.
  • B. Xây dựng bệnh viện thông minh.
  • C. Giải trình tự và lập bản đồ toàn bộ bộ gen người.
  • D. Tự động hóa phẫu thuật bằng robot.

Câu 9: Kính thiên văn không gian Kepler của NASA là một ví dụ về ứng dụng Khoa học dữ liệu trong nghiên cứu vũ trụ. Kính Kepler đã thu thập loại dữ liệu nào chủ yếu để tìm kiếm các hành tinh ngoài hệ mặt trời?

  • A. Hình ảnh trực tiếp các hành tinh.
  • B. Dữ liệu về sự thay đổi độ sáng của các ngôi sao.
  • C. Dữ liệu âm thanh từ không gian.
  • D. Dữ liệu về thành phần hóa học của khí quyển hành tinh.

Câu 10: Hệ thống Giám sát đánh bắt cá toàn cầu (Global Fishing Watch) sử dụng Khoa học dữ liệu để chống lại hoạt động đánh bắt cá bất hợp pháp. Nguồn dữ liệu chính nào được hệ thống này sử dụng để theo dõi tàu cá?

  • A. Dữ liệu vệ tinh xác định vị trí tàu cá.
  • B. Dữ liệu từ nhật ký đánh bắt cá thủ công.
  • C. Dữ liệu từ phỏng vấn ngư dân.
  • D. Dữ liệu từ camera dưới nước.

Câu 11: Các mô hình ngôn ngữ lớn (LLM) như GPT-3, GPT-4 là một thành tựu đáng kể của Khoa học dữ liệu và Trí tuệ nhân tạo trong lĩnh vực nào?

  • A. Xử lý hình ảnh.
  • B. Phân tích dữ liệu số.
  • C. Robot học.
  • D. Xử lý ngôn ngữ tự nhiên.

Câu 12: Trong lĩnh vực tài chính, Khoa học dữ liệu đóng vai trò quan trọng trong việc phát hiện gian lận. Kỹ thuật nào thường được sử dụng để nhận diện các giao dịch bất thường, khác biệt đáng kể so với hành vi thông thường?

  • A. Phân tích cảm xúc.
  • B. Xử lý ngôn ngữ tự nhiên.
  • C. Phát hiện bất thường (Anomaly Detection).
  • D. Phân tích chuỗi thời gian đơn giản.

Câu 13: Giả sử bạn đang làm việc trong một dự án Khoa học dữ liệu để dự đoán giá nhà. Sau khi thu thập dữ liệu về diện tích, số phòng, vị trí, v.v., bạn nhận thấy một số dữ liệu bị thiếu hoặc nhập sai đơn vị. Bạn đang ở giai đoạn nào và cần làm gì tiếp theo?

  • A. Giai đoạn Thu thập dữ liệu, cần thu thập thêm dữ liệu.
  • B. Giai đoạn Chuẩn bị dữ liệu, cần làm sạch và xử lý dữ liệu.
  • C. Giai đoạn Phân tích dữ liệu, cần xây dựng mô hình ngay lập tức.
  • D. Giai đoạn Đánh giá, cần kiểm tra kết quả dự đoán.

Câu 14: Một nhà khoa học dữ liệu đang sử dụng các thuật toán học máy để xây dựng một mô hình phân loại email spam. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Chuẩn bị dữ liệu.
  • C. Phân tích và khai phá dữ liệu.
  • D. Ra quyết định và triển khai.

Câu 15: Sau khi mô hình phân loại email spam (ở Câu 14) được xây dựng, nhà khoa học dữ liệu cần kiểm tra xem mô hình có phân loại chính xác email spam và email hợp lệ hay không. Hoạt động này thuộc giai đoạn nào?

  • A. Xác định vấn đề.
  • B. Chuẩn bị dữ liệu.
  • C. Phân tích và khai phá dữ liệu.
  • D. Đánh giá và giải thích.

Câu 16: Yếu tố nào sau đây KHÔNG phải là một thành phần cốt lõi tạo nên Khoa học dữ liệu?

  • A. Thiết kế đồ họa.
  • B. Toán học và Thống kê.
  • C. Khoa học máy tính.
  • D. Kiến thức chuyên môn về lĩnh vực ứng dụng (Domain Knowledge).

Câu 17: Tại sao kiến thức chuyên môn về lĩnh vực ứng dụng (ví dụ: y tế, tài chính, marketing) lại quan trọng đối với một nhà khoa học dữ liệu?

  • A. Để tự động hóa toàn bộ quy trình phân tích.
  • B. Để viết code nhanh hơn.
  • C. Để hiểu ngữ cảnh dữ liệu, diễn giải kết quả chính xác và xác định vấn đề phù hợp.
  • D. Để thay thế hoàn toàn các công cụ phân tích.

Câu 18: Khoa học dữ liệu khác biệt với Business Intelligence (BI) truyền thống ở điểm nào là chủ yếu?

  • A. BI chỉ sử dụng dữ liệu số, còn Khoa học dữ liệu sử dụng mọi loại dữ liệu.
  • B. BI chỉ dành cho các công ty nhỏ, còn Khoa học dữ liệu dành cho công ty lớn.
  • C. BI chỉ tạo báo cáo, còn Khoa học dữ liệu chỉ xây dựng mô hình.
  • D. BI chủ yếu tập trung vào phân tích mô tả (điều gì đã xảy ra), còn Khoa học dữ liệu mở rộng sang phân tích dự đoán (điều gì sẽ xảy ra) và đề xuất (nên làm gì).

Câu 19: Phân tích dữ liệu từ các cảm biến IoT (Internet of Things) để theo dõi tình trạng hoạt động của máy móc trong nhà máy nhằm dự đoán khi nào máy có khả năng hỏng hóc (bảo trì dự đoán) là một ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

  • A. Sản xuất và Công nghiệp.
  • B. Giáo dục.
  • C. Nghệ thuật.
  • D. Du lịch.

Câu 20: Một công ty truyền thông xã hội muốn phân tích hàng triệu bình luận của người dùng để hiểu xem họ đang cảm thấy thế nào về một sản phẩm mới ra mắt. Hoạt động này thuộc loại phân tích dữ liệu nào?

  • A. Phân tích số học.
  • B. Phân tích hình ảnh.
  • C. Phân tích cảm xúc (Sentiment Analysis).
  • D. Phân tích địa lý.

Câu 21: Khi xây dựng một mô hình dự đoán khách hàng tiềm năng, một nhà khoa học dữ liệu cần chọn lựa các đặc trưng (features) từ dữ liệu thô (ví dụ: tuổi, thu nhập, lịch sử mua sắm) có ảnh hưởng nhất đến việc khách hàng có mua hàng hay không. Hoạt động này thường diễn ra trong giai đoạn nào?

  • A. Thu thập dữ liệu.
  • B. Chuẩn bị dữ liệu (cụ thể là Kỹ thuật đặc trưng - Feature Engineering/Selection).
  • C. Đánh giá mô hình.
  • D. Ra quyết định.

Câu 22: Giả sử bạn đã hoàn thành việc xây dựng và đánh giá mô hình Khoa học dữ liệu. Bước tiếp theo trong quy trình chuẩn là gì để kết quả phân tích có thể tạo ra giá trị thực tế?

  • A. Quay lại bước thu thập dữ liệu.
  • B. Tìm kiếm dữ liệu mới.
  • C. Lặp lại bước phân tích.
  • D. Ra quyết định và triển khai kết quả phân tích vào thực tế.

Câu 23: Vai trò của Thống kê trong Khoa học dữ liệu là gì?

  • A. Cung cấp nền tảng toán học cho việc phân tích dữ liệu, kiểm định giả thuyết và xây dựng mô hình.
  • B. Chỉ để tạo ra các biểu đồ đơn giản.
  • C. Chỉ để lưu trữ dữ liệu hiệu quả.
  • D. Chỉ để viết code cho các thuật toán.

Câu 24: Vai trò của Khoa học máy tính trong Khoa học dữ liệu là gì?

  • A. Chỉ để vẽ biểu đồ phức tạp.
  • B. Chỉ để thu thập dữ liệu thủ công.
  • C. Cung cấp các thuật toán, công cụ lập trình và hạ tầng để xử lý, phân tích dữ liệu quy mô lớn và triển khai mô hình.
  • D. Chỉ để xác định vấn đề ban đầu.

Câu 25: Hệ thống gợi ý sản phẩm (Recommendation System) trên các trang thương mại điện tử (ví dụ: "Những sản phẩm bạn có thể thích") là một ứng dụng phổ biến của Khoa học dữ liệu nhằm mục tiêu gì?

  • A. Giảm thiểu dữ liệu trùng lặp.
  • B. Tăng trải nghiệm người dùng và thúc đẩy doanh số thông qua cá nhân hóa.
  • C. Phát hiện gian lận trong thanh toán.
  • D. Tự động hóa quy trình đóng gói hàng hóa.

Câu 26: Khi một nhà khoa học dữ liệu sử dụng kỹ thuật "phân cụm" (clustering) để nhóm khách hàng thành các nhóm có hành vi mua sắm tương tự nhau, hoạt động này chủ yếu nhằm mục tiêu nào của Khoa học dữ liệu?

  • A. Phát hiện tri thức/mẫu ẩn trong dữ liệu (Knowledge Discovery).
  • B. Dự đoán giá trị tương lai.
  • C. Tối ưu hóa quy trình vận hành.
  • D. Chuẩn bị dữ liệu ban đầu.

Câu 27: Việc sử dụng các công cụ trực quan hóa dữ liệu (Data Visualization) như biểu đồ, đồ thị, dashboard có vai trò gì trong Khoa học dữ liệu?

  • A. Chỉ làm đẹp báo cáo.
  • B. Chỉ để lưu trữ dữ liệu.
  • C. Chỉ để thu thập dữ liệu mới.
  • D. Giúp khám phá dữ liệu, hiểu rõ các mẫu, xu hướng và truyền đạt kết quả phân tích một cách hiệu quả.

Câu 28: Phân tích dữ liệu lịch sử về hiệu suất của các chiến dịch marketing trước đây để xác định chiến lược nào mang lại tỷ lệ chuyển đổi cao nhất và đề xuất ngân sách tối ưu cho chiến dịch tiếp theo là một ví dụ về việc sử dụng Khoa học dữ liệu để đạt được mục tiêu nào?

  • A. Chỉ thu thập dữ liệu.
  • B. Chỉ trực quan hóa dữ liệu.
  • C. Tối ưu hóa quyết định.
  • D. Chỉ chuẩn bị dữ liệu.

Câu 29: Một tập đoàn bán lẻ lớn có dữ liệu về lịch sử mua hàng của hàng triệu khách hàng, bao gồm các mặt hàng đã mua, thời gian mua, địa điểm cửa hàng. Dữ liệu này có thể được sử dụng trong Khoa học dữ liệu để giải quyết vấn đề kinh doanh nào sau đây một cách hiệu quả nhất?

  • A. Thiết kế lại logo công ty.
  • B. Phân khúc khách hàng và đưa ra các chương trình khuyến mãi cá nhân hóa.
  • C. Tuyển dụng nhân viên mới.
  • D. Xây dựng tòa nhà văn phòng mới.

Câu 30: Trong bối cảnh dữ liệu ngày càng bùng nổ, khả năng xử lý dữ liệu lớn và phức tạp là một yêu cầu quan trọng đối với Khoa học dữ liệu. Lĩnh vực nào đóng vai trò cung cấp các công cụ, thuật toán và kiến trúc hệ thống để xử lý hiệu quả lượng dữ liệu khổng lồ này?

  • A. Khoa học máy tính (đặc biệt là các mảng về Big Data, Distributed Computing).
  • B. Toán học (chỉ cung cấp công thức).
  • C. Thống kê (chỉ cung cấp phương pháp phân tích).
  • D. Thiết kế đồ họa (chỉ làm đẹp).

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Sự liên ngành này chủ yếu kết hợp những lĩnh vực chính nào để phân tích và trích xuất tri thức từ dữ liệu?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 2: Mục tiêu chính của Khoa học dữ liệu là gì?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 3: Giai đoạn đầu tiên và quan trọng nhất trong quy trình của một dự án Khoa học dữ liệu là gì?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 4: Một công ty bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để đưa ra các chiến dịch khuyến mãi hiệu quả. Bước nào trong quy trình Khoa học dữ liệu sẽ tập trung vào việc thu thập dữ liệu từ các nguồn như hệ thống POS (điểm bán hàng), website và ứng dụng di động?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 5: Dữ liệu thu thập được từ các nguồn khác nhau thường không nhất quán, thiếu giá trị hoặc chứa lỗi. Giai đoạn nào trong quy trình Khoa học dữ liệu giải quyết các vấn đề như làm sạch, biến đổi và tích hợp dữ liệu?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 6: Giai đoạn nào của dự án Khoa học dữ liệu tập trung vào việc áp dụng các kỹ thuật thống kê, học máy và khai phá dữ liệu để tìm ra các mẫu, xu hướng và mối quan hệ ẩn trong dữ liệu đã được làm sạch?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 7: Sau khi xây dựng một mô hình dự đoán, việc kiểm tra hiệu quả của mô hình, hiểu rõ kết quả và rút ra kết luận có ý nghĩa được thực hiện ở giai đoạn nào?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 8: Một trong những ứng dụng nổi bật của Khoa học dữ liệu trong lĩnh vực y tế là Dự án Bộ gen người (HGP). Mục tiêu chính của dự án này là gì?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 9: Kính thiên văn không gian Kepler của NASA là một ví dụ về ứng dụng Khoa học dữ liệu trong nghiên cứu vũ trụ. Kính Kepler đã thu thập loại dữ liệu nào chủ yếu để tìm kiếm các hành tinh ngoài hệ mặt trời?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 10: Hệ thống Giám sát đánh bắt cá toàn cầu (Global Fishing Watch) sử dụng Khoa học dữ liệu để chống lại hoạt động đánh bắt cá bất hợp pháp. Nguồn dữ liệu chính nào được hệ thống này sử dụng để theo dõi tàu cá?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 11: Các mô hình ngôn ngữ lớn (LLM) như GPT-3, GPT-4 là một thành tựu đáng kể của Khoa học dữ liệu và Trí tuệ nhân tạo trong lĩnh vực nào?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 12: Trong lĩnh vực tài chính, Khoa học dữ liệu đóng vai trò quan trọng trong việc phát hiện gian lận. Kỹ thuật nào thường được sử dụng để nhận diện các giao dịch bất thường, khác biệt đáng kể so với hành vi thông thường?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 13: Giả sử bạn đang làm việc trong một dự án Khoa học dữ liệu để dự đoán giá nhà. Sau khi thu thập dữ liệu về diện tích, số phòng, vị trí, v.v., bạn nhận thấy một số dữ liệu bị thiếu hoặc nhập sai đơn vị. Bạn đang ở giai đoạn nào và cần làm gì tiếp theo?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 14: Một nhà khoa học dữ liệu đang sử dụng các thuật toán học máy để xây dựng một mô hình phân loại email spam. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 15: Sau khi mô hình phân loại email spam (ở Câu 14) được xây dựng, nhà khoa học dữ liệu cần kiểm tra xem mô hình có phân loại chính xác email spam và email hợp lệ hay không. Hoạt động này thuộc giai đoạn nào?

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 16: Yếu tố nào sau đây KHÔNG phải là một thành phần cốt lõi tạo nên Khoa học dữ liệu?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 17: Tại sao kiến thức chuyên môn về lĩnh vực ứng dụng (ví dụ: y tế, tài chính, marketing) lại quan trọng đối với một nhà khoa học dữ liệu?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 18: Khoa học dữ liệu khác biệt với Business Intelligence (BI) truyền thống ở điểm nào là chủ yếu?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 19: Phân tích dữ liệu từ các cảm biến IoT (Internet of Things) để theo dõi tình trạng hoạt động của máy móc trong nhà máy nhằm dự đoán khi nào máy có khả năng hỏng hóc (bảo trì dự đoán) là một ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 20: Một công ty truyền thông xã hội muốn phân tích hàng triệu bình luận của người dùng để hiểu xem họ đang cảm thấy thế nào về một sản phẩm mới ra mắt. Hoạt động này thuộc loại phân tích dữ liệu nào?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 21: Khi xây dựng một mô hình dự đoán khách hàng tiềm năng, một nhà khoa học dữ liệu cần chọn lựa các đặc trưng (features) từ dữ liệu thô (ví dụ: tuổi, thu nhập, lịch sử mua sắm) có ảnh hưởng nhất đến việc khách hàng có mua hàng hay không. Hoạt động này thường diễn ra trong giai đoạn nào?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 22: Giả sử bạn đã hoàn thành việc xây dựng và đánh giá mô hình Khoa học dữ liệu. Bước tiếp theo trong quy trình chuẩn là gì để kết quả phân tích có thể tạo ra giá trị thực tế?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 23: Vai trò của Thống kê trong Khoa học dữ liệu là gì?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 24: Vai trò của Khoa học máy tính trong Khoa học dữ liệu là gì?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 25: Hệ thống gợi ý sản phẩm (Recommendation System) trên các trang thương mại điện tử (ví dụ: 'Những sản phẩm bạn có thể thích') là một ứng dụng phổ biến của Khoa học dữ liệu nhằm mục tiêu gì?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 26: Khi một nhà khoa học dữ liệu sử dụng kỹ thuật 'phân cụm' (clustering) để nhóm khách hàng thành các nhóm có hành vi mua sắm tương tự nhau, hoạt động này chủ yếu nhằm mục tiêu nào của Khoa học dữ liệu?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 27: Việc sử dụng các công cụ trực quan hóa dữ liệu (Data Visualization) như biểu đồ, đồ thị, dashboard có vai trò gì trong Khoa học dữ liệu?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 28: Phân tích dữ liệu lịch sử về hiệu suất của các chiến dịch marketing trước đây để xác định chiến lược nào mang lại tỷ lệ chuyển đổi cao nhất và đề xuất ngân sách tối ưu cho chiến dịch tiếp theo là một ví dụ về việc sử dụng Khoa học dữ liệu để đạt được mục tiêu nào?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 29: Một tập đoàn bán lẻ lớn có dữ liệu về lịch sử mua hàng của hàng triệu khách hàng, bao gồm các mặt hàng đã mua, thời gian mua, địa điểm cửa hàng. Dữ liệu này có thể được sử dụng trong Khoa học dữ liệu để giải quyết vấn đề kinh doanh nào sau đây một cách hiệu quả nhất?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 8

Câu 30: Trong bối cảnh dữ liệu ngày càng bùng nổ, khả năng xử lý dữ liệu lớn và phức tạp là một yêu cầu quan trọng đối với Khoa học dữ liệu. Lĩnh vực nào đóng vai trò cung cấp các công cụ, thuật toán và kiến trúc hệ thống để xử lý hiệu quả lượng dữ liệu khổng lồ này?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 09

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 09 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Một công ty thương mại điện tử muốn hiểu lý do tại sao khách hàng bỏ giỏ hàng trước khi hoàn tất thanh toán. Họ thu thập dữ liệu về hành vi người dùng trên trang web, lịch sử mua sắm, thông tin nhân khẩu học. Công việc tiếp theo trong quy trình khoa học dữ liệu, sau khi thu thập dữ liệu, là gì?

  • A. Xây dựng mô hình dự đoán giá trị trọn đời của khách hàng.
  • B. Trực quan hóa dữ liệu về doanh thu theo từng khu vực.
  • C. Chuẩn bị và làm sạch dữ liệu thu thập được.
  • D. Triển khai giải pháp khuyến mãi cho khách hàng.

Câu 2: Khi phân tích dữ liệu bán hàng, bạn phát hiện ra rằng các giá trị "doanh thu" ở một số bản ghi bị thiếu hoặc sai định dạng (ví dụ: chứa ký tự chữ). Giai đoạn nào trong quy trình khoa học dữ liệu bạn cần thực hiện để xử lý vấn đề này?

  • A. Xác định vấn đề.
  • B. Chuẩn bị dữ liệu.
  • C. Phân tích và khai phá dữ liệu.
  • D. Đánh giá và giải thích.

Câu 3: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn về thời tiết để dự báo khả năng xảy ra bão. Cô ấy sử dụng các thuật toán học máy để xây dựng mô hình. Công việc này thuộc giai đoạn nào trong quy trình khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Chuẩn bị dữ liệu.
  • C. Ra quyết định và triển khai.
  • D. Phân tích và khai phá dữ liệu.

Câu 4: Sau khi xây dựng một mô hình dự đoán khách hàng tiềm năng, nhóm khoa học dữ liệu cần kiểm tra xem mô hình hoạt động tốt như thế nào trên dữ liệu mới và hiểu ý nghĩa của các kết quả dự đoán. Giai đoạn này được gọi là gì?

  • A. Đánh giá và giải thích.
  • B. Xác định vấn đề.
  • C. Thu thập dữ liệu.
  • D. Ra quyết định và triển khai.

Câu 5: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là khoa học dữ liệu kết hợp kiến thức và phương pháp từ nhiều lĩnh vực khác nhau. Những lĩnh vực cốt lõi nào thường được nhắc đến khi nói về khoa học dữ liệu?

  • A. Chỉ có Toán học và Khoa học máy tính.
  • B. Toán học, Thống kê và Khoa học máy tính.
  • C. Chỉ có Thống kê và Khoa học máy tính.
  • D. Chỉ có Toán học và Thống kê.

Câu 6: Mục tiêu chính của khoa học dữ liệu là gì?

  • A. Chỉ để tạo ra các biểu đồ và đồ thị đẹp mắt.
  • B. Chỉ để thu thập lượng lớn dữ liệu.
  • C. Chỉ để xây dựng các phần mềm ứng dụng.
  • D. Phát hiện tri thức, hiểu biết sâu sắc từ dữ liệu để hỗ trợ ra quyết định.

Câu 7: Một công ty bảo hiểm muốn sử dụng khoa học dữ liệu để xác định những yếu tố nào ảnh hưởng lớn nhất đến khả năng xảy ra tai nạn giao thông của người lái xe. Mục tiêu này thuộc khía cạnh nào của khoa học dữ liệu?

  • A. Phát hiện tri thức và hiểu biết.
  • B. Tối ưu hóa quyết định.
  • C. Xây dựng mô hình dự đoán.
  • D. Trực quan hóa dữ liệu đơn thuần.

Câu 8: Một ngân hàng sử dụng các mô hình khoa học dữ liệu để tự động phát hiện và ngăn chặn các giao dịch có dấu hiệu gian lận trong thời gian thực. Ứng dụng này thể hiện rõ nhất khía cạnh nào của khoa học dữ liệu?

  • A. Thu thập dữ liệu lớn.
  • B. Trực quan hóa dữ liệu lịch sử.
  • C. Tối ưu hóa quyết định và hành động.
  • D. Giải thích các sự kiện đã xảy ra.

Câu 9: Dự án Bộ gen người (Human Genome Project - HGP) là một ví dụ nổi bật về ứng dụng khoa học dữ liệu. Dự án này chủ yếu liên quan đến việc gì?

  • A. Xây dựng các mô hình ngôn ngữ lớn.
  • B. Giải trình tự và nghiên cứu cấu trúc, chức năng của bộ gen người.
  • C. Phát triển các hệ thống nhận dạng hình ảnh.
  • D. Theo dõi các hoạt động khai thác tài nguyên thiên nhiên.

Câu 10: Kính thiên văn Kepler là một ví dụ về nguồn dữ liệu khổng lồ cho khoa học dữ liệu trong lĩnh vực thiên văn học. Loại dữ liệu chính mà Kepler thu thập là gì?

  • A. Dữ liệu về độ sáng của các ngôi sao theo thời gian.
  • B. Hình ảnh chi tiết bề mặt các hành tinh.
  • C. Dữ liệu âm thanh từ vũ trụ.
  • D. Dữ liệu nhiệt độ của các ngôi sao.

Câu 11: Hệ thống Giám sát đánh bắt cá toàn cầu (Global Fishing Watch) sử dụng khoa học dữ liệu để giải quyết vấn đề đánh bắt cá bất hợp pháp. Nguồn dữ liệu chính được hệ thống này sử dụng là gì?

  • A. Báo cáo từ các tàu tuần tra.
  • B. Dữ liệu từ các cảng cá.
  • C. Dữ liệu vệ tinh về vị trí và hoạt động của tàu cá.
  • D. Thông tin từ các chợ hải sản.

Câu 12: Các mô hình ngôn ngữ lớn (LLM) như GPT-3 được coi là một thành tựu đáng chú ý của khoa học dữ liệu và trí tuệ nhân tạo. Ứng dụng chính của các mô hình này là gì?

  • A. Phân tích hình ảnh y tế.
  • B. Dự báo giá cổ phiếu.
  • C. Theo dõi biến đổi khí hậu.
  • D. Xử lý và tạo ra ngôn ngữ tự nhiên.

Câu 13: Tại sao giai đoạn "Chuẩn bị dữ liệu" lại chiếm phần lớn thời gian trong một dự án khoa học dữ liệu?

  • A. Vì dữ liệu thực tế thường không hoàn chỉnh, không nhất quán và chứa nhiều lỗi cần được xử lý.
  • B. Vì việc thu thập dữ liệu rất phức tạp và mất nhiều thời gian.
  • C. Vì giai đoạn phân tích đòi hỏi các thuật toán rất phức tạp.
  • D. Vì việc trực quan hóa dữ liệu yêu cầu công cụ chuyên biệt.

Câu 14: Trong giai đoạn "Phân tích và khai phá dữ liệu", nhà khoa học dữ liệu có thể sử dụng những kỹ thuật nào?

  • A. Chỉ có việc nhập dữ liệu vào bảng tính.
  • B. Chỉ có việc tạo báo cáo định kỳ.
  • C. Thống kê mô tả, trực quan hóa, học máy, khai phá dữ liệu.
  • D. Chỉ có việc sao chép dữ liệu sang định dạng khác.

Câu 15: Một công ty muốn dự báo doanh số bán hàng cho quý tiếp theo dựa trên dữ liệu lịch sử, xu hướng thị trường và các chiến dịch quảng cáo sắp tới. Đây là một ví dụ về việc sử dụng khoa học dữ liệu cho mục đích gì?

  • A. Xây dựng mô hình dự đoán.
  • B. Phát hiện gian lận.
  • C. Phân tích cảm xúc khách hàng.
  • D. Tối ưu hóa quy trình sản xuất.

Câu 16: Để trực quan hóa dữ liệu một cách hiệu quả trong khoa học dữ liệu, cần lựa chọn loại biểu đồ hoặc đồ thị phù hợp với mục đích phân tích. Nếu bạn muốn so sánh doanh thu của các sản phẩm khác nhau, loại biểu đồ nào thường được sử dụng?

  • A. Biểu đồ đường (Line chart).
  • B. Biểu đồ cột (Bar chart).
  • C. Biểu đồ phân tán (Scatter plot).
  • D. Biểu đồ vùng (Area chart).

Câu 17: Trong khoa học dữ liệu, "dữ liệu có cấu trúc" là gì?

  • A. Dữ liệu chỉ tồn tại dưới dạng văn bản.
  • B. Dữ liệu được tổ chức theo một mô hình linh hoạt, không cố định.
  • C. Dữ liệu không có bất kỳ tổ chức nào.
  • D. Dữ liệu được tổ chức theo một định dạng cố định, thường là dạng bảng với các hàng và cột.

Câu 18: Hãy phân tích tình huống sau: Một bệnh viện thu thập dữ liệu về bệnh sử, kết quả xét nghiệm và lối sống của bệnh nhân để dự đoán nguy cơ mắc bệnh tim mạch. Dữ liệu này thuộc loại nào và việc dự đoán nguy cơ thuộc mục tiêu nào của khoa học dữ liệu?

  • A. Dữ liệu có cấu trúc; Xây dựng mô hình dự đoán.
  • B. Dữ liệu phi cấu trúc; Phát hiện tri thức.
  • C. Dữ liệu bán cấu trúc; Tối ưu hóa quyết định.
  • D. Dữ liệu lớn; Trực quan hóa dữ liệu.

Câu 19: Đâu là ví dụ về "dữ liệu phi cấu trúc"?

  • A. Bảng điểm thi của học sinh.
  • B. Cơ sở dữ liệu khách hàng của một công ty.
  • C. Nội dung các bài đăng trên mạng xã hội.
  • D. Bảng lương của nhân viên.

Câu 20: Việc sử dụng khoa học dữ liệu để phân tích cảm xúc (sentiment analysis) từ các bình luận của khách hàng về một sản phẩm trên mạng xã hội thuộc giai đoạn nào và mục tiêu nào của dự án khoa học dữ liệu?

  • A. Thu thập dữ liệu; Tối ưu hóa quyết định.
  • B. Phân tích và khai phá dữ liệu; Phát hiện tri thức.
  • C. Chuẩn bị dữ liệu; Xây dựng mô hình dự đoán.
  • D. Đánh giá và giải thích; Trực quan hóa dữ liệu.

Câu 21: Một trong những thách thức lớn khi làm việc với dữ liệu trong khoa học dữ liệu là "tính không đầy đủ" (incompleteness). Điều này đề cập đến vấn đề gì của dữ liệu?

  • A. Dữ liệu có kích thước quá lớn.
  • B. Dữ liệu được thu thập từ nhiều nguồn khác nhau.
  • C. Dữ liệu chứa các giá trị không chính xác.
  • D. Dữ liệu có các giá trị bị thiếu hoặc không tồn tại.

Câu 22: Để đảm bảo tính "nhất quán" (consistency) của dữ liệu trong giai đoạn chuẩn bị dữ liệu, nhà khoa học dữ liệu cần làm gì?

  • A. Đảm bảo các giá trị dữ liệu tuân theo cùng một định dạng, đơn vị đo lường và quy tắc.
  • B. Loại bỏ các bản ghi trùng lặp.
  • C. Điền các giá trị thiếu bằng giá trị trung bình.
  • D. Chuyển đổi dữ liệu sang dạng bảng.

Câu 23: Một nhà bán lẻ muốn sử dụng khoa học dữ liệu để xác định những khách hàng có khả năng mua sắm cao nhất trong đợt khuyến mãi sắp tới, dựa trên lịch sử mua hàng và hành vi duyệt web của họ. Đây là một ví dụ về ứng dụng nào?

  • A. Phân tích chuỗi cung ứng.
  • B. Giám sát an ninh mạng.
  • C. Nhắm mục tiêu khách hàng (Customer Targeting).
  • D. Tối ưu hóa tuyến đường giao hàng.

Câu 24: Khi trình bày kết quả phân tích dữ liệu cho những người không có chuyên môn sâu về kỹ thuật, khía cạnh nào của khoa học dữ liệu trở nên đặc biệt quan trọng?

  • A. Sử dụng các thuật toán phức tạp nhất.
  • B. Trực quan hóa dữ liệu và giải thích kết quả một cách rõ ràng, dễ hiểu.
  • C. Thu thập càng nhiều dữ liệu càng tốt.
  • D. Tập trung vào chi tiết kỹ thuật của mô hình.

Câu 25: Một nhà khoa học dữ liệu đang so sánh hiệu suất của hai mô hình học máy khác nhau để dự đoán giá nhà. Cô ấy sử dụng các chỉ số như R-squared và Mean Absolute Error để đánh giá. Công việc này thuộc giai đoạn nào của dự án khoa học dữ liệu?

  • A. Đánh giá và giải thích.
  • B. Thu thập dữ liệu.
  • C. Chuẩn bị dữ liệu.
  • D. Ra quyết định và triển khai.

Câu 26: Việc một ứng dụng bản đồ giao thông sử dụng dữ liệu vị trí từ điện thoại của hàng triệu người dùng để cung cấp thông tin ùn tắc theo thời gian thực là một ví dụ về ứng dụng khoa học dữ liệu trong lĩnh vực nào?

  • A. Y tế.
  • B. Thiên văn học.
  • C. Sinh học.
  • D. Giao thông vận tải.

Câu 27: Một trường học muốn phân tích dữ liệu điểm thi của học sinh trong nhiều năm để xác định những môn học nào thường khó đối với học sinh và những yếu tố nào (ví dụ: số buổi vắng mặt, kết quả bài kiểm tra thường xuyên) có liên quan đến kết quả học tập kém. Mục tiêu này phù hợp nhất với khía cạnh nào của khoa học dữ liệu?

  • A. Phát hiện tri thức và hiểu biết sâu sắc.
  • B. Tối ưu hóa quyết định tuyển sinh.
  • C. Xây dựng mô hình dự đoán điểm thi.
  • D. Trực quan hóa dữ liệu về số lượng học sinh.

Câu 28: Yếu tố nào sau đây KHÔNG phải là một thành phần cốt lõi của khoa học dữ liệu?

  • A. Kiến thức chuyên môn về lĩnh vực ứng dụng.
  • B. Kỹ năng lập trình và sử dụng công cụ phần mềm.
  • C. Khả năng ghi nhớ lượng lớn dữ liệu thô.
  • D. Hiểu biết về toán học và thống kê.

Câu 29: Trong bối cảnh khoa học dữ liệu, "Dữ liệu lớn" (Big Data) thường được mô tả bằng các đặc điểm nào?

  • A. Chỉ có Khối lượng (Volume) lớn.
  • B. Chỉ có Tốc độ (Velocity) nhanh.
  • C. Chỉ có Đa dạng (Variety) về định dạng.
  • D. Khối lượng lớn, Tốc độ cao và Đa dạng về định dạng.

Câu 30: Sau khi hoàn thành phân tích và có được kết quả, giai đoạn cuối cùng và quan trọng nhất của một dự án khoa học dữ liệu là gì để tạo ra giá trị thực tế?

  • A. Ra quyết định và triển khai các giải pháp dựa trên kết quả phân tích.
  • B. Tìm kiếm thêm các nguồn dữ liệu mới.
  • C. Lặp lại toàn bộ quy trình từ đầu.
  • D. Lưu trữ dữ liệu đã phân tích vào cơ sở dữ liệu.

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 3: Hệ thống chatbot hỗ trợ khách hàng trên website của một cửa hàng trực tuyến có khả năng trả lời các câu hỏi thường gặp về sản phẩm, đơn hàng và chính sách đổi trả. Hệ thống này là một ví dụ điển hình về ứng dụng AI trong lĩnh vực nào?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 4: Một ứng dụng di động sử dụng công nghệ nhận dạng hình ảnh để xác định loại cây trồng và đưa ra lời khuyên về cách chăm sóc dựa trên hình ảnh lá cây bị bệnh. Đây là ứng dụng AI trong lĩnh vực nào?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 5: Một trường đại học sử dụng hệ thống Elearning tích hợp AI để phân tích quá trình học tập của sinh viên, đưa ra gợi ý về tài liệu phù hợp và cá nhân hóa lộ trình học tập cho từng người. Lợi ích chính của việc ứng dụng AI trong trường hợp này là gì?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 6: Một trong những lo ngại lớn nhất về tác động xã hội của AI là khả năng AI tự động hóa nhiều công việc, dẫn đến nguy cơ gì đối với một bộ phận lực lượng lao động?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 7: Việc các hệ thống AI thu thập và phân tích lượng lớn dữ liệu cá nhân từ người dùng (ví dụ: lịch sử tìm kiếm, thói quen mua sắm, vị trí địa lý) tiềm ẩn nguy cơ gì liên quan đến quyền riêng tư?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 8: Tại sao vấn đề 'thiên vị' (bias) trong dữ liệu huấn luyện là một thách thức nghiêm trọng đối với sự phát triển AI?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 9: Một hệ thống AI được sử dụng để quản lý lưới điện thông minh của một thành phố, dự đoán nhu cầu năng lượng và tối ưu hóa phân phối điện. Nếu hệ thống này bị tấn công mạng và dữ liệu bị thay đổi, hậu quả nghiêm trọng nhất có thể xảy ra là gì?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 10: Để giảm thiểu nguy cơ AI gây ra thất nghiệp, giải pháp nào sau đây được coi là hiệu quả nhất?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 11: Khả năng AI có thể kiểm soát hoặc thay đổi ý thức và hành vi của con người thông qua các thuật toán gợi ý nội dung hoặc quảng cáo được cá nhân hóa quá mức đặt ra vấn đề đạo đức nào?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 12: Phân tích vai trò của AI trong việc hỗ trợ các nhà khoa học nghiên cứu và phát triển thuốc mới.

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 13: So sánh sự khác biệt cơ bản giữa Trí tuệ nhân tạo (AI) hẹp (Narrow AI) và Trí tuệ nhân tạo tổng quát (General AI).

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 14: Một trong những ứng dụng tiềm năng của AI trong lĩnh vực giao thông vận tải là phát triển xe tự hành. Thách thức lớn nhất đối với xe tự hành hiện nay là gì?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 15: Việc phát triển AI có khả năng tạo ra nội dung (văn bản, hình ảnh, âm thanh) giống hoặc khó phân biệt với nội dung do con người tạo ra (ví dụ: Deepfake) đặt ra nguy cơ nào về mặt xã hội?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 16: Hệ thống AI được sử dụng trong các thiết bị nhà thông minh để học hỏi thói quen của người dùng và tự động điều chỉnh ánh sáng, nhiệt độ, âm thanh. Đây là ứng dụng AI trong lĩnh vực nào?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 17: Một công ty sử dụng AI để phân tích xu hướng thị trường chứng khoán và đưa ra quyết định đầu tư. Mặc dù AI có thể xử lý dữ liệu nhanh chóng, rủi ro lớn nhất khi phụ thuộc hoàn toàn vào AI trong trường hợp này là gì?

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 18: Lĩnh vực Robotics kết hợp những ngành khoa học nào để phát triển robot thông minh?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 19: Hệ thống AI được sử dụng trong y tế để phân tích hình ảnh y khoa (X-quang, MRI) giúp bác sĩ phát hiện sớm các dấu hiệu bệnh. Ứng dụng này thể hiện lợi ích nào của AI trong y tế?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 20: Để đảm bảo các hệ thống AI được phát triển và sử dụng một cách có trách nhiệm, cần có sự phối hợp giữa các bên liên quan như chính phủ, doanh nghiệp, nhà khoa học và cộng đồng. Điều này liên quan đến khía cạnh nào trong phát triển AI?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 21: Phân tích cách AI có thể hỗ trợ việc quản lý tài nguyên môi trường, ví dụ như theo dõi nạn phá rừng hoặc ô nhiễm nguồn nước.

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 22: Một hệ thống AI được thiết kế để dự đoán nhu cầu của khách hàng dựa trên lịch sử mua sắm và hành vi duyệt web. Hệ thống này thường được ứng dụng trong lĩnh vực nào?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 23: Việc AI có khả năng tự học và thích nghi từ dữ liệu mới mà không cần lập trình tường minh cho từng trường hợp cụ thể là nhờ vào đặc điểm cốt lõi nào?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 24: Đâu KHÔNG phải là một ứng dụng phổ biến của AI trong đời sống hàng ngày?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 25: Đánh giá tính hợp lý của nhận định sau: "AI có khả năng giải quyết mọi vấn đề của nhân loại và không cần bất kỳ sự can thiệp hay giám sát nào từ con người."

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 26: Một công ty phát triển hệ thống AI để dự báo thời tiết cực đoan. Để hệ thống này hoạt động hiệu quả, yếu tố đầu vào quan trọng nhất là gì?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 27: Phân tích điểm khác biệt cơ bản giữa AI và các chương trình máy tính truyền thống.

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 28: Một trong những vai trò quan trọng của AI trong lĩnh vực y tế, ngoài chẩn đoán hình ảnh, là gì?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 29: Để giảm thiểu nguy cơ AI vi phạm quyền riêng tư, biện pháp kỹ thuật nào sau đây là cần thiết?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về trí tuệ nhân tạo (tiếp theo)

Tags: Bộ đề 9

Câu 30: Tại sao việc phát triển các quy tắc đạo đức và pháp lý cho AI là vô cùng quan trọng?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giao thức mạng

Tags: Bộ đề 9

Câu 1: Giao thức mạng đóng vai trò như thế nào trong việc kết nối các thiết bị khác nhau trong mạng máy tính?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giao thức mạng

Tags: Bộ đề 9

Câu 2: Khi bạn truy cập một trang web có địa chỉ bắt đầu bằng 'https://', giao thức nào ở tầng ứng dụng chủ yếu được sử dụng để truyền tải nội dung trang web một cách an toàn?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 10

Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu - Đề 10 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Một công ty thương mại điện tử muốn dự đoán những khách hàng nào có khả năng rời bỏ (churn) trong 3 tháng tới để có chiến lược giữ chân phù hợp. Đây là một ví dụ điển hình về ứng dụng nào của khoa học dữ liệu?

  • A. Phát hiện tri thức từ dữ liệu
  • B. Trực quan hóa dữ liệu
  • C. Xây dựng mô hình dự đoán
  • D. Tối ưu hóa quyết định

Câu 2: Trong quy trình dự án khoa học dữ liệu, sau khi đã xác định rõ vấn đề cần giải quyết, bước tiếp theo logic và quan trọng nhất là gì?

  • A. Thu thập dữ liệu liên quan đến vấn đề
  • B. Xây dựng mô hình học máy phức tạp
  • C. Trực quan hóa kết quả ban đầu
  • D. Đưa ra quyết định cuối cùng

Câu 3: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khách hàng lớn, bao gồm thông tin cá nhân, lịch sử mua hàng và hành vi duyệt web. Trước khi có thể sử dụng dữ liệu này để xây dựng mô hình, người đó cần thực hiện các bước xử lý như làm sạch dữ liệu bị thiếu, loại bỏ dữ liệu trùng lặp và chuẩn hóa định dạng. Giai đoạn này thuộc phần nào của quy trình khoa học dữ liệu?

  • A. Phân tích và khai phá dữ liệu
  • B. Chuẩn bị dữ liệu (Data Preparation)
  • C. Thu thập dữ liệu (Data Collection)
  • D. Đánh giá và giải thích mô hình

Câu 4: Tại sao khoa học dữ liệu được coi là một lĩnh vực liên ngành (interdisciplinary)?

  • A. Vì nó chỉ sử dụng dữ liệu từ nhiều ngành khác nhau.
  • B. Vì nó chỉ được áp dụng trong lĩnh vực công nghệ thông tin.
  • C. Vì nó chỉ liên quan đến việc thu thập và lưu trữ dữ liệu.
  • D. Vì nó kết hợp kiến thức, kỹ năng từ nhiều lĩnh vực như toán học, thống kê, khoa học máy tính và kiến thức chuyên ngành.

Câu 5: Việc sử dụng các biểu đồ, đồ thị, bản đồ nhiệt,... để biểu diễn thông tin và mẫu hình ẩn trong dữ liệu một cách trực quan, dễ hiểu thuộc mục tiêu nào của khoa học dữ liệu?

  • A. Xây dựng mô hình dự đoán
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Thu thập dữ liệu
  • D. Ra quyết định

Câu 6: Một ngân hàng sử dụng khoa học dữ liệu để phân tích các giao dịch tài chính bất thường nhằm phát hiện và ngăn chặn kịp thời các hành vi lừa đảo. Đây là một ví dụ về ứng dụng nào?

  • A. Phát hiện gian lận (Fraud Detection)
  • B. Phân tích cảm xúc khách hàng
  • C. Tối ưu hóa chuỗi cung ứng
  • D. Quản lý nhân sự

Câu 7: Kỹ năng nào sau đây được xem là **quan trọng nhất** đối với một nhà khoa học dữ liệu để có thể chuyển đổi các vấn đề kinh doanh hoặc khoa học thành các bài toán có thể giải quyết bằng dữ liệu và thuật toán?

  • A. Kỹ năng thiết kế đồ họa
  • B. Kỹ năng bán hàng
  • C. Kỹ năng ghi nhớ dữ kiện lịch sử
  • D. Kỹ năng tư duy phân tích và giải quyết vấn đề

Câu 8: Dự án Bộ gen người (Human Genome Project) là một ví dụ lịch sử quan trọng về ứng dụng khoa học dữ liệu trong lĩnh vực nào?

  • A. Thiên văn học
  • B. Tài chính
  • C. Y sinh học (Genomics)
  • D. Thương mại điện tử

Câu 9: Một nhà bán lẻ muốn phân tích dữ liệu lịch sử mua sắm của khách hàng để tìm ra các nhóm khách hàng có hành vi tương đồng và đưa ra các chương trình khuyến mãi cá nhân hóa. Kỹ thuật phân tích nào trong khoa học dữ liệu thường được sử dụng cho mục đích này?

  • A. Phân nhóm (Clustering)
  • B. Phân loại (Classification)
  • C. Hồi quy (Regression)
  • D. Phát hiện bất thường (Anomaly Detection)

Câu 10: Giả sử bạn có một tập dữ liệu về thời tiết trong 10 năm qua và muốn xây dựng một mô hình để dự đoán nhiệt độ ngày mai. Loại bài toán khoa học dữ liệu nào đang được đề cập ở đây?

  • A. Phân loại (Classification)
  • B. Phân nhóm (Clustering)
  • C. Dự báo chuỗi thời gian (Time Series Forecasting)
  • D. Phát hiện bất thường

Câu 11: Một công ty truyền thông xã hội muốn phân tích hàng triệu bình luận của người dùng để hiểu cảm xúc chung của họ về một sản phẩm mới ra mắt (tích cực, tiêu cực, trung lập). Kỹ thuật nào trong xử lý ngôn ngữ tự nhiên (NLP) thường được áp dụng cho nhiệm vụ này?

  • A. Dịch máy
  • B. Phân tích cảm xúc (Sentiment Analysis)
  • C. Nhận dạng thực thể có tên (Named Entity Recognition)
  • D. Tóm tắt văn bản

Câu 12: Một trong những thách thức lớn khi làm việc với dữ liệu lớn (Big Data) là tốc độ dữ liệu được tạo ra và truyền đi rất nhanh, đòi hỏi hệ thống phải xử lý theo thời gian thực hoặc gần thời gian thực. Thách thức này được gọi là gì trong các đặc trưng của Big Data (3V hoặc 4V)?

  • A. Velocity (Tốc độ)
  • B. Volume (Khối lượng)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 13: Một nhà khoa học dữ liệu đã xây dựng xong một mô hình dự đoán và cần trình bày kết quả, những phát hiện và đề xuất của mình cho các nhà quản lý không chuyên về kỹ thuật. Kỹ năng nào sau đây là **cần thiết nhất** trong tình huống này?

  • A. Kỹ năng lập trình C++
  • B. Kỹ năng thiết kế cơ sở dữ liệu phức tạp
  • C. Kỹ năng thu thập dữ liệu thủ công
  • D. Kỹ năng giao tiếp và trình bày (Storytelling with Data)

Câu 14: Giả sử bạn đang phân tích dữ liệu doanh số bán hàng và nhận thấy một số giao dịch có giá trị rất lớn, khác biệt đáng kể so với phần còn lại. Việc xác định và xử lý những điểm dữ liệu bất thường này (outliers) thuộc giai đoạn nào trong quy trình khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Chuẩn bị dữ liệu (Data Preparation/Cleaning)
  • C. Đánh giá và giải thích
  • D. Ra quyết định

Câu 15: Một công ty logistics muốn tối ưu hóa tuyến đường vận chuyển hàng hóa để giảm chi phí xăng dầu và thời gian giao hàng. Họ sử dụng dữ liệu về vị trí kho hàng, địa chỉ khách hàng, tình hình giao thông,... Khoa học dữ liệu giúp họ giải quyết bài toán này thông qua mục tiêu nào?

  • A. Phát hiện tri thức
  • B. Trực quan hóa dữ liệu
  • C. Xây dựng mô hình dự đoán
  • D. Tối ưu hóa quyết định (Decision Optimization)

Câu 16: Hệ thống gợi ý sản phẩm trên các trang thương mại điện tử (ví dụ: "Những sản phẩm bạn có thể thích") dựa trên lịch sử duyệt web và mua hàng của người dùng là một ứng dụng phổ biến của khoa học dữ liệu thuộc nhóm nào?

  • A. Hệ thống gợi ý (Recommendation Systems)
  • B. Nhận dạng hình ảnh
  • C. Phân tích chuỗi thời gian
  • D. Phát hiện bất thường

Câu 17: Khi một nhà khoa học dữ liệu kiểm tra các giả định của mô hình, đánh giá hiệu suất của nó trên tập dữ liệu mới và so sánh với các mô hình khác để chọn ra mô hình tốt nhất, người đó đang thực hiện giai đoạn nào của quy trình khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Chuẩn bị dữ liệu
  • C. Đánh giá và giải thích (Evaluation and Interpretation)
  • D. Ra quyết định

Câu 18: Việc hiểu rõ lĩnh vực mà dữ liệu được thu thập (ví dụ: kinh doanh, y tế, giáo dục) là rất quan trọng trong khoa học dữ liệu. Yếu tố này được gọi là gì trong các thành phần cốt lõi của khoa học dữ liệu?

  • A. Toán học và Thống kê
  • B. Khoa học Máy tính
  • C. Trực quan hóa dữ liệu
  • D. Kiến thức chuyên ngành (Domain Knowledge)

Câu 19: Một dự án khoa học dữ liệu nhằm mục đích dự đoán kết quả thi tốt nghiệp THPT của học sinh dựa trên điểm các kỳ kiểm tra trước đó, thái độ học tập, thời gian tự học,... Đây là một bài toán thuộc nhóm nào trong học máy?

  • A. Học có giám sát (Supervised Learning) - bài toán hồi quy
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học sâu (Deep Learning) - nếu không rõ loại bài toán cụ thể

Câu 20: Công cụ nào sau đây thường được sử dụng để làm sạch, biến đổi và phân tích dữ liệu có cấu trúc (dữ liệu dạng bảng) trong khoa học dữ liệu?

  • A. Phần mềm chỉnh sửa ảnh (ví dụ: Photoshop)
  • B. Trình duyệt web
  • C. Thư viện lập trình như Pandas (Python) hoặc R
  • D. Phần mềm soạn thảo văn bản (ví dụ: Microsoft Word)

Câu 21: Khi phân tích dữ liệu, việc nhận diện các mối tương quan giữa các biến (ví dụ: chi tiêu quảng cáo và doanh số bán hàng) hoặc các mẫu hình ẩn trong dữ liệu (ví dụ: khách hàng mua sản phẩm A thường mua kèm sản phẩm B) thuộc giai đoạn nào của quy trình khoa học dữ liệu?

  • A. Phân tích và khai phá dữ liệu (Data Analysis and Exploration)
  • B. Thu thập dữ liệu
  • C. Triển khai mô hình
  • D. Ra quyết định

Câu 22: Một công ty muốn phân tích dữ liệu từ các cảm biến trong nhà máy để phát hiện sớm các dấu hiệu hỏng hóc của thiết bị, giúp thực hiện bảo trì dự đoán. Ứng dụng này thuộc lĩnh vực nào của khoa học dữ liệu?

  • A. Phân tích cảm xúc
  • B. Bảo trì dự đoán (Predictive Maintenance)
  • C. Hệ thống gợi ý
  • D. Phân tích ngôn ngữ tự nhiên

Câu 23: Đặc điểm nào của dữ liệu lớn (Big Data) liên quan đến việc dữ liệu có thể đến từ nhiều nguồn khác nhau với các định dạng, cấu trúc và loại hình khác nhau (ví dụ: văn bản, hình ảnh, video, dữ liệu cảm biến, dữ liệu từ cơ sở dữ liệu)?

  • A. Volume
  • B. Velocity
  • C. Variety
  • D. Veracity

Câu 24: Sau khi một mô hình khoa học dữ liệu đã được xây dựng, đánh giá và giải thích, bước cuối cùng và quan trọng nhất để dự án mang lại giá trị thực tế là gì?

  • A. Thu thập thêm dữ liệu mới
  • B. Làm sạch dữ liệu lại từ đầu
  • C. Trực quan hóa tất cả dữ liệu thô
  • D. Ra quyết định và triển khai kết quả (Decision Making and Deployment)

Câu 25: Một nhà khoa học dữ liệu đang sử dụng thuật toán hồi quy tuyến tính để dự đoán giá nhà dựa trên diện tích, số phòng ngủ và vị trí. Đây là một ví dụ về việc áp dụng kiến thức từ lĩnh vực nào?

  • A. Thống kê và Học máy
  • B. Thiết kế đồ họa
  • C. Quản trị mạng
  • D. Lịch sử học

Câu 26: Thách thức nào của dữ liệu lớn liên quan đến việc đảm bảo tính chính xác, độ tin cậy và nguồn gốc của dữ liệu?

  • A. Volume
  • B. Velocity
  • C. Variety
  • D. Veracity

Câu 27: Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng theo thời gian để xác định xu hướng (trend), tính mùa vụ (seasonality) và các yếu tố chu kỳ (cyclical patterns). Kỹ thuật phân tích nào đang được sử dụng?

  • A. Phân loại hình ảnh
  • B. Phân tích mạng xã hội
  • C. Phân tích chuỗi thời gian (Time Series Analysis)
  • D. Phân tích cảm xúc

Câu 28: Việc đảm bảo quyền riêng tư của người dùng khi sử dụng dữ liệu cá nhân trong các dự án khoa học dữ liệu là một vấn đề quan trọng liên quan đến khía cạnh nào?

  • A. Đạo đức và pháp lý (Ethics and Legal)
  • B. Hiệu suất thuật toán
  • C. Chi phí lưu trữ dữ liệu
  • D. Tốc độ xử lý dữ liệu

Câu 29: Một nhà khoa học dữ liệu được yêu cầu xây dựng một hệ thống phân loại email thành "spam" hoặc "không spam". Đây là một bài toán thuộc nhóm nào trong học máy?

  • A. Học không giám sát (Unsupervised Learning)
  • B. Học có giám sát (Supervised Learning) - bài toán phân loại
  • C. Học tăng cường (Reinforcement Learning)
  • D. Phân tích chuỗi thời gian

Câu 30: Kính thiên văn Kepler, dự án thu thập lượng lớn dữ liệu về độ sáng của các ngôi sao để tìm kiếm các hành tinh ngoại hệ, là một ví dụ về ứng dụng khoa học dữ liệu trong lĩnh vực nào?

  • A. Thiên văn học (Astronomy)
  • B. Y tế
  • C. Tài chính
  • D. Giáo dục

1 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 1: Một công ty thương mại điện tử muốn dự đoán những khách hàng nào có khả năng rời bỏ (churn) trong 3 tháng tới để có chiến lược giữ chân phù hợp. Đây là một ví dụ điển hình về ứng dụng nào của khoa học dữ liệu?

2 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 2: Trong quy trình dự án khoa học dữ liệu, sau khi đã xác định rõ vấn đề cần giải quyết, bước tiếp theo logic và quan trọng nhất là gì?

3 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 3: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khách hàng lớn, bao gồm thông tin cá nhân, lịch sử mua hàng và hành vi duyệt web. Trước khi có thể sử dụng dữ liệu này để xây dựng mô hình, người đó cần thực hiện các bước xử lý như làm sạch dữ liệu bị thiếu, loại bỏ dữ liệu trùng lặp và chuẩn hóa định dạng. Giai đoạn này thuộc phần nào của quy trình khoa học dữ liệu?

4 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 4: Tại sao khoa học dữ liệu được coi là một lĩnh vực liên ngành (interdisciplinary)?

5 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 5: Việc sử dụng các biểu đồ, đồ thị, bản đồ nhiệt,... để biểu diễn thông tin và mẫu hình ẩn trong dữ liệu một cách trực quan, dễ hiểu thuộc mục tiêu nào của khoa học dữ liệu?

6 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 6: Một ngân hàng sử dụng khoa học dữ liệu để phân tích các giao dịch tài chính bất thường nhằm phát hiện và ngăn chặn kịp thời các hành vi lừa đảo. Đây là một ví dụ về ứng dụng nào?

7 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 7: Kỹ năng nào sau đây được xem là **quan trọng nhất** đối với một nhà khoa học dữ liệu để có thể chuyển đổi các vấn đề kinh doanh hoặc khoa học thành các bài toán có thể giải quyết bằng dữ liệu và thuật toán?

8 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 8: Dự án Bộ gen người (Human Genome Project) là một ví dụ lịch sử quan trọng về ứng dụng khoa học dữ liệu trong lĩnh vực nào?

9 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 9: Một nhà bán lẻ muốn phân tích dữ liệu lịch sử mua sắm của khách hàng để tìm ra các nhóm khách hàng có hành vi tương đồng và đưa ra các chương trình khuyến mãi cá nhân hóa. Kỹ thuật phân tích nào trong khoa học dữ liệu thường được sử dụng cho mục đích này?

10 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 10: Giả sử bạn có một tập dữ liệu về thời tiết trong 10 năm qua và muốn xây dựng một mô hình để dự đoán nhiệt độ ngày mai. Loại bài toán khoa học dữ liệu nào đang được đề cập ở đây?

11 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 11: Một công ty truyền thông xã hội muốn phân tích hàng triệu bình luận của người dùng để hiểu cảm xúc chung của họ về một sản phẩm mới ra mắt (tích cực, tiêu cực, trung lập). Kỹ thuật nào trong xử lý ngôn ngữ tự nhiên (NLP) thường được áp dụng cho nhiệm vụ này?

12 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 12: Một trong những thách thức lớn khi làm việc với dữ liệu lớn (Big Data) là tốc độ dữ liệu được tạo ra và truyền đi rất nhanh, đòi hỏi hệ thống phải xử lý theo thời gian thực hoặc gần thời gian thực. Thách thức này được gọi là gì trong các đặc trưng của Big Data (3V hoặc 4V)?

13 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 13: Một nhà khoa học dữ liệu đã xây dựng xong một mô hình dự đoán và cần trình bày kết quả, những phát hiện và đề xuất của mình cho các nhà quản lý không chuyên về kỹ thuật. Kỹ năng nào sau đây là **cần thiết nhất** trong tình huống này?

14 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 14: Giả sử bạn đang phân tích dữ liệu doanh số bán hàng và nhận thấy một số giao dịch có giá trị rất lớn, khác biệt đáng kể so với phần còn lại. Việc xác định và xử lý những điểm dữ liệu bất thường này (outliers) thuộc giai đoạn nào trong quy trình khoa học dữ liệu?

15 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 15: Một công ty logistics muốn tối ưu hóa tuyến đường vận chuyển hàng hóa để giảm chi phí xăng dầu và thời gian giao hàng. Họ sử dụng dữ liệu về vị trí kho hàng, địa chỉ khách hàng, tình hình giao thông,... Khoa học dữ liệu giúp họ giải quyết bài toán này thông qua mục tiêu nào?

16 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 16: Hệ thống gợi ý sản phẩm trên các trang thương mại điện tử (ví dụ: 'Những sản phẩm bạn có thể thích') dựa trên lịch sử duyệt web và mua hàng của người dùng là một ứng dụng phổ biến của khoa học dữ liệu thuộc nhóm nào?

17 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 17: Khi một nhà khoa học dữ liệu kiểm tra các giả định của mô hình, đánh giá hiệu suất của nó trên tập dữ liệu mới và so sánh với các mô hình khác để chọn ra mô hình tốt nhất, người đó đang thực hiện giai đoạn nào của quy trình khoa học dữ liệu?

18 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 18: Việc hiểu rõ lĩnh vực mà dữ liệu được thu thập (ví dụ: kinh doanh, y tế, giáo dục) là rất quan trọng trong khoa học dữ liệu. Yếu tố này được gọi là gì trong các thành phần cốt lõi của khoa học dữ liệu?

19 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 19: Một dự án khoa học dữ liệu nhằm mục đích dự đoán kết quả thi tốt nghiệp THPT của học sinh dựa trên điểm các kỳ kiểm tra trước đó, thái độ học tập, thời gian tự học,... Đây là một bài toán thuộc nhóm nào trong học máy?

20 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 20: Công cụ nào sau đây thường được sử dụng để làm sạch, biến đổi và phân tích dữ liệu có cấu trúc (dữ liệu dạng bảng) trong khoa học dữ liệu?

21 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 21: Khi phân tích dữ liệu, việc nhận diện các mối tương quan giữa các biến (ví dụ: chi tiêu quảng cáo và doanh số bán hàng) hoặc các mẫu hình ẩn trong dữ liệu (ví dụ: khách hàng mua sản phẩm A thường mua kèm sản phẩm B) thuộc giai đoạn nào của quy trình khoa học dữ liệu?

22 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 22: Một công ty muốn phân tích dữ liệu từ các cảm biến trong nhà máy để phát hiện sớm các dấu hiệu hỏng hóc của thiết bị, giúp thực hiện bảo trì dự đoán. Ứng dụng này thuộc lĩnh vực nào của khoa học dữ liệu?

23 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 23: Đặc điểm nào của dữ liệu lớn (Big Data) liên quan đến việc dữ liệu có thể đến từ nhiều nguồn khác nhau với các định dạng, cấu trúc và loại hình khác nhau (ví dụ: văn bản, hình ảnh, video, dữ liệu cảm biến, dữ liệu từ cơ sở dữ liệu)?

24 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 24: Sau khi một mô hình khoa học dữ liệu đã được xây dựng, đánh giá và giải thích, bước cuối cùng và quan trọng nhất để dự án mang lại giá trị thực tế là gì?

25 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 25: Một nhà khoa học dữ liệu đang sử dụng thuật toán hồi quy tuyến tính để dự đoán giá nhà dựa trên diện tích, số phòng ngủ và vị trí. Đây là một ví dụ về việc áp dụng kiến thức từ lĩnh vực nào?

26 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 26: Thách thức nào của dữ liệu lớn liên quan đến việc đảm bảo tính chính xác, độ tin cậy và nguồn gốc của dữ liệu?

27 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 27: Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng theo thời gian để xác định xu hướng (trend), tính mùa vụ (seasonality) và các yếu tố chu kỳ (cyclical patterns). Kỹ thuật phân tích nào đang được sử dụng?

28 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 28: Việc đảm bảo quyền riêng tư của người dùng khi sử dụng dữ liệu cá nhân trong các dự án khoa học dữ liệu là một vấn đề quan trọng liên quan đến khía cạnh nào?

29 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 29: Một nhà khoa học dữ liệu được yêu cầu xây dựng một hệ thống phân loại email thành 'spam' hoặc 'không spam'. Đây là một bài toán thuộc nhóm nào trong học máy?

30 / 30

Category: Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu

Tags: Bộ đề 10

Câu 30: Kính thiên văn Kepler, dự án thu thập lượng lớn dữ liệu về độ sáng của các ngôi sao để tìm kiếm các hành tinh ngoại hệ, là một ví dụ về ứng dụng khoa học dữ liệu trong lĩnh vực nào?

Xem kết quả