15+ Đề Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Đề 01

Đề 02

Đề 03

Đề 04

Đề 05

Đề 06

Đề 07

Đề 08

Đề 09

Đề 10

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 01

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 01 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong quy trình Khoa học Dữ liệu, máy tính đóng vai trò trung tâm trong việc nào sau đây, ngoại trừ:

  • A. Lưu trữ và quản lý lượng lớn dữ liệu.
  • B. Thực hiện các thuật toán phân tích phức tạp.
  • C. Trực quan hóa dữ liệu để khám phá thông tin.
  • D. Xác định vấn đề nghiên cứu và đặt câu hỏi.

Câu 2: Xét bài toán phân loại khách hàng dựa trên lịch sử mua sắm trực tuyến. Kỹ thuật nào trong Khoa học Dữ liệu sau đây sẽ được máy tính sử dụng chủ yếu để xây dựng mô hình dự đoán nhóm khách hàng (ví dụ: khách hàng tiềm năng, khách hàng trung thành)?

  • A. Thu thập dữ liệu web (Web scraping)
  • B. Học máy (Machine Learning)
  • C. Trực quan hóa dữ liệu (Data Visualization)
  • D. Làm sạch dữ liệu (Data Cleaning)

Câu 3: Điện toán đám mây mang lại lợi ích gì cho các nhà khoa học dữ liệu khi xử lý các dự án lớn, phức tạp?

  • A. Cung cấp khả năng mở rộng tài nguyên tính toán linh hoạt theo nhu cầu dự án.
  • B. Giảm thiểu sự phụ thuộc vào kết nối Internet tốc độ cao.
  • C. Đảm bảo an toàn tuyệt đối cho dữ liệu khỏi mọi nguy cơ mất mát.
  • D. Loại bỏ hoàn toàn nhu cầu về phần cứng máy tính cá nhân.

Câu 4: Trong bối cảnh "dữ liệu lớn" (Big Data), thách thức chính mà máy tính phải đối mặt khi xử lý là gì?

  • A. Sự đa dạng về định dạng dữ liệu (Variety).
  • B. Tính xác thực của nguồn gốc dữ liệu (Veracity).
  • C. Yêu cầu về tốc độ xử lý và phân tích (Velocity).
  • D. Khối lượng dữ liệu khổng lồ (Volume).

Câu 5: Để tăng tốc độ phân tích dữ liệu lớn, kỹ thuật xử lý song song (parallel processing) trên máy tính được áp dụng như thế nào?

  • A. Tăng cường bộ nhớ RAM để lưu trữ nhiều dữ liệu hơn.
  • B. Chia nhỏ dữ liệu và phân công cho nhiều bộ xử lý thực hiện đồng thời.
  • C. Sử dụng các thuật toán phân tích dữ liệu phức tạp hơn.
  • D. Giảm độ phân giải của dữ liệu để giảm kích thước.

Câu 6: Trong dự án Hệ gen người (HGP), máy tính đã đóng góp quan trọng nhất vào giai đoạn nào của dự án?

  • A. Thu thập mẫu vật phẩm sinh học từ con người.
  • B. Xây dựng phòng thí nghiệm và trang thiết bị hiện đại.
  • C. Giải trình tự và phân tích bộ gen người.
  • D. Công bố kết quả nghiên cứu trên các tạp chí khoa học.

Câu 7: Một nhà khoa học dữ liệu muốn trực quan hóa mối tương quan giữa nhiệt độ trung bình hàng tháng và doanh số bán kem. Loại biểu đồ nào sau đây là phù hợp nhất để thể hiện mối tương quan này?

  • A. Biểu đồ cột (Bar chart)
  • B. Biểu đồ đường (Line chart)
  • C. Biểu đồ tròn (Pie chart)
  • D. Biểu đồ tán xạ (Scatter plot)

Câu 8: Tự động hóa quy trình trong khoa học dữ liệu, nhờ sự hỗ trợ của máy tính, mang lại lợi ích chính nào sau đây?

  • A. Tăng sự phức tạp của các thuật toán phân tích.
  • B. Giảm thiểu lỗi do con người và tăng tốc độ xử lý.
  • C. Loại bỏ hoàn toàn vai trò của con người trong phân tích dữ liệu.
  • D. Tạo ra các loại dữ liệu mới và phức tạp hơn.

Câu 9: Trong ứng dụng phân tích dữ liệu thời gian thực (real-time data analytics), máy tính cần có khả năng gì đặc biệt?

  • A. Lưu trữ dữ liệu với dung lượng cực lớn.
  • B. Trực quan hóa dữ liệu với đồ họa phức tạp.
  • C. Xử lý và phân tích dữ liệu với tốc độ cực nhanh.
  • D. Kết nối với nhiều nguồn dữ liệu khác nhau.

Câu 10: Để đảm bảo tính chính xác của kết quả phân tích dữ liệu lớn, vai trò của máy tính trong việc kiểm soát và giảm thiểu sai sót là gì?

  • A. Thực hiện các quy trình kiểm tra và xác thực dữ liệu tự động.
  • B. Loại bỏ hoàn toàn sự can thiệp của con người vào quy trình phân tích.
  • C. Tăng cường khả năng dự đoán kết quả phân tích.
  • D. Nén dữ liệu để giảm thiểu dung lượng lưu trữ.

Câu 11: Một công ty thương mại điện tử muốn dự đoán sản phẩm nào khách hàng sẽ mua tiếp theo. Ứng dụng nào của Khoa học Dữ liệu và máy tính phù hợp nhất cho mục tiêu này?

  • A. Phân tích cảm xúc khách hàng từ bình luận trực tuyến.
  • B. Hệ thống gợi ý sản phẩm (Recommendation System).
  • C. Phân cụm khách hàng theo nhân khẩu học.
  • D. Tối ưu hóa chiến dịch quảng cáo trực tuyến.

Câu 12: Trong lĩnh vực y tế, máy tính và khoa học dữ liệu được ứng dụng để phân tích hình ảnh y tế (như X-quang, CT scan) nhằm mục đích chính nào?

  • A. Quản lý hồ sơ bệnh án điện tử.
  • B. Theo dõi sức khỏe bệnh nhân từ xa.
  • C. Nghiên cứu phát triển thuốc mới.
  • D. Hỗ trợ chẩn đoán bệnh thông qua phát hiện bất thường.

Câu 13: Giả sử bạn có một bộ dữ liệu lớn về thông tin giao thông đô thị (lưu lượng xe, tốc độ, vị trí GPS). Bạn muốn sử dụng máy tính để xây dựng mô hình dự đoán tình trạng tắc nghẽn giao thông trong tương lai. Kỹ thuật học máy nào có thể phù hợp?

  • A. Học máy có giám sát (Supervised Learning).
  • B. Học máy không giám sát (Unsupervised Learning).
  • C. Học tăng cường (Reinforcement Learning).
  • D. Xử lý ngôn ngữ tự nhiên (Natural Language Processing).

Câu 14: Để khai thác thông tin hữu ích từ dữ liệu văn bản lớn (ví dụ: bình luận trên mạng xã hội, bài báo), các nhà khoa học dữ liệu sử dụng lĩnh vực nào của Khoa học Dữ liệu?

  • A. Thống kê mô tả (Descriptive Statistics).
  • B. Khai phá dữ liệu (Data Mining).
  • C. Xử lý ngôn ngữ tự nhiên (Natural Language Processing).
  • D. Trực quan hóa dữ liệu (Data Visualization).

Câu 15: Trong quy trình Khoa học Dữ liệu, giai đoạn "làm sạch dữ liệu" (data cleaning) có vai trò quan trọng như thế nào đối với máy tính và kết quả phân tích?

  • A. Giảm dung lượng lưu trữ dữ liệu.
  • B. Đảm bảo dữ liệu chất lượng, giúp phân tích chính xác.
  • C. Tăng tốc độ thu thập dữ liệu.
  • D. Trực quan hóa dữ liệu dễ dàng hơn.

Câu 16: Phát biểu nào sau đây mô tả đúng nhất mối quan hệ giữa Máy tính và Khoa học Dữ liệu?

  • A. Máy tính là một lĩnh vực con của Khoa học Dữ liệu.
  • B. Khoa học Dữ liệu là một lĩnh vực con của Máy tính.
  • C. Máy tính là công cụ nền tảng, không thể thiếu cho Khoa học Dữ liệu.
  • D. Máy tính và Khoa học Dữ liệu là hai lĩnh vực hoàn toàn độc lập.

Câu 17: Để phân tích dữ liệu từ các cảm biến IoT (Internet of Things) trong thời gian thực, hạ tầng máy tính nào thường được ưu tiên sử dụng?

  • A. Máy tính cá nhân cấu hình mạnh.
  • B. Máy chủ truyền thống trong trung tâm dữ liệu.
  • C. Siêu máy tính (Supercomputer).
  • D. Điện toán biên (Edge Computing).

Câu 18: Một nhà nghiên cứu muốn so sánh hiệu quả của hai phương pháp điều trị bệnh tiểu đường dựa trên dữ liệu bệnh án điện tử của bệnh nhân. Phương pháp phân tích dữ liệu nào là phù hợp nhất?

  • A. Trực quan hóa dữ liệu bệnh án.
  • B. Phân tích thống kê so sánh (Comparative Statistical Analysis).
  • C. Khai phá luật kết hợp từ dữ liệu bệnh án.
  • D. Phân tích cảm xúc từ ghi chú của bác sĩ.

Câu 19: Trong quá trình xây dựng mô hình học máy, máy tính sử dụng dữ liệu huấn luyện (training data) để làm gì?

  • A. Lưu trữ dữ liệu một cách hiệu quả.
  • B. Trực quan hóa dữ liệu huấn luyện.
  • C. Học các mẫu và quy tắc để xây dựng mô hình dự đoán.
  • D. Kiểm tra tính chính xác của dữ liệu.

Câu 20: Khi một mô hình học máy được triển khai trong thực tế, máy tính sử dụng dữ liệu mới (chưa từng thấy trước đó) để thực hiện công việc gì?

  • A. Đưa ra dự đoán hoặc phân loại trên dữ liệu mới.
  • B. Tiếp tục huấn luyện lại mô hình.
  • C. Làm sạch dữ liệu mới.
  • D. Trực quan hóa dữ liệu mới.

Câu 21: Phát biểu nào sau đây không phải là một thách thức về mặt đạo đức trong Khoa học Dữ liệu liên quan đến việc sử dụng máy tính?

  • A. Sự thiên vị trong thuật toán và dữ liệu (Bias).
  • B. Xâm phạm quyền riêng tư cá nhân.
  • C. Thiếu minh bạch trong quyết định của mô hình.
  • D. Tốc độ xử lý dữ liệu chậm.

Câu 22: Để đảm bảo tính bền vững của các hệ thống Khoa học Dữ liệu, yếu tố nào sau đây cần được máy tính và các nhà phát triển quan tâm?

  • A. Tăng cường khả năng lưu trữ dữ liệu.
  • B. Sử dụng thuật toán phức tạp hơn.
  • C. Tối ưu hóa hiệu suất sử dụng năng lượng của máy tính.
  • D. Tăng cường bảo mật dữ liệu.

Câu 23: Trong một dự án Khoa học Dữ liệu về phân tích mạng xã hội, máy tính được sử dụng để xác định "người có ảnh hưởng" (influencer) dựa trên tiêu chí nào?

  • A. Số lượng bạn bè hoặc người theo dõi.
  • B. Mức độ tương tác và lan tỏa thông tin (ví dụ: lượt thích, chia sẻ).
  • C. Thời gian hoạt động trên mạng xã hội.
  • D. Thông tin cá nhân chi tiết.

Câu 24: Để xây dựng một hệ thống cảnh báo sớm thiên tai (ví dụ: lũ lụt, động đất), máy tính cần tích hợp và phân tích dữ liệu từ những nguồn nào?

  • A. Dữ liệu lịch sử dân số.
  • B. Dữ liệu kinh tế xã hội.
  • C. Dữ liệu giao thông vận tải.
  • D. Dữ liệu thời tiết, địa chấn, vệ tinh.

Câu 25: Trong lĩnh vực tài chính, máy tính và khoa học dữ liệu được sử dụng để phát hiện gian lận giao dịch bằng cách nào?

  • A. Phân tích các mẫu giao dịch bất thường hoặc đáng ngờ.
  • B. Dự đoán biến động thị trường chứng khoán.
  • C. Quản lý rủi ro tín dụng.
  • D. Tối ưu hóa danh mục đầu tư.

Câu 26: Một hệ thống máy tính sử dụng Khoa học Dữ liệu để cá nhân hóa trải nghiệm học tập trực tuyến cho học sinh. Điều này có nghĩa là gì?

  • A. Hệ thống chỉ cung cấp nội dung học tập bằng ngôn ngữ mẹ đẻ của học sinh.
  • B. Hệ thống điều chỉnh nội dung và phương pháp học tập phù hợp với từng học sinh.
  • C. Hệ thống theo dõi thời gian học tập của học sinh.
  • D. Hệ thống tự động chấm điểm bài tập của học sinh.

Câu 27: Để đánh giá hiệu quả của một mô hình học máy, các nhà khoa học dữ liệu sử dụng các "metrics" (chỉ số đánh giá) như độ chính xác (accuracy), độRecall (recall), độPrecision (precision), F1-score. Các metrics này giúp máy tính và con người hiểu điều gì về mô hình?

  • A. Kích thước của mô hình học máy.
  • B. Độ phức tạp của thuật toán học máy.
  • C. Hiệu suất và độ tin cậy của mô hình trong việc dự đoán.
  • D. Thời gian huấn luyện mô hình.

Câu 28: Trong quy trình Khoa học Dữ liệu, việc "trực quan hóa dữ liệu" thường được thực hiện trước giai đoạn nào?

  • A. Xây dựng mô hình học máy.
  • B. Thu thập dữ liệu.
  • C. Làm sạch dữ liệu.
  • D. Triển khai mô hình.

Câu 29: Khi nói về "khả năng diễn giải" (interpretability) của mô hình học máy, điều này có nghĩa là gì?

  • A. Mô hình có khả năng xử lý dữ liệu ngôn ngữ tự nhiên.
  • B. Mô hình có khả năng học từ dữ liệu không có nhãn.
  • C. Mô hình có độ chính xác dự đoán cao.
  • D. Con người có thể hiểu được cách mô hình đưa ra quyết định hoặc dự đoán.

Câu 30: Trong tương lai, xu hướng phát triển nào của máy tính sẽ có tác động lớn đến lĩnh vực Khoa học Dữ liệu?

  • A. Tăng tốc độ kết nối Internet.
  • B. Phát triển trí tuệ nhân tạo (AI) và học máy.
  • C. Giảm giá thành phần cứng máy tính.
  • D. Tăng dung lượng lưu trữ đám mây.

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 1: Trong quy trình Khoa học Dữ liệu, máy tính đóng vai trò trung tâm trong việc nào sau đây, ngoại trừ:

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 2: Xét bài toán phân loại khách hàng dựa trên lịch sử mua sắm trực tuyến. Kỹ thuật nào trong Khoa học Dữ liệu sau đây sẽ được máy tính sử dụng chủ yếu để xây dựng mô hình dự đoán nhóm khách hàng (ví dụ: khách hàng tiềm năng, khách hàng trung thành)?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 3: Điện toán đám mây mang lại lợi ích gì cho các nhà khoa học dữ liệu khi xử lý các dự án lớn, phức tạp?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 4: Trong bối cảnh 'dữ liệu lớn' (Big Data), thách thức chính mà máy tính phải đối mặt khi xử lý là gì?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 5: Để tăng tốc độ phân tích dữ liệu lớn, kỹ thuật xử lý song song (parallel processing) trên máy tính được áp dụng như thế nào?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 6: Trong dự án Hệ gen người (HGP), máy tính đã đóng góp quan trọng nhất vào giai đoạn nào của dự án?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 7: Một nhà khoa học dữ liệu muốn trực quan hóa mối tương quan giữa nhiệt độ trung bình hàng tháng và doanh số bán kem. Loại biểu đồ nào sau đây là phù hợp nhất để thể hiện mối tương quan này?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 8: Tự động hóa quy trình trong khoa học dữ liệu, nhờ sự hỗ trợ của máy tính, mang lại lợi ích chính nào sau đây?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 9: Trong ứng dụng phân tích dữ liệu thời gian thực (real-time data analytics), máy tính cần có khả năng gì đặc biệt?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 10: Để đảm bảo tính chính xác của kết quả phân tích dữ liệu lớn, vai trò của máy tính trong việc kiểm soát và giảm thiểu sai sót là gì?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 11: Một công ty thương mại điện tử muốn dự đoán sản phẩm nào khách hàng sẽ mua tiếp theo. Ứng dụng nào của Khoa học Dữ liệu và máy tính phù hợp nhất cho mục tiêu này?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 12: Trong lĩnh vực y tế, máy tính và khoa học dữ liệu được ứng dụng để phân tích hình ảnh y tế (như X-quang, CT scan) nhằm mục đích chính nào?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 13: Giả sử bạn có một bộ dữ liệu lớn về thông tin giao thông đô thị (lưu lượng xe, tốc độ, vị trí GPS). Bạn muốn sử dụng máy tính để xây dựng mô hình dự đoán tình trạng tắc nghẽn giao thông trong tương lai. Kỹ thuật học máy nào có thể phù hợp?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 14: Để khai thác thông tin hữu ích từ dữ liệu văn bản lớn (ví dụ: bình luận trên mạng xã hội, bài báo), các nhà khoa học dữ liệu sử dụng lĩnh vực nào của Khoa học Dữ liệu?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 15: Trong quy trình Khoa học Dữ liệu, giai đoạn 'làm sạch dữ liệu' (data cleaning) có vai trò quan trọng như thế nào đối với máy tính và kết quả phân tích?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 16: Phát biểu nào sau đây mô tả đúng nhất mối quan hệ giữa Máy tính và Khoa học Dữ liệu?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 17: Để phân tích dữ liệu từ các cảm biến IoT (Internet of Things) trong thời gian thực, hạ tầng máy tính nào thường được ưu tiên sử dụng?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 18: Một nhà nghiên cứu muốn so sánh hiệu quả của hai phương pháp điều trị bệnh tiểu đường dựa trên dữ liệu bệnh án điện tử của bệnh nhân. Phương pháp phân tích dữ liệu nào là phù hợp nhất?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 19: Trong quá trình xây dựng mô hình học máy, máy tính sử dụng dữ liệu huấn luyện (training data) để làm gì?

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 20: Khi một mô hình học máy được triển khai trong thực tế, máy tính sử dụng dữ liệu mới (chưa từng thấy trước đó) để thực hiện công việc gì?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 21: Phát biểu nào sau đây không phải là một thách thức về mặt đạo đức trong Khoa học Dữ liệu liên quan đến việc sử dụng máy tính?

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 22: Để đảm bảo tính bền vững của các hệ thống Khoa học Dữ liệu, yếu tố nào sau đây cần được máy tính và các nhà phát triển quan tâm?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 23: Trong một dự án Khoa học Dữ liệu về phân tích mạng xã hội, máy tính được sử dụng để xác định 'người có ảnh hưởng' (influencer) dựa trên tiêu chí nào?

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 24: Để xây dựng một hệ thống cảnh báo sớm thiên tai (ví dụ: lũ lụt, động đất), máy tính cần tích hợp và phân tích dữ liệu từ những nguồn nào?

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 25: Trong lĩnh vực tài chính, máy tính và khoa học dữ liệu được sử dụng để phát hiện gian lận giao dịch bằng cách nào?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 26: Một hệ thống máy tính sử dụng Khoa học Dữ liệu để cá nhân hóa trải nghiệm học tập trực tuyến cho học sinh. Điều này có nghĩa là gì?

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 27: Để đánh giá hiệu quả của một mô hình học máy, các nhà khoa học dữ liệu sử dụng các 'metrics' (chỉ số đánh giá) như độ chính xác (accuracy), độRecall (recall), độPrecision (precision), F1-score. Các metrics này giúp máy tính và con người hiểu điều gì về mô hình?

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 28: Trong quy trình Khoa học Dữ liệu, việc 'trực quan hóa dữ liệu' thường được thực hiện trước giai đoạn nào?

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 29: Khi nói về 'khả năng diễn giải' (interpretability) của mô hình học máy, điều này có nghĩa là gì?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 1

Câu 30: Trong tương lai, xu hướng phát triển nào của máy tính sẽ có tác động lớn đến lĩnh vực Khoa học Dữ liệu?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 02

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 02 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong lĩnh vực Khoa học Dữ liệu, máy tính đóng vai trò trung tâm trong việc xử lý lượng lớn thông tin. Chức năng cốt lõi nào của máy tính cho phép các nhà khoa học dữ liệu làm việc hiệu quả với tập dữ liệu khổng lồ?

  • A. Khả năng kết nối mạng diện rộng, cho phép chia sẻ dữ liệu toàn cầu.
  • B. Khả năng tính toán mạnh mẽ và tốc độ xử lý cao, vượt xa khả năng con người.
  • C. Khả năng lưu trữ dữ liệu trên các thiết bị ngoại vi nhỏ gọn.
  • D. Khả năng hiển thị dữ liệu trực quan trên màn hình độ phân giải cao.

Câu 2: Trực quan hóa dữ liệu là một bước quan trọng trong quy trình Khoa học Dữ liệu. Máy tính hỗ trợ quá trình này như thế nào để tăng cường khả năng hiểu và truyền đạt thông tin từ dữ liệu?

  • A. Máy tính tự động phân tích và đưa ra kết luận cuối cùng về dữ liệu.
  • B. Máy tính mã hóa dữ liệu sang định dạng phức tạp để bảo mật thông tin.
  • C. Máy tính tạo ra các biểu đồ, đồ thị và mô hình trực quan, giúp nhận diện mẫu và xu hướng dễ dàng.
  • D. Máy tính cho phép in dữ liệu ra giấy để dễ dàng mang theo và xem xét mọi lúc mọi nơi.

Câu 3: Dự án Hệ gen Người (HGP) là một ví dụ điển hình về ứng dụng Khoa học Dữ liệu trong Sinh học. Thách thức lớn nhất mà máy tính đã giúp giải quyết trong HGP là gì?

  • A. Giải trình tự và phân tích một lượng khổng lồ dữ liệu gen, vượt quá khả năng xử lý thủ công.
  • B. Tạo ra các mẫu DNA nhân tạo để thay thế các đoạn gen bị lỗi.
  • C. Điều khiển các thiết bị thí nghiệm từ xa để thu thập dữ liệu gen tự động.
  • D. Bảo mật thông tin di truyền của con người khỏi nguy cơ bị đánh cắp.

Câu 4: Điện toán đám mây ngày càng phổ biến trong Khoa học Dữ liệu. Ưu điểm nổi bật nhất của việc sử dụng điện toán đám mây so với việc tự xây dựng và duy trì cơ sở hạ tầng tính toán là gì?

  • A. Đảm bảo an toàn dữ liệu tuyệt đối do dữ liệu được lưu trữ phân tán.
  • B. Tăng tốc độ truyền tải dữ liệu nhờ vào băng thông mạng không giới hạn.
  • C. Cho phép tùy chỉnh phần cứng theo yêu cầu cụ thể của từng bài toán.
  • D. Giảm chi phí đầu tư ban đầu vào phần cứng và cơ sở hạ tầng, dễ dàng mở rộng tài nguyên khi cần.

Câu 5: Khi phân tích dữ liệu lớn, thời gian xử lý là một yếu tố quan trọng. Kỹ thuật xử lý song song giúp máy tính giảm đáng kể thời gian phân tích. Nguyên lý cơ bản của xử lý song song là gì?

  • A. Chia nhỏ dữ liệu thành các phần nhỏ và xử lý tuần tự từng phần một.
  • B. Chia nhỏ bài toán thành các tác vụ nhỏ và thực hiện đồng thời trên nhiều bộ xử lý.
  • C. Nén dữ liệu để giảm kích thước trước khi xử lý, sau đó giải nén để phân tích.
  • D. Sử dụng các thuật toán tối ưu để giảm số lượng phép tính cần thực hiện.

Câu 6: Tự động hóa quy trình phân tích dữ liệu là một ưu điểm lớn của việc ứng dụng máy tính trong Khoa học Dữ liệu. Lợi ích chính của tự động hóa trong bối cảnh này là gì?

  • A. Giảm sự phụ thuộc vào các thuật toán phức tạp, giúp phân tích dữ liệu dễ dàng hơn.
  • B. Tăng cường tính bảo mật của dữ liệu trong quá trình phân tích và xử lý.
  • C. Tăng tốc độ xử lý, giảm thiểu lỗi do con người và đảm bảo tính nhất quán của quy trình.
  • D. Cho phép người dùng không chuyên cũng có thể thực hiện phân tích dữ liệu phức tạp.

Câu 7: Trong nhiều ứng dụng thực tế, việc phân tích dữ liệu thời gian thực là rất quan trọng (ví dụ: giám sát giao thông, cảnh báo sớm thiên tai). Máy tính hỗ trợ phân tích dữ liệu thời gian thực bằng cách nào?

  • A. Lưu trữ dữ liệu liên tục và phân tích định kỳ theo lịch trình cố định.
  • B. Xử lý dữ liệu ngay khi dữ liệu được tạo ra, cho phép đưa ra phản hồi và quyết định tức thì.
  • C. Sử dụng kết nối internet tốc độ cao để truyền dữ liệu đến trung tâm phân tích.
  • D. Tạo ra các bản sao dữ liệu dự phòng để đảm bảo tính liên tục trong trường hợp sự cố.

Câu 8: Mạng lưới siêu máy tính đã đóng vai trò then chốt trong thành công của Dự án Hệ gen Người. Điều gì làm cho mạng lưới siêu máy tính trở nên cần thiết cho các dự án khoa học dữ liệu quy mô lớn như HGP?

  • A. Khả năng bảo mật dữ liệu tuyệt đối trước các cuộc tấn công mạng.
  • B. Chi phí vận hành thấp hơn so với việc sử dụng nhiều máy tính cá nhân.
  • C. Dễ dàng di chuyển và triển khai ở nhiều địa điểm khác nhau trên thế giới.
  • D. Cung cấp sức mạnh tính toán cực lớn, cho phép xử lý các bài toán phức tạp trong thời gian chấp nhận được.

Câu 9: Trong việc giải thích dữ liệu gen, máy tính và các thuật toán đóng vai trò như "người phiên dịch". Vai trò chính của chúng trong việc "phiên dịch" dữ liệu gen là gì?

  • A. Phân tích trình tự DNA, xác định các gene và chức năng của chúng, từ đó hiểu cơ chế sinh học.
  • B. Lưu trữ và sắp xếp dữ liệu gen một cách có hệ thống để dễ dàng truy cập và quản lý.
  • C. Tạo ra các hình ảnh 3D trực quan về cấu trúc của DNA và các gene.
  • D. Chuyển đổi dữ liệu gen từ định dạng này sang định dạng khác để tương thích với các phần mềm khác nhau.

Câu 10: Hợp tác quốc tế là yếu tố quan trọng trong Dự án Hệ gen Người. Máy tính và mạng internet đã tạo điều kiện thuận lợi như thế nào cho sự hợp tác giữa các nhóm nghiên cứu trên toàn thế giới trong dự án HGP?

  • A. Cung cấp phương tiện giao tiếp trực tuyến miễn phí giữa các nhà khoa học.
  • B. Tự động dịch các tài liệu nghiên cứu từ ngôn ngữ này sang ngôn ngữ khác.
  • C. Cho phép chia sẻ dữ liệu, công cụ và kết quả nghiên cứu một cách nhanh chóng và hiệu quả.
  • D. Đảm bảo tính công bằng trong việc phân chia nguồn lực và kinh phí cho các nhóm nghiên cứu.

Câu 11: Hãy xem xét một công ty thương mại điện tử muốn phân tích hành vi mua sắm của khách hàng để tối ưu hóa chiến dịch quảng cáo. Máy tính và Khoa học Dữ liệu có thể giúp công ty này như thế nào?

  • A. Máy tính sẽ tự động tạo ra các sản phẩm mới để thu hút khách hàng.
  • B. Máy tính phân tích dữ liệu giao dịch, tìm ra xu hướng mua sắm và giúp cá nhân hóa quảng cáo.
  • C. Máy tính thay thế hoàn toàn nhân viên marketing trong việc lên kế hoạch quảng cáo.
  • D. Máy tính dự đoán chính xác sản phẩm nào sẽ bán chạy nhất trong tương lai gần.

Câu 12: So sánh phương pháp phân tích dữ liệu thủ công truyền thống với phương pháp sử dụng máy tính trong Khoa học Dữ liệu. Ưu điểm vượt trội của phương pháp sử dụng máy tính là gì về mặt quy mô dữ liệu?

  • A. Phân tích thủ công đảm bảo tính chính xác cao hơn do có sự can thiệp của con người.
  • B. Phân tích thủ công phù hợp hơn với dữ liệu phức tạp và phi cấu trúc.
  • C. Máy tính có thể xử lý và phân tích lượng dữ liệu lớn hơn gấp nhiều lần so với phương pháp thủ công.
  • D. Máy tính giúp tiết kiệm chi phí hơn so với việc thuê nhân công phân tích thủ công.

Câu 13: Bên cạnh những lợi ích to lớn, việc sử dụng máy tính trong Khoa học Dữ liệu cũng đặt ra những thách thức. Một trong những thách thức quan trọng nhất liên quan đến dữ liệu cá nhân là gì?

  • A. Sự phụ thuộc quá lớn vào công nghệ máy tính làm giảm khả năng tư duy của con người.
  • B. Chi phí đầu tư và duy trì hệ thống máy tính lớn là rất tốn kém.
  • C. Nguy cơ máy tính bị lỗi hoặc hỏng hóc làm gián đoạn quá trình phân tích dữ liệu.
  • D. Vấn đề bảo vệ quyền riêng tư và nguy cơ lạm dụng dữ liệu cá nhân cho mục đích không chính đáng.

Câu 14: Tiền xử lý dữ liệu là một giai đoạn quan trọng trước khi phân tích dữ liệu. Tại sao giai đoạn tiền xử lý lại cần thiết trong quy trình Khoa học Dữ liệu?

  • A. Để chuyển đổi dữ liệu sang định dạng phù hợp với phần mềm trực quan hóa.
  • B. Để làm sạch dữ liệu, loại bỏ nhiễu, dữ liệu không đầy đủ hoặc không nhất quán, đảm bảo chất lượng dữ liệu đầu vào.
  • C. Để giảm kích thước dữ liệu, giúp tiết kiệm không gian lưu trữ và tăng tốc độ truyền tải.
  • D. Để mã hóa dữ liệu, bảo vệ thông tin nhạy cảm trước khi phân tích.

Câu 15: "Dữ liệu rác vào, dữ liệu rác ra" (Garbage in, garbage out) là một nguyên tắc thường được nhắc đến trong Khoa học Dữ liệu. Nguyên tắc này nhấn mạnh điều gì về chất lượng dữ liệu đầu vào?

  • A. Dữ liệu đầu vào càng nhiều thì kết quả phân tích càng chính xác.
  • B. Máy tính có khả năng tự động sửa lỗi dữ liệu đầu vào.
  • C. Chất lượng dữ liệu đầu vào quyết định chất lượng kết quả phân tích, dữ liệu đầu vào kém sẽ dẫn đến kết quả sai lệch.
  • D. Nguyên tắc này không còn đúng trong thời đại Khoa học Dữ liệu hiện nay.

Câu 16: Học máy (Machine Learning) là một lĩnh vực quan trọng của Khoa học Dữ liệu. Máy tính đóng vai trò gì trong việc hiện thực hóa các thuật toán học máy?

  • A. Cung cấp nền tảng để thực thi các thuật toán phức tạp, huấn luyện mô hình và dự đoán từ dữ liệu.
  • B. Tự động lựa chọn thuật toán học máy phù hợp nhất cho từng bài toán cụ thể.
  • C. Đảm bảo tính minh bạch và dễ hiểu của các mô hình học máy.
  • D. Thay thế hoàn toàn vai trò của con người trong việc thiết kế và phát triển thuật toán học máy.

Câu 17: Cơ sở dữ liệu (Database) đóng vai trò quan trọng trong việc quản lý dữ liệu cho Khoa học Dữ liệu. Chức năng chính của cơ sở dữ liệu trong bối cảnh này là gì?

  • A. Phân tích dữ liệu và tạo ra các báo cáo thống kê tự động.
  • B. Trực quan hóa dữ liệu dưới dạng biểu đồ và đồ thị.
  • C. Tiền xử lý dữ liệu để làm sạch và chuẩn hóa dữ liệu.
  • D. Lưu trữ, truy xuất, quản lý và cập nhật dữ liệu một cách có cấu trúc và hiệu quả.

Câu 18: Kho dữ liệu (Data Warehouse) là một khái niệm quan trọng trong Khoa học Dữ liệu, đặc biệt khi làm việc với dữ liệu lịch sử. Mục đích chính của việc xây dựng kho dữ liệu là gì?

  • A. Lưu trữ dữ liệu giao dịch hiện tại để phục vụ các hoạt động hàng ngày.
  • B. Tập hợp dữ liệu từ nhiều nguồn khác nhau, lưu trữ dữ liệu lịch sử để phân tích và hỗ trợ ra quyết định chiến lược.
  • C. Tạo ra các bản sao lưu dữ liệu để phòng ngừa rủi ro mất dữ liệu.
  • D. Tối ưu hóa hiệu suất truy vấn dữ liệu cho các ứng dụng thời gian thực.

Câu 19: Khai phá dữ liệu (Data Mining) là quá trình tìm kiếm tri thức ẩn chứa trong dữ liệu lớn. Máy tính giúp thực hiện khai phá dữ liệu như thế nào?

  • A. Tự động thu thập dữ liệu từ các nguồn khác nhau trên internet.
  • B. Bảo vệ dữ liệu khỏi các truy cập trái phép trong quá trình khai phá.
  • C. Thực thi các thuật toán phức tạp để phát hiện mẫu, xu hướng và quy luật ẩn trong dữ liệu.
  • D. Trình bày kết quả khai phá dữ liệu dưới dạng báo cáo dễ hiểu cho người dùng.

Câu 20: "Dữ liệu lớn" (Big Data) là một thuật ngữ phổ biến trong Khoa học Dữ liệu. Điều gì làm cho một tập dữ liệu được coi là "lớn" trong bối cảnh Khoa học Dữ liệu?

  • A. Dữ liệu được thu thập từ nhiều nguồn khác nhau trên toàn thế giới.
  • B. Dữ liệu chứa thông tin phức tạp và đa dạng, bao gồm cả văn bản, hình ảnh và video.
  • C. Dữ liệu được cập nhật liên tục theo thời gian thực.
  • D. Kích thước, tốc độ tạo ra và sự đa dạng của dữ liệu vượt quá khả năng xử lý của các hệ thống truyền thống.

Câu 21: Dự báo thời tiết hiện đại là một ứng dụng của Khoa học Dữ liệu. Hãy mô tả vai trò của máy tính trong quy trình dự báo thời tiết.

  • A. Thu thập dữ liệu thời tiết từ nhiều nguồn, chạy các mô hình mô phỏng phức tạp và đưa ra dự báo.
  • B. Hiển thị thông tin thời tiết trên các bản đồ trực quan cho người dùng.
  • C. Điều khiển các vệ tinh thời tiết để thu thập dữ liệu từ không gian.
  • D. Tự động phát đi các cảnh báo thời tiết nguy hiểm đến người dân.

Câu 22: Sự phát triển của sức mạnh tính toán đã tác động như thế nào đến sự tiến bộ của Khoa học Dữ liệu?

  • A. Làm giảm sự cần thiết của các thuật toán phức tạp trong phân tích dữ liệu.
  • B. Hạn chế khả năng xử lý dữ liệu thời gian thực do tiêu tốn nhiều năng lượng.
  • C. Mở ra khả năng xử lý các tập dữ liệu lớn hơn, phức tạp hơn và phát triển các mô hình phân tích tinh vi hơn.
  • D. Giảm sự quan tâm của các nhà khoa học đến lĩnh vực Khoa học Dữ liệu.

Câu 23: Phân tích dữ liệu cá nhân bằng máy tính có thể mang lại nhiều lợi ích, nhưng cũng tiềm ẩn rủi ro về đạo đức. Rủi ro đạo đức lớn nhất cần xem xét là gì?

  • A. Khả năng máy tính bị tấn công và dữ liệu bị đánh cắp.
  • B. Vi phạm quyền riêng tư, sử dụng dữ liệu cá nhân sai mục đích hoặc phân biệt đối xử.
  • C. Sự không chính xác của các thuật toán phân tích dữ liệu.
  • D. Chi phí cao để bảo vệ dữ liệu cá nhân.

Câu 24: Bảo mật dữ liệu là một vấn đề sống còn trong Khoa học Dữ liệu. Máy tính và các hệ thống mạng có thể vừa là công cụ bảo vệ, vừa là mục tiêu tấn công dữ liệu. Điều gì quan trọng nhất để đảm bảo an ninh dữ liệu trong Khoa học Dữ liệu?

  • A. Sử dụng phần mềm diệt virus mạnh mẽ trên tất cả các máy tính.
  • B. Sao lưu dữ liệu thường xuyên để phòng ngừa mất dữ liệu.
  • C. Kết hợp các biện pháp kỹ thuật (mã hóa, tường lửa...) và quy trình quản lý chặt chẽ để bảo vệ dữ liệu toàn diện.
  • D. Hạn chế chia sẻ dữ liệu với bên ngoài để giảm nguy cơ rò rỉ thông tin.

Câu 25: Đạo đức dữ liệu (Data Ethics) ngày càng được quan tâm trong Khoa học Dữ liệu. Tại sao đạo đức dữ liệu trở nên quan trọng hơn trong thời đại "Dữ liệu lớn" và máy tính mạnh mẽ?

  • A. Do chi phí xử lý dữ liệu ngày càng tăng cao, cần có đạo đức để tiết kiệm tài nguyên.
  • B. Do khả năng thu thập, xử lý và phân tích dữ liệu cá nhân ngày càng lớn, nguy cơ xâm phạm quyền riêng tư và gây hại ngày càng cao.
  • C. Do các quy định pháp luật về bảo vệ dữ liệu ngày càng nghiêm ngặt hơn.
  • D. Do nhận thức của người dùng về quyền lợi dữ liệu cá nhân ngày càng tăng.

Câu 26: Thuật toán đóng vai trò trung tâm trong Khoa học Dữ liệu. Thuật toán trong Khoa học Dữ liệu được sử dụng để làm gì?

  • A. Lưu trữ và quản lý dữ liệu trong cơ sở dữ liệu.
  • B. Trực quan hóa dữ liệu dưới dạng biểu đồ và đồ thị.
  • C. Thực hiện các bước xử lý, phân tích dữ liệu, khai phá tri thức và đưa ra dự đoán.
  • D. Bảo vệ dữ liệu khỏi các truy cập trái phép.

Câu 27: Ngôn ngữ lập trình Python và R là những công cụ phổ biến trong Khoa học Dữ liệu. Tại sao các ngôn ngữ lập trình lại quan trọng đối với các nhà khoa học dữ liệu?

  • A. Để giao tiếp với máy tính bằng ngôn ngữ tự nhiên.
  • B. Để tạo ra các phần mềm ứng dụng thương mại.
  • C. Để thiết kế giao diện người dùng trực quan.
  • D. Để viết mã lệnh, xây dựng các quy trình phân tích dữ liệu, thuật toán và mô hình học máy.

Câu 28: So sánh các công cụ trực quan hóa dữ liệu khác nhau như biểu đồ cột, biểu đồ đường, bản đồ nhiệt. Khi nào thì biểu đồ phân tán (Scatter plot) là lựa chọn phù hợp nhất để trực quan hóa dữ liệu?

  • A. Khi muốn so sánh giá trị của các danh mục khác nhau.
  • B. Khi muốn thể hiện mối quan hệ giữa hai biến số liên tục.
  • C. Khi muốn theo dõi sự thay đổi của một biến số theo thời gian.
  • D. Khi muốn hiển thị mật độ phân bố của dữ liệu trên một khu vực địa lý.

Câu 29: Một ngân hàng muốn sử dụng Khoa học Dữ liệu để phát hiện giao dịch gian lận. Bạn sẽ đề xuất sử dụng máy tính và thuật toán như thế nào để giải quyết vấn đề này?

  • A. Sử dụng máy tính để lưu trữ tất cả các giao dịch ngân hàng một cách an toàn.
  • B. Sử dụng phần mềm trực quan hóa dữ liệu để theo dõi các giao dịch đáng ngờ.
  • C. Xây dựng mô hình học máy để phân tích lịch sử giao dịch, phát hiện các mẫu giao dịch bất thường và cảnh báo giao dịch gian lận.
  • D. Sử dụng siêu máy tính để xử lý giao dịch nhanh hơn, giảm thời gian chờ đợi cho khách hàng.

Câu 30: Trong tương lai, vai trò của máy tính trong Khoa học Dữ liệu sẽ tiếp tục phát triển. Xu hướng nào có thể định hình vai trò của máy tính trong Khoa học Dữ liệu trong những năm tới?

  • A. Giảm sự phụ thuộc vào máy tính và tăng cường vai trò của phân tích thủ công.
  • B. Máy tính sẽ chỉ đóng vai trò lưu trữ dữ liệu, còn phân tích sẽ do con người thực hiện.
  • C. Máy tính sẽ trở nên ít quan trọng hơn do sự phát triển của các phương pháp phân tích mới.
  • D. Sự phát triển của trí tuệ nhân tạo (AI), điện toán lượng tử và các công nghệ mới sẽ mở rộng khả năng của máy tính trong Khoa học Dữ liệu.

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 1: Trong lĩnh vực Khoa học Dữ liệu, máy tính đóng vai trò trung tâm trong việc xử lý lượng lớn thông tin. Chức năng cốt lõi nào của máy tính cho phép các nhà khoa học dữ liệu làm việc hiệu quả với tập dữ liệu khổng lồ?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 2: Trực quan hóa dữ liệu là một bước quan trọng trong quy trình Khoa học Dữ liệu. Máy tính hỗ trợ quá trình này như thế nào để tăng cường khả năng hiểu và truyền đạt thông tin từ dữ liệu?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 3: Dự án Hệ gen Người (HGP) là một ví dụ điển hình về ứng dụng Khoa học Dữ liệu trong Sinh học. Thách thức lớn nhất mà máy tính đã giúp giải quyết trong HGP là gì?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 4: Điện toán đám mây ngày càng phổ biến trong Khoa học Dữ liệu. Ưu điểm nổi bật nhất của việc sử dụng điện toán đám mây so với việc tự xây dựng và duy trì cơ sở hạ tầng tính toán là gì?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 5: Khi phân tích dữ liệu lớn, thời gian xử lý là một yếu tố quan trọng. Kỹ thuật xử lý song song giúp máy tính giảm đáng kể thời gian phân tích. Nguyên lý cơ bản của xử lý song song là gì?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 6: Tự động hóa quy trình phân tích dữ liệu là một ưu điểm lớn của việc ứng dụng máy tính trong Khoa học Dữ liệu. Lợi ích chính của tự động hóa trong bối cảnh này là gì?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 7: Trong nhiều ứng dụng thực tế, việc phân tích dữ liệu thời gian thực là rất quan trọng (ví dụ: giám sát giao thông, cảnh báo sớm thiên tai). Máy tính hỗ trợ phân tích dữ liệu thời gian thực bằng cách nào?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 8: Mạng lưới siêu máy tính đã đóng vai trò then chốt trong thành công của Dự án Hệ gen Người. Điều gì làm cho mạng lưới siêu máy tính trở nên cần thiết cho các dự án khoa học dữ liệu quy mô lớn như HGP?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 9: Trong việc giải thích dữ liệu gen, máy tính và các thuật toán đóng vai trò như 'người phiên dịch'. Vai trò chính của chúng trong việc 'phiên dịch' dữ liệu gen là gì?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 10: Hợp tác quốc tế là yếu tố quan trọng trong Dự án Hệ gen Người. Máy tính và mạng internet đã tạo điều kiện thuận lợi như thế nào cho sự hợp tác giữa các nhóm nghiên cứu trên toàn thế giới trong dự án HGP?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 11: Hãy xem xét một công ty thương mại điện tử muốn phân tích hành vi mua sắm của khách hàng để tối ưu hóa chiến dịch quảng cáo. Máy tính và Khoa học Dữ liệu có thể giúp công ty này như thế nào?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 12: So sánh phương pháp phân tích dữ liệu thủ công truyền thống với phương pháp sử dụng máy tính trong Khoa học Dữ liệu. Ưu điểm vượt trội của phương pháp sử dụng máy tính là gì về mặt quy mô dữ liệu?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 13: Bên cạnh những lợi ích to lớn, việc sử dụng máy tính trong Khoa học Dữ liệu cũng đặt ra những thách thức. Một trong những thách thức quan trọng nhất liên quan đến dữ liệu cá nhân là gì?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 14: Tiền xử lý dữ liệu là một giai đoạn quan trọng trước khi phân tích dữ liệu. Tại sao giai đoạn tiền xử lý lại cần thiết trong quy trình Khoa học Dữ liệu?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 15: 'Dữ liệu rác vào, dữ liệu rác ra' (Garbage in, garbage out) là một nguyên tắc thường được nhắc đến trong Khoa học Dữ liệu. Nguyên tắc này nhấn mạnh điều gì về chất lượng dữ liệu đầu vào?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 16: Học máy (Machine Learning) là một lĩnh vực quan trọng của Khoa học Dữ liệu. Máy tính đóng vai trò gì trong việc hiện thực hóa các thuật toán học máy?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 17: Cơ sở dữ liệu (Database) đóng vai trò quan trọng trong việc quản lý dữ liệu cho Khoa học Dữ liệu. Chức năng chính của cơ sở dữ liệu trong bối cảnh này là gì?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 18: Kho dữ liệu (Data Warehouse) là một khái niệm quan trọng trong Khoa học Dữ liệu, đặc biệt khi làm việc với dữ liệu lịch sử. Mục đích chính của việc xây dựng kho dữ liệu là gì?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 19: Khai phá dữ liệu (Data Mining) là quá trình tìm kiếm tri thức ẩn chứa trong dữ liệu lớn. Máy tính giúp thực hiện khai phá dữ liệu như thế nào?

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 20: 'Dữ liệu lớn' (Big Data) là một thuật ngữ phổ biến trong Khoa học Dữ liệu. Điều gì làm cho một tập dữ liệu được coi là 'lớn' trong bối cảnh Khoa học Dữ liệu?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 21: Dự báo thời tiết hiện đại là một ứng dụng của Khoa học Dữ liệu. Hãy mô tả vai trò của máy tính trong quy trình dự báo thời tiết.

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 22: Sự phát triển của sức mạnh tính toán đã tác động như thế nào đến sự tiến bộ của Khoa học Dữ liệu?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 23: Phân tích dữ liệu cá nhân bằng máy tính có thể mang lại nhiều lợi ích, nhưng cũng tiềm ẩn rủi ro về đạo đức. Rủi ro đạo đức lớn nhất cần xem xét là gì?

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 24: Bảo mật dữ liệu là một vấn đề sống còn trong Khoa học Dữ liệu. Máy tính và các hệ thống mạng có thể vừa là công cụ bảo vệ, vừa là mục tiêu tấn công dữ liệu. Điều gì quan trọng nhất để đảm bảo an ninh dữ liệu trong Khoa học Dữ liệu?

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 25: Đạo đức dữ liệu (Data Ethics) ngày càng được quan tâm trong Khoa học Dữ liệu. Tại sao đạo đức dữ liệu trở nên quan trọng hơn trong thời đại 'Dữ liệu lớn' và máy tính mạnh mẽ?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 26: Thuật toán đóng vai trò trung tâm trong Khoa học Dữ liệu. Thuật toán trong Khoa học Dữ liệu được sử dụng để làm gì?

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 27: Ngôn ngữ lập trình Python và R là những công cụ phổ biến trong Khoa học Dữ liệu. Tại sao các ngôn ngữ lập trình lại quan trọng đối với các nhà khoa học dữ liệu?

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 28: So sánh các công cụ trực quan hóa dữ liệu khác nhau như biểu đồ cột, biểu đồ đường, bản đồ nhiệt. Khi nào thì biểu đồ phân tán (Scatter plot) là lựa chọn phù hợp nhất để trực quan hóa dữ liệu?

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 29: Một ngân hàng muốn sử dụng Khoa học Dữ liệu để phát hiện giao dịch gian lận. Bạn sẽ đề xuất sử dụng máy tính và thuật toán như thế nào để giải quyết vấn đề này?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 2

Câu 30: Trong tương lai, vai trò của máy tính trong Khoa học Dữ liệu sẽ tiếp tục phát triển. Xu hướng nào có thể định hình vai trò của máy tính trong Khoa học Dữ liệu trong những năm tới?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 03

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 03 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong quy trình khoa học dữ liệu, máy tính đóng vai trò quan trọng nhất trong việc xử lý khối lượng dữ liệu lớn và phức tạp ở giai đoạn nào?

  • A. Chỉ thu thập dữ liệu
  • B. Chỉ trực quan hóa dữ liệu ban đầu
  • C. Tiền xử lý, phân tích và mô hình hóa dữ liệu
  • D. Chỉ trình bày kết quả

Câu 2: Việc sử dụng các thuật toán học máy phức tạp để phát hiện các mẫu ẩn hoặc đưa ra dự đoán từ dữ liệu lớn yêu cầu khả năng tính toán mạnh mẽ của máy tính. Đây là vai trò của máy tính trong giai đoạn nào của khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Phân tích và mô hình hóa dữ liệu
  • C. Lưu trữ dữ liệu
  • D. Trực quan hóa dữ liệu

Câu 3: Một nhà khoa học dữ liệu đang làm sạch một tập dữ liệu khách hàng khổng lồ chứa hàng triệu bản ghi với nhiều giá trị bị thiếu và không nhất quán. Công cụ nào do máy tính cung cấp sẽ hỗ trợ hiệu quả nhất cho tác vụ này?

  • A. Phần mềm vẽ biểu đồ đơn giản
  • B. Hệ thống quản lý cơ sở dữ liệu quan hệ truyền thống
  • C. Công cụ tạo báo cáo tự động
  • D. Các thư viện lập trình và framework xử lý dữ liệu lớn (ví dụ: Pandas, Spark)

Câu 4: Dự án Giải mã bộ gene người (Human Genome Project - HGP) là một ví dụ điển hình minh chứng cho vai trò của máy tính trong việc xử lý dữ liệu lớn. Thách thức dữ liệu chính mà HGP phải đối mặt là gì, và máy tính đã giải quyết nó như thế nào?

  • A. Khối lượng dữ liệu khổng lồ và phức tạp; Máy tính giúp xử lý song song và tự động hóa phân tích.
  • B. Thiếu dữ liệu; Máy tính giúp tạo ra dữ liệu gene nhân tạo.
  • C. Dữ liệu không có cấu trúc; Máy tính chỉ dùng để lưu trữ.
  • D. Dữ liệu thay đổi liên tục theo thời gian; Máy tính chỉ ghi lại các thay đổi.

Câu 5: Khi phân tích dữ liệu thời gian thực từ các cảm biến trong một nhà máy thông minh, khả năng nào của máy tính là tối quan trọng để đưa ra các cảnh báo hoặc điều chỉnh quy trình kịp thời?

  • A. Khả năng lưu trữ dữ liệu lâu dài
  • B. Khả năng tạo ra báo cáo định kỳ
  • C. Khả năng xử lý dữ liệu với tốc độ cao và độ trễ thấp
  • D. Khả năng trực quan hóa dữ liệu tĩnh

Câu 6: Một trong những lợi ích chính của việc áp dụng tự động hóa trong các tác vụ khoa học dữ liệu lặp đi lặp lại (như làm sạch dữ liệu, tạo báo cáo) là gì?

  • A. Giảm yêu cầu về phần cứng máy tính
  • B. Tăng tốc quy trình và giảm thiểu lỗi do con người
  • C. Loại bỏ hoàn toàn sự cần thiết của chuyên gia dữ liệu
  • D. Chỉ áp dụng được cho dữ liệu nhỏ

Câu 7: Điện toán đám mây (Cloud Computing) mang lại lợi ích đáng kể nào cho các dự án khoa học dữ liệu yêu cầu nguồn lực tính toán lớn và linh hoạt?

  • A. Cung cấp tài nguyên tính toán theo yêu cầu mà không cần đầu tư ban đầu lớn vào phần cứng vật lý.
  • B. Tăng cường bảo mật dữ liệu tự động mà không cần cấu hình.
  • C. Giảm hoàn toàn chi phí vận hành hệ thống.
  • D. Chỉ hỗ trợ lưu trữ dữ liệu, không hỗ trợ phân tích.

Câu 8: Để trực quan hóa một tập dữ liệu phức tạp với nhiều chiều (ví dụ: dữ liệu kinh doanh bao gồm doanh thu, chi phí, lợi nhuận theo từng khu vực, thời gian, loại sản phẩm), máy tính hỗ trợ bằng cách nào?

  • A. Chỉ hiển thị dữ liệu dưới dạng bảng số thô.
  • B. Tự động tạo ra các kết luận từ dữ liệu.
  • C. Giới hạn số lượng điểm dữ liệu có thể hiển thị.
  • D. Cung cấp các công cụ và thư viện để tạo biểu đồ, đồ thị tương tác, dashboard đa chiều.

Câu 9: Khả năng xử lý song song (Parallel Processing) của máy tính có ý nghĩa gì đặc biệt đối với việc phân tích dữ liệu lớn (Big Data)?

  • A. Giúp giảm dung lượng lưu trữ cần thiết cho dữ liệu.
  • B. Phân chia và xử lý các phần của dữ liệu cùng lúc trên nhiều bộ xử lý, giảm đáng kể thời gian xử lý.
  • C. Đảm bảo tính chính xác 100% của dữ liệu đầu vào.
  • D. Chỉ áp dụng cho các tác vụ thu thập dữ liệu.

Câu 10: Trong bối cảnh khoa học dữ liệu, thuật ngữ "khả năng mở rộng" (scalability) của cơ sở hạ tầng tính toán đề cập đến điều gì?

  • A. Khả năng tăng hoặc giảm tài nguyên tính toán (CPU, RAM, lưu trữ) dễ dàng để phù hợp với khối lượng dữ liệu và độ phức tạp của bài toán.
  • B. Khả năng kết nối nhiều loại thiết bị ngoại vi khác nhau.
  • C. Khả năng chạy nhiều hệ điều hành cùng lúc.
  • D. Khả năng hiển thị dữ liệu trên nhiều loại màn hình.

Câu 11: Một công ty thương mại điện tử muốn phân tích lịch sử mua hàng của hàng triệu khách hàng để đề xuất sản phẩm phù hợp cho từng người. Bài toán này đòi hỏi khả năng nào của máy tính trong khoa học dữ liệu?

  • A. Chỉ khả năng lưu trữ dữ liệu lớn.
  • B. Chỉ khả năng tạo báo cáo doanh số.
  • C. Khả năng xử lý, phân tích dữ liệu phức tạp và áp dụng thuật toán học máy.
  • D. Chỉ khả năng hiển thị dữ liệu dưới dạng bảng.

Câu 12: Tại sao việc tích hợp dữ liệu từ nhiều nguồn khác nhau (ví dụ: dữ liệu bán hàng, dữ liệu marketing, dữ liệu phản hồi khách hàng) lại là một bước quan trọng trong khoa học dữ liệu, và máy tính hỗ trợ việc này như thế nào?

  • A. Giúp giảm dung lượng lưu trữ dữ liệu.
  • B. Chỉ để so sánh các con số đơn giản.
  • C. Làm cho dữ liệu trở nên ngẫu nhiên hơn.
  • D. Tạo ra cái nhìn toàn diện hơn về vấn đề; Máy tính cung cấp công cụ để kết hợp, làm sạch và biến đổi dữ liệu từ các định dạng khác nhau.

Câu 13: Khi một mô hình dự báo (ví dụ: dự báo thời tiết, dự báo giá cổ phiếu) được xây dựng dựa trên dữ liệu lịch sử, máy tính đóng vai trò gì trong quá trình này?

  • A. Chỉ thu thập dữ liệu lịch sử.
  • B. Thực hiện các tính toán phức tạp để tìm ra mối quan hệ trong dữ liệu và xây dựng mô hình.
  • C. Tự động đưa ra quyết định cuối cùng mà không cần sự can thiệp của con người.
  • D. Chỉ lưu trữ mô hình đã được xây dựng sẵn.

Câu 14: Trong khoa học dữ liệu, "tiền xử lý dữ liệu" (data preprocessing) là gì, và máy tính đóng vai trò then chốt như thế nào trong giai đoạn này?

  • A. Là quá trình làm sạch, biến đổi và chuẩn hóa dữ liệu để sẵn sàng cho phân tích; Máy tính cung cấp công cụ tự động hóa các tác vụ này trên quy mô lớn.
  • B. Là quá trình thu thập dữ liệu từ các nguồn khác nhau; Máy tính chỉ đóng vai trò kết nối mạng.
  • C. Là quá trình tạo ra các biểu đồ và đồ thị; Máy tính chỉ là màn hình hiển thị.
  • D. Là quá trình diễn giải kết quả phân tích; Máy tính chỉ hiển thị văn bản giải thích.

Câu 15: Tại sao việc sử dụng siêu máy tính hoặc mạng lưới máy tính phân tán lại cần thiết cho các dự án khoa học dữ liệu quy mô rất lớn, như phân tích dữ liệu thiên văn hoặc mô phỏng khí hậu toàn cầu?

  • A. Chỉ vì chúng có màn hình hiển thị lớn hơn.
  • B. Để giảm chi phí vận hành so với máy tính cá nhân.
  • C. Để cung cấp sức mạnh tính toán vượt trội, cho phép xử lý khối lượng dữ liệu khổng lồ và chạy các mô hình tính toán phức tạp trong thời gian hợp lý.
  • D. Để đảm bảo dữ liệu được lưu trữ an toàn tuyệt đối.

Câu 16: Khả năng "học" từ dữ liệu mà không được lập trình tường minh (Machine Learning) là một kỹ thuật cốt lõi trong khoa học dữ liệu. Máy tính làm nền tảng cho khả năng này chủ yếu thông qua việc gì?

  • A. Chỉ đơn giản là lưu trữ các thuật toán.
  • B. Thực hiện lặp đi lặp lại các phép tính toán phức tạp trên dữ liệu để tìm ra các mẫu và điều chỉnh mô hình.
  • C. Tự động thu thập dữ liệu mới từ môi trường.
  • D. Trực quan hóa quá trình học một cách tự động.

Câu 17: So sánh việc phân tích dữ liệu bằng tay truyền thống với việc sử dụng máy tính trong khoa học dữ liệu, ưu điểm vượt trội của việc dùng máy tính trong phân tích dữ liệu lớn nằm ở đâu?

  • A. Độ chính xác luôn thấp hơn.
  • B. Chỉ có thể xử lý các tập dữ liệu nhỏ.
  • C. Tốn nhiều thời gian hơn.
  • D. Tốc độ xử lý nhanh hơn, khả năng xử lý khối lượng dữ liệu lớn hơn, và khả năng thực hiện các phân tích phức tạp mà con người khó thực hiện thủ công.

Câu 18: Một công ty muốn sử dụng dữ liệu bán hàng để dự báo xu hướng thị trường trong 6 tháng tới. Việc áp dụng các mô hình dự báo dựa trên dữ liệu lịch sử đòi hỏi máy tính phải có khả năng nào?

  • A. Thực hiện tính toán số học và thống kê phức tạp trên tập dữ liệu lớn.
  • B. Chỉ hiển thị đồ thị đường.
  • C. Thu thập dữ liệu từ các cửa hàng vật lý.
  • D. Lưu trữ dữ liệu vô thời hạn.

Câu 19: Khả năng nào của máy tính cho phép các nhà khoa học dữ liệu khám phá mối quan hệ nhân quả hoặc tương quan phức tạp giữa các biến trong tập dữ liệu lớn?

  • A. Khả năng in ấn báo cáo.
  • B. Khả năng kết nối internet.
  • C. Sức mạnh tính toán để chạy các thuật toán phân tích thống kê và mô hình hóa.
  • D. Khả năng phát nhạc.

Câu 20: Tại sao việc quản lý và lưu trữ dữ liệu lớn một cách hiệu quả là một thách thức trong khoa học dữ liệu, và máy tính giải quyết thách thức này như thế nào?

  • A. Khối lượng dữ liệu vượt quá khả năng lưu trữ và xử lý của hệ thống truyền thống; Máy tính cung cấp các hệ thống lưu trữ phân tán (ví dụ: HDFS) và cơ sở dữ liệu NoSQL.
  • B. Dữ liệu luôn bị mất; Máy tính chỉ sao lưu dữ liệu.
  • C. Dữ liệu không thay đổi; Máy tính chỉ cần một ổ đĩa nhỏ.
  • D. Dữ liệu chỉ có một định dạng duy nhất; Máy tính chỉ cần một phần mềm đơn giản.

Câu 21: Một nhà nghiên cứu y tế đang phân tích hình ảnh y khoa (ví dụ: ảnh X-quang, MRI) với số lượng lớn để phát hiện sớm các dấu hiệu bệnh. Kỹ thuật nào trong khoa học dữ liệu, được hỗ trợ mạnh mẽ bởi máy tính, thường được áp dụng cho loại dữ liệu này?

  • A. Phân tích văn bản đơn giản.
  • B. Thống kê mô tả cơ bản.
  • C. Trực quan hóa dữ liệu dưới dạng bảng.
  • D. Học sâu (Deep Learning) và thị giác máy tính (Computer Vision).

Câu 22: Việc tạo ra các bảng điều khiển (dashboards) tương tác, cho phép người dùng khám phá dữ liệu và hiểu kết quả phân tích một cách trực quan, là vai trò của máy tính trong giai đoạn nào của khoa học dữ liệu?

  • A. Trực quan hóa và giao tiếp kết quả.
  • B. Thu thập dữ liệu.
  • C. Tiền xử lý dữ liệu.
  • D. Lưu trữ dữ liệu.

Câu 23: Khi làm việc với dữ liệu lớn, việc lặp đi lặp lại các bước như làm sạch, biến đổi, và trích xuất đặc trưng là phổ biến. Khả năng nào của máy tính giúp tối ưu hóa các tác vụ lặp này?

  • A. Khả năng kết nối mạng nhanh.
  • B. Khả năng tự động hóa quy trình (automation) thông qua lập trình và các công cụ chuyên dụng.
  • C. Khả năng hiển thị màu sắc đẹp.
  • D. Khả năng phát âm thanh.

Câu 24: Một trong những rào cản lớn nhất khi xử lý dữ liệu lớn mà máy tính giúp khắc phục là gì?

  • A. Thiếu dữ liệu.
  • B. Dữ liệu quá dễ hiểu.
  • C. Tốc độ xử lý chậm và hạn chế về bộ nhớ khi sử dụng phương pháp thủ công hoặc công cụ truyền thống.
  • D. Dữ liệu không có định dạng.

Câu 25: Hệ thống quản lý cơ sở dữ liệu truyền thống (ví dụ: SQL) có thể gặp khó khăn khi xử lý dữ liệu lớn có cấu trúc không cố định (ví dụ: dữ liệu từ mạng xã hội, cảm biến). Máy tính hỗ trợ giải quyết vấn đề này bằng cách nào?

  • A. Cung cấp các hệ thống cơ sở dữ liệu NoSQL (ví dụ: MongoDB, Cassandra) được thiết kế để lưu trữ và quản lý dữ liệu phi cấu trúc hoặc bán cấu trúc trên quy mô lớn.
  • B. Chỉ chuyển đổi tất cả dữ liệu sang định dạng bảng.
  • C. Bỏ qua các dữ liệu không có cấu trúc.
  • D. Chỉ lưu trữ dữ liệu trên đĩa cứng đơn giản.

Câu 26: Khi một mô hình học máy được huấn luyện trên một tập dữ liệu lớn, quá trình này bao gồm hàng tỷ phép tính lặp đi lặp lại. Khả năng nào của phần cứng máy tính là quan trọng nhất để tăng tốc độ huấn luyện mô hình này?

  • A. Dung lượng ổ cứng lớn.
  • B. Màn hình có độ phân giải cao.
  • C. Bàn phím có đèn nền.
  • D. Sức mạnh xử lý của CPU và GPU (Bộ xử lý đồ họa).

Câu 27: Một trong những ứng dụng của khoa học dữ liệu là phân tích cảm xúc (sentiment analysis) từ các bài đăng trên mạng xã hội. Máy tính hỗ trợ việc này bằng cách sử dụng kỹ thuật nào?

  • A. Chỉ đếm số lượng bài đăng.
  • B. Phân tích ngôn ngữ tự nhiên (Natural Language Processing - NLP) để hiểu ý nghĩa và sắc thái của văn bản.
  • C. Chỉ hiển thị các bài đăng theo thứ tự thời gian.
  • D. Tạo ra các bài đăng mới dựa trên dữ liệu cũ.

Câu 28: Việc kiểm định giả thuyết thống kê trên một tập dữ liệu lớn để rút ra kết luận có ý nghĩa thống kê đòi hỏi máy tính phải có khả năng nào?

  • A. Chỉ lưu trữ công thức thống kê.
  • B. Chỉ vẽ biểu đồ cột.
  • C. Thực hiện các phép tính thống kê phức tạp và lặp đi lặp lại trên toàn bộ dữ liệu một cách nhanh chóng và chính xác.
  • D. Chỉ hiển thị kết quả dưới dạng văn bản.

Câu 29: Trong khoa học dữ liệu, việc tạo ra các "đặc trưng" (features) mới từ dữ liệu thô hiện có (feature engineering) thường là một bước cần thiết để cải thiện hiệu suất của mô hình. Máy tính hỗ trợ quá trình này như thế nào?

  • A. Cung cấp các công cụ lập trình và thư viện để tự động hóa việc biến đổi, kết hợp và tạo ra các biến mới dựa trên logic hoặc thuật toán.
  • B. Chỉ gợi ý cho người dùng nên tạo đặc trưng nào.
  • C. Tự động tạo ra đặc trưng ngẫu nhiên.
  • D. Chỉ lưu trữ các đặc trưng đã được tạo thủ công.

Câu 30: Khả năng nào của máy tính là nền tảng cho việc xây dựng và triển khai các hệ thống khuyến nghị (recommendation systems) cá nhân hóa, như gợi ý phim trên Netflix hay sản phẩm trên Amazon?

  • A. Khả năng hiển thị video chất lượng cao.
  • B. Khả năng xử lý âm thanh.
  • C. Khả năng kết nối nhiều người dùng cùng lúc.
  • D. Khả năng phân tích hành vi người dùng, lịch sử tương tác và áp dụng các thuật toán lọc cộng tác hoặc dựa trên nội dung để đưa ra gợi ý phù hợp.

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 1: Trong quy trình khoa học dữ liệu, máy tính đóng vai trò quan trọng nhất trong việc xử lý khối lượng dữ liệu lớn và phức tạp ở giai đoạn nào?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 2: Việc sử dụng các thuật toán học máy phức tạp để phát hiện các mẫu ẩn hoặc đưa ra dự đoán từ dữ liệu lớn yêu cầu khả năng tính toán mạnh mẽ của máy tính. Đây là vai trò của máy tính trong giai đoạn nào của khoa học dữ liệu?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 3: Một nhà khoa học dữ liệu đang làm sạch một tập dữ liệu khách hàng khổng lồ chứa hàng triệu bản ghi với nhiều giá trị bị thiếu và không nhất quán. Công cụ nào do máy tính cung cấp sẽ hỗ trợ hiệu quả nhất cho tác vụ này?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 4: Dự án Giải mã bộ gene người (Human Genome Project - HGP) là một ví dụ điển hình minh chứng cho vai trò của máy tính trong việc xử lý dữ liệu lớn. Thách thức dữ liệu chính mà HGP phải đối mặt là gì, và máy tính đã giải quyết nó như thế nào?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 5: Khi phân tích dữ liệu thời gian thực từ các cảm biến trong một nhà máy thông minh, khả năng nào của máy tính là tối quan trọng để đưa ra các cảnh báo hoặc điều chỉnh quy trình kịp thời?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 6: Một trong những lợi ích chính của việc áp dụng tự động hóa trong các tác vụ khoa học dữ liệu lặp đi lặp lại (như làm sạch dữ liệu, tạo báo cáo) là gì?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 7: Điện toán đám mây (Cloud Computing) mang lại lợi ích đáng kể nào cho các dự án khoa học dữ liệu yêu cầu nguồn lực tính toán lớn và linh hoạt?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 8: Để trực quan hóa một tập dữ liệu phức tạp với nhiều chiều (ví dụ: dữ liệu kinh doanh bao gồm doanh thu, chi phí, lợi nhuận theo từng khu vực, thời gian, loại sản phẩm), máy tính hỗ trợ bằng cách nào?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 9: Khả năng xử lý song song (Parallel Processing) của máy tính có ý nghĩa gì đặc biệt đối với việc phân tích dữ liệu lớn (Big Data)?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 10: Trong bối cảnh khoa học dữ liệu, thuật ngữ 'khả năng mở rộng' (scalability) của cơ sở hạ tầng tính toán đề cập đến điều gì?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 11: Một công ty thương mại điện tử muốn phân tích lịch sử mua hàng của hàng triệu khách hàng để đề xuất sản phẩm phù hợp cho từng người. Bài toán này đòi hỏi khả năng nào của máy tính trong khoa học dữ liệu?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 12: Tại sao việc tích hợp dữ liệu từ nhiều nguồn khác nhau (ví dụ: dữ liệu bán hàng, dữ liệu marketing, dữ liệu phản hồi khách hàng) lại là một bước quan trọng trong khoa học dữ liệu, và máy tính hỗ trợ việc này như thế nào?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 13: Khi một mô hình dự báo (ví dụ: dự báo thời tiết, dự báo giá cổ phiếu) được xây dựng dựa trên dữ liệu lịch sử, máy tính đóng vai trò gì trong quá trình này?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 14: Trong khoa học dữ liệu, 'tiền xử lý dữ liệu' (data preprocessing) là gì, và máy tính đóng vai trò then chốt như thế nào trong giai đoạn này?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 15: Tại sao việc sử dụng siêu máy tính hoặc mạng lưới máy tính phân tán lại cần thiết cho các dự án khoa học dữ liệu quy mô rất lớn, như phân tích dữ liệu thiên văn hoặc mô phỏng khí hậu toàn cầu?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 16: Khả năng 'học' từ dữ liệu mà không được lập trình tường minh (Machine Learning) là một kỹ thuật cốt lõi trong khoa học dữ liệu. Máy tính làm nền tảng cho khả năng này chủ yếu thông qua việc gì?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 17: So sánh việc phân tích dữ liệu bằng tay truyền thống với việc sử dụng máy tính trong khoa học dữ liệu, ưu điểm vượt trội của việc dùng máy tính trong phân tích dữ liệu lớn nằm ở đâu?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 18: Một công ty muốn sử dụng dữ liệu bán hàng để dự báo xu hướng thị trường trong 6 tháng tới. Việc áp dụng các mô hình dự báo dựa trên dữ liệu lịch sử đòi hỏi máy tính phải có khả năng nào?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 19: Khả năng nào của máy tính cho phép các nhà khoa học dữ liệu khám phá mối quan hệ nhân quả hoặc tương quan phức tạp giữa các biến trong tập dữ liệu lớn?

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 20: Tại sao việc quản lý và lưu trữ dữ liệu lớn một cách hiệu quả là một thách thức trong khoa học dữ liệu, và máy tính giải quyết thách thức này như thế nào?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 21: Một nhà nghiên cứu y tế đang phân tích hình ảnh y khoa (ví dụ: ảnh X-quang, MRI) với số lượng lớn để phát hiện sớm các dấu hiệu bệnh. Kỹ thuật nào trong khoa học dữ liệu, được hỗ trợ mạnh mẽ bởi máy tính, thường được áp dụng cho loại dữ liệu này?

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 22: Việc tạo ra các bảng điều khiển (dashboards) tương tác, cho phép người dùng khám phá dữ liệu và hiểu kết quả phân tích một cách trực quan, là vai trò của máy tính trong giai đoạn nào của khoa học dữ liệu?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 23: Khi làm việc với dữ liệu lớn, việc lặp đi lặp lại các bước như làm sạch, biến đổi, và trích xuất đặc trưng là phổ biến. Khả năng nào của máy tính giúp tối ưu hóa các tác vụ lặp này?

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 24: Một trong những rào cản lớn nhất khi xử lý dữ liệu lớn mà máy tính giúp khắc phục là gì?

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 25: Hệ thống quản lý cơ sở dữ liệu truyền thống (ví dụ: SQL) có thể gặp khó khăn khi xử lý dữ liệu lớn có cấu trúc không cố định (ví dụ: dữ liệu từ mạng xã hội, cảm biến). Máy tính hỗ trợ giải quyết vấn đề này bằng cách nào?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 26: Khi một mô hình học máy được huấn luyện trên một tập dữ liệu lớn, quá trình này bao gồm hàng tỷ phép tính lặp đi lặp lại. Khả năng nào của phần cứng máy tính là quan trọng nhất để tăng tốc độ huấn luyện mô hình này?

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 27: Một trong những ứng dụng của khoa học dữ liệu là phân tích cảm xúc (sentiment analysis) từ các bài đăng trên mạng xã hội. Máy tính hỗ trợ việc này bằng cách sử dụng kỹ thuật nào?

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 28: Việc kiểm định giả thuyết thống kê trên một tập dữ liệu lớn để rút ra kết luận có ý nghĩa thống kê đòi hỏi máy tính phải có khả năng nào?

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 29: Trong khoa học dữ liệu, việc tạo ra các 'đặc trưng' (features) mới từ dữ liệu thô hiện có (feature engineering) thường là một bước cần thiết để cải thiện hiệu suất của mô hình. Máy tính hỗ trợ quá trình này như thế nào?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 3

Câu 30: Khả năng nào của máy tính là nền tảng cho việc xây dựng và triển khai các hệ thống khuyến nghị (recommendation systems) cá nhân hóa, như gợi ý phim trên Netflix hay sản phẩm trên Amazon?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 04

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 04 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Vai trò cốt lõi nào của máy tính giúp các nhà khoa học dữ liệu xử lý và phân tích các tập dữ liệu khổng lồ, thường vượt quá khả năng xử lý thủ công?

  • A. Khả năng tạo ra dữ liệu mới một cách tự động.
  • B. Chỉ đơn thuần lưu trữ dữ liệu thô.
  • C. Giới hạn khả năng trực quan hóa dữ liệu phức tạp.
  • D. Cung cấp sức mạnh tính toán và khả năng lưu trữ dữ liệu quy mô lớn.

Câu 2: Trong quy trình khoa học dữ liệu, bước "Tiền xử lý dữ liệu" (Data Preprocessing) thường tiêu tốn nhiều thời gian và công sức. Máy tính hỗ trợ hiệu quả nhất cho bước này bằng cách nào?

  • A. Tự động đưa ra các kết luận kinh doanh từ dữ liệu bẩn.
  • B. Chỉ giúp lưu trữ tạm thời các dữ liệu bị thiếu hoặc lỗi.
  • C. Thực hiện tự động các tác vụ như làm sạch, chuyển đổi và tích hợp dữ liệu.
  • D. Chỉ hỗ trợ thu thập dữ liệu từ các nguồn khác nhau.

Câu 3: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm của hàng triệu khách hàng để đưa ra các gợi ý sản phẩm cá nhân hóa. Thách thức lớn nhất về mặt dữ liệu mà họ phải đối mặt, đòi hỏi sự hỗ trợ của máy tính, là gì?

  • A. Sự thiếu đa dạng trong các loại dữ liệu thu thập.
  • B. Khối lượng (Volume) và tốc độ phát sinh (Velocity) dữ liệu khổng lồ.
  • C. Dữ liệu luôn hoàn hảo, không có sai sót.
  • D. Không cần phân tích phức tạp, chỉ cần báo cáo đơn giản.

Câu 4: Kỹ thuật tính toán nào cho phép thực hiện nhiều phép tính hoặc tác vụ xử lý dữ liệu cùng lúc trên nhiều bộ xử lý hoặc máy tính, giúp giảm đáng kể thời gian phân tích các tập dữ liệu lớn?

  • A. Xử lý song song (Parallel Processing).
  • B. Xử lý tuần tự (Sequential Processing).
  • C. Xử lý thủ công (Manual Processing).
  • D. Trực quan hóa dữ liệu (Data Visualization).

Câu 5: Điện toán đám mây (Cloud Computing) mang lại lợi ích đáng kể nào cho các dự án khoa học dữ liệu, đặc biệt là đối với các nhóm nghiên cứu hoặc doanh nghiệp nhỏ?

  • A. Yêu cầu đầu tư lớn vào phần cứng máy chủ tại chỗ.
  • B. Giảm khả năng truy cập và chia sẻ dữ liệu giữa các thành viên.
  • C. Hạn chế sử dụng các thuật toán phân tích phức tạp.
  • D. Cung cấp tài nguyên tính toán và lưu trữ linh hoạt, có thể mở rộng mà không cần đầu tư ban đầu lớn.

Câu 6: Trực quan hóa dữ liệu (Data Visualization) là một giai đoạn quan trọng trong khoa học dữ liệu. Máy tính đóng góp vào giai đoạn này chủ yếu bằng cách nào?

  • A. Tạo ra dữ liệu mới để điền vào các khoảng trống.
  • B. Chuyển đổi các kết quả phân tích phức tạp thành biểu đồ, đồ thị dễ hiểu.
  • C. Chỉ lưu trữ các hình ảnh biểu đồ đã tạo.
  • D. Thực hiện các phép tính toán học trên dữ liệu.

Câu 7: Trong Dự án Hệ gene người (HGP), việc sử dụng máy tính và các thuật toán tiên tiến là yếu tố then chốt. Vai trò quan trọng nhất của chúng trong việc giải trình tự và phân tích dữ liệu gene là gì?

  • A. Đảm bảo độ chính xác cao trong việc xác định và sắp xếp hàng tỷ cặp base, đồng thời xử lý khối lượng dữ liệu khổng lồ.
  • B. Chỉ đơn giản là lưu trữ kết quả cuối cùng sau khi phân tích thủ công.
  • C. Giới hạn khả năng phát hiện các vùng chức năng trong gene.
  • D. Thay thế hoàn toàn vai trò của các nhà sinh học trong việc diễn giải kết quả.

Câu 8: Khoa học dữ liệu là sự kết hợp của nhiều lĩnh vực. Ngoài Tin học (Khoa học máy tính) và Toán học/Thống kê, lĩnh vực kiến thức nào sau đây cũng đóng vai trò thiết yếu?

  • A. Văn học.
  • B. Mỹ thuật.
  • C. Kiến thức chuyên sâu về lĩnh vực ứng dụng (Domain Knowledge).
  • D. Âm nhạc.

Câu 9: Một công ty tài chính sử dụng khoa học dữ liệu để phát hiện các giao dịch gian lận. Họ cần phân tích hàng nghìn giao dịch mỗi giây. Thách thức nào của Big Data được nhấn mạnh trong tình huống này, đòi hỏi hệ thống máy tính mạnh mẽ và khả năng xử lý thời gian thực?

  • A. Variety (Đa dạng).
  • B. Velocity (Tốc độ).

Câu 21: Khi sử dụng dữ liệu cá nhân trong các dự án khoa học dữ liệu (ví dụ: phân tích hành vi người dùng), vấn đề đạo đức nào cần được đặc biệt chú trọng và máy tính cần có các cơ chế hỗ trợ để đảm bảo?

  • A. Quyền riêng tư và bảo mật dữ liệu.
  • B. Tốc độ xử lý của thuật toán.
  • C. Độ phức tạp của mô hình học máy.
  • D. Số lượng dữ liệu được thu thập.

Câu 10: Học máy (Machine Learning), một lĩnh vực quan trọng của Trí tuệ nhân tạo, là công cụ mạnh mẽ trong phân tích dữ liệu. Máy tính cung cấp nền tảng cần thiết cho học máy bằng cách nào?

  • A. Tự động tạo ra các câu hỏi nghiên cứu.
  • B. Chỉ hiển thị kết quả cuối cùng mà không cần tính toán.
  • C. Thực hiện các phép tính phức tạp, lặp đi lặp lại để huấn luyện các mô hình dữ liệu.
  • D. Giới hạn số lượng dữ liệu có thể sử dụng để huấn luyện.

Câu 11: Giả sử bạn đang phân tích một tập dữ liệu lớn về nhiệt độ và lượng mưa của các khu vực khác nhau trong 50 năm để dự báo biến đổi khí hậu. Bước đầu tiên quan trọng trong quy trình khoa học dữ liệu mà máy tính sẽ hỗ trợ là gì?

  • A. Xây dựng mô hình dự báo phức tạp ngay lập tức.
  • B. Thu thập và làm sạch dữ liệu từ nhiều nguồn khác nhau.
  • C. Trực quan hóa kết quả cuối cùng.
  • D. Viết báo cáo tổng kết nghiên cứu.

Câu 12: Một trong những thách thức khi làm việc với dữ liệu từ nhiều nguồn khác nhau (ví dụ: cơ sở dữ liệu, file Excel, API) là tính không nhất quán về định dạng và cấu trúc. Máy tính giúp giải quyết thách thức "Variety" (Đa dạng) của Big Data này bằng cách nào trong giai đoạn tiền xử lý?

  • A. Bỏ qua tất cả dữ liệu không đồng nhất.
  • B. Lưu trữ mỗi định dạng dữ liệu ở một nơi riêng biệt.
  • C. Chỉ phân tích những dữ liệu có định dạng giống nhau.
  • D. Cung cấp các công cụ và thuật toán để chuyển đổi và tích hợp dữ liệu về một định dạng chuẩn.

Câu 13: Tại sao việc tự động hóa các tác vụ lặp đi lặp lại trong khoa học dữ liệu (ví dụ: làm sạch dữ liệu, chạy mô hình) lại cực kỳ quan trọng và đòi hỏi sự hỗ trợ của máy tính?

  • A. Tăng tốc độ xử lý, giảm thiểu sai sót do con người và đảm bảo tính nhất quán.
  • B. Làm cho quy trình trở nên phức tạp hơn.
  • C. Chỉ có tác dụng với các tập dữ liệu nhỏ.
  • D. Loại bỏ hoàn toàn vai trò ra quyết định của con người.

Câu 14: Khi phân tích dữ liệu cảm biến từ các thiết bị IoT (Internet of Things), dữ liệu thường được tạo ra liên tục và với tốc độ rất cao. Để đưa ra phản ứng kịp thời (ví dụ: cảnh báo sớm về sự cố), hệ thống máy tính cần có khả năng xử lý dữ liệu theo phương thức nào?

  • A. Xử lý hàng loạt (Batch Processing) cuối ngày.
  • B. Lưu trữ dữ liệu và phân tích sau nhiều tuần.
  • C. Phân tích thời gian thực (Real-time Analytics).
  • D. Chỉ trực quan hóa dữ liệu mà không phân tích.

Câu 15: Trong bối cảnh khoa học dữ liệu, siêu máy tính (Supercomputer) hoặc các hệ thống máy tính phân tán quy mô lớn thường được sử dụng cho các bài toán nào?

  • A. Lưu trữ các file văn bản đơn giản.
  • B. Thực hiện các phép tính cộng trừ cơ bản.
  • C. Trực quan hóa dữ liệu bằng biểu đồ cột đơn giản.
  • D. Giải quyết các bài toán mô phỏng phức tạp, phân tích dữ liệu khổng lồ hoặc huấn luyện các mô hình học sâu.

Câu 16: Một nhà khoa học dữ liệu đang sử dụng một thuật toán học máy để phân loại hình ảnh. Quá trình huấn luyện mô hình này trên một tập dữ liệu lớn đòi hỏi khả năng tính toán rất cao. Thành phần phần cứng nào trong máy tính đóng vai trò quan trọng nhất trong việc tăng tốc các phép tính song song cho học máy và xử lý hình ảnh?

  • A. Ổ đĩa cứng (Hard Drive).
  • B. Bộ xử lý đồ họa (GPU - Graphics Processing Unit).
  • C. Máy in (Printer).
  • D. Màn hình (Monitor).

Câu 17: Khi một mô hình học máy đã được huấn luyện và sẵn sàng sử dụng (ví dụ: để dự đoán giá nhà hoặc phát hiện email spam), giai đoạn tiếp theo trong quy trình khoa học dữ liệu, nơi máy tính đóng vai trò thực thi mô hình, được gọi là gì?

  • A. Thu thập dữ liệu ban đầu.
  • B. Tiền xử lý dữ liệu mới.
  • C. Huấn luyện mô hình.
  • D. Triển khai (Deployment) hoặc sử dụng mô hình.

Câu 18: Phân tích dữ liệu khám phá (Exploratory Data Analysis - EDA) là bước quan trọng để hiểu rõ dữ liệu trước khi xây dựng mô hình. Máy tính hỗ trợ EDA bằng cách nào hiệu quả nhất?

  • A. Tính toán thống kê mô tả (trung bình, phương sai, phân bố), tạo biểu đồ phân phối, mối quan hệ giữa các biến.
  • B. Tự động đưa ra kết luận cuối cùng về bài toán.
  • C. Chỉ lưu trữ dữ liệu một cách ngẫu nhiên.
  • D. Xây dựng các mô hình học sâu phức tạp.

Câu 19: Một trong những rủi ro tiềm ẩn khi sử dụng các mô hình học máy được huấn luyện từ dữ liệu có sai lệch (bias) là gì? Máy tính, mặc dù là công cụ mạnh mẽ, không thể tự động khắc phục vấn đề này nếu dữ liệu đầu vào không tốt.

  • A. Mô hình sẽ luôn đưa ra kết quả chính xác 100%.
  • B. Tốc độ xử lý của máy tính sẽ chậm lại.
  • C. Mô hình có thể đưa ra các dự đoán hoặc quyết định không công bằng, phân biệt đối xử.
  • D. Dữ liệu sau khi xử lý sẽ bị xóa hết.

Câu 20: So với các phương pháp phân tích dữ liệu truyền thống, việc sử dụng máy tính và các thuật toán hiện đại trong khoa học dữ liệu cho phép các nhà phân tích thực hiện được những điều gì mà trước đây rất khó hoặc không thể?

  • A. Chỉ phân tích được các tập dữ liệu rất nhỏ.
  • B. Giới hạn khả năng tìm kiếm các mẫu hình phức tạp ẩn trong dữ liệu.
  • C. Yêu cầu thời gian xử lý lâu hơn.
  • D. Xử lý khối lượng dữ liệu lớn hơn nhiều, phát hiện các mẫu hình phức tạp, tự động hóa quy trình và đưa ra dự đoán dựa trên dữ liệu.

Câu 22: Để một hệ thống máy tính có thể hỗ trợ hiệu quả cho khoa học dữ liệu, nó cần có những đặc điểm kỹ thuật nào?

  • A. Chỉ cần bộ xử lý tốc độ thấp và bộ nhớ nhỏ.
  • B. Không cần kết nối mạng internet.
  • C. Chỉ cần khả năng hiển thị văn bản đơn giản.
  • D. Bộ xử lý mạnh mẽ (CPU/GPU), bộ nhớ RAM lớn, dung lượng lưu trữ dồi dào và kết nối mạng tốc độ cao.

Câu 23: Giả sử bạn cần phân tích dữ liệu khảo sát từ hàng triệu người với nhiều loại câu trả lời khác nhau (số, văn bản, lựa chọn). Thách thức "Variety" (Đa dạng) của Big Data trong trường hợp này thể hiện rõ nhất ở khía cạnh nào?

  • A. Tốc độ thu thập dữ liệu.
  • B. Sự khác biệt về định dạng và cấu trúc của các loại dữ liệu (số, văn bản, danh mục).
  • C. Độ chính xác của dữ liệu.
  • D. Khối lượng dữ liệu thu thập được.

Câu 24: Trong bối cảnh khoa học dữ liệu, thuật ngữ ETL (Extract, Transform, Load) mô tả một quy trình quan trọng. Máy tính đóng vai trò thực hiện các bước này chủ yếu trong giai đoạn nào của khoa học dữ liệu?

  • A. Tiền xử lý dữ liệu (Data Preprocessing).
  • B. Thu thập dữ liệu (Data Collection).
  • C. Trực quan hóa dữ liệu (Data Visualization).
  • D. Triển khai mô hình (Model Deployment).

Câu 25: Một công ty sản xuất muốn dự đoán khi nào một máy móc sẽ hỏng dựa trên dữ liệu cảm biến liên tục. Họ sử dụng máy tính và các thuật toán để phân tích dữ liệu này. Đây là một ví dụ về ứng dụng khoa học dữ liệu trong lĩnh vực nào?

  • A. Y tế.
  • B. Thương mại điện tử.
  • C. Sản xuất và bảo trì dự đoán.
  • D. Giáo dục.

Câu 26: Khả năng mở rộng (Scalability) là một yếu tố quan trọng của hạ tầng tính toán trong khoa học dữ liệu quy mô lớn. Điều này có nghĩa là gì?

  • A. Hệ thống chỉ có thể xử lý một lượng dữ liệu cố định.
  • B. Hệ thống có thể dễ dàng tăng hoặc giảm tài nguyên (CPU, RAM, lưu trữ) để đáp ứng nhu cầu xử lý dữ liệu thay đổi.
  • C. Hệ thống chỉ hoạt động trên một máy tính duy nhất.
  • D. Hệ thống không thể xử lý dữ liệu từ nhiều nguồn.

Câu 27: Khi làm việc với các tập dữ liệu có chứa thông tin không đáng tin cậy, không đầy đủ hoặc không chính xác (thách thức "Veracity" - Tính xác thực), máy tính hỗ trợ như thế nào trong giai đoạn tiền xử lý?

  • A. Tự động tạo ra dữ liệu chính xác để thay thế.
  • B. Bỏ qua hoàn toàn các bản ghi có dữ liệu không chính xác.
  • C. Chỉ báo cáo số lượng dữ liệu không chính xác.
  • D. Cung cấp các công cụ và thuật toán để phát hiện, xử lý (lấp đầy, loại bỏ, biến đổi) dữ liệu thiếu, nhiễu hoặc sai lệch.

Câu 28: Một công ty truyền thông xã hội muốn phân tích cảm xúc (tích cực, tiêu cực, trung lập) từ hàng triệu bình luận của người dùng. Họ sử dụng các kỹ thuật xử lý ngôn ngữ tự nhiên (NLP) được hỗ trợ bởi máy tính. Đây là ví dụ về việc máy tính hỗ trợ phân tích loại dữ liệu nào?

  • A. Dữ liệu phi cấu trúc (ví dụ: văn bản).
  • B. Dữ liệu chỉ có dạng số.
  • C. Dữ liệu chỉ có dạng hình ảnh.
  • D. Dữ liệu đã được tổng hợp sẵn.

Câu 29: Tại sao việc hiểu rõ kiến thức chuyên sâu về lĩnh vực ứng dụng (Domain Knowledge) lại quan trọng đối với nhà khoa học dữ liệu, ngay cả khi họ có các công cụ máy tính mạnh mẽ để phân tích?

  • A. Kiến thức lĩnh vực giúp máy tính tự động thu thập dữ liệu.
  • B. Kiến thức lĩnh vực thay thế hoàn toàn nhu cầu sử dụng máy tính.
  • C. Kiến thức lĩnh vực giúp đặt câu hỏi đúng, hiểu ý nghĩa của dữ liệu, diễn giải kết quả phân tích và đánh giá tính hợp lý của mô hình.
  • D. Kiến thức lĩnh vực chỉ cần thiết cho giai đoạn trực quan hóa.

Câu 30: Tương lai của khoa học dữ liệu được dự đoán sẽ ngày càng phụ thuộc vào khả năng của máy tính. Xu hướng nào sau đây thể hiện rõ nhất sự phụ thuộc này?

  • A. Giảm dần việc sử dụng các thuật toán phức tạp.
  • B. Sự phát triển của AI (đặc biệt là học sâu) và nhu cầu về sức mạnh tính toán ngày càng tăng.
  • C. Chuyển dịch hoàn toàn sang phân tích thủ công.
  • D. Giới hạn khả năng xử lý dữ liệu thời gian thực.

1 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 1: Vai trò cốt lõi nào của máy tính giúp các nhà khoa học dữ liệu xử lý và phân tích các tập dữ liệu khổng lồ, thường vượt quá khả năng xử lý thủ công?

2 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 2: Trong quy trình khoa học dữ liệu, bước 'Tiền xử lý dữ liệu' (Data Preprocessing) thường tiêu tốn nhiều thời gian và công sức. Máy tính hỗ trợ hiệu quả nhất cho bước này bằng cách nào?

3 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 3: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm của hàng triệu khách hàng để đưa ra các gợi ý sản phẩm cá nhân hóa. Thách thức lớn nhất về mặt dữ liệu mà họ phải đối mặt, đòi hỏi sự hỗ trợ của máy tính, là gì?

4 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 4: Kỹ thuật tính toán nào cho phép thực hiện nhiều phép tính hoặc tác vụ xử lý dữ liệu cùng lúc trên nhiều bộ xử lý hoặc máy tính, giúp giảm đáng kể thời gian phân tích các tập dữ liệu lớn?

5 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 5: Điện toán đám mây (Cloud Computing) mang lại lợi ích đáng kể nào cho các dự án khoa học dữ liệu, đặc biệt là đối với các nhóm nghiên cứu hoặc doanh nghiệp nhỏ?

6 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 6: Trực quan hóa dữ liệu (Data Visualization) là một giai đoạn quan trọng trong khoa học dữ liệu. Máy tính đóng góp vào giai đoạn này chủ yếu bằng cách nào?

7 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 7: Trong Dự án Hệ gene người (HGP), việc sử dụng máy tính và các thuật toán tiên tiến là yếu tố then chốt. Vai trò quan trọng nhất của chúng trong việc giải trình tự và phân tích dữ liệu gene là gì?

8 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 8: Khoa học dữ liệu là sự kết hợp của nhiều lĩnh vực. Ngoài Tin học (Khoa học máy tính) và Toán học/Thống kê, lĩnh vực kiến thức nào sau đây cũng đóng vai trò thiết yếu?

9 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 9: Một công ty tài chính sử dụng khoa học dữ liệu để phát hiện các giao dịch gian lận. Họ cần phân tích hàng nghìn giao dịch mỗi giây. Thách thức nào của Big Data được nhấn mạnh trong tình huống này, đòi hỏi hệ thống máy tính mạnh mẽ và khả năng xử lý thời gian thực?

10 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 10: Học máy (Machine Learning), một lĩnh vực quan trọng của Trí tuệ nhân tạo, là công cụ mạnh mẽ trong phân tích dữ liệu. Máy tính cung cấp nền tảng cần thiết cho học máy bằng cách nào?

11 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 11: Giả sử bạn đang phân tích một tập dữ liệu lớn về nhiệt độ và lượng mưa của các khu vực khác nhau trong 50 năm để dự báo biến đổi khí hậu. Bước đầu tiên quan trọng trong quy trình khoa học dữ liệu mà máy tính sẽ hỗ trợ là gì?

12 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 12: Một trong những thách thức khi làm việc với dữ liệu từ nhiều nguồn khác nhau (ví dụ: cơ sở dữ liệu, file Excel, API) là tính không nhất quán về định dạng và cấu trúc. Máy tính giúp giải quyết thách thức 'Variety' (Đa dạng) của Big Data này bằng cách nào trong giai đoạn tiền xử lý?

13 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 13: Tại sao việc tự động hóa các tác vụ lặp đi lặp lại trong khoa học dữ liệu (ví dụ: làm sạch dữ liệu, chạy mô hình) lại cực kỳ quan trọng và đòi hỏi sự hỗ trợ của máy tính?

14 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 14: Khi phân tích dữ liệu cảm biến từ các thiết bị IoT (Internet of Things), dữ liệu thường được tạo ra liên tục và với tốc độ rất cao. Để đưa ra phản ứng kịp thời (ví dụ: cảnh báo sớm về sự cố), hệ thống máy tính cần có khả năng xử lý dữ liệu theo phương thức nào?

15 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 15: Trong bối cảnh khoa học dữ liệu, siêu máy tính (Supercomputer) hoặc các hệ thống máy tính phân tán quy mô lớn thường được sử dụng cho các bài toán nào?

16 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 16: Một nhà khoa học dữ liệu đang sử dụng một thuật toán học máy để phân loại hình ảnh. Quá trình huấn luyện mô hình này trên một tập dữ liệu lớn đòi hỏi khả năng tính toán rất cao. Thành phần phần cứng nào trong máy tính đóng vai trò quan trọng nhất trong việc tăng tốc các phép tính song song cho học máy và xử lý hình ảnh?

17 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 17: Khi một mô hình học máy đã được huấn luyện và sẵn sàng sử dụng (ví dụ: để dự đoán giá nhà hoặc phát hiện email spam), giai đoạn tiếp theo trong quy trình khoa học dữ liệu, nơi máy tính đóng vai trò thực thi mô hình, được gọi là gì?

18 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 18: Phân tích dữ liệu khám phá (Exploratory Data Analysis - EDA) là bước quan trọng để hiểu rõ dữ liệu trước khi xây dựng mô hình. Máy tính hỗ trợ EDA bằng cách nào hiệu quả nhất?

19 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 19: Một trong những rủi ro tiềm ẩn khi sử dụng các mô hình học máy được huấn luyện từ dữ liệu có sai lệch (bias) là gì? Máy tính, mặc dù là công cụ mạnh mẽ, không thể tự động khắc phục vấn đề này nếu dữ liệu đầu vào không tốt.

20 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 20: So với các phương pháp phân tích dữ liệu truyền thống, việc sử dụng máy tính và các thuật toán hiện đại trong khoa học dữ liệu cho phép các nhà phân tích thực hiện được những điều gì mà trước đây rất khó hoặc không thể?

21 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 22: Để một hệ thống máy tính có thể hỗ trợ hiệu quả cho khoa học dữ liệu, nó cần có những đặc điểm kỹ thuật nào?

22 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 23: Giả sử bạn cần phân tích dữ liệu khảo sát từ hàng triệu người với nhiều loại câu trả lời khác nhau (số, văn bản, lựa chọn). Thách thức 'Variety' (Đa dạng) của Big Data trong trường hợp này thể hiện rõ nhất ở khía cạnh nào?

23 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 24: Trong bối cảnh khoa học dữ liệu, thuật ngữ ETL (Extract, Transform, Load) mô tả một quy trình quan trọng. Máy tính đóng vai trò thực hiện các bước này chủ yếu trong giai đoạn nào của khoa học dữ liệu?

24 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 25: Một công ty sản xuất muốn dự đoán khi nào một máy móc sẽ hỏng dựa trên dữ liệu cảm biến liên tục. Họ sử dụng máy tính và các thuật toán để phân tích dữ liệu này. Đây là một ví dụ về ứng dụng khoa học dữ liệu trong lĩnh vực nào?

25 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 26: Khả năng mở rộng (Scalability) là một yếu tố quan trọng của hạ tầng tính toán trong khoa học dữ liệu quy mô lớn. Điều này có nghĩa là gì?

26 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 27: Khi làm việc với các tập dữ liệu có chứa thông tin không đáng tin cậy, không đầy đủ hoặc không chính xác (thách thức 'Veracity' - Tính xác thực), máy tính hỗ trợ như thế nào trong giai đoạn tiền xử lý?

27 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 28: Một công ty truyền thông xã hội muốn phân tích cảm xúc (tích cực, tiêu cực, trung lập) từ hàng triệu bình luận của người dùng. Họ sử dụng các kỹ thuật xử lý ngôn ngữ tự nhiên (NLP) được hỗ trợ bởi máy tính. Đây là ví dụ về việc máy tính hỗ trợ phân tích loại dữ liệu nào?

28 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 29: Tại sao việc hiểu rõ kiến thức chuyên sâu về lĩnh vực ứng dụng (Domain Knowledge) lại quan trọng đối với nhà khoa học dữ liệu, ngay cả khi họ có các công cụ máy tính mạnh mẽ để phân tích?

29 / 29

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 4

Câu 30: Tương lai của khoa học dữ liệu được dự đoán sẽ ngày càng phụ thuộc vào khả năng của máy tính. Xu hướng nào sau đây thể hiện rõ nhất sự phụ thuộc này?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Công nghệ 10 Kết nối tri thức Bài 9: Sử dụng công nghệ vi sinh trong sản xuất phân bón

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 05

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 05 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong quy trình khoa học dữ liệu, giai đoạn nào máy tính đóng vai trò thiết yếu trong việc thu thập, làm sạch và biến đổi dữ liệu từ nhiều nguồn khác nhau?

  • A. Giai đoạn xây dựng mô hình.
  • B. Giai đoạn thu thập và tiền xử lý dữ liệu.
  • C. Giai đoạn trực quan hóa dữ liệu.
  • D. Giai đoạn triển khai và đánh giá.

Câu 2: Một nhà khoa học dữ liệu cần phân tích một tập dữ liệu lớn chứa thông tin về hành vi mua sắm trực tuyến của hàng triệu khách hàng. Tập dữ liệu này có kích thước vượt quá khả năng lưu trữ và xử lý của máy tính cá nhân thông thường. Công nghệ tính toán nào sau đây là giải pháp hiệu quả nhất để xử lý vấn đề này?

  • A. Sử dụng ổ cứng ngoài dung lượng lớn.
  • B. Chia nhỏ dữ liệu và xử lý tuần tự trên máy tính cá nhân.
  • C. Sử dụng điện toán đám mây hoặc hệ thống tính toán phân tán.
  • D. Giảm số lượng dữ liệu bằng cách loại bỏ ngẫu nhiên một phần.

Câu 3: Vai trò chính của máy tính trong việc trực quan hóa dữ liệu trong khoa học dữ liệu là gì?

  • A. Tạo ra các biểu đồ, đồ thị và dashboard tương tác để khám phá và trình bày thông tin.
  • B. Tự động thu thập dữ liệu mới từ internet.
  • C. Thực hiện các phép tính phức tạp để dự báo xu hướng.
  • D. Lưu trữ dữ liệu thô một cách an toàn.

Câu 4: Dự án Hệ gene người (HGP) là một ví dụ điển hình minh họa vai trò của máy tính trong khoa học dữ liệu quy mô lớn. Thách thức chính về mặt tính toán mà HGP phải đối mặt là gì?

  • A. Thiếu phần mềm chuyên dụng để phân tích trình tự DNA.
  • B. Khó khăn trong việc chia sẻ dữ liệu giữa các phòng thí nghiệm.
  • C. Chi phí cao của các thiết bị giải trình tự gene.
  • D. Xử lý, lưu trữ và phân tích khối lượng dữ liệu gene khổng lồ một cách nhanh chóng và chính xác.

Câu 5: Kỹ thuật xử lý song song (parallel processing) được ứng dụng trong khoa học dữ liệu nhằm mục đích chủ yếu nào?

  • A. Giảm thiểu lỗi nhập liệu của con người.
  • B. Tăng tốc độ xử lý các tác vụ tính toán phức tạp hoặc xử lý dữ liệu lớn bằng cách chia nhỏ và thực hiện đồng thời.
  • C. Tự động hóa quy trình thu thập dữ liệu.
  • D. Cải thiện khả năng trực quan hóa dữ liệu.

Câu 6: Tự động hóa trong khoa học dữ liệu, được hỗ trợ bởi máy tính và phần mềm, mang lại lợi ích quan trọng nào sau đây?

  • A. Loại bỏ hoàn toàn vai trò của con người trong phân tích.
  • B. Chỉ áp dụng cho các bài toán đơn giản.
  • C. Tăng hiệu quả, giảm thời gian thực hiện các tác vụ lặp lại (ví dụ: làm sạch dữ liệu, chạy mô hình) và giảm thiểu sai sót.
  • D. Tạo ra dữ liệu tổng hợp (synthetic data) một cách tự động.

Câu 7: Phân tích dữ liệu thời gian thực (real-time data analysis), một khả năng mạnh mẽ của máy tính trong khoa học dữ liệu, cho phép điều gì?

  • A. Lưu trữ dữ liệu lịch sử trong thời gian dài.
  • B. Chỉ phân tích dữ liệu đã được làm sạch hoàn toàn.
  • C. Tạo ra các báo cáo tổng kết hàng tháng.
  • D. Xử lý và phân tích dữ liệu ngay khi nó được tạo ra, hỗ trợ đưa ra quyết định tức thời.

Câu 8: Khi làm việc với tập dữ liệu rất lớn (Big Data), bên cạnh khả năng xử lý, máy tính còn cần có khả năng gì để quản lý hiệu quả lượng dữ liệu này?

  • A. In ấn dữ liệu với tốc độ cao.
  • B. Lưu trữ và quản lý dữ liệu trên các hệ thống phân tán hoặc cơ sở dữ liệu chuyên dụng.
  • C. Tạo ra các bản sao lưu dữ liệu thủ công.
  • D. Chuyển đổi tất cả dữ liệu sang định dạng văn bản thuần túy.

Câu 9: Một công ty thương mại điện tử muốn phân tích hành vi người dùng trên trang web của họ để cá nhân hóa trải nghiệm. Dữ liệu thu thập được bao gồm lịch sử duyệt web, sản phẩm đã xem, sản phẩm đã thêm vào giỏ hàng và giao dịch mua sắm. Máy tính và các thuật toán học máy sẽ đóng vai trò gì trong việc này?

  • A. Phân tích các mẫu hành vi, xây dựng mô hình dự đoán sở thích và đề xuất sản phẩm phù hợp.
  • B. Chỉ đơn thuần lưu trữ lịch sử duyệt web của mỗi người dùng.
  • C. Tạo ra các quảng cáo ngẫu nhiên để hiển thị cho người dùng.
  • D. Chỉ trực quan hóa số lượng sản phẩm được xem nhiều nhất.

Câu 10: Việc sử dụng các thư viện và framework lập trình chuyên biệt cho khoa học dữ liệu (ví dụ: Pandas, NumPy, Scikit-learn trong Python) trên máy tính giúp ích gì cho nhà khoa học dữ liệu?

  • A. Giới hạn các loại dữ liệu có thể xử lý.
  • B. Buộc người dùng phải viết mã từ đầu cho mọi tác vụ.
  • C. Chỉ hỗ trợ trực quan hóa dữ liệu.
  • D. Cung cấp các công cụ và hàm dựng sẵn mạnh mẽ để xử lý, phân tích dữ liệu và xây dựng mô hình một cách hiệu quả và nhanh chóng.

Câu 11: Khi phân tích dữ liệu, việc làm sạch dữ liệu (data cleaning) là một bước quan trọng. Máy tính hỗ trợ quá trình này như thế nào?

  • A. Tự động nhận diện và sửa tất cả các lỗi trong dữ liệu mà không cần can thiệp.
  • B. Chỉ lưu trữ dữ liệu lỗi để xem xét sau.
  • C. Cung cấp các công cụ và thuật toán để phát hiện, xử lý các giá trị thiếu, ngoại lai, không nhất quán, và định dạng lại dữ liệu.
  • D. Chỉ có thể xử lý dữ liệu đã được làm sạch hoàn toàn từ trước.

Câu 12: Một nhà nghiên cứu đang phân tích mối liên hệ giữa lượng mưa và năng suất cây trồng trên một khu vực rộng lớn trong nhiều năm. Dữ liệu bao gồm thông tin thời tiết từ nhiều trạm khí tượng và báo cáo năng suất từ nhiều nông trại. Để phân tích mối liên hệ này hiệu quả, máy tính cần có khả năng xử lý loại dữ liệu nào?

  • A. Dữ liệu có cấu trúc (bảng), dữ liệu không gian (vị trí trạm/nông trại), và dữ liệu thời gian (nhiều năm).
  • B. Chỉ dữ liệu văn bản từ báo cáo.
  • C. Chỉ dữ liệu số về lượng mưa và năng suất.
  • D. Chỉ hình ảnh của cây trồng.

Câu 13: Trong bối cảnh khoa học dữ liệu, thuật ngữ "tài nguyên tính toán linh hoạt" (flexible computing resources) khi nói về điện toán đám mây có ý nghĩa gì?

  • A. Chỉ có thể sử dụng một loại máy chủ duy nhất.
  • B. Có thể dễ dàng tăng hoặc giảm năng lực xử lý, lưu trữ theo nhu cầu thực tế của dự án mà không cần mua sắm phần cứng mới.
  • C. Chỉ cung cấp các phần mềm miễn phí.
  • D. Yêu cầu người dùng phải cài đặt tất cả phần mềm thủ công.

Câu 14: Một ứng dụng dự báo thời tiết sử dụng dữ liệu từ hàng ngàn cảm biến trên khắp thế giới và cần cập nhật dự báo liên tục. Hệ thống máy tính xử lý dữ liệu cho ứng dụng này cần ưu tiên khả năng nào?

  • A. Lưu trữ dữ liệu vĩnh viễn.
  • B. Thực hiện các phép tính thủ công.
  • C. Phân tích dữ liệu thời gian thực và xử lý song song khối lượng dữ liệu lớn.
  • D. Chỉ trực quan hóa dữ liệu lịch sử.

Câu 15: Sự phát triển của phần cứng máy tính (CPU, GPU, bộ nhớ, lưu trữ) ảnh hưởng như thế nào đến khả năng thực hiện khoa học dữ liệu?

  • A. Tăng đáng kể khả năng xử lý các thuật toán phức tạp, phân tích dữ liệu lớn và xây dựng các mô hình học máy tiên tiến.
  • B. Làm giảm nhu cầu về phần mềm phân tích dữ liệu.
  • C. Chỉ cải thiện tốc độ hiển thị đồ họa.
  • D. Không có ảnh hưởng đáng kể đến quy trình phân tích dữ liệu.

Câu 16: Khi một nhà khoa học dữ liệu sử dụng máy tính để chạy một thuật toán phân cụm (clustering) trên một tập dữ liệu khách hàng để tìm ra các nhóm khách hàng có hành vi tương tự, đây là ví dụ về việc sử dụng máy tính trong giai đoạn nào của khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Trực quan hóa dữ liệu.
  • C. Xây dựng mô hình và phân tích chuyên sâu.
  • D. Triển khai kết quả.

Câu 17: Một trong những thách thức khi làm việc với dữ liệu lớn là tính "đa dạng" (Variety) của dữ liệu. Máy tính và các công cụ phần mềm hỗ trợ giải quyết thách thức này bằng cách nào?

  • A. Chỉ cho phép xử lý dữ liệu có cấu trúc.
  • B. Bỏ qua các loại dữ liệu không có cấu trúc.
  • C. Yêu cầu chuyển đổi thủ công tất cả dữ liệu về một định dạng duy nhất.
  • D. Cung cấp các công cụ và framework để xử lý, tích hợp dữ liệu từ nhiều nguồn và định dạng khác nhau (có cấu trúc, bán cấu trúc, không cấu trúc).

Câu 18: Tại sao việc sử dụng các hệ cơ sở dữ liệu phân tán (distributed databases) lại quan trọng trong khoa học dữ liệu khi làm việc với Big Data?

  • A. Cho phép lưu trữ và truy xuất hiệu quả khối lượng dữ liệu vượt quá khả năng của một máy chủ duy nhất.
  • B. Chỉ dùng để lưu trữ dữ liệu nhạy cảm.
  • C. Giúp giảm chi phí phần cứng.
  • D. Tự động làm sạch dữ liệu.

Câu 19: Một công ty muốn theo dõi và phân tích các bình luận của khách hàng về sản phẩm của họ trên mạng xã hội để hiểu rõ hơn về cảm nhận của khách hàng. Loại hình phân tích nào sẽ được máy tính hỗ trợ thực hiện trong trường hợp này?

  • A. Phân tích dữ liệu số (Numerical analysis).
  • B. Phân tích văn bản (Text analysis) và phân tích cảm xúc (Sentiment analysis).
  • C. Phân tích hình ảnh (Image analysis).
  • D. Phân tích dữ liệu thời gian (Time series analysis).

Câu 20: Giả sử bạn có một tập dữ liệu rất lớn cần thực hiện một phép biến đổi đơn giản (ví dụ: chuẩn hóa dữ liệu). Việc sử dụng một framework xử lý dữ liệu lớn như Apache Spark trên một cụm máy tính (cluster) thay vì xử lý trên máy tính cá nhân sẽ mang lại lợi ích chính nào?

  • A. Giảm thiểu số lượng dữ liệu cần xử lý.
  • B. Đảm bảo dữ liệu luôn được bảo mật tuyệt đối.
  • C. Tăng tốc độ xử lý bằng cách phân tán công việc trên nhiều máy (xử lý song song).
  • D. Tự động tạo báo cáo kết quả đẹp mắt.

Câu 21: Vai trò của các thuật toán học máy (machine learning algorithms) trong khoa học dữ liệu, được thực hiện bởi máy tính, là gì?

  • A. Chỉ để tạo ra các biểu đồ đơn giản.
  • B. Chỉ để lưu trữ dữ liệu một cách có tổ chức.
  • C. Tự động thu thập dữ liệu từ các nguồn khác nhau.
  • D. Cho phép máy tính học hỏi từ dữ liệu để tìm ra các mẫu, đưa ra dự đoán hoặc đưa ra quyết định mà không cần được lập trình rõ ràng cho từng tác vụ cụ thể.

Câu 22: Khi một công ty sử dụng khoa học dữ liệu để dự đoán nhu cầu sản phẩm trong tương lai dựa trên dữ liệu bán hàng lịch sử, đây là một ứng dụng của khả năng nào của máy tính trong khoa học dữ liệu?

  • A. Xây dựng mô hình dự báo (Predictive Modeling).
  • B. Trực quan hóa dữ liệu (Data Visualization).
  • C. Làm sạch dữ liệu (Data Cleaning).
  • D. Thu thập dữ liệu (Data Collection).

Câu 23: Một nhà nghiên cứu phát triển một thuật toán mới để phân tích dữ liệu hình ảnh y tế. Để kiểm tra hiệu quả của thuật toán này trên một tập dữ liệu lớn gồm hàng ngàn ảnh, nhà nghiên cứu cần sử dụng máy tính có cấu hình như thế nào?

  • A. Máy tính chỉ có bộ xử lý tốc độ thấp.
  • B. Máy tính chỉ cần dung lượng lưu trữ nhỏ.
  • C. Máy tính có bộ xử lý mạnh (CPU/GPU), bộ nhớ RAM lớn và dung lượng lưu trữ đủ để chứa dữ liệu và chạy thuật toán.
  • D. Bất kỳ máy tính nào cũng có thể thực hiện được.

Câu 24: Vai trò của giao diện người dùng (User Interface - UI) và giao diện lập trình ứng dụng (Application Programming Interface - API) trong các công cụ khoa học dữ liệu chạy trên máy tính là gì?

  • A. Chỉ để tạo ra dữ liệu mới.
  • B. Giúp người dùng (nhà khoa học dữ liệu hoặc ứng dụng khác) tương tác với dữ liệu, các thuật toán và kết quả phân tích một cách hiệu quả.
  • C. Tự động hóa toàn bộ quy trình mà không cần người dùng.
  • D. Chỉ dùng để bảo mật dữ liệu.

Câu 25: Trong việc xây dựng các mô hình học máy phức tạp (ví dụ: mạng nơ-ron sâu), thành phần phần cứng nào của máy tính thường đóng vai trò quan trọng nhất trong việc tăng tốc độ huấn luyện mô hình?

  • A. Bộ xử lý đồ họa (GPU - Graphics Processing Unit).
  • B. Ổ đĩa cứng (HDD).
  • C. Màn hình hiển thị.
  • D. Bàn phím và chuột.

Câu 26: Một hệ thống giám sát giao thông sử dụng camera và cảm biến để thu thập dữ liệu về lưu lượng xe cộ theo thời gian thực. Hệ thống này cần phân tích dữ liệu ngay lập tức để phát hiện ùn tắc và điều chỉnh đèn giao thông. Khả năng nào của máy tính là cần thiết nhất cho hệ thống này?

  • A. Khả năng lưu trữ dữ liệu lâu dài.
  • B. Khả năng tạo báo cáo hàng ngày.
  • C. Khả năng xử lý dữ liệu thời gian thực và đưa ra quyết định tự động.
  • D. Khả năng trực quan hóa dữ liệu lịch sử.

Câu 27: Khi một nhà khoa học dữ liệu cần chia sẻ kết quả phân tích phức tạp của mình với những người không chuyên về kỹ thuật, vai trò của máy tính trong việc trình bày kết quả này là gì?

  • A. Chỉ in ra các bảng số liệu thô.
  • B. Yêu cầu người nghe phải tự phân tích dữ liệu gốc.
  • C. Chỉ cung cấp quyền truy cập vào mã nguồn.
  • D. Sử dụng các công cụ trực quan hóa để tạo ra các biểu đồ, đồ thị, dashboard rõ ràng, dễ hiểu, giúp truyền đạt thông tin và insight một cách hiệu quả.

Câu 28: Việc tích hợp dữ liệu từ nhiều nguồn khác nhau (ví dụ: cơ sở dữ liệu bán hàng, dữ liệu website, dữ liệu mạng xã hội) là một bước quan trọng trong khoa học dữ liệu. Máy tính hỗ trợ quá trình này chủ yếu thông qua:

  • A. Các công cụ ETL (Extract, Transform, Load) hoặc ELT và các hệ quản trị cơ sở dữ liệu hỗ trợ kết nối và xử lý dữ liệu từ nhiều nguồn.
  • B. Khả năng in ấn dữ liệu từ nhiều nguồn.
  • C. Tự động tạo ra dữ liệu mới để điền vào chỗ trống.
  • D. Chỉ cho phép phân tích từng nguồn dữ liệu riêng lẻ.

Câu 29: Một trong những yếu tố quan trọng mà máy tính cung cấp để hỗ trợ quy trình lặp đi lặp lại trong khoa học dữ liệu (ví dụ: thử nghiệm các tham số mô hình khác nhau) là gì?

  • A. Khả năng đưa ra quyết định cuối cùng thay cho con người.
  • B. Khả năng tự động hóa các tác vụ thông qua mã lệnh (scripting) và các công cụ quản lý quy trình làm việc (workflow management tools).
  • C. Chỉ lưu trữ kết quả của lần chạy đầu tiên.
  • D. Yêu cầu người dùng phải thực hiện thủ công từng bước lặp lại.

Câu 30: Xét về mặt hạ tầng, sự khác biệt cơ bản giữa việc thực hiện phân tích khoa học dữ liệu trên máy tính cá nhân so với sử dụng nền tảng điện toán đám mây quy mô lớn là gì?

  • A. Máy tính cá nhân luôn có tốc độ xử lý nhanh hơn.
  • B. Điện toán đám mây yêu cầu đầu tư ban đầu lớn hơn.
  • C. Máy tính cá nhân phù hợp hơn cho việc xử lý Big Data.
  • D. Điện toán đám mây cung cấp khả năng mở rộng linh hoạt và truy cập vào tài nguyên tính toán/lưu trữ lớn hơn nhiều so với giới hạn cố định của một máy tính cá nhân.

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 1: Trong quy trình khoa học dữ liệu, giai đoạn nào máy tính đóng vai trò thiết yếu trong việc thu thập, làm sạch và biến đổi dữ liệu từ nhiều nguồn khác nhau?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 2: Một nhà khoa học dữ liệu cần phân tích một tập dữ liệu lớn chứa thông tin về hành vi mua sắm trực tuyến của hàng triệu khách hàng. Tập dữ liệu này có kích thước vượt quá khả năng lưu trữ và xử lý của máy tính cá nhân thông thường. Công nghệ tính toán nào sau đây là giải pháp hiệu quả nhất để xử lý vấn đề này?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 3: Vai trò chính của máy tính trong việc trực quan hóa dữ liệu trong khoa học dữ liệu là gì?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 4: Dự án Hệ gene người (HGP) là một ví dụ điển hình minh họa vai trò của máy tính trong khoa học dữ liệu quy mô lớn. Thách thức chính về mặt tính toán mà HGP phải đối mặt là gì?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 5: Kỹ thuật xử lý song song (parallel processing) được ứng dụng trong khoa học dữ liệu nhằm mục đích chủ yếu nào?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 6: Tự động hóa trong khoa học dữ liệu, được hỗ trợ bởi máy tính và phần mềm, mang lại lợi ích quan trọng nào sau đây?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 7: Phân tích dữ liệu thời gian thực (real-time data analysis), một khả năng mạnh mẽ của máy tính trong khoa học dữ liệu, cho phép điều gì?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 8: Khi làm việc với tập dữ liệu rất lớn (Big Data), bên cạnh khả năng xử lý, máy tính còn cần có khả năng gì để quản lý hiệu quả lượng dữ liệu này?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 9: Một công ty thương mại điện tử muốn phân tích hành vi người dùng trên trang web của họ để cá nhân hóa trải nghiệm. Dữ liệu thu thập được bao gồm lịch sử duyệt web, sản phẩm đã xem, sản phẩm đã thêm vào giỏ hàng và giao dịch mua sắm. Máy tính và các thuật toán học máy sẽ đóng vai trò gì trong việc này?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 10: Việc sử dụng các thư viện và framework lập trình chuyên biệt cho khoa học dữ liệu (ví dụ: Pandas, NumPy, Scikit-learn trong Python) trên máy tính giúp ích gì cho nhà khoa học dữ liệu?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 11: Khi phân tích dữ liệu, việc làm sạch dữ liệu (data cleaning) là một bước quan trọng. Máy tính hỗ trợ quá trình này như thế nào?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 12: Một nhà nghiên cứu đang phân tích mối liên hệ giữa lượng mưa và năng suất cây trồng trên một khu vực rộng lớn trong nhiều năm. Dữ liệu bao gồm thông tin thời tiết từ nhiều trạm khí tượng và báo cáo năng suất từ nhiều nông trại. Để phân tích mối liên hệ này hiệu quả, máy tính cần có khả năng xử lý loại dữ liệu nào?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 13: Trong bối cảnh khoa học dữ liệu, thuật ngữ 'tài nguyên tính toán linh hoạt' (flexible computing resources) khi nói về điện toán đám mây có ý nghĩa gì?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 14: Một ứng dụng dự báo thời tiết sử dụng dữ liệu từ hàng ngàn cảm biến trên khắp thế giới và cần cập nhật dự báo liên tục. Hệ thống máy tính xử lý dữ liệu cho ứng dụng này cần ưu tiên khả năng nào?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 15: Sự phát triển của phần cứng máy tính (CPU, GPU, bộ nhớ, lưu trữ) ảnh hưởng như thế nào đến khả năng thực hiện khoa học dữ liệu?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 16: Khi một nhà khoa học dữ liệu sử dụng máy tính để chạy một thuật toán phân cụm (clustering) trên một tập dữ liệu khách hàng để tìm ra các nhóm khách hàng có hành vi tương tự, đây là ví dụ về việc sử dụng máy tính trong giai đoạn nào của khoa học dữ liệu?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 17: Một trong những thách thức khi làm việc với dữ liệu lớn là tính 'đa dạng' (Variety) của dữ liệu. Máy tính và các công cụ phần mềm hỗ trợ giải quyết thách thức này bằng cách nào?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 18: Tại sao việc sử dụng các hệ cơ sở dữ liệu phân tán (distributed databases) lại quan trọng trong khoa học dữ liệu khi làm việc với Big Data?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 19: Một công ty muốn theo dõi và phân tích các bình luận của khách hàng về sản phẩm của họ trên mạng xã hội để hiểu rõ hơn về cảm nhận của khách hàng. Loại hình phân tích nào sẽ được máy tính hỗ trợ thực hiện trong trường hợp này?

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 20: Giả sử bạn có một tập dữ liệu rất lớn cần thực hiện một phép biến đổi đơn giản (ví dụ: chuẩn hóa dữ liệu). Việc sử dụng một framework xử lý dữ liệu lớn như Apache Spark trên một cụm máy tính (cluster) thay vì xử lý trên máy tính cá nhân sẽ mang lại lợi ích chính nào?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 21: Vai trò của các thuật toán học máy (machine learning algorithms) trong khoa học dữ liệu, được thực hiện bởi máy tính, là gì?

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 22: Khi một công ty sử dụng khoa học dữ liệu để dự đoán nhu cầu sản phẩm trong tương lai dựa trên dữ liệu bán hàng lịch sử, đây là một ứng dụng của khả năng nào của máy tính trong khoa học dữ liệu?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 23: Một nhà nghiên cứu phát triển một thuật toán mới để phân tích dữ liệu hình ảnh y tế. Để kiểm tra hiệu quả của thuật toán này trên một tập dữ liệu lớn gồm hàng ngàn ảnh, nhà nghiên cứu cần sử dụng máy tính có cấu hình như thế nào?

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 24: Vai trò của giao diện người dùng (User Interface - UI) và giao diện lập trình ứng dụng (Application Programming Interface - API) trong các công cụ khoa học dữ liệu chạy trên máy tính là gì?

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 25: Trong việc xây dựng các mô hình học máy phức tạp (ví dụ: mạng nơ-ron sâu), thành phần phần cứng nào của máy tính thường đóng vai trò quan trọng nhất trong việc tăng tốc độ huấn luyện mô hình?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 26: Một hệ thống giám sát giao thông sử dụng camera và cảm biến để thu thập dữ liệu về lưu lượng xe cộ theo thời gian thực. Hệ thống này cần phân tích dữ liệu ngay lập tức để phát hiện ùn tắc và điều chỉnh đèn giao thông. Khả năng nào của máy tính là cần thiết nhất cho hệ thống này?

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 27: Khi một nhà khoa học dữ liệu cần chia sẻ kết quả phân tích phức tạp của mình với những người không chuyên về kỹ thuật, vai trò của máy tính trong việc trình bày kết quả này là gì?

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 28: Việc tích hợp dữ liệu từ nhiều nguồn khác nhau (ví dụ: cơ sở dữ liệu bán hàng, dữ liệu website, dữ liệu mạng xã hội) là một bước quan trọng trong khoa học dữ liệu. Máy tính hỗ trợ quá trình này chủ yếu thông qua:

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 29: Một trong những yếu tố quan trọng mà máy tính cung cấp để hỗ trợ quy trình lặp đi lặp lại trong khoa học dữ liệu (ví dụ: thử nghiệm các tham số mô hình khác nhau) là gì?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 5

Câu 30: Xét về mặt hạ tầng, sự khác biệt cơ bản giữa việc thực hiện phân tích khoa học dữ liệu trên máy tính cá nhân so với sử dụng nền tảng điện toán đám mây quy mô lớn là gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 06

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 06 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong quy trình khoa học dữ liệu, máy tính đóng vai trò cốt lõi nhất ở giai đoạn nào để biến dữ liệu thô thành thông tin hữu ích và tri thức?

  • A. Chỉ ở giai đoạn thu thập dữ liệu ban đầu.
  • B. Chỉ ở giai đoạn trực quan hóa kết quả cuối cùng.
  • C. Ở hầu hết các giai đoạn, đặc biệt là tiền xử lý, phân tích và mô hình hóa dữ liệu.
  • D. Chỉ cần thiết cho việc lưu trữ dữ liệu lớn.

Câu 2: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn chứa nhiều giá trị thiếu và không nhất quán. Vai trò của máy tính trong giai đoạn này là gì?

  • A. Tự động tạo ra dữ liệu mới để lấp đầy chỗ trống.
  • B. Cung cấp các công cụ và thuật toán để làm sạch, biến đổi và chuẩn hóa dữ liệu.
  • C. Trực quan hóa các giá trị thiếu dưới dạng biểu đồ.
  • D. Chỉ đơn thuần lưu trữ tập dữ liệu lỗi.

Câu 3: Tại sao kỹ thuật xử lý song song lại cực kỳ quan trọng khi phân tích dữ liệu lớn (Big Data)?

  • A. Vì nó giúp giảm thiểu nhu cầu về bộ nhớ lưu trữ.
  • B. Vì nó cho phép dữ liệu được thu thập nhanh hơn.
  • C. Vì nó chỉ hoạt động với các loại dữ liệu có cấu trúc.
  • D. Vì nó cho phép chia nhỏ và xử lý đồng thời các phần dữ liệu trên nhiều bộ xử lý, giảm đáng kể thời gian phân tích.

Câu 4: Điện toán đám mây mang lại lợi ích đáng kể nào cho các dự án khoa học dữ liệu, đặc biệt là đối với các nhóm nghiên cứu nhỏ hoặc các công ty khởi nghiệp?

  • A. Cung cấp khả năng truy cập linh hoạt và mở rộng đến tài nguyên tính toán mạnh mẽ mà không cần đầu tư lớn vào hạ tầng phần cứng ban đầu.
  • B. Giảm thiểu hoàn toàn nguy cơ mất mát dữ liệu.
  • C. Tự động viết mã cho các thuật toán phân tích.
  • D. Chỉ hỗ trợ lưu trữ dữ liệu, không hỗ trợ xử lý.

Câu 5: Tự động hóa các tác vụ lặp lại trong quy trình khoa học dữ liệu (ví dụ: làm sạch dữ liệu, chạy thử nghiệm mô hình) nhờ máy tính mang lại kết quả chính nào?

  • A. Tăng độ phức tạp của quy trình làm việc.
  • B. Loại bỏ hoàn toàn sự tham gia của con người.
  • C. Tăng tốc độ thực hiện, giảm thiểu sai sót do con người và đảm bảo tính nhất quán.
  • D. Chỉ áp dụng được cho các tập dữ liệu rất nhỏ.

Câu 6: Trong Dự án Hệ gene người (HGP), việc sử dụng mạng lưới siêu máy tính và các thuật toán tinh vi đã minh chứng rõ rệt vai trò của máy tính trong việc xử lý dữ liệu lớn như thế nào?

  • A. Chỉ để lưu trữ an toàn hàng trăm gigabyte dữ liệu gene.
  • B. Giúp giải trình tự, lắp ráp và phân tích bộ gene người với tốc độ và độ chính xác không thể đạt được bằng phương pháp thủ công.
  • C. Tạo ra các gene mới dựa trên dữ liệu thu thập được.
  • D. Trực quan hóa toàn bộ trình tự DNA trên một màn hình duy nhất.

Câu 7: Một hệ thống giám sát giao thông sử dụng dữ liệu cảm biến để điều chỉnh đèn giao thông theo thời gian thực nhằm giảm ùn tắc. Khả năng nào của máy tính là quan trọng nhất trong ứng dụng này?

  • A. Phân tích dữ liệu với tốc độ cao để đưa ra quyết định kịp thời (phân tích thời gian thực).
  • B. Khả năng lưu trữ dữ liệu lịch sử trong nhiều năm.
  • C. Tự động tạo báo cáo thống kê hàng tháng.
  • D. Trực quan hóa bản đồ giao thông tĩnh.

Câu 8: Trực quan hóa dữ liệu (Data Visualization) là một giai đoạn quan trọng trong khoa học dữ liệu. Máy tính hỗ trợ giai đoạn này bằng cách nào?

  • A. Tự động thu thập thêm dữ liệu từ các nguồn khác.
  • B. Làm sạch và loại bỏ các giá trị ngoại lai.
  • C. Thực hiện các phép tính thống kê phức tạp.
  • D. Tạo ra các biểu đồ, đồ thị và bảng điều khiển tương tác giúp con người dễ dàng hiểu và khám phá insight từ dữ liệu.

Câu 9: Khi xây dựng một mô hình học máy để phân loại hình ảnh, vai trò của máy tính trong quá trình huấn luyện mô hình là gì?

  • A. Chỉ hiển thị kết quả cuối cùng của quá trình huấn luyện.
  • B. Thu thập các hình ảnh mới để thêm vào tập dữ liệu huấn luyện.
  • C. Thực hiện lặp đi lặp lại các phép tính toán ma trận và tối ưu hóa dựa trên thuật toán được lập trình sẵn trên một lượng lớn dữ liệu.
  • D. Tự động giải thích tại sao mô hình đưa ra dự đoán cụ thể.

Câu 10: Một trong những thách thức lớn khi làm việc với dữ liệu lớn là tốc độ xử lý. Máy tính giải quyết thách thức này chủ yếu thông qua những phương tiện nào?

  • A. Tăng cường sức mạnh tính toán của bộ xử lý (CPU/GPU), sử dụng kiến trúc xử lý song song và phân tán.
  • B. Giảm kích thước của tập dữ liệu bằng cách loại bỏ ngẫu nhiên dữ liệu.
  • C. Chỉ tập trung vào phân tích dữ liệu có cấu trúc đơn giản.
  • D. Yêu cầu con người thực hiện phần lớn công việc phân tích.

Câu 11: Khả năng mở rộng (scalability) của hạ tầng tính toán là yếu tố then chốt trong khoa học dữ liệu vì:

  • A. Nó giúp giảm thiểu số lượng thuật toán cần sử dụng.
  • B. Nó đảm bảo dữ liệu luôn được trực quan hóa đẹp mắt.
  • C. Nó chỉ quan trọng đối với các dự án nhỏ.
  • D. Khối lượng dữ liệu và độ phức tạp của bài toán có thể tăng lên theo thời gian, đòi hỏi khả năng tăng/giảm tài nguyên tính toán linh hoạt.

Câu 12: Yếu tố nào sau đây ít phụ thuộc vào sức mạnh tính toán trực tiếp của máy tính trong quy trình khoa học dữ liệu?

  • A. Huấn luyện mô hình học sâu (deep learning).
  • B. Tìm kiếm các mẫu phức tạp trong tập dữ liệu hàng petabyte.
  • C. Xác định mục tiêu kinh doanh hoặc câu hỏi nghiên cứu ban đầu.
  • D. Thực hiện các phép biến đổi dữ liệu trên tập dữ liệu lớn.

Câu 13: Giả sử bạn cần phân tích mối quan hệ giữa hàng trăm biến trong một tập dữ liệu khách hàng khổng lồ. Máy tính giúp bạn thực hiện điều này bằng cách nào?

  • A. Tự động tạo ra mối quan hệ mới giữa các biến.
  • B. Thực hiện các phép tính thống kê, phân tích tương quan, và xây dựng mô hình trên quy mô lớn và tốc độ cao.
  • C. Chỉ đơn giản là liệt kê tất cả các biến có trong dữ liệu.
  • D. Loại bỏ các biến không liên quan một cách ngẫu nhiên.

Câu 14: Trong khoa học dữ liệu, "tiền xử lý dữ liệu" là giai đoạn máy tính thực hiện nhiều tác vụ quan trọng. Tác vụ nào sau đây thuộc về giai đoạn tiền xử lý?

  • A. Xử lý các giá trị thiếu, làm sạch dữ liệu nhiễu, và biến đổi định dạng dữ liệu.
  • B. Xây dựng mô hình học máy dự đoán.
  • C. Trực quan hóa kết quả phân tích dưới dạng biểu đồ cột.
  • D. Diễn giải ý nghĩa của mô hình đã xây dựng.

Câu 15: Tại sao việc tích hợp dữ liệu từ nhiều nguồn khác nhau lại là một thách thức, và máy tính hỗ trợ giải quyết thách thức này như thế nào?

  • A. Các nguồn dữ liệu luôn có định dạng giống nhau, không cần máy tính.
  • B. Máy tính chỉ có thể tích hợp dữ liệu từ tối đa hai nguồn.
  • C. Dữ liệu thường có định dạng, cấu trúc, và ngữ nghĩa khác nhau; máy tính cung cấp công cụ và thuật toán để ánh xạ, biến đổi và hợp nhất dữ liệu.
  • D. Việc tích hợp dữ liệu luôn phải được thực hiện thủ công.

Câu 16: Phân tích cảm xúc (Sentiment Analysis) từ hàng triệu bình luận của khách hàng trên mạng xã hội đòi hỏi khả năng xử lý ngôn ngữ tự nhiên (NLP). Máy tính đóng vai trò gì trong quá trình này?

  • A. Chỉ lưu trữ các bình luận.
  • B. Thực hiện các thuật toán NLP phức tạp để phân tích cấu trúc câu, nhận diện từ khóa, và gán nhãn cảm xúc cho từng bình luận trên quy mô lớn.
  • C. Tự động trả lời các bình luận của khách hàng.
  • D. Chỉ đếm số lượng bình luận tích cực và tiêu cực.

Câu 17: Khi một công ty muốn dự đoán xu hướng thị trường dựa trên dữ liệu lịch sử, họ thường sử dụng các mô hình dự báo. Máy tính hỗ trợ quá trình này chủ yếu ở khía cạnh nào?

  • A. Tạo ra dữ liệu xu hướng thị trường trong tương lai.
  • B. Chỉ hiển thị các dữ liệu lịch sử dưới dạng bảng.
  • C. Giảm thiểu hoàn toàn sự không chắc chắn trong dự báo.
  • D. Thực hiện các phép tính toán phức tạp để xây dựng, huấn luyện và đánh giá các mô hình dự báo dựa trên dữ liệu lớn và các thuật toán thống kê/học máy.

Câu 18: Ưu điểm chính của việc sử dụng các công cụ trực quan hóa dữ liệu do máy tính cung cấp (như biểu đồ tương tác) so với các phương pháp truyền thống (như bảng số liệu in) là gì?

  • A. Giúp con người nhanh chóng nhận diện các mẫu, xu hướng và ngoại lệ trong dữ liệu một cách trực quan và dễ hiểu.
  • B. Đảm bảo dữ liệu không chứa bất kỳ lỗi nào.
  • C. Tự động đưa ra kết luận phân tích chi tiết.
  • D. Chỉ hữu ích cho các tập dữ liệu rất nhỏ.

Câu 19: Trong bối cảnh khoa học dữ liệu, "học máy" (Machine Learning) là một lĩnh vực quan trọng. Vai trò của máy tính trong học máy là gì?

  • A. Chỉ là nơi lưu trữ các thuật toán học máy.
  • B. Thay thế hoàn toàn con người trong việc đưa ra quyết định.
  • C. Cung cấp nền tảng tính toán cần thiết để thực thi các thuật toán học máy, học hỏi từ dữ liệu và đưa ra dự đoán/phân loại.
  • D. Chỉ tạo ra các mô hình học máy đơn giản.

Câu 20: Một nhà khoa học dữ liệu đang thử nghiệm nhiều thuật toán khác nhau để tìm ra mô hình tốt nhất cho bài toán phân loại. Máy tính hỗ trợ quá trình này như thế nào?

  • A. Chỉ cho phép chạy một thuật toán duy nhất tại một thời điểm.
  • B. Tự động chọn thuật toán tốt nhất mà không cần thử nghiệm.
  • C. Chỉ hiển thị mã nguồn của các thuật toán.
  • D. Cho phép chạy thử nghiệm (experimentation) các thuật toán khác nhau trên cùng một tập dữ liệu một cách hiệu quả, so sánh kết quả và tinh chỉnh mô hình.

Câu 21: Khi phân tích các mối quan hệ phức tạp giữa nhiều yếu tố trong dữ liệu (ví dụ: ảnh hưởng của quảng cáo, giá cả và khuyến mãi đến doanh số bán hàng), máy tính giúp con người bằng cách nào?

  • A. Đơn giản hóa các mối quan hệ phức tạp thành các mối quan hệ tuyến tính.
  • B. Thực hiện các phân tích thống kê đa biến, xây dựng mô hình hồi quy hoặc các mô hình phức tạp khác để định lượng và kiểm tra các mối quan hệ này.
  • C. Chỉ liệt kê các yếu tố có trong dữ liệu.
  • D. Loại bỏ các yếu tố không có mối quan hệ rõ ràng.

Câu 22: Một công ty tài chính cần phát hiện các giao dịch gian lận trong hàng triệu giao dịch mỗi ngày. Khả năng nào của máy tính là quan trọng nhất trong việc xây dựng hệ thống phát hiện gian lận dựa trên dữ liệu?

  • A. Khả năng xử lý và phân tích dữ liệu với tốc độ cao để xác định các mẫu bất thường trong thời gian gần thực.
  • B. Khả năng lưu trữ lịch sử giao dịch trong nhiều năm.
  • C. Khả năng tạo báo cáo tài chính tự động.
  • D. Khả năng trực quan hóa tất cả các giao dịch trên một bản đồ.

Câu 23: Trong khoa học dữ liệu, việc đánh giá hiệu suất của một mô hình là rất quan trọng. Máy tính hỗ trợ giai đoạn đánh giá này bằng cách nào?

  • A. Tự động cải thiện hiệu suất của mô hình mà không cần đánh giá.
  • B. Chỉ hiển thị các chỉ số đánh giá dưới dạng văn bản.
  • C. Chỉ đánh giá các mô hình đơn giản.
  • D. Tính toán nhanh chóng và chính xác các chỉ số đánh giá (ví dụ: độ chính xác, độ phủ, F1-score) trên tập dữ liệu kiểm tra, giúp so sánh các mô hình khác nhau.

Câu 24: Đối với các bài toán khoa học dữ liệu đòi hỏi tài nguyên tính toán rất lớn và chỉ chạy một lần hoặc theo đợt không thường xuyên (ví dụ: phân tích dữ liệu địa chấn sau một trận động đất), lựa chọn hạ tầng nào thường hiệu quả hơn so với việc mua sắm và duy trì một siêu máy tính riêng?

  • A. Sử dụng máy tính cá nhân thông thường.
  • B. Sử dụng dịch vụ điện toán đám mây với khả năng mở rộng linh hoạt theo nhu cầu.
  • C. Thuê một nhóm lớn người để phân tích dữ liệu thủ công.
  • D. Chỉ phân tích một phần rất nhỏ của dữ liệu.

Câu 25: Khả năng tự động tạo báo cáo và trình bày kết quả phân tích dữ liệu từ máy tính giúp tiết kiệm thời gian và công sức đáng kể cho nhà khoa học dữ liệu. Điều này thuộc khía cạnh nào của vai trò máy tính?

  • A. Tự động hóa các tác vụ trong quy trình làm việc.
  • B. Thu thập dữ liệu.
  • C. Lưu trữ dữ liệu an toàn.
  • D. Xây dựng mô hình học máy.

Câu 26: Trong Dự án Hệ gene người, việc phân tích dữ liệu gene đòi hỏi khả năng nhận diện các vùng mã hóa protein (gene) và các yếu tố điều hòa. Máy tính và thuật toán đã hỗ trợ điều này bằng cách nào?

  • A. Tự động tạo ra các protein mới dựa trên trình tự DNA.
  • B. Chỉ lưu trữ danh sách các gene đã biết.
  • C. Áp dụng các thuật toán so sánh trình tự, nhận dạng mẫu và phân tích thống kê để xác định các vùng chức năng trong bộ gene khổng lồ.
  • D. Trực quan hóa cấu trúc không gian ba chiều của DNA.

Câu 27: Khi làm việc với các tập dữ liệu phi cấu trúc (ví dụ: văn bản, hình ảnh, âm thanh), vai trò của máy tính trong giai đoạn tiền xử lý (như trích xuất đặc trưng) trở nên đặc biệt quan trọng vì:

  • A. Dữ liệu phi cấu trúc luôn có kích thước nhỏ.
  • B. Máy tính không thể xử lý dữ liệu phi cấu trúc.
  • C. Chỉ cần lưu trữ dữ liệu phi cấu trúc là đủ cho phân tích.
  • D. Việc trích xuất thông tin có ý nghĩa từ dữ liệu phi cấu trúc thường đòi hỏi các thuật toán phức tạp và sức mạnh tính toán lớn để chuyển đổi chúng sang định dạng có thể phân tích được.

Câu 28: Một ứng dụng của khoa học dữ liệu là hệ thống gợi ý sản phẩm cho người dùng dựa trên lịch sử mua sắm của họ và những người dùng khác (ví dụ: "Khách hàng mua X cũng mua Y"). Máy tính đóng vai trò gì trong hệ thống này?

  • A. Chỉ hiển thị danh sách tất cả sản phẩm.
  • B. Phân tích dữ liệu hành vi người dùng quy mô lớn, áp dụng thuật toán gợi ý (recommendation algorithms) và đưa ra danh sách sản phẩm đề xuất phù hợp cho từng cá nhân.
  • C. Tự động tạo ra sản phẩm mới.
  • D. Chỉ lưu trữ lịch sử mua sắm.

Câu 29: Khả năng của máy tính trong việc thực hiện lặp đi lặp lại các phép tính phức tạp hàng triệu hoặc hàng tỷ lần một cách nhanh chóng là nền tảng cho việc phát triển và ứng dụng các mô hình nào trong khoa học dữ liệu?

  • A. Các mô hình học máy và học sâu đòi hỏi quá trình huấn luyện lặp đi lặp lại trên tập dữ liệu lớn.
  • B. Các mô hình chỉ dựa trên phép cộng và trừ đơn giản.
  • C. Các mô hình chỉ sử dụng dữ liệu có cấu trúc cố định.
  • D. Các mô hình không cần bất kỳ dữ liệu nào.

Câu 30: Khi một tổ chức cần phân tích dữ liệu nhạy cảm (ví dụ: dữ liệu y tế, tài chính), máy tính không chỉ cung cấp sức mạnh xử lý mà còn hỗ trợ khía cạnh nào?

  • A. Tự động làm cho dữ liệu không còn nhạy cảm.
  • B. Loại bỏ nhu cầu tuân thủ các quy định về bảo mật.
  • C. Chỉ đơn thuần lưu trữ dữ liệu và không xử lý.
  • D. Thực thi các biện pháp kỹ thuật bảo mật dữ liệu (mã hóa, kiểm soát truy cập) và các thuật toán xử lý dữ liệu riêng tư để bảo vệ thông tin cá nhân trong quá trình phân tích.

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 1: Trong quy trình khoa học dữ liệu, máy tính đóng vai trò cốt lõi nhất ở giai đoạn nào để biến dữ liệu thô thành thông tin hữu ích và tri thức?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 2: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn chứa nhiều giá trị thiếu và không nhất quán. Vai trò của máy tính trong giai đoạn này là gì?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 3: Tại sao kỹ thuật xử lý song song lại cực kỳ quan trọng khi phân tích dữ liệu lớn (Big Data)?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 4: Điện toán đám mây mang lại lợi ích đáng kể nào cho các dự án khoa học dữ liệu, đặc biệt là đối với các nhóm nghiên cứu nhỏ hoặc các công ty khởi nghiệp?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 5: Tự động hóa các tác vụ lặp lại trong quy trình khoa học dữ liệu (ví dụ: làm sạch dữ liệu, chạy thử nghiệm mô hình) nhờ máy tính mang lại kết quả chính nào?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 6: Trong Dự án Hệ gene người (HGP), việc sử dụng mạng lưới siêu máy tính và các thuật toán tinh vi đã minh chứng rõ rệt vai trò của máy tính trong việc xử lý dữ liệu lớn như thế nào?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 7: Một hệ thống giám sát giao thông sử dụng dữ liệu cảm biến để điều chỉnh đèn giao thông theo thời gian thực nhằm giảm ùn tắc. Khả năng nào của máy tính là quan trọng nhất trong ứng dụng này?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 8: Trực quan hóa dữ liệu (Data Visualization) là một giai đoạn quan trọng trong khoa học dữ liệu. Máy tính hỗ trợ giai đoạn này bằng cách nào?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 9: Khi xây dựng một mô hình học máy để phân loại hình ảnh, vai trò của máy tính trong quá trình *huấn luyện* mô hình là gì?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 10: Một trong những thách thức lớn khi làm việc với dữ liệu lớn là tốc độ xử lý. Máy tính giải quyết thách thức này chủ yếu thông qua những phương tiện nào?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 11: Khả năng mở rộng (scalability) của hạ tầng tính toán là yếu tố then chốt trong khoa học dữ liệu vì:

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 12: Yếu tố nào sau đây *ít* phụ thuộc vào sức mạnh tính toán trực tiếp của máy tính trong quy trình khoa học dữ liệu?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 13: Giả sử bạn cần phân tích mối quan hệ giữa hàng trăm biến trong một tập dữ liệu khách hàng khổng lồ. Máy tính giúp bạn thực hiện điều này bằng cách nào?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 14: Trong khoa học dữ liệu, 'tiền xử lý dữ liệu' là giai đoạn máy tính thực hiện nhiều tác vụ quan trọng. Tác vụ nào sau đây thuộc về giai đoạn tiền xử lý?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 15: Tại sao việc tích hợp dữ liệu từ nhiều nguồn khác nhau lại là một thách thức, và máy tính hỗ trợ giải quyết thách thức này như thế nào?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 16: Phân tích cảm xúc (Sentiment Analysis) từ hàng triệu bình luận của khách hàng trên mạng xã hội đòi hỏi khả năng xử lý ngôn ngữ tự nhiên (NLP). Máy tính đóng vai trò gì trong quá trình này?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 17: Khi một công ty muốn dự đoán xu hướng thị trường dựa trên dữ liệu lịch sử, họ thường sử dụng các mô hình dự báo. Máy tính hỗ trợ quá trình này chủ yếu ở khía cạnh nào?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 18: Ưu điểm chính của việc sử dụng các công cụ trực quan hóa dữ liệu do máy tính cung cấp (như biểu đồ tương tác) so với các phương pháp truyền thống (như bảng số liệu in) là gì?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 19: Trong bối cảnh khoa học dữ liệu, 'học máy' (Machine Learning) là một lĩnh vực quan trọng. Vai trò của máy tính trong học máy là gì?

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 20: Một nhà khoa học dữ liệu đang thử nghiệm nhiều thuật toán khác nhau để tìm ra mô hình tốt nhất cho bài toán phân loại. Máy tính hỗ trợ quá trình này như thế nào?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 21: Khi phân tích các mối quan hệ phức tạp giữa nhiều yếu tố trong dữ liệu (ví dụ: ảnh hưởng của quảng cáo, giá cả và khuyến mãi đến doanh số bán hàng), máy tính giúp con người bằng cách nào?

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 22: Một công ty tài chính cần phát hiện các giao dịch gian lận trong hàng triệu giao dịch mỗi ngày. Khả năng nào của máy tính là quan trọng nhất trong việc xây dựng hệ thống phát hiện gian lận dựa trên dữ liệu?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 23: Trong khoa học dữ liệu, việc đánh giá hiệu suất của một mô hình là rất quan trọng. Máy tính hỗ trợ giai đoạn đánh giá này bằng cách nào?

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 24: Đối với các bài toán khoa học dữ liệu đòi hỏi tài nguyên tính toán rất lớn và chỉ chạy một lần hoặc theo đợt không thường xuyên (ví dụ: phân tích dữ liệu địa chấn sau một trận động đất), lựa chọn hạ tầng nào thường hiệu quả hơn so với việc mua sắm và duy trì một siêu máy tính riêng?

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 25: Khả năng tự động tạo báo cáo và trình bày kết quả phân tích dữ liệu từ máy tính giúp tiết kiệm thời gian và công sức đáng kể cho nhà khoa học dữ liệu. Điều này thuộc khía cạnh nào của vai trò máy tính?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 26: Trong Dự án Hệ gene người, việc phân tích dữ liệu gene đòi hỏi khả năng nhận diện các vùng mã hóa protein (gene) và các yếu tố điều hòa. Máy tính và thuật toán đã hỗ trợ điều này bằng cách nào?

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 27: Khi làm việc với các tập dữ liệu phi cấu trúc (ví dụ: văn bản, hình ảnh, âm thanh), vai trò của máy tính trong giai đoạn tiền xử lý (như trích xuất đặc trưng) trở nên đặc biệt quan trọng vì:

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 28: Một ứng dụng của khoa học dữ liệu là hệ thống gợi ý sản phẩm cho người dùng dựa trên lịch sử mua sắm của họ và những người dùng khác (ví dụ: 'Khách hàng mua X cũng mua Y'). Máy tính đóng vai trò gì trong hệ thống này?

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 29: Khả năng của máy tính trong việc thực hiện lặp đi lặp lại các phép tính phức tạp hàng triệu hoặc hàng tỷ lần một cách nhanh chóng là nền tảng cho việc phát triển và ứng dụng các mô hình nào trong khoa học dữ liệu?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 6

Câu 30: Khi một tổ chức cần phân tích dữ liệu nhạy cảm (ví dụ: dữ liệu y tế, tài chính), máy tính không chỉ cung cấp sức mạnh xử lý mà còn hỗ trợ khía cạnh nào?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 07

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 07 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong quy trình khoa học dữ liệu, máy tính đóng vai trò gì trong giai đoạn tiền xử lý (preprocessing) dữ liệu?

  • A. Chỉ lưu trữ dữ liệu thô
  • B. Thực hiện các thao tác làm sạch, chuyển đổi, tích hợp dữ liệu
  • C. Tạo ra các biểu đồ trực quan
  • D. Xây dựng mô hình dự đoán

Câu 2: Tại sao việc phân tích dữ liệu hệ gene người (HGP) đòi hỏi hệ thống máy tính có hiệu năng cao (HPC) hoặc sử dụng điện toán đám mây, trong khi phân tích dữ liệu từ một cuộc khảo sát nhỏ thì không?

  • A. Dữ liệu gene ít phức tạp hơn
  • B. Dữ liệu gene có khối lượng rất lớn và cần xử lý song song
  • C. Dữ liệu khảo sát không cần lưu trữ
  • D. Dữ liệu gene chỉ cần trực quan hóa

Câu 3: Một công ty công nghệ cần xử lý hàng petabyte dữ liệu được tạo ra mỗi ngày từ người dùng. Giải pháp hạ tầng tính toán nào sau đây là phù hợp và hiệu quả nhất để đáp ứng nhu cầu này?

  • A. Sử dụng một máy tính cá nhân mạnh
  • B. Xây dựng một trung tâm dữ liệu với mạng lưới máy chủ xử lý song song hoặc sử dụng điện toán đám mây quy mô lớn
  • C. Thuê ngoài một nhóm chuyên gia phân tích thủ công
  • D. Chỉ lưu trữ dữ liệu mà không xử lý

Câu 4: Tự động hóa các tác vụ lặp lại trong quy trình khoa học dữ liệu (ví dụ: làm sạch dữ liệu hàng ngày) do máy tính thực hiện mang lại lợi ích chính nào?

  • A. Chỉ làm tăng chi phí vận hành
  • B. Giảm tốc độ xử lý nhưng tăng độ chính xác
  • C. Tăng tốc độ xử lý, giảm thiểu lỗi do con người và đảm bảo tính nhất quán
  • D. Loại bỏ hoàn toàn vai trò của con người

Câu 5: Một nhà khoa học dữ liệu sử dụng thư viện Pandas trong Python để đọc, thao tác và xử lý dữ liệu dạng bảng (tabular data). Công việc này thường thuộc giai đoạn nào trong quy trình khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Tiền xử lý dữ liệu
  • C. Trực quan hóa kết quả
  • D. Diễn giải và truyền thông

Câu 6: Phát biểu nào sau đây đánh giá đúng nhất về khả năng của các mô hình Học máy (Machine Learning) trong khoa học dữ liệu?

  • A. Các mô hình học máy luôn đưa ra kết quả chính xác 100%
  • B. Mô hình học máy có thể tự động phát hiện và giải quyết mọi vấn đề về đạo đức dữ liệu
  • C. Mô hình học máy rất mạnh mẽ trong việc tìm kiếm mẫu hình và dự đoán, nhưng vẫn cần sự diễn giải và kiểm tra từ chuyên gia con người
  • D. Mô hình học máy chỉ có thể xử lý dữ liệu số

Câu 7: Hệ thống dự báo thời tiết xử lý dữ liệu từ vệ tinh, radar, và các trạm quan trắc liên tục theo thời gian thực để cập nhật dự báo. Khả năng nào của máy tính hiện đại là thiết yếu cho ứng dụng này?

  • A. Khả năng lưu trữ dữ liệu offline
  • B. Khả năng xử lý dữ liệu theo lô (batch processing)
  • C. Khả năng xử lý và phân tích dữ liệu theo thời gian thực với tốc độ cao
  • D. Khả năng tạo ra dữ liệu mới

Câu 8: So sánh cách xử lý dữ liệu lớn (Big Data) trên máy tính hiện đại với cách xử lý dữ liệu truyền thống. Điểm khác biệt cơ bản nhất nằm ở đâu?

  • A. Dữ liệu truyền thống chỉ có văn bản
  • B. Xử lý Big Data thường yêu cầu các kỹ thuật phân tán và song song do khối lượng, tốc độ và đa dạng dữ liệu
  • C. Máy tính truyền thống không có khả năng lưu trữ
  • D. Xử lý Big Data không cần thuật toán

Câu 9: Một ngân hàng muốn dự đoán khách hàng nào có khả năng cao sẽ ngừng sử dụng dịch vụ (churn) dựa trên lịch sử giao dịch và tương tác của họ. Nhiệm vụ tính toán cốt lõi mà máy tính cần thực hiện để xây dựng mô hình dự đoán này là gì?

  • A. Chỉ đơn thuần sao chép dữ liệu
  • B. Thực hiện các thuật toán học máy để tìm kiếm mẫu hình và xây dựng mô hình dự đoán dựa trên dữ liệu lịch sử
  • C. Xóa tất cả dữ liệu cũ
  • D. Tạo ra dữ liệu khách hàng mới

Câu 10: Khi phân tích dữ liệu bằng máy tính, nếu dữ liệu thu thập ban đầu đã mang tính thiên vị (bias) đối với một nhóm nhất định, điều gì có khả năng xảy ra với kết quả phân tích hoặc mô hình được xây dựng?

  • A. Máy tính sẽ tự động loại bỏ thiên vị này
  • B. Kết quả phân tích và mô hình sẽ phản ánh và thậm chí khuếch đại thiên vị có sẵn trong dữ liệu
  • C. Thiên vị trong dữ liệu không ảnh hưởng đến kết quả phân tích
  • D. Chỉ có con người mới có thể gây ra thiên vị, không phải dữ liệu

Câu 11: Một dự án nghiên cứu y học quốc tế liên quan đến việc chia sẻ và phân tích dữ liệu bệnh nhân lớn từ nhiều bệnh viện khác nhau trên thế giới. Mô hình điện toán nào hỗ trợ tốt nhất cho việc cung cấp tài nguyên tính toán linh hoạt, khả năng mở rộng và hợp tác giữa các bên?

  • A. Sử dụng máy chủ cục bộ riêng biệt tại mỗi bệnh viện
  • B. Điện toán đám mây (Cloud Computing)
  • C. Chỉ trao đổi dữ liệu qua email
  • D. Xử lý toàn bộ dữ liệu trên một máy tính duy nhất

Câu 12: Khối lượng dữ liệu ngày càng tăng lên theo cấp số nhân (Big Data) ảnh hưởng như thế nào đến nhu cầu về tài nguyên tính toán (máy tính, phần cứng)?

  • A. Giảm nhu cầu vì dữ liệu lớn dễ xử lý hơn
  • B. Tăng nhu cầu đáng kể về sức mạnh xử lý, bộ nhớ và lưu trữ để xử lý kịp thời
  • C. Không ảnh hưởng vì chỉ cần phần mềm tốt
  • D. Chỉ cần máy tính cá nhân thông thường là đủ

Câu 13: Một kỹ sư dữ liệu viết một đoạn mã Python để tự động kiểm tra và chuẩn hóa định dạng ngày tháng trong một tập dữ liệu lớn. Khả năng nào của máy tính đang được tận dụng trong công việc này?

  • A. Khả năng tạo ra dữ liệu mới
  • B. Khả năng trình bày dữ liệu trực quan
  • C. Khả năng tự động hóa các tác vụ lặp đi lặp lại với tốc độ và độ chính xác cao
  • D. Khả năng đưa ra quyết định chiến lược

Câu 14: Tại sao trực quan hóa dữ liệu (Data Visualization) là một bước quan trọng trong khoa học dữ liệu, và máy tính hỗ trợ bước này như thế nào?

  • A. Chỉ để làm đẹp báo cáo
  • B. Giúp con người dễ dàng hiểu, khám phá các mẫu hình và xu hướng trong dữ liệu phức tạp thông qua biểu đồ, đồ thị; máy tính cung cấp công cụ tạo ra chúng
  • C. Chỉ dùng để lưu trữ kết quả cuối cùng
  • D. Là bước đầu tiên để thu thập dữ liệu

Câu 15: Một hệ thống phát hiện gian lận trong giao dịch thẻ tín dụng cần phân tích hàng nghìn giao dịch mỗi giây để xác định các hoạt động đáng ngờ ngay lập tức. Kiểu phân tích dữ liệu nào đang được thực hiện ở đây, và đặc điểm nào của máy tính là thiết yếu?

  • A. Phân tích dữ liệu lịch sử theo lô
  • B. Phân tích dữ liệu ngoại tuyến
  • C. Phân tích dữ liệu thời gian thực, yêu cầu khả năng xử lý tốc độ cao và độ trễ thấp
  • D. Chỉ cần lưu trữ giao dịch

Câu 16: So sánh xử lý dữ liệu song song (Parallel Processing) và xử lý dữ liệu tuần tự (Sequential Processing) trên máy tính. Lợi ích chính của xử lý song song khi làm việc với dữ liệu lớn là gì?

  • A. Xử lý song song chỉ dùng cho dữ liệu nhỏ
  • B. Xử lý song song phức tạp hơn nhưng không nhanh hơn
  • C. Xử lý song song cho phép nhiều tác vụ được thực hiện đồng thời, giúp giảm đáng kể thời gian xử lý trên các tập dữ liệu lớn
  • D. Xử lý tuần tự hiệu quả hơn cho dữ liệu lớn

Câu 17: Thư viện NumPy trong Python, được sử dụng rộng rãi trong khoa học dữ liệu, có chức năng chính là gì, đặc biệt hữu ích cho các tính toán phức tạp và mô hình học máy?

  • A. Chỉ để hiển thị hình ảnh
  • B. Cung cấp các cấu trúc dữ liệu mảng đa chiều và các hàm toán học hiệu quả để xử lý số lượng lớn dữ liệu số
  • C. Để tạo giao diện người dùng
  • D. Để gửi email tự động

Câu 18: Thách thức lớn khi xử lý tính

  • A. Dữ liệu quá sạch sẽ
  • B. Dữ liệu đến từ nhiều nguồn khác nhau với định dạng, cấu trúc và chất lượng khác nhau, đòi hỏi máy tính có khả năng tích hợp và chuẩn hóa dữ liệu từ các nguồn đó
  • C. Dữ liệu quá nhỏ
  • D. Dữ liệu luôn có cùng định dạng

Câu 19: Phân tích hình ảnh y tế (như MRI, CT scan) bằng các thuật toán học sâu (Deep Learning) để hỗ trợ chẩn đoán đòi hỏi loại phần cứng máy tính đặc biệt nào để tăng tốc độ xử lý?

  • A. Máy in tốc độ cao
  • B. Card đồ họa mạnh (GPU)
  • C. Ổ cứng dung lượng nhỏ
  • D. Màn hình độ phân giải thấp

Câu 20: Bước

  • A. Chỉ để lưu trữ kết quả cho riêng nhà khoa học dữ liệu
  • B. Để biến các kết quả phân tích kỹ thuật thành thông tin có ý nghĩa, dễ hiểu cho người ra quyết định, và trực quan hóa giúp truyền đạt thông tin này hiệu quả
  • C. Để tạo ra dữ liệu mới dựa trên kết quả
  • D. Để kiểm tra lại mã nguồn

Câu 21: Một chuỗi siêu thị muốn phân tích dữ liệu mua hàng để nhóm các khách hàng có hành vi mua sắm tương tự nhau, nhằm mục đích cá nhân hóa chiến dịch marketing. Kỹ thuật khoa học dữ liệu nào, phụ thuộc nhiều vào sức mạnh tính toán của máy tính, sẽ được áp dụng ở đây?

  • A. Thu thập dữ liệu ngẫu nhiên
  • B. Phân tích cảm xúc (Sentiment Analysis)
  • C. Phân nhóm (Clustering)
  • D. Dự báo thời tiết

Câu 22: Mặc dù máy tính vượt trội trong việc xử lý dữ liệu và thực hiện tính toán phức tạp, nhưng có một khía cạnh quan trọng trong khoa học dữ liệu mà con người vẫn đóng vai trò không thể thay thế hoặc vượt trội hơn máy tính. Đó là gì?

  • A. Khả năng lưu trữ dữ liệu
  • B. Khả năng xử lý số lượng lớn phép tính
  • C. Khả năng đặt câu hỏi nghiên cứu sáng tạo, diễn giải kết quả trong bối cảnh phức tạp, và đưa ra quyết định dựa trên sự hiểu biết sâu sắc (wisdom)
  • D. Khả năng chạy thuật toán

Câu 23: Mô phỏng các hiện tượng phức tạp trong khoa học (ví dụ: mô hình khí hậu toàn cầu, tương tác phân tử) thường đòi hỏi thực hiện hàng tỷ, thậm chí hàng nghìn tỷ phép tính. Loại hạ tầng máy tính nào là cần thiết cho các tác vụ này?

  • A. Máy tính xách tay thông thường
  • B. Điện thoại thông minh
  • C. Siêu máy tính (Supercomputer) hoặc cụm máy tính hiệu năng cao (HPC Cluster)
  • D. Máy tính bảng

Câu 24: Khi phân tích các tập dữ liệu lớn chứa thông tin cá nhân (ví dụ: hồ sơ y tế, lịch sử duyệt web), một trong những lo ngại đạo đức lớn nhất là gì, và việc sử dụng máy tính để xử lý nhanh chóng làm tăng nguy cơ này như thế nào?

  • A. Dữ liệu có thể bị xóa nhầm
  • B. Nguy cơ vi phạm quyền riêng tư và sử dụng dữ liệu sai mục đích do khả năng kết hợp và phân tích thông tin từ nhiều nguồn khác nhau
  • C. Máy tính có thể tự ý thay đổi dữ liệu
  • D. Dữ liệu có thể quá chính xác

Câu 25: Trước khi phân tích chuyên sâu, dữ liệu thường cần được tổ chức, quản lý và truy vấn. Loại phần mềm nào là công cụ cơ bản cho nhiệm vụ này, đặc biệt đối với dữ liệu có cấu trúc?

  • A. Phần mềm chỉnh sửa ảnh
  • B. Hệ quản trị cơ sở dữ liệu (Database Management System - DBMS)
  • C. Trình duyệt web
  • D. Phần mềm soạn thảo văn bản

Câu 26: Tại sao hạ tầng lưu trữ dữ liệu lại là một thành phần quan trọng không thể thiếu trong môi trường khoa học dữ liệu hiện đại?

  • A. Chỉ để lưu các tệp văn bản nhỏ
  • B. Khoa học dữ liệu thường làm việc với khối lượng dữ liệu lớn và đa dạng, đòi hỏi không gian lưu trữ đủ lớn và khả năng truy cập hiệu quả để xử lý
  • C. Lưu trữ không cần thiết nếu có phần mềm tốt
  • D. Chỉ cần lưu trữ kết quả cuối cùng

Câu 27: Dịch vụ xem phim trực tuyến sử dụng lịch sử xem và đánh giá của người dùng để gợi ý các bộ phim khác mà họ có thể thích. Vai trò của học máy và xử lý dữ liệu bằng máy tính trong hệ thống gợi ý này là gì?

  • A. Học máy chỉ dùng để đếm số lượt xem
  • B. Máy tính lưu trữ danh sách phim, còn gợi ý do con người làm thủ công
  • C. Học máy phân tích hành vi người dùng để tìm ra mẫu hình và xây dựng mô hình dự đoán sở thích, máy tính cung cấp sức mạnh xử lý cho các thuật toán này
  • D. Hệ thống gợi ý hoạt động ngẫu nhiên

Câu 28: Lợi ích đáng kể nhất của việc một công ty khởi nghiệp trong lĩnh vực khoa học dữ liệu sử dụng tài nguyên điện toán đám mây thay vì đầu tư xây dựng trung tâm dữ liệu riêng là gì?

  • A. Giảm khả năng hợp tác
  • B. Tăng chi phí vận hành
  • C. Giảm đáng kể chi phí đầu tư ban đầu vào phần cứng và hạ tầng, đồng thời cung cấp khả năng mở rộng linh hoạt theo nhu cầu
  • D. Hạn chế khả năng xử lý dữ liệu lớn

Câu 29: Công việc xác định, xử lý hoặc điền các giá trị bị thiếu (missing values) hoặc các giá trị ngoại lai (outliers) trong một tập dữ liệu là một phần quan trọng của giai đoạn nào trong quy trình khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Tiền xử lý dữ liệu
  • C. Xây dựng mô hình
  • D. Trực quan hóa dữ liệu

Câu 30: Sự phát triển mạnh mẽ của Trí tuệ Nhân tạo (AI), đặc biệt là học sâu (Deep Learning), được kỳ vọng sẽ thay đổi vai trò của máy tính trong khoa học dữ liệu như thế nào trong tương lai?

  • A. Làm cho máy tính trở nên kém quan trọng hơn
  • B. Giúp máy tính có khả năng tự động hóa nhiều tác vụ phức tạp hơn, phát hiện các mẫu hình tinh vi hơn và đưa ra các dự đoán chính xác hơn
  • C. Chỉ ảnh hưởng đến phần cứng, không ảnh hưởng đến phần mềm
  • D. Giới hạn khả năng xử lý dữ liệu

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 1: Trong quy trình khoa học dữ liệu, máy tính đóng vai trò gì trong giai đoạn tiền xử lý (preprocessing) dữ liệu?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 2: Tại sao việc phân tích dữ liệu hệ gene người (HGP) đòi hỏi hệ thống máy tính có hiệu năng cao (HPC) hoặc sử dụng điện toán đám mây, trong khi phân tích dữ liệu từ một cuộc khảo sát nhỏ thì không?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 3: Một công ty công nghệ cần xử lý hàng petabyte dữ liệu được tạo ra mỗi ngày từ người dùng. Giải pháp hạ tầng tính toán nào sau đây là phù hợp và hiệu quả nhất để đáp ứng nhu cầu này?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 4: Tự động hóa các tác vụ lặp lại trong quy trình khoa học dữ liệu (ví dụ: làm sạch dữ liệu hàng ngày) do máy tính thực hiện mang lại lợi ích chính nào?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 5: Một nhà khoa học dữ liệu sử dụng thư viện Pandas trong Python để đọc, thao tác và xử lý dữ liệu dạng bảng (tabular data). Công việc này thường thuộc giai đoạn nào trong quy trình khoa học dữ liệu?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 6: Phát biểu nào sau đây đánh giá đúng nhất về khả năng của các mô hình Học máy (Machine Learning) trong khoa học dữ liệu?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 7: Hệ thống dự báo thời tiết xử lý dữ liệu từ vệ tinh, radar, và các trạm quan trắc liên tục theo thời gian thực để cập nhật dự báo. Khả năng nào của máy tính hiện đại là thiết yếu cho ứng dụng này?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 8: So sánh cách xử lý dữ liệu lớn (Big Data) trên máy tính hiện đại với cách xử lý dữ liệu truyền thống. Điểm khác biệt cơ bản nhất nằm ở đâu?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 9: Một ngân hàng muốn dự đoán khách hàng nào có khả năng cao sẽ ngừng sử dụng dịch vụ (churn) dựa trên lịch sử giao dịch và tương tác của họ. Nhiệm vụ tính toán cốt lõi mà máy tính cần thực hiện để xây dựng mô hình dự đoán này là gì?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 10: Khi phân tích dữ liệu bằng máy tính, nếu dữ liệu thu thập ban đầu đã mang tính thiên vị (bias) đối với một nhóm nhất định, điều gì có khả năng xảy ra với kết quả phân tích hoặc mô hình được xây dựng?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 11: Một dự án nghiên cứu y học quốc tế liên quan đến việc chia sẻ và phân tích dữ liệu bệnh nhân lớn từ nhiều bệnh viện khác nhau trên thế giới. Mô hình điện toán nào hỗ trợ tốt nhất cho việc cung cấp tài nguyên tính toán linh hoạt, khả năng mở rộng và hợp tác giữa các bên?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 12: Khối lượng dữ liệu ngày càng tăng lên theo cấp số nhân (Big Data) ảnh hưởng như thế nào đến nhu cầu về tài nguyên tính toán (máy tính, phần cứng)?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 13: Một kỹ sư dữ liệu viết một đoạn mã Python để tự động kiểm tra và chuẩn hóa định dạng ngày tháng trong một tập dữ liệu lớn. Khả năng nào của máy tính đang được tận dụng trong công việc này?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 14: Tại sao trực quan hóa dữ liệu (Data Visualization) là một bước quan trọng trong khoa học dữ liệu, và máy tính hỗ trợ bước này như thế nào?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 15: Một hệ thống phát hiện gian lận trong giao dịch thẻ tín dụng cần phân tích hàng nghìn giao dịch mỗi giây để xác định các hoạt động đáng ngờ ngay lập tức. Kiểu phân tích dữ liệu nào đang được thực hiện ở đây, và đặc điểm nào của máy tính là thiết yếu?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 16: So sánh xử lý dữ liệu song song (Parallel Processing) và xử lý dữ liệu tuần tự (Sequential Processing) trên máy tính. Lợi ích chính của xử lý song song khi làm việc với dữ liệu lớn là gì?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 17: Thư viện NumPy trong Python, được sử dụng rộng rãi trong khoa học dữ liệu, có chức năng chính là gì, đặc biệt hữu ích cho các tính toán phức tạp và mô hình học máy?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 18: Thách thức lớn khi xử lý tính "đa dạng" (Variety) của Big Data là gì, và máy tính giúp giải quyết nó như thế nào?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 19: Phân tích hình ảnh y tế (như MRI, CT scan) bằng các thuật toán học sâu (Deep Learning) để hỗ trợ chẩn đoán đòi hỏi loại phần cứng máy tính đặc biệt nào để tăng tốc độ xử lý?

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 20: Bước "Diễn giải và Truyền thông" trong quy trình khoa học dữ liệu có mục đích chính là gì, và các kết quả trực quan hóa do máy tính tạo ra đóng góp như thế nào?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 21: Một chuỗi siêu thị muốn phân tích dữ liệu mua hàng để nhóm các khách hàng có hành vi mua sắm tương tự nhau, nhằm mục đích cá nhân hóa chiến dịch marketing. Kỹ thuật khoa học dữ liệu nào, phụ thuộc nhiều vào sức mạnh tính toán của máy tính, sẽ được áp dụng ở đây?

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 22: Mặc dù máy tính vượt trội trong việc xử lý dữ liệu và thực hiện tính toán phức tạp, nhưng có một khía cạnh quan trọng trong khoa học dữ liệu mà con người vẫn đóng vai trò không thể thay thế hoặc vượt trội hơn máy tính. Đó là gì?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 23: Mô phỏng các hiện tượng phức tạp trong khoa học (ví dụ: mô hình khí hậu toàn cầu, tương tác phân tử) thường đòi hỏi thực hiện hàng tỷ, thậm chí hàng nghìn tỷ phép tính. Loại hạ tầng máy tính nào là cần thiết cho các tác vụ này?

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 24: Khi phân tích các tập dữ liệu lớn chứa thông tin cá nhân (ví dụ: hồ sơ y tế, lịch sử duyệt web), một trong những lo ngại đạo đức lớn nhất là gì, và việc sử dụng máy tính để xử lý nhanh chóng làm tăng nguy cơ này như thế nào?

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 25: Trước khi phân tích chuyên sâu, dữ liệu thường cần được tổ chức, quản lý và truy vấn. Loại phần mềm nào là công cụ cơ bản cho nhiệm vụ này, đặc biệt đối với dữ liệu có cấu trúc?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 26: Tại sao hạ tầng lưu trữ dữ liệu lại là một thành phần quan trọng không thể thiếu trong môi trường khoa học dữ liệu hiện đại?

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 27: Dịch vụ xem phim trực tuyến sử dụng lịch sử xem và đánh giá của người dùng để gợi ý các bộ phim khác mà họ có thể thích. Vai trò của học máy và xử lý dữ liệu bằng máy tính trong hệ thống gợi ý này là gì?

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 28: Lợi ích đáng kể nhất của việc một công ty khởi nghiệp trong lĩnh vực khoa học dữ liệu sử dụng tài nguyên điện toán đám mây thay vì đầu tư xây dựng trung tâm dữ liệu riêng là gì?

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 29: Công việc xác định, xử lý hoặc điền các giá trị bị thiếu (missing values) hoặc các giá trị ngoại lai (outliers) trong một tập dữ liệu là một phần quan trọng của giai đoạn nào trong quy trình khoa học dữ liệu?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 7

Câu 30: Sự phát triển mạnh mẽ của Trí tuệ Nhân tạo (AI), đặc biệt là học sâu (Deep Learning), được kỳ vọng sẽ thay đổi vai trò của máy tính trong khoa học dữ liệu như thế nào trong tương lai?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 08

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 08 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong quy trình khoa học dữ liệu, máy tính đóng vai trò chủ chốt nào trong giai đoạn thu thập dữ liệu từ các nguồn khác nhau?

  • A. Chỉ thực hiện phân tích thống kê đơn giản.
  • B. Tự động tạo ra dữ liệu mới hoàn toàn.
  • C. Chỉ hiển thị dữ liệu dưới dạng biểu đồ.
  • D. Cung cấp công cụ và khả năng kết nối để tự động hóa việc thu thập dữ liệu từ nhiều nguồn.

Câu 2: Giai đoạn tiền xử lý dữ liệu (data preprocessing) trong khoa học dữ liệu thường bao gồm các công việc như làm sạch dữ liệu, xử lý dữ liệu bị thiếu, chuyển đổi định dạng. Vai trò của máy tính trong giai đoạn này là gì?

  • A. Thực hiện các phép tính toán học phức tạp để dự đoán xu hướng.
  • B. Áp dụng các thuật toán để làm sạch, biến đổi và chuẩn hóa dữ liệu với số lượng lớn một cách tự động.
  • C. Lưu trữ dữ liệu tạm thời trước khi phân tích.
  • D. Tạo báo cáo tổng hợp về chất lượng dữ liệu.

Câu 3: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu gồm hàng terabyte thông tin giao dịch khách hàng để tìm ra các mẫu mua sắm bất thường. Công nghệ tính toán nào sau đây là cần thiết nhất để xử lý khối lượng dữ liệu khổng lồ này một cách hiệu quả?

  • A. Máy tính cá nhân cấu hình thấp.
  • B. Phần mềm soạn thảo văn bản.
  • C. Hệ thống máy tính có khả năng xử lý song song hoặc điện toán đám mây.
  • D. Máy in tốc độ cao.

Câu 4: Trong khoa học dữ liệu, trực quan hóa dữ liệu (data visualization) là quá trình biểu diễn dữ liệu và kết quả phân tích dưới dạng đồ họa (biểu đồ, đồ thị...). Máy tính hỗ trợ quá trình này như thế nào?

  • A. Cung cấp các công cụ phần mềm để tạo ra biểu đồ, đồ thị tương tác từ dữ liệu đã xử lý.
  • B. Chỉ đơn thuần lưu trữ các hình ảnh biểu đồ đã có sẵn.
  • C. Tự động giải thích ý nghĩa của biểu đồ mà không cần sự can thiệp của con người.
  • D. Tạo ra dữ liệu giả để điền vào biểu đồ.

Câu 5: Dự án Hệ gene người (Human Genome Project - HGP) là một ví dụ điển hình về việc ứng dụng máy tính trong khoa học dữ liệu quy mô lớn. Vai trò quan trọng nhất của máy tính và các thuật toán trong HGP là gì?

  • A. Chỉ để ghi chép lại quá trình thí nghiệm bằng tay.
  • B. Xử lý, lưu trữ và phân tích khối lượng dữ liệu gene khổng lồ để xác định trình tự DNA.
  • C. Thay thế hoàn toàn các nhà khoa học trong phòng thí nghiệm.
  • D. Tạo ra các đột biến gene mới cho nghiên cứu.

Câu 6: Điện toán đám mây (cloud computing) mang lại lợi ích đáng kể nào cho các dự án khoa học dữ liệu, đặc biệt là những dự án cần xử lý dữ liệu lớn?

  • A. Bắt buộc phải mua sắm nhiều máy tính cá nhân mới.
  • B. Giảm khả năng chia sẻ dữ liệu giữa các nhóm nghiên cứu.
  • C. Chỉ cho phép xử lý dữ liệu khi không có kết nối internet.
  • D. Cung cấp tài nguyên tính toán và lưu trữ linh hoạt, có khả năng mở rộng theo nhu cầu mà không cần đầu tư lớn vào cơ sở hạ tầng vật lý ban đầu.

Câu 7: Khả năng xử lý song song (parallel processing) là kỹ thuật cho phép nhiều tác vụ tính toán được thực hiện đồng thời. Kỹ thuật này đặc biệt quan trọng trong khoa học dữ liệu để giải quyết vấn đề gì?

  • A. Giảm đáng kể thời gian cần thiết để phân tích các tập dữ liệu rất lớn và phức tạp.
  • B. Chỉ dùng để tạo ra các biểu đồ đơn giản.
  • C. Giảm độ chính xác của kết quả phân tích.
  • D. Tăng chi phí vận hành hệ thống máy tính.

Câu 8: Tự động hóa (automation) trong khoa học dữ liệu, được hỗ trợ bởi máy tính và thuật toán, giúp cải thiện hiệu quả công việc như thế nào?

  • A. Loại bỏ hoàn toàn vai trò của con người trong mọi giai đoạn.
  • B. Chỉ áp dụng được cho các tập dữ liệu rất nhỏ.
  • C. Tăng tốc độ thực hiện các tác vụ lặp đi lặp lại (ví dụ: thu thập, làm sạch), giảm thiểu sai sót do con người và đảm bảo tính nhất quán.
  • D. Làm cho quy trình phân tích trở nên phức tạp hơn.

Câu 9: Khi một công ty thương mại điện tử muốn phân tích hành vi mua sắm của hàng triệu khách hàng để đưa ra các đề xuất sản phẩm cá nhân hóa theo thời gian thực, khả năng tính toán của máy tính đóng vai trò nào?

  • A. Chỉ lưu trữ lịch sử mua hàng của khách.
  • B. Thực hiện các mô hình phân tích phức tạp trên dữ liệu lớn với tốc độ cao để đưa ra đề xuất ngay lập tức.
  • C. Tạo ra các sản phẩm mới dựa trên dữ liệu.
  • D. In ấn danh sách sản phẩm phổ biến nhất.

Câu 10: Một nhà nghiên cứu cần phân tích dữ liệu từ kính thiên văn vô tuyến để tìm kiếm các tín hiệu bất thường có thể chỉ ra sự sống ngoài Trái Đất. Khối lượng dữ liệu này là cực kỳ lớn. Công nghệ tính toán nào giúp nhà nghiên cứu xử lý được thách thức về quy mô dữ liệu này?

  • A. Sử dụng siêu máy tính hoặc hệ thống điện toán phân tán.
  • B. Chỉ phân tích một phần rất nhỏ dữ liệu.
  • C. Thực hiện phân tích bằng tay trên giấy.
  • D. Sử dụng máy tính bảng thông thường.

Câu 11: Giả sử bạn cần xây dựng một mô hình dự đoán giá nhà dựa trên hàng trăm yếu tố (diện tích, vị trí, số phòng...). Việc huấn luyện mô hình này đòi hỏi lặp đi lặp lại các phép tính phức tạp trên tập dữ liệu lớn. Máy tính với cấu hình mạnh (CPU/GPU) hỗ trợ công việc này như thế nào?

  • A. Chỉ giúp nhập dữ liệu giá nhà ban đầu.
  • B. Tự động thu thập dữ liệu từ internet mà không cần thuật toán.
  • C. Chỉ hiển thị kết quả cuối cùng của mô hình.
  • D. Cung cấp sức mạnh xử lý cần thiết để thực hiện các thuật toán học máy phức tạp và huấn luyện mô hình trong thời gian hợp lý.

Câu 12: Trong bối cảnh khoa học dữ liệu, thuật toán học máy (machine learning algorithms) thường được sử dụng để tìm kiếm các mẫu ẩn, phân loại hoặc dự đoán. Máy tính đóng vai trò gì trong việc triển khai và thực thi các thuật toán này?

  • A. Chỉ viết ra mã lệnh của thuật toán.
  • B. Tự động thiết kế thuật toán mới mà không cần lập trình.
  • C. Là nền tảng vật lý và môi trường phần mềm để chạy các thuật toán học máy trên dữ liệu.
  • D. Lưu trữ kết quả cuối cùng dưới dạng tệp PDF.

Câu 13: Một trong những thách thức lớn khi làm việc với dữ liệu lớn (Big Data) là tốc độ xử lý. Ngoài xử lý song song, máy tính còn hỗ trợ giải quyết thách thức này thông qua việc sử dụng các cấu trúc dữ liệu và hệ quản trị cơ sở dữ liệu được tối ưu hóa cho dữ liệu lớn. Điều này giúp gì?

  • A. Làm cho dữ liệu trở nên phức tạp hơn.
  • B. Truy xuất và xử lý dữ liệu nhanh hơn so với các phương pháp truyền thống.
  • C. Giảm kích thước tổng thể của tập dữ liệu.
  • D. Tăng chi phí lưu trữ dữ liệu.

Câu 14: Xét một hệ thống giám sát giao thông thông minh sử dụng camera và cảm biến để thu thập dữ liệu về lưu lượng xe theo thời gian thực. Khoa học dữ liệu được áp dụng để phân tích dữ liệu này nhằm tối ưu hóa tín hiệu đèn giao thông. Máy tính đóng vai trò gì trong việc cho phép phân tích theo thời gian thực này?

  • A. Cung cấp khả năng xử lý dữ liệu liên tục và tốc độ cao ngay khi dữ liệu được thu thập.
  • B. Chỉ lưu trữ dữ liệu và phân tích sau đó hàng tuần.
  • C. Tạo ra các phương tiện giao thông ảo.
  • D. Chỉ hiển thị hình ảnh từ camera.

Câu 15: Tích hợp dữ liệu từ nhiều nguồn khác nhau là một công việc phổ biến trong khoa học dữ liệu (ví dụ: kết hợp dữ liệu bán hàng, dữ liệu marketing và dữ liệu phản hồi khách hàng). Máy tính và các công cụ phần mềm hỗ trợ việc tích hợp này như thế nào?

  • A. Chỉ cho phép tích hợp dữ liệu nếu chúng có cùng định dạng ban đầu.
  • B. Yêu cầu người dùng phải nhập lại toàn bộ dữ liệu vào một tệp duy nhất.
  • C. Tự động tạo ra các nguồn dữ liệu mới để tích hợp.
  • D. Cung cấp các công cụ, API và khả năng xử lý để kết nối, biến đổi và hợp nhất dữ liệu từ các nguồn, định dạng khác nhau một cách hiệu quả.

Câu 16: Khi một nhà khoa học dữ liệu sử dụng thư viện phần mềm như Pandas (trong Python) để làm sạch và biến đổi dữ liệu, họ đang tận dụng khả năng nào của máy tính?

  • A. Khả năng in ấn tài liệu.
  • B. Khả năng thực thi mã lệnh và sử dụng các thư viện được viết sẵn để thao tác dữ liệu.
  • C. Khả năng giao tiếp bằng giọng nói.
  • D. Khả năng kết nối mạng internet duy nhất.

Câu 17: Một nhóm nghiên cứu y tế đang sử dụng máy tính để phân tích dữ liệu hình ảnh y tế (ví dụ: ảnh X-quang, MRI) nhằm phát hiện sớm các dấu hiệu bệnh. Công nghệ nào trong khoa học dữ liệu, được hỗ trợ mạnh mẽ bởi máy tính, thường được sử dụng cho loại phân tích hình ảnh này?

  • A. Học sâu (Deep Learning), đặc biệt là Mạng nơ-ron tích chập (CNN).
  • B. Phân tích dữ liệu văn bản.
  • C. Mô hình dự báo thời tiết.
  • D. Cơ sở dữ liệu quan hệ truyền thống.

Câu 18: Việc lưu trữ khối lượng dữ liệu khổng lồ, ngày càng tăng là một thách thức trong khoa học dữ liệu. Máy tính và các hệ thống lưu trữ hiện đại (ví dụ: hệ thống tệp phân tán, cơ sở dữ liệu NoSQL) giải quyết thách thức này như thế nào?

  • A. Bằng cách xóa bớt dữ liệu cũ.
  • B. Chỉ cho phép lưu trữ dữ liệu dưới dạng văn bản thuần túy.
  • C. Cung cấp khả năng lưu trữ có dung lượng lớn, chi phí hiệu quả và khả năng mở rộng để chứa dữ liệu Big Data.
  • D. Lưu trữ tất cả dữ liệu trên một ổ đĩa cứng duy nhất.

Câu 19: Trong các mô hình dự báo (ví dụ: dự báo doanh số bán hàng, dự báo thời tiết), khoa học dữ liệu sử dụng các thuật toán phức tạp. Máy tính cung cấp nền tảng để thực hiện các phép tính lặp đi lặp lại với độ chính xác cao, điều này quan trọng vì:

  • A. Làm cho quá trình dự báo mất nhiều thời gian hơn.
  • B. Giảm số lượng dữ liệu cần thiết.
  • C. Chỉ cho phép dự báo các sự kiện trong quá khứ.
  • D. Đảm bảo kết quả dự báo đáng tin cậy và chính xác dựa trên dữ liệu và mô hình.

Câu 20: Một công ty muốn sử dụng khoa học dữ liệu để phân tích cảm xúc (sentiment analysis) từ hàng triệu bình luận của khách hàng trên mạng xã hội. Công việc này đòi hỏi xử lý ngôn ngữ tự nhiên (NLP). Máy tính hỗ trợ giai đoạn phân tích NLP này như thế nào?

  • A. Chỉ hiển thị các bình luận tích cực.
  • B. Cung cấp sức mạnh tính toán để chạy các mô hình NLP phức tạp nhằm phân tích cấu trúc, ngữ nghĩa và cảm xúc trong văn bản.
  • C. Tự động trả lời bình luận của khách hàng.
  • D. Dịch bình luận sang ngôn ngữ khác.

Câu 21: Giả sử bạn có một tập dữ liệu về nhiệt độ và lượng mưa của một thành phố trong 10 năm và muốn tìm mối tương quan giữa hai yếu tố này bằng hồi quy tuyến tính. Máy tính giúp bạn thực hiện việc này bằng cách:

  • A. Thay đổi dữ liệu nhiệt độ và lượng mưa.
  • B. Chỉ hiển thị dữ liệu thô.
  • C. Thực thi thuật toán hồi quy tuyến tính để tính toán hệ số tương quan và xây dựng mô hình dựa trên dữ liệu đầu vào.
  • D. Tự động viết báo cáo khoa học về kết quả.

Câu 22: Việc chia sẻ và cộng tác trên các dự án khoa học dữ liệu quy mô lớn trở nên dễ dàng hơn nhờ có máy tính và mạng máy tính. Lợi ích cụ thể của khả năng này là gì?

  • A. Cho phép các nhà khoa học dữ liệu từ các địa điểm khác nhau cùng truy cập, xử lý và cập nhật dữ liệu, mô hình một cách hiệu quả.
  • B. Bắt buộc mỗi người phải làm việc độc lập trên bản sao dữ liệu riêng.
  • C. Chỉ cho phép chia sẻ kết quả cuối cùng, không phải dữ liệu thô.
  • D. Làm tăng nguy cơ mất mát dữ liệu.

Câu 23: Khi một thuật toán học máy được "triển khai" (deployed), nghĩa là nó được đưa vào sử dụng trong một ứng dụng thực tế (ví dụ: hệ thống đề xuất sản phẩm, phát hiện gian lận). Máy tính đóng vai trò gì trong giai đoạn triển khai này?

  • A. Chỉ dùng để tạo ra tài liệu hướng dẫn sử dụng.
  • B. Tự động cải tiến thuật toán mà không cần dữ liệu mới.
  • C. Chỉ hiển thị mã nguồn của thuật toán.
  • D. Cung cấp môi trường chạy (server, nền tảng đám mây...) để thuật toán có thể nhận dữ liệu đầu vào mới và đưa ra kết quả/dự đoán trong thời gian thực hoặc gần thời gian thực.

Câu 24: Công cụ Jupyter Notebook, một môi trường lập trình dựa trên web phổ biến trong khoa học dữ liệu, cho phép người dùng kết hợp code, văn bản giải thích, công thức và trực quan hóa dữ liệu. Máy tính cung cấp khả năng nào để hỗ trợ môi trường tương tác này?

  • A. Chỉ dùng để viết văn bản.
  • B. Khả năng thực thi từng đoạn mã (cell), hiển thị kết quả ngay lập tức và tích hợp các thành phần đa phương tiện.
  • C. Tự động viết code cho người dùng.
  • D. Chỉ dùng để vẽ biểu đồ tĩnh.

Câu 25: Một công ty bảo hiểm muốn phân tích dữ liệu lịch sử yêu cầu bồi thường để phát hiện các hành vi gian lận tiềm ẩn. Phân tích này thường dựa vào việc tìm kiếm các mẫu bất thường trong tập dữ liệu lớn. Máy tính hỗ trợ công việc này bằng cách nào?

  • A. Chỉ lưu trữ các yêu cầu bồi thường đã được xác minh.
  • B. Yêu cầu nhân viên đọc và phân tích từng yêu cầu bồi thường một.
  • C. Cung cấp sức mạnh tính toán để chạy các thuật toán phát hiện bất thường trên toàn bộ tập dữ liệu, xác định các trường hợp có khả năng gian lận cao.
  • D. Tự động thanh toán tất cả các yêu cầu bồi thường.

Câu 26: Trong khoa học dữ liệu, việc đánh giá hiệu suất của mô hình (ví dụ: độ chính xác của mô hình dự đoán) là rất quan trọng. Máy tính giúp quá trình đánh giá này bằng cách:

  • A. Tự động làm cho mô hình đạt hiệu suất hoàn hảo.
  • B. Chỉ hiển thị các chỉ số hiệu suất theo dạng văn bản.
  • C. Yêu cầu người dùng tính toán thủ công tất cả các chỉ số.
  • D. Thực hiện các phép tính thống kê và so sánh kết quả dự đoán của mô hình với dữ liệu thực tế một cách tự động và nhanh chóng.

Câu 27: Một nhà khoa học khí hậu sử dụng dữ liệu từ vệ tinh, trạm khí tượng và mô hình dự báo để nghiên cứu biến đổi khí hậu. Khối lượng và sự đa dạng của dữ liệu này rất lớn. Máy tính đóng vai trò nào trong việc quản lý và phân tích dữ liệu đa nguồn này?

  • A. Cung cấp nền tảng lưu trữ, xử lý và tích hợp các loại dữ liệu khác nhau từ nhiều nguồn.
  • B. Chỉ xử lý dữ liệu từ một nguồn duy nhất.
  • C. Tự động thay đổi dữ liệu để phù hợp với mô hình.
  • D. Chỉ dùng để hiển thị bản đồ thời tiết.

Câu 28: Khả năng mở rộng (scalability) của hệ thống tính toán là yếu tố quan trọng trong khoa học dữ liệu khi quy mô dữ liệu hoặc độ phức tạp của bài toán tăng lên. Máy tính và cơ sở hạ tầng (như điện toán đám mây) hỗ trợ khả năng mở rộng này như thế nào?

  • A. Bắt buộc phải mua sắm thiết bị mới mỗi khi cần thêm tài nguyên.
  • B. Giảm hiệu suất khi xử lý nhiều dữ liệu hơn.
  • C. Cho phép tăng hoặc giảm tài nguyên tính toán (CPU, RAM, lưu trữ) một cách linh hoạt theo nhu cầu sử dụng.
  • D. Chỉ hoạt động hiệu quả với quy mô dữ liệu cố định.

Câu 29: Một nhà tiếp thị sử dụng khoa học dữ liệu để phân khúc khách hàng dựa trên hành vi trực tuyến của họ. Điều này bao gồm việc nhóm các khách hàng có đặc điểm tương tự nhau. Máy tính hỗ trợ quá trình phân khúc này bằng cách:

  • A. Tự động tạo ra các khách hàng mới cho từng phân khúc.
  • B. Thực thi các thuật toán phân cụm (clustering) trên dữ liệu khách hàng để tự động nhóm họ vào các phân khúc khác nhau.
  • C. Chỉ lưu trữ tên của khách hàng.
  • D. Yêu cầu nhà tiếp thị tự phân loại từng khách hàng một.

Câu 30: Vai trò của máy tính trong việc lặp lại các thí nghiệm hoặc mô phỏng trong khoa học dữ liệu (ví dụ: chạy lại mô hình với các tham số khác nhau để tìm ra kết quả tốt nhất) là gì?

  • A. Thực hiện các quy trình lặp lại một cách nhanh chóng, chính xác và không mệt mỏi, cho phép khám phá không gian tham số rộng lớn.
  • B. Chỉ cho phép chạy thí nghiệm một lần duy nhất.
  • C. Yêu cầu người dùng phải thiết lập lại toàn bộ môi trường cho mỗi lần lặp.
  • D. Tự động chọn tham số tốt nhất mà không cần thử nghiệm.

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 1: Trong quy trình khoa học dữ liệu, máy tính đóng vai trò chủ chốt nào trong giai đoạn thu thập dữ liệu từ các nguồn khác nhau?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 2: Giai đoạn tiền xử lý dữ liệu (data preprocessing) trong khoa học dữ liệu thường bao gồm các công việc như làm sạch dữ liệu, xử lý dữ liệu bị thiếu, chuyển đổi định dạng. Vai trò của máy tính trong giai đoạn này là gì?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 3: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu gồm hàng terabyte thông tin giao dịch khách hàng để tìm ra các mẫu mua sắm bất thường. Công nghệ tính toán nào sau đây là cần thiết nhất để xử lý khối lượng dữ liệu khổng lồ này một cách hiệu quả?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 4: Trong khoa học dữ liệu, trực quan hóa dữ liệu (data visualization) là quá trình biểu diễn dữ liệu và kết quả phân tích dưới dạng đồ họa (biểu đồ, đồ thị...). Máy tính hỗ trợ quá trình này như thế nào?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 5: Dự án Hệ gene người (Human Genome Project - HGP) là một ví dụ điển hình về việc ứng dụng máy tính trong khoa học dữ liệu quy mô lớn. Vai trò quan trọng nhất của máy tính và các thuật toán trong HGP là gì?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 6: Điện toán đám mây (cloud computing) mang lại lợi ích đáng kể nào cho các dự án khoa học dữ liệu, đặc biệt là những dự án cần xử lý dữ liệu lớn?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 7: Khả năng xử lý song song (parallel processing) là kỹ thuật cho phép nhiều tác vụ tính toán được thực hiện đồng thời. Kỹ thuật này đặc biệt quan trọng trong khoa học dữ liệu để giải quyết vấn đề gì?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 8: Tự động hóa (automation) trong khoa học dữ liệu, được hỗ trợ bởi máy tính và thuật toán, giúp cải thiện hiệu quả công việc như thế nào?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 9: Khi một công ty thương mại điện tử muốn phân tích hành vi mua sắm của hàng triệu khách hàng để đưa ra các đề xuất sản phẩm cá nhân hóa theo thời gian thực, khả năng tính toán của máy tính đóng vai trò nào?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 10: Một nhà nghiên cứu cần phân tích dữ liệu từ kính thiên văn vô tuyến để tìm kiếm các tín hiệu bất thường có thể chỉ ra sự sống ngoài Trái Đất. Khối lượng dữ liệu này là cực kỳ lớn. Công nghệ tính toán nào giúp nhà nghiên cứu xử lý được thách thức về quy mô dữ liệu này?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 11: Giả sử bạn cần xây dựng một mô hình dự đoán giá nhà dựa trên hàng trăm yếu tố (diện tích, vị trí, số phòng...). Việc huấn luyện mô hình này đòi hỏi lặp đi lặp lại các phép tính phức tạp trên tập dữ liệu lớn. Máy tính với cấu hình mạnh (CPU/GPU) hỗ trợ công việc này như thế nào?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 12: Trong bối cảnh khoa học dữ liệu, thuật toán học máy (machine learning algorithms) thường được sử dụng để tìm kiếm các mẫu ẩn, phân loại hoặc dự đoán. Máy tính đóng vai trò gì trong việc triển khai và thực thi các thuật toán này?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 13: Một trong những thách thức lớn khi làm việc với dữ liệu lớn (Big Data) là tốc độ xử lý. Ngoài xử lý song song, máy tính còn hỗ trợ giải quyết thách thức này thông qua việc sử dụng các cấu trúc dữ liệu và hệ quản trị cơ sở dữ liệu được tối ưu hóa cho dữ liệu lớn. Điều này giúp gì?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 14: Xét một hệ thống giám sát giao thông thông minh sử dụng camera và cảm biến để thu thập dữ liệu về lưu lượng xe theo thời gian thực. Khoa học dữ liệu được áp dụng để phân tích dữ liệu này nhằm tối ưu hóa tín hiệu đèn giao thông. Máy tính đóng vai trò gì trong việc cho phép phân tích theo thời gian thực này?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 15: Tích hợp dữ liệu từ nhiều nguồn khác nhau là một công việc phổ biến trong khoa học dữ liệu (ví dụ: kết hợp dữ liệu bán hàng, dữ liệu marketing và dữ liệu phản hồi khách hàng). Máy tính và các công cụ phần mềm hỗ trợ việc tích hợp này như thế nào?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 16: Khi một nhà khoa học dữ liệu sử dụng thư viện phần mềm như Pandas (trong Python) để làm sạch và biến đổi dữ liệu, họ đang tận dụng khả năng nào của máy tính?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 17: Một nhóm nghiên cứu y tế đang sử dụng máy tính để phân tích dữ liệu hình ảnh y tế (ví dụ: ảnh X-quang, MRI) nhằm phát hiện sớm các dấu hiệu bệnh. Công nghệ nào trong khoa học dữ liệu, được hỗ trợ mạnh mẽ bởi máy tính, thường được sử dụng cho loại phân tích hình ảnh này?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 18: Việc lưu trữ khối lượng dữ liệu khổng lồ, ngày càng tăng là một thách thức trong khoa học dữ liệu. Máy tính và các hệ thống lưu trữ hiện đại (ví dụ: hệ thống tệp phân tán, cơ sở dữ liệu NoSQL) giải quyết thách thức này như thế nào?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 19: Trong các mô hình dự báo (ví dụ: dự báo doanh số bán hàng, dự báo thời tiết), khoa học dữ liệu sử dụng các thuật toán phức tạp. Máy tính cung cấp nền tảng để thực hiện các phép tính lặp đi lặp lại với độ chính xác cao, điều này quan trọng vì:

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 20: Một công ty muốn sử dụng khoa học dữ liệu để phân tích cảm xúc (sentiment analysis) từ hàng triệu bình luận của khách hàng trên mạng xã hội. Công việc này đòi hỏi xử lý ngôn ngữ tự nhiên (NLP). Máy tính hỗ trợ giai đoạn phân tích NLP này như thế nào?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 21: Giả sử bạn có một tập dữ liệu về nhiệt độ và lượng mưa của một thành phố trong 10 năm và muốn tìm mối tương quan giữa hai yếu tố này bằng hồi quy tuyến tính. Máy tính giúp bạn thực hiện việc này bằng cách:

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 22: Việc chia sẻ và cộng tác trên các dự án khoa học dữ liệu quy mô lớn trở nên dễ dàng hơn nhờ có máy tính và mạng máy tính. Lợi ích cụ thể của khả năng này là gì?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 23: Khi một thuật toán học máy được 'triển khai' (deployed), nghĩa là nó được đưa vào sử dụng trong một ứng dụng thực tế (ví dụ: hệ thống đề xuất sản phẩm, phát hiện gian lận). Máy tính đóng vai trò gì trong giai đoạn triển khai này?

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 24: Công cụ Jupyter Notebook, một môi trường lập trình dựa trên web phổ biến trong khoa học dữ liệu, cho phép người dùng kết hợp code, văn bản giải thích, công thức và trực quan hóa dữ liệu. Máy tính cung cấp khả năng nào để hỗ trợ môi trường tương tác này?

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 25: Một công ty bảo hiểm muốn phân tích dữ liệu lịch sử yêu cầu bồi thường để phát hiện các hành vi gian lận tiềm ẩn. Phân tích này thường dựa vào việc tìm kiếm các mẫu bất thường trong tập dữ liệu lớn. Máy tính hỗ trợ công việc này bằng cách nào?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 26: Trong khoa học dữ liệu, việc đánh giá hiệu suất của mô hình (ví dụ: độ chính xác của mô hình dự đoán) là rất quan trọng. Máy tính giúp quá trình đánh giá này bằng cách:

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 27: Một nhà khoa học khí hậu sử dụng dữ liệu từ vệ tinh, trạm khí tượng và mô hình dự báo để nghiên cứu biến đổi khí hậu. Khối lượng và sự đa dạng của dữ liệu này rất lớn. Máy tính đóng vai trò nào trong việc quản lý và phân tích dữ liệu đa nguồn này?

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 28: Khả năng mở rộng (scalability) của hệ thống tính toán là yếu tố quan trọng trong khoa học dữ liệu khi quy mô dữ liệu hoặc độ phức tạp của bài toán tăng lên. Máy tính và cơ sở hạ tầng (như điện toán đám mây) hỗ trợ khả năng mở rộng này như thế nào?

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 29: Một nhà tiếp thị sử dụng khoa học dữ liệu để phân khúc khách hàng dựa trên hành vi trực tuyến của họ. Điều này bao gồm việc nhóm các khách hàng có đặc điểm tương tự nhau. Máy tính hỗ trợ quá trình phân khúc này bằng cách:

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 8

Câu 30: Vai trò của máy tính trong việc lặp lại các thí nghiệm hoặc mô phỏng trong khoa học dữ liệu (ví dụ: chạy lại mô hình với các tham số khác nhau để tìm ra kết quả tốt nhất) là gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 09

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 09 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong quy trình khoa học dữ liệu, vai trò nào của máy tính là nền tảng cho phép lưu trữ, xử lý và phân tích các tập dữ liệu có kích thước vượt quá khả năng của máy tính cá nhân thông thường?

  • A. Trực quan hóa dữ liệu
  • B. Tự động hóa tác vụ
  • C. Phân tích thời gian thực
  • D. Cung cấp hạ tầng tính toán và lưu trữ

Câu 2: Một nhà khoa học dữ liệu đang làm việc với một bộ dữ liệu lớn chứa thông tin về nhiệt độ và lượng mưa từ hàng nghìn trạm khí tượng trong 50 năm. Anh ấy cần tạo ra các biểu đồ phức tạp để tìm xu hướng biến đổi khí hậu. Khả năng nào của máy tính hỗ trợ trực tiếp nhất cho công việc này?

  • A. Xử lý ngôn ngữ tự nhiên
  • B. Học máy
  • C. Trực quan hóa dữ liệu
  • D. Quản lý cơ sở dữ liệu

Câu 3: Dự án Hệ gene người (HGP) đã tạo ra một khối lượng dữ liệu khổng lồ. Việc giải trình tự và lắp ráp bộ gene này đòi hỏi sức mạnh tính toán rất lớn. Công nghệ nào đã được áp dụng hiệu quả trong HGP để xử lý đồng thời nhiều phần của dữ liệu, giúp tăng tốc độ hoàn thành dự án?

  • A. Xử lý song song
  • B. Xử lý tuần tự
  • C. Xử lý thủ công
  • D. Trực quan hóa dữ liệu

Câu 4: Một công ty khởi nghiệp về phân tích dữ liệu muốn triển khai một nền tảng xử lý dữ liệu lớn nhưng không có ngân sách lớn để đầu tư vào máy chủ và hạ tầng mạng ban đầu. Giải pháp công nghệ nào được đề cập trong bài học là phù hợp nhất để giải quyết vấn đề này, cung cấp tài nguyên tính toán linh hoạt và theo nhu cầu?

  • A. Xây dựng trung tâm dữ liệu riêng
  • B. Sử dụng điện toán đám mây
  • C. Mua sắm máy tính cá nhân cấu hình cao
  • D. Thuê ngoài dịch vụ nhập liệu

Câu 5: Tự động hóa trong khoa học dữ liệu, được hỗ trợ bởi máy tính, mang lại lợi ích chính nào cho quy trình làm việc?

  • A. Tăng sự phụ thuộc vào con người
  • B. Giảm khả năng xử lý dữ liệu lớn
  • C. Chỉ hữu ích cho các tác vụ đơn giản
  • D. Tăng tốc độ xử lý và giảm thiểu sai sót do thao tác lặp lại

Câu 6: Phân tích dữ liệu thời gian thực (real-time analysis) là khả năng xử lý và phân tích dữ liệu ngay khi nó được thu thập. Ứng dụng nào sau đây ít có khả năng yêu cầu phân tích dữ liệu thời gian thực?

  • A. Phân tích xu hướng dân số trong 100 năm qua
  • B. Phát hiện gian lận thẻ tín dụng ngay khi giao dịch xảy ra
  • C. Giám sát lưu lượng mạng để phát hiện tấn công mạng
  • D. Hệ thống cảnh báo sớm thiên tai dựa trên dữ liệu cảm biến

Câu 7: Trong giai đoạn tiền xử lý dữ liệu (data preprocessing), máy tính đóng vai trò quan trọng trong việc làm sạch, biến đổi và tích hợp dữ liệu. Thao tác nào sau đây là một ví dụ về việc máy tính hỗ trợ làm sạch dữ liệu?

  • A. Tạo biểu đồ từ dữ liệu
  • B. Xác định và xử lý các giá trị thiếu hoặc không nhất quán
  • C. Chạy thuật toán học máy
  • D. Lưu trữ dữ liệu vào cơ sở dữ liệu

Câu 8: Một nhà nghiên cứu cần phân tích một bộ dữ liệu hình ảnh y tế rất lớn để phát hiện các dấu hiệu sớm của bệnh. Việc này đòi hỏi các thuật toán phức tạp và nhiều vòng lặp tính toán. Khả năng nào của máy tính là quan trọng nhất để thực hiện phân tích này một cách hiệu quả về mặt thời gian?

  • A. Sức mạnh tính toán (Computational power)
  • B. Kích thước màn hình hiển thị
  • C. Khả năng kết nối mạng
  • D. Thiết kế giao diện người dùng

Câu 9: Hãy xem xét một hệ thống đề xuất sản phẩm trên một trang thương mại điện tử. Hệ thống này cần phân tích hành vi mua sắm của hàng triệu người dùng để đưa ra gợi ý phù hợp theo thời gian thực. Máy tính hỗ trợ khả năng nào để hệ thống này hoạt động hiệu quả?

  • A. Lưu trữ văn bản
  • B. Chỉ hiển thị hình ảnh sản phẩm
  • C. Xử lý và phân tích dữ liệu lớn, áp dụng thuật toán học máy và phân tích thời gian thực
  • D. In ấn hóa đơn mua hàng

Câu 10: Việc tích hợp dữ liệu từ nhiều nguồn khác nhau (ví dụ: dữ liệu bán hàng, dữ liệu marketing, dữ liệu phản hồi khách hàng) là một bước quan trọng trong khoa học dữ liệu để có cái nhìn toàn diện. Máy tính hỗ trợ quá trình này chủ yếu thông qua:

  • A. Tạo ra dữ liệu mới hoàn toàn
  • B. Ngăn chặn việc kết hợp các loại dữ liệu khác nhau
  • C. Chỉ cho phép tích hợp dữ liệu văn bản
  • D. Cung cấp công cụ, cơ sở dữ liệu và khả năng xử lý để kết nối và chuẩn hóa dữ liệu từ các nguồn không đồng nhất

Câu 11: Trong bối cảnh khoa học dữ liệu, khả năng mở rộng (scalability) của cơ sở hạ tầng tính toán là rất quan trọng. Điều này có nghĩa là gì?

  • A. Hệ thống có thể dễ dàng tăng hoặc giảm tài nguyên (CPU, bộ nhớ, lưu trữ) để đáp ứng khối lượng dữ liệu và yêu cầu xử lý thay đổi.
  • B. Hệ thống chỉ có thể xử lý một loại dữ liệu duy nhất.
  • C. Hệ thống chỉ hoạt động trên một máy tính duy nhất.
  • D. Hệ thống yêu cầu đầu tư cố định ban đầu rất lớn.

Câu 12: Điện toán đám mây (Cloud Computing) mang lại nhiều lợi ích cho khoa học dữ liệu. Lợi ích nào sau đây không phải là lợi ích trực tiếp của việc sử dụng điện toán đám mây trong lĩnh vực này?

  • A. Giảm chi phí đầu tư ban đầu vào phần cứng.
  • B. Dễ dàng truy cập tài nguyên tính toán mạnh theo nhu cầu.
  • C. Giảm hoàn toàn rủi ro về bảo mật dữ liệu.
  • D. Khả năng làm việc cộng tác hiệu quả hơn giữa các nhóm.

Câu 13: Một công ty tài chính muốn phân tích hàng tỷ giao dịch để phát hiện các mẫu bất thường có thể là dấu hiệu của hoạt động rửa tiền. Thuật toán phân tích rất phức tạp và cần chạy trên toàn bộ dữ liệu. Công nghệ xử lý song song sẽ giúp ích như thế nào trong tình huống này?

  • A. Làm cho dữ liệu nhỏ lại.
  • B. Chia nhỏ bài toán thành nhiều phần và xử lý đồng thời trên nhiều bộ xử lý hoặc máy tính khác nhau, giảm thời gian phân tích.
  • C. Chỉ cho phép phân tích dữ liệu thủ công.
  • D. Tăng độ phức tạp của thuật toán.

Câu 14: Khả năng tự động hóa trong khoa học dữ liệu thường được áp dụng cho các tác vụ lặp đi lặp lại. Ví dụ nào sau đây là một tác vụ có thể được tự động hóa hiệu quả để cải thiện quy trình khoa học dữ liệu?

  • A. Đưa ra quyết định chiến lược dựa trên kết quả phân tích.
  • B. Thiết kế mô hình học máy mới hoàn toàn.
  • C. Diễn giải ý nghĩa sâu sắc của kết quả phân tích cho người không chuyên.
  • D. Thu thập dữ liệu định kỳ từ các nguồn trực tuyến và làm sạch sơ bộ.

Câu 15: Tại sao khả năng phân tích dữ liệu thời gian thực, được hỗ trợ bởi máy tính, lại quan trọng trong các ứng dụng như hệ thống giao thông thông minh hay sàn giao dịch chứng khoán?

  • A. Để đưa ra quyết định hoặc phản ứng kịp thời trước các sự kiện đang diễn ra.
  • B. Để lưu trữ dữ liệu lịch sử lâu dài.
  • C. Để tạo ra các báo cáo tổng kết cuối năm.
  • D. Để giảm số lượng dữ liệu cần xử lý.

Câu 16: Trong bối cảnh xử lý dữ liệu lớn, thuật ngữ "Big Data" không chỉ nói về khối lượng dữ liệu mà còn đề cập đến "Ba V". Ba V đó thường bao gồm Volume (Khối lượng), Velocity (Tốc độ), và Variety (Đa dạng). Máy tính hỗ trợ "Velocity" (Tốc độ) trong khoa học dữ liệu như thế nào?

  • A. Chỉ lưu trữ dữ liệu tốc độ cao.
  • B. Cung cấp khả năng xử lý và phân tích dữ liệu ngay khi nó được tạo ra hoặc thu thập (phân tích thời gian thực) và sử dụng xử lý song song để tăng tốc độ xử lý tổng thể.
  • C. Giảm tốc độ thu thập dữ liệu.
  • D. Chỉ tập trung vào dữ liệu tĩnh.

Câu 17: Việc sử dụng máy tính và các thuật toán trong dự án HGP để xác định vị trí và chức năng của hàng ngàn gene trong bộ gene người là một ví dụ điển hình cho vai trò nào của máy tính trong khoa học dữ liệu?

  • A. Chỉ trực quan hóa dữ liệu.
  • B. Chỉ thu thập dữ liệu.
  • C. Phân tích và giải thích dữ liệu phức tạp.
  • D. Chỉ lưu trữ dữ liệu.

Câu 18: Khi một nhà khoa học dữ liệu sử dụng một thư viện phần mềm (như Pandas trong Python) để làm sạch và biến đổi dữ liệu trước khi phân tích, anh/cô ấy đang sử dụng máy tính ở vai trò nào trong quy trình khoa học dữ liệu?

  • A. Cung cấp công cụ phần mềm cho tiền xử lý và phân tích.
  • B. Thu thập dữ liệu từ cảm biến.
  • C. In báo cáo cuối cùng.
  • D. Trình bày kết quả trước đám đông.

Câu 19: Một trong những thách thức khi làm việc với dữ liệu lớn là việc di chuyển và xử lý dữ liệu giữa các hệ thống khác nhau. Điện toán đám mây giúp giải quyết thách thức này như thế nào?

  • A. Bắt buộc tất cả dữ liệu phải ở định dạng giống nhau.
  • B. Loại bỏ hoàn toàn nhu cầu di chuyển dữ liệu.
  • C. Chỉ cho phép lưu trữ dữ liệu trên máy tính cá nhân.
  • D. Cung cấp nền tảng tập trung và các dịch vụ tích hợp dữ liệu, giảm thiểu việc di chuyển dữ liệu vật lý và tạo điều kiện cho xử lý phân tán.

Câu 20: Hãy tưởng tượng bạn đang phân tích dữ liệu về lưu lượng truy cập website của một trang tin tức lớn. Dữ liệu được cập nhật liên tục với hàng nghìn lượt truy cập mỗi giây. Bạn cần theo dõi và cảnh báo ngay lập tức nếu có dấu hiệu tấn công từ chối dịch vụ (DDoS). Khả năng nào của máy tính là cần thiết nhất cho nhiệm vụ này?

  • A. Phân tích thời gian thực và xử lý dữ liệu tốc độ cao.
  • B. Khả năng tạo ra hình ảnh 3D.
  • C. Lưu trữ dữ liệu trên đĩa mềm.
  • D. Khả năng chạy các trò chơi điện tử.

Câu 21: Trong khoa học dữ liệu, thuật toán học máy (machine learning) thường được sử dụng để tìm ra các mẫu ẩn trong dữ liệu và đưa ra dự đoán. Máy tính đóng vai trò gì trong việc triển khai và thực thi các thuật toán học máy này?

  • A. Chỉ viết code cho thuật toán.
  • B. Cung cấp môi trường tính toán và sức mạnh xử lý cần thiết để huấn luyện và chạy các mô hình phức tạp trên dữ liệu.
  • C. Chỉ hiển thị kết quả cuối cùng.
  • D. Tự động tạo ra dữ liệu huấn luyện.

Câu 22: Việc sử dụng các công cụ trực quan hóa dữ liệu trên máy tính giúp người làm khoa học dữ liệu thực hiện điều gì một cách hiệu quả hơn?

  • A. Tăng khối lượng dữ liệu.
  • B. Giảm độ chính xác của dữ liệu.
  • C. Chỉ lưu trữ dữ liệu.
  • D. Khám phá các xu hướng, mẫu hình và ngoại lệ trong dữ liệu một cách trực quan, dễ hiểu.

Câu 23: Giả sử bạn có một tập dữ liệu khách hàng rất lớn và muốn phân loại khách hàng thành các nhóm dựa trên hành vi mua sắm của họ (phân khúc khách hàng). Quá trình này đòi hỏi chạy một thuật toán phân cụm (clustering algorithm). Máy tính hỗ trợ bạn trong bước nào của quá trình này?

  • A. Chỉ thu thập dữ liệu từ khách hàng.
  • B. Chỉ đưa ra quyết định cuối cùng về chiến lược marketing.
  • C. Thực hiện các phép tính phức tạp của thuật toán phân cụm trên toàn bộ dữ liệu.
  • D. Viết email cho từng khách hàng.

Câu 24: Trong bối cảnh khoa học dữ liệu, "ETL" (Extract, Transform, Load) là một quy trình phổ biến. Máy tính đóng vai trò then chốt trong giai đoạn "Transform" (Biến đổi) như thế nào?

  • A. Thực hiện các phép làm sạch, chuẩn hóa, tổng hợp và biến đổi cấu trúc dữ liệu theo yêu cầu của phân tích.
  • B. Chỉ sao chép dữ liệu từ nguồn này sang nguồn khác.
  • C. Chỉ hiển thị dữ liệu thô.
  • D. Tự động tạo ra dữ liệu mới mà không dựa vào dữ liệu nguồn.

Câu 25: Việc sử dụng mạng lưới siêu máy tính trong HGP là một ví dụ về ứng dụng của khả năng nào của máy tính trong khoa học dữ liệu?

  • A. Trực quan hóa dữ liệu.
  • B. Xử lý dữ liệu lớn và phức tạp với tốc độ cao (tận dụng sức mạnh tính toán phân tán).
  • C. Thu thập dữ liệu từ bệnh nhân.
  • D. Lưu trữ dữ liệu trên ổ cứng cá nhân.

Câu 26: Một lợi thế của việc sử dụng điện toán đám mây cho các dự án khoa học dữ liệu là khả năng cộng tác. Điều này được thể hiện qua khía cạnh nào?

  • A. Mỗi thành viên trong nhóm phải làm việc độc lập.
  • B. Yêu cầu tất cả thành viên phải có máy tính cấu hình rất cao.
  • C. Cho phép nhiều người dùng truy cập, chia sẻ tài nguyên, dữ liệu và môi trường làm việc chung từ xa.
  • D. Giới hạn số lượng người có thể tham gia dự án.

Câu 27: Khi một thuật toán học máy được "huấn luyện" (trained) trên một tập dữ liệu khổng lồ để nhận dạng vật thể trong ảnh, quá trình này đòi hỏi hàng tỷ phép tính. Vai trò nào của máy tính là thiết yếu nhất để quá trình huấn luyện này hoàn thành trong khoảng thời gian hợp lý?

  • A. Sức mạnh tính toán và khả năng xử lý song song.
  • B. Màu sắc của màn hình.
  • C. Dung lượng ổ đĩa cứng nhỏ.
  • D. Khả năng in ấn.

Câu 28: Tự động hóa các báo cáo định kỳ dựa trên dữ liệu bán hàng là một ứng dụng phổ biến trong khoa học dữ liệu kinh doanh. Lợi ích chính của việc tự động hóa này là gì?

  • A. Làm cho báo cáo trở nên khó hiểu hơn.
  • B. Tăng thời gian cần thiết để tạo báo cáo.
  • C. Yêu cầu nhiều nhân viên hơn để kiểm tra.
  • D. Tiết kiệm thời gian, giảm thiểu lỗi do con người và đảm bảo báo cáo được tạo ra nhất quán theo lịch trình.

Câu 29: Việc sử dụng máy tính để xây dựng các mô hình mô phỏng phức tạp (ví dụ: mô phỏng biến đổi khí hậu, mô phỏng thị trường chứng khoán) dựa trên dữ liệu lịch sử và các giả định là một ứng dụng của khoa học dữ liệu. Máy tính hỗ trợ khả năng nào trong việc này?

  • A. Chỉ lưu trữ dữ liệu đầu vào.
  • B. Thực hiện các phép tính phức tạp, lặp đi lặp lại để chạy mô phỏng và phân tích kết quả.
  • C. Chỉ hiển thị kết quả dưới dạng văn bản.
  • D. Thu thập dữ liệu từ tương lai.

Câu 30: Khi một nhà khoa học dữ liệu sử dụng các công cụ trên máy tính để tìm kiếm các mối tương quan giữa các biến khác nhau trong một tập dữ liệu (ví dụ: mối liên hệ giữa chi tiêu quảng cáo và doanh thu), họ đang thực hiện bước nào trong quy trình khoa học dữ liệu?

  • A. Phân tích dữ liệu (Data Analysis).
  • B. Thu thập dữ liệu (Data Collection).
  • C. Trực quan hóa dữ liệu (Data Visualization).
  • D. Triển khai mô hình (Model Deployment).

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 22: Việc sử dụng các công cụ trực quan hóa dữ liệu trên máy tính giúp người làm khoa học dữ liệu thực hiện điều gì một cách hiệu quả hơn?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 23: Giả sử bạn có một tập dữ liệu khách hàng rất lớn và muốn phân loại khách hàng thành các nhóm dựa trên hành vi mua sắm của họ (phân khúc khách hàng). Quá trình này đòi hỏi chạy một thuật toán phân cụm (clustering algorithm). Máy tính hỗ trợ bạn trong bước nào của quá trình này?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 24: Trong bối cảnh khoa học dữ liệu, 'ETL' (Extract, Transform, Load) là một quy trình phổ biến. Máy tính đóng vai trò then chốt trong giai đoạn 'Transform' (Biến đổi) như thế nào?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 25: Việc sử dụng mạng lưới siêu máy tính trong HGP là một ví dụ về ứng dụng của khả năng nào của máy tính trong khoa học dữ liệu?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 26: Một lợi thế của việc sử dụng điện toán đám mây cho các dự án khoa học dữ liệu là khả năng cộng tác. Điều này được thể hiện qua khía cạnh nào?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 27: Khi một thuật toán học máy được 'huấn luyện' (trained) trên một tập dữ liệu khổng lồ để nhận dạng vật thể trong ảnh, quá trình này đòi hỏi hàng tỷ phép tính. Vai trò nào của máy tính là *thiết yếu nhất* để quá trình huấn luyện này hoàn thành trong khoảng thời gian hợp lý?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 28: Tự động hóa các báo cáo định kỳ dựa trên dữ liệu bán hàng là một ứng dụng phổ biến trong khoa học dữ liệu kinh doanh. Lợi ích chính của việc tự động hóa này là gì?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 29: Việc sử dụng máy tính để xây dựng các mô hình mô phỏng phức tạp (ví dụ: mô phỏng biến đổi khí hậu, mô phỏng thị trường chứng khoán) dựa trên dữ liệu lịch sử và các giả định là một ứng dụng của khoa học dữ liệu. Máy tính hỗ trợ khả năng nào trong việc này?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 9

Câu 30: Khi một nhà khoa học dữ liệu sử dụng các công cụ trên máy tính để tìm kiếm các mối tương quan giữa các biến khác nhau trong một tập dữ liệu (ví dụ: mối liên hệ giữa chi tiêu quảng cáo và doanh thu), họ đang thực hiện bước nào trong quy trình khoa học dữ liệu?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 1: Khi bắt đầu thực hiện dự án website tổng hợp trong Bài 28, việc lựa chọn chủ đề phù hợp là bước đầu tiên. Tiêu chí quan trọng nhất để đánh giá sự phù hợp của một chủ đề là gì?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 2: Bạn đã chọn chủ đề và xác định đối tượng độc giả mục tiêu cho website của mình. Bước tiếp theo quan trọng trong giai đoạn chuẩn bị là gì để đảm bảo cấu trúc trang web mạch lạc?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 3: Website của bạn cần trình bày thông tin về một địa điểm du lịch. Bạn có nhiều ảnh đẹp và một đoạn video ngắn. Để trang web hấp dẫn và truyền tải thông tin hiệu quả, bạn nên ưu tiên sử dụng loại tư liệu nào và đặt chúng ở đâu?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 4: Bạn đang thiết kế bố cục cho một trang nội dung trong Google Sites. Trang này có một bài viết dài và nhiều hình ảnh minh họa. Để giúp người đọc dễ theo dõi và không bị 'ngợp', bạn nên áp dụng nguyên tắc bố cục nào?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 5: Website của bạn có các trang con như 'Giới thiệu', 'Sản phẩm', 'Liên hệ'. Để người dùng có thể dễ dàng chuyển đổi giữa các trang này, bạn cần xây dựng một hệ thống điều hướng. Tính năng nào trong Google Sites giúp bạn thực hiện điều này một cách hiệu quả nhất?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 6: Bạn muốn thu thập thông tin phản hồi từ khách truy cập, ví dụ: tên, email và ý kiến của họ. Công cụ nào được tích hợp hoặc dễ dàng nhúng vào Google Sites để tạo một giao diện nhập liệu cho mục đích này?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 7: Khi thiết kế thanh điều hướng cho website, bạn cần quyết định vị trí hiển thị (trên cùng hoặc bên cạnh) và kiểu hiển thị (ngang hoặc dọc). Quyết định này nên dựa vào yếu tố nào là chính?

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 8: Bạn đã hoàn thành việc xây dựng website với đầy đủ nội dung và các tính năng cơ bản. Bước cuối cùng và rất quan trọng trước khi 'xuất bản' trang web là gì?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 9: Một trong những yêu cầu đối với sản phẩm cuối cùng trong Bài 28 là thuyết minh về website. Nội dung chính của bài thuyết minh này nên tập trung vào điều gì?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 10: Khi sử dụng hình ảnh trên website, bạn cần chú ý đến vấn đề bản quyền. Điều nào sau đây là cách tốt nhất để đảm bảo bạn không vi phạm bản quyền hình ảnh?

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 11: Bạn muốn thêm một đoạn âm thanh hoặc một bài hát làm nhạc nền cho một trang cụ thể. Trong Google Sites, cách phổ biến và hiệu quả để nhúng nội dung âm thanh là gì?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 12: Website của bạn có một trang 'Thư viện' chứa nhiều ảnh. Bạn muốn hiển thị chúng theo kiểu trình chiếu để tiết kiệm không gian và trông chuyên nghiệp hơn. Tính năng nào trong Google Sites hỗ trợ điều này?

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 13: Màu sắc và phông chữ đóng vai trò quan trọng trong thẩm mỹ và khả năng đọc của website. Khi lựa chọn màu sắc và phông chữ, bạn nên cân nhắc điều gì đầu tiên?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 14: Bạn muốn tạo liên kết từ một từ hoặc cụm từ trong bài viết của mình đến một trang khác *trong cùng* website. Thao tác đúng trong Google Sites là gì?

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 15: Chân trang (footer) của website thường được sử dụng để chứa những loại thông tin nào?

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 16: Khi chuẩn bị tư liệu cho website, bạn thu thập được nhiều file tài liệu dạng PDF, Word, Excel... Bạn muốn người dùng có thể xem hoặc tải về các tài liệu này trực tiếp từ website. Tính năng nào của Google Sites hỗ trợ tốt nhất việc nhúng hoặc liên kết đến các loại file này?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 17: Bạn nhận thấy tốc độ tải trang của website mình khá chậm, đặc biệt là trên điện thoại di động. Vấn đề này có thể do nguyên nhân chính nào liên quan đến nội dung bạn đã thêm vào?

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 18: Trong quá trình thực hành, bạn cần tạo một trang mới là 'Album ảnh' nằm dưới trang 'Giới thiệu'. Thao tác nào trong Google Sites giúp bạn thiết lập đúng cấu trúc phân cấp này trên thanh điều hướng?

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 19: Bạn muốn thêm một bản đồ chỉ đường đến địa điểm được giới thiệu trên website. Tính năng nào trong Google Sites cho phép bạn dễ dàng nhúng bản đồ tương tác?

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 20: Website của bạn có mục đích chia sẻ kiến thức về một chủ đề khoa học. Khi viết nội dung, điều quan trọng nhất cần đảm bảo là gì?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành tổng hợp

Tags: Bộ đề 9

Câu 21: Bạn đã tạo một biểu mẫu Google Forms để thu thập thông tin. Sau khi nhúng biểu mẫu này vào trang web Google Sites và người dùng gửi phản hồi, dữ liệu phản hồi sẽ được lưu trữ ở đâu theo mặc định?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 10

Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu - Đề 10 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong quy trình khoa học dữ liệu, máy tính đóng vai trò chủ chốt trong việc xử lý các tập dữ liệu có kích thước rất lớn mà phương pháp thủ công không thể thực hiện được. Khả năng này của máy tính chủ yếu liên quan đến khía cạnh nào?

  • A. Khả năng trực quan hóa dữ liệu phức tạp.
  • B. Khả năng tạo ra dữ liệu mới một cách tự động.
  • C. Khả năng tính toán và lưu trữ dữ liệu với dung lượng và tốc độ cao.
  • D. Khả năng giao tiếp với con người bằng ngôn ngữ tự nhiên.

Câu 2: Khoa học dữ liệu thường bao gồm nhiều giai đoạn như thu thập, làm sạch, phân tích, mô hình hóa và trực quan hóa dữ liệu. Máy tính hỗ trợ hiệu quả nhất ở giai đoạn nào đòi hỏi lặp đi lặp lại các thao tác xử lý trên toàn bộ tập dữ liệu lớn?

  • A. Thu thập dữ liệu ban đầu.
  • B. Làm sạch và tiền xử lý dữ liệu.
  • C. Diễn giải kết quả phân tích.
  • D. Xác định mục tiêu nghiên cứu.

Câu 3: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khổng lồ từ các cảm biến IoT. Để tăng tốc độ phân tích và trích xuất thông tin, họ quyết định sử dụng một hệ thống máy tính có nhiều bộ xử lý hoạt động đồng thời. Kỹ thuật tính toán nào đang được áp dụng trong trường hợp này?

  • A. Xử lý tuần tự.
  • B. Tính toán lượng tử.
  • C. Mã hóa dữ liệu.
  • D. Xử lý song song.

Câu 4: Dự án Hệ gene người (HGP) là một ví dụ điển hình về việc máy tính đóng vai trò thiết yếu trong khoa học dữ liệu quy mô lớn. Vai trò cụ thể nào của máy tính đã giúp đảm bảo tính chính xác cao trong việc xác định trình tự hàng tỷ cặp base DNA?

  • A. Sử dụng các thuật toán phức tạp để ghép các đoạn DNA nhỏ và phát hiện lỗi.
  • B. Khả năng lưu trữ dữ liệu trên giấy.
  • C. Tự động tạo ra các đoạn DNA mới.
  • D. Chỉ đơn thuần hiển thị kết quả dưới dạng văn bản.

Câu 5: Một công ty khởi nghiệp về phân tích dữ liệu muốn triển khai một mô hình học máy yêu cầu sức mạnh tính toán rất lớn nhưng không muốn đầu tư ban đầu vào cơ sở hạ tầng máy chủ đắt tiền. Giải pháp công nghệ nào mà họ có thể lựa chọn để giải quyết vấn đề này?

  • A. Sử dụng máy tính cá nhân thông thường.
  • B. Sử dụng dịch vụ điện toán đám mây (Cloud Computing).
  • C. Thuê thêm nhân viên nhập liệu.
  • D. Giảm kích thước tập dữ liệu.

Câu 6: Việc tự động hóa các tác vụ lặp đi lặp lại như thu thập dữ liệu từ web, làm sạch dữ liệu theo quy tắc nhất định giúp ích gì nhiều nhất cho nhà khoa học dữ liệu?

  • A. Tăng chi phí thực hiện dự án.
  • B. Yêu cầu sự can thiệp thủ công nhiều hơn.
  • C. Tăng tốc độ xử lý và giảm thiểu lỗi do con người.
  • D. Làm cho quy trình trở nên khó hiểu hơn.

Câu 7: Trong phân tích dữ liệu, trực quan hóa (visualization) là một bước quan trọng để trình bày kết quả. Máy tính hỗ trợ trực quan hóa bằng cách nào?

  • A. Cung cấp các công cụ phần mềm để tạo biểu đồ, đồ thị, bản đồ tương tác từ dữ liệu.
  • B. Tự động giải thích ý nghĩa của biểu đồ.
  • C. Chỉ hiển thị dữ liệu dưới dạng bảng tính.
  • D. Lưu trữ hình ảnh của biểu đồ đã vẽ tay.

Câu 8: Một hệ thống dự báo thời tiết sử dụng dữ liệu từ hàng nghìn trạm khí tượng và vệ tinh để đưa ra dự báo trong vài giờ tới. Hệ thống này đòi hỏi khả năng phân tích dữ liệu loại nào?

  • A. Phân tích dữ liệu cũ.
  • B. Phân tích dữ liệu bằng tay.
  • C. Phân tích chỉ một phần nhỏ dữ liệu.
  • D. Phân tích dữ liệu thời gian thực (real-time analysis).

Câu 9: Tại sao khả năng mở rộng (scalability) của cơ sở hạ tầng tính toán lại quan trọng đối với các dự án khoa học dữ liệu lớn, ví dụ như phân tích dữ liệu từ các kính viễn vọng hiện đại?

  • A. Cho phép xử lý khối lượng dữ liệu ngày càng tăng mà không cần thay đổi toàn bộ hệ thống.
  • B. Giảm bớt nhu cầu về phần mềm phân tích.
  • C. Chỉ hỗ trợ lưu trữ dữ liệu, không liên quan đến xử lý.
  • D. Làm cho dữ liệu trở nên ít phức tạp hơn.

Câu 10: Trong khoa học dữ liệu, thuật toán học máy (machine learning algorithms) thường được sử dụng để tìm kiếm các mẫu ẩn, xây dựng mô hình dự đoán hoặc phân loại. Vai trò của máy tính trong việc triển khai các thuật toán này là gì?

  • A. Tự động thiết kế thuật toán mới từ đầu.
  • B. Chỉ lưu trữ mã nguồn của thuật toán.
  • C. Cung cấp sức mạnh tính toán để huấn luyện mô hình trên dữ liệu lớn và thực hiện dự đoán.
  • D. Chỉ hiển thị kết quả cuối cùng mà không thực hiện tính toán.

Câu 11: Giả sử bạn có một tập dữ liệu về hành vi mua sắm của hàng triệu khách hàng. Để tìm ra các nhóm khách hàng có hành vi tương đồng (phân khúc khách hàng), bạn có thể sử dụng một thuật toán phân cụm (clustering). Máy tính sẽ hỗ trợ bạn trong quá trình này như thế nào?

  • A. Tự động đặt tên cho các phân khúc khách hàng.
  • B. Thực hiện các phép tính toán lặp đi lặp lại để nhóm khách hàng dựa trên đặc điểm của họ.
  • C. Chọn ngẫu nhiên một vài khách hàng làm đại diện cho mỗi nhóm.
  • D. Chỉ lưu trữ thông tin về các giao dịch mua sắm.

Câu 12: Một thách thức lớn khi làm việc với Big Data là tốc độ xử lý. Kỹ thuật xử lý song song giúp giải quyết thách thức này bằng cách nào?

  • A. Chia nhỏ bài toán xử lý dữ liệu thành nhiều phần và thực hiện đồng thời trên nhiều bộ xử lý.
  • B. Giảm bớt dung lượng của tập dữ liệu.
  • C. Lưu trữ dữ liệu trên nhiều ổ cứng riêng biệt.
  • D. Thực hiện các bước xử lý một cách tuần tự nhưng nhanh hơn.

Câu 13: Việc sử dụng các thư viện và framework lập trình chuyên biệt cho khoa học dữ liệu (ví dụ: Pandas, NumPy, Scikit-learn trong Python) trên máy tính giúp nhà khoa học dữ liệu làm gì?

  • A. Giảm bớt nhu cầu sử dụng máy tính.
  • B. Phải viết lại tất cả các thuật toán từ đầu.
  • C. Chỉ hỗ trợ trực quan hóa dữ liệu.
  • D. Thực hiện các tác vụ xử lý, phân tích và mô hình hóa dữ liệu phức tạp một cách hiệu quả và nhanh chóng.

Câu 14: Một nhà nghiên cứu muốn phân tích hàng triệu hình ảnh y tế để phát hiện sớm dấu hiệu bệnh. Đây là một bài toán điển hình của thị giác máy tính (computer vision), một lĩnh vực ứng dụng của khoa học dữ liệu. Máy tính đóng vai trò nào để xử lý lượng dữ liệu hình ảnh khổng lồ này?

  • A. Cung cấp sức mạnh tính toán cho các mạng nơ-ron sâu (deep neural networks) để học và nhận dạng mẫu trong ảnh.
  • B. Chỉ hiển thị hình ảnh trên màn hình.
  • C. Tự động tạo ra các hình ảnh y tế mới.
  • D. Chỉ lưu trữ các tập tin hình ảnh.

Câu 15: Điện toán đám mây mang lại lợi ích về tính linh hoạt và khả năng mở rộng cho khoa học dữ liệu. Điều này có ý nghĩa gì khi nhu cầu tính toán của một dự án tăng lên đột ngột?

  • A. Dự án sẽ bị dừng lại do thiếu tài nguyên.
  • B. Phải mua thêm máy chủ vật lý mới.
  • C. Có thể dễ dàng thuê thêm tài nguyên tính toán từ nhà cung cấp đám mây theo nhu cầu.
  • D. Chỉ có thể xử lý một phần nhỏ dữ liệu.

Câu 16: Trong quá trình làm sạch dữ liệu, máy tính có thể giúp phát hiện và xử lý các giá trị thiếu, ngoại lai (outliers) hoặc không nhất quán. Điều này được thực hiện chủ yếu thông qua:

  • A. Khả năng in ấn dữ liệu.
  • B. Khả năng tạo ra dữ liệu hoàn toàn mới.
  • C. Việc yêu cầu người dùng kiểm tra thủ công từng dòng dữ liệu.
  • D. Áp dụng các thuật toán và quy tắc được định nghĩa trước để kiểm tra và biến đổi dữ liệu.

Câu 17: Khoa học dữ liệu thường liên quan đến việc xây dựng các mô hình dự báo. Ví dụ, dự đoán giá nhà dựa trên diện tích, vị trí, số phòng ngủ, v.v. Máy tính hỗ trợ quá trình này bằng cách nào?

  • A. Thực hiện các phép tính phức tạp để tìm ra mối quan hệ giữa các yếu tố đầu vào và kết quả dự đoán (huấn luyện mô hình).
  • B. Đưa ra dự đoán dựa trên cảm tính.
  • C. Chỉ lưu trữ dữ liệu về giá nhà cũ.
  • D. Vẽ biểu đồ giá nhà theo thời gian.

Câu 18: Một công ty thương mại điện tử muốn phân tích dữ liệu lịch sử mua hàng để đưa ra gợi ý sản phẩm phù hợp cho từng khách hàng (hệ thống khuyến nghị). Đây là một ứng dụng của khoa học dữ liệu. Máy tính đóng vai trò nào quan trọng nhất trong việc này?

  • A. Chỉ hiển thị danh sách tất cả sản phẩm.
  • B. Xử lý lượng lớn dữ liệu hành vi khách hàng và áp dụng thuật toán để tìm ra mối liên hệ và đưa ra gợi ý cá nhân hóa.
  • C. Tự động sản xuất sản phẩm mới.
  • D. Gửi email quảng cáo hàng loạt.

Câu 19: Khi làm việc với dữ liệu lớn, việc tải toàn bộ dữ liệu vào bộ nhớ RAM của một máy tính duy nhất thường là không khả thi. Máy tính và hệ thống phân tán giải quyết vấn đề này như thế nào?

  • A. Nén dữ liệu đến mức tối đa để vừa với bộ nhớ.
  • B. Chỉ xử lý một phần nhỏ dữ liệu mỗi lần.
  • C. Lưu trữ dữ liệu trên đĩa cứng và không sử dụng bộ nhớ RAM.
  • D. Phân tán dữ liệu và quá trình xử lý trên nhiều máy tính hoặc cụm máy tính.

Câu 20: Một trong những thách thức khi ứng dụng khoa học dữ liệu là đảm bảo tính riêng tư và bảo mật của dữ liệu nhạy cảm. Máy tính hỗ trợ giải quyết thách thức này bằng cách nào?

  • A. Cung cấp các công cụ mã hóa, kiểm soát truy cập và các biện pháp an ninh mạng.
  • B. Tự động xóa tất cả dữ liệu sau khi phân tích.
  • C. Chỉ làm việc với dữ liệu công khai.
  • D. Lưu trữ dữ liệu trên các thiết bị không kết nối mạng.

Câu 21: Phân tích cảm xúc (Sentiment Analysis) là một kỹ thuật khoa học dữ liệu dùng để xác định thái độ (tích cực, tiêu cực, trung lập) của người viết đối với một chủ đề nào đó dựa trên văn bản. Máy tính hỗ trợ phân tích cảm xúc bằng cách nào?

  • A. Yêu cầu người dùng đọc và gán nhãn cảm xúc cho từng đoạn văn bản.
  • B. Áp dụng các thuật toán xử lý ngôn ngữ tự nhiên (NLP) để phân tích cấu trúc và từ vựng của văn bản.
  • C. Chỉ đếm số lượng từ trong văn bản.
  • D. Tạo ra các văn bản mới có cảm xúc rõ ràng.

Câu 22: Mô hình hóa dữ liệu (Data Modeling) là quá trình tạo ra cấu trúc hoặc biểu diễn dữ liệu để dễ dàng lưu trữ, truy cập và phân tích. Máy tính hỗ trợ bước này như thế nào trong khoa học dữ liệu?

  • A. Tự động tạo ra ý nghĩa của dữ liệu.
  • B. Chỉ lưu trữ dữ liệu mà không cần cấu trúc.
  • C. Cung cấp các hệ quản trị cơ sở dữ liệu (DBMS) và công cụ để thiết kế, triển khai và quản lý các cấu trúc dữ liệu phức tạp.
  • D. Chỉ vẽ sơ đồ mô hình trên giấy.

Câu 23: Một nhà khoa học dữ liệu đang sử dụng máy tính để chạy một thuật toán học sâu (deep learning) trên một bộ dữ liệu hình ảnh rất lớn. Quá trình này mất nhiều giờ đồng hồ ngay cả trên máy tính mạnh. Điều này minh họa thách thức nào khi làm việc với dữ liệu lớn và các mô hình phức tạp?

  • A. Nhu cầu về tài nguyên tính toán (sức mạnh xử lý và thời gian).
  • B. Khó khăn trong việc trực quan hóa kết quả.
  • C. Thiếu dữ liệu để huấn luyện mô hình.
  • D. Dữ liệu có quá ít biến.

Câu 24: Trong y học, khoa học dữ liệu được ứng dụng để phân tích dữ liệu bệnh nhân nhằm tìm ra phác đồ điều trị hiệu quả. Máy tính giúp sức trong việc này chủ yếu thông qua:

  • A. Thay thế hoàn toàn bác sĩ trong việc chẩn đoán.
  • B. Chỉ lưu trữ hồ sơ bệnh án điện tử.
  • C. In ra các bài báo khoa học.
  • D. Xử lý và phân tích các tập dữ liệu y tế lớn (ví dụ: hình ảnh, kết quả xét nghiệm, tiền sử bệnh án) để tìm ra các mối liên hệ, xu hướng và hỗ trợ bác sĩ đưa ra quyết định.

Câu 25: Tích hợp dữ liệu từ nhiều nguồn khác nhau (ví dụ: cơ sở dữ liệu bán hàng, dữ liệu website, dữ liệu mạng xã hội) là một bước quan trọng trong khoa học dữ liệu. Máy tính hỗ trợ quá trình tích hợp này bằng cách nào?

  • A. Yêu cầu người dùng sao chép và dán dữ liệu thủ công.
  • B. Cung cấp các công cụ và nền tảng (ETL - Extract, Transform, Load) để kết nối, chuyển đổi và hợp nhất dữ liệu từ các định dạng và nguồn khác nhau.
  • C. Chỉ làm việc với dữ liệu từ một nguồn duy nhất.
  • D. Tự động tạo ra dữ liệu giả để lấp đầy chỗ trống.

Câu 26: Một nhà khoa học dữ liệu muốn so sánh hiệu quả của hai thuật toán phân loại khác nhau trên cùng một tập dữ liệu. Máy tính hỗ trợ quá trình này bằng cách nào hiệu quả nhất?

  • A. Đưa ra ý kiến chủ quan về thuật toán nào tốt hơn.
  • B. Chỉ cho phép chạy một thuật toán duy nhất.
  • C. Thực hiện các thử nghiệm lặp đi lặp lại, tính toán các chỉ số đánh giá (ví dụ: độ chính xác, độ đo F1) cho từng thuật toán và so sánh kết quả một cách khách quan.
  • D. Vẽ biểu đồ so sánh bằng tay.

Câu 27: Khả năng xử lý lặp (iteration) và điều kiện (condition) của máy tính là nền tảng cho việc triển khai các thuật toán trong khoa học dữ liệu. Điều này đặc biệt quan trọng trong giai đoạn nào của quy trình khoa học dữ liệu, nơi các phép tính cần được lặp lại hàng triệu, hàng tỷ lần?

  • A. Huấn luyện mô hình học máy.
  • B. Viết báo cáo kết quả.
  • C. Trình bày kết quả cho người không chuyên.
  • D. Xác định câu hỏi nghiên cứu ban đầu.

Câu 28: Một công ty muốn phân tích dữ liệu bán hàng theo thời gian để dự báo doanh số cho quý tiếp theo. Đây là một bài toán chuỗi thời gian (time series forecasting). Máy tính hỗ trợ bài toán này bằng cách nào?

  • A. Chỉ hiển thị dữ liệu bán hàng dưới dạng bảng.
  • B. Đưa ra dự báo dựa trên kinh nghiệm của nhân viên bán hàng.
  • C. Tự động tạo ra dữ liệu bán hàng giả trong tương lai.
  • D. Áp dụng các mô hình dự báo chuỗi thời gian (ví dụ: ARIMA, Prophet, mô hình học máy) để phân tích xu hướng, tính mùa vụ và đưa ra dự báo dựa trên dữ liệu lịch sử.

Câu 29: Khi làm việc với dữ liệu có cấu trúc phức tạp hoặc dữ liệu phi cấu trúc (ví dụ: văn bản, hình ảnh, âm thanh), máy tính cần có khả năng xử lý các định dạng dữ liệu đa dạng này. Điều này liên quan đến khả năng nào của máy tính trong khoa học dữ liệu?

  • A. Khả năng in ấn dữ liệu.
  • B. Khả năng đọc, xử lý và chuyển đổi các định dạng dữ liệu khác nhau.
  • C. Chỉ làm việc với dữ liệu dạng bảng đơn giản.
  • D. Tự động tạo ra cấu trúc cho dữ liệu phi cấu trúc.

Câu 30: Vai trò của máy tính trong việc thúc đẩy sự hợp tác trong các dự án khoa học dữ liệu quy mô lớn (như HGP) được thể hiện rõ nhất qua khía cạnh nào?

  • A. Cung cấp nền tảng chia sẻ dữ liệu, mã nguồn, kết quả và công cụ làm việc chung cho các nhóm nghiên cứu phân tán địa lý.
  • B. Giảm thiểu nhu cầu giao tiếp giữa các thành viên nhóm.
  • C. Yêu cầu tất cả thành viên làm việc trên cùng một máy tính vật lý.
  • D. Làm cho dữ liệu trở nên khó hiểu đối với các nhóm khác.

1 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 1: Trong quy trình khoa học dữ liệu, máy tính đóng vai trò chủ chốt trong việc xử lý các tập dữ liệu có kích thước rất lớn mà phương pháp thủ công không thể thực hiện được. Khả năng này của máy tính chủ yếu liên quan đến khía cạnh nào?

2 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 2: Khoa học dữ liệu thường bao gồm nhiều giai đoạn như thu thập, làm sạch, phân tích, mô hình hóa và trực quan hóa dữ liệu. Máy tính hỗ trợ hiệu quả nhất ở giai đoạn nào đòi hỏi lặp đi lặp lại các thao tác xử lý trên toàn bộ tập dữ liệu lớn?

3 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 3: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khổng lồ từ các cảm biến IoT. Để tăng tốc độ phân tích và trích xuất thông tin, họ quyết định sử dụng một hệ thống máy tính có nhiều bộ xử lý hoạt động đồng thời. Kỹ thuật tính toán nào đang được áp dụng trong trường hợp này?

4 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 4: Dự án Hệ gene người (HGP) là một ví dụ điển hình về việc máy tính đóng vai trò thiết yếu trong khoa học dữ liệu quy mô lớn. Vai trò cụ thể nào của máy tính đã giúp đảm bảo tính chính xác cao trong việc xác định trình tự hàng tỷ cặp base DNA?

5 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 5: Một công ty khởi nghiệp về phân tích dữ liệu muốn triển khai một mô hình học máy yêu cầu sức mạnh tính toán rất lớn nhưng không muốn đầu tư ban đầu vào cơ sở hạ tầng máy chủ đắt tiền. Giải pháp công nghệ nào mà họ có thể lựa chọn để giải quyết vấn đề này?

6 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 6: Việc tự động hóa các tác vụ lặp đi lặp lại như thu thập dữ liệu từ web, làm sạch dữ liệu theo quy tắc nhất định giúp ích gì nhiều nhất cho nhà khoa học dữ liệu?

7 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 7: Trong phân tích dữ liệu, trực quan hóa (visualization) là một bước quan trọng để trình bày kết quả. Máy tính hỗ trợ trực quan hóa bằng cách nào?

8 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 8: Một hệ thống dự báo thời tiết sử dụng dữ liệu từ hàng nghìn trạm khí tượng và vệ tinh để đưa ra dự báo trong vài giờ tới. Hệ thống này đòi hỏi khả năng phân tích dữ liệu loại nào?

9 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 9: Tại sao khả năng mở rộng (scalability) của cơ sở hạ tầng tính toán lại quan trọng đối với các dự án khoa học dữ liệu lớn, ví dụ như phân tích dữ liệu từ các kính viễn vọng hiện đại?

10 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 10: Trong khoa học dữ liệu, thuật toán học máy (machine learning algorithms) thường được sử dụng để tìm kiếm các mẫu ẩn, xây dựng mô hình dự đoán hoặc phân loại. Vai trò của máy tính trong việc triển khai các thuật toán này là gì?

11 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 11: Giả sử bạn có một tập dữ liệu về hành vi mua sắm của hàng triệu khách hàng. Để tìm ra các nhóm khách hàng có hành vi tương đồng (phân khúc khách hàng), bạn có thể sử dụng một thuật toán phân cụm (clustering). Máy tính sẽ hỗ trợ bạn trong quá trình này như thế nào?

12 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 12: Một thách thức lớn khi làm việc với Big Data là tốc độ xử lý. Kỹ thuật xử lý song song giúp giải quyết thách thức này bằng cách nào?

13 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 13: Việc sử dụng các thư viện và framework lập trình chuyên biệt cho khoa học dữ liệu (ví dụ: Pandas, NumPy, Scikit-learn trong Python) trên máy tính giúp nhà khoa học dữ liệu làm gì?

14 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 14: Một nhà nghiên cứu muốn phân tích hàng triệu hình ảnh y tế để phát hiện sớm dấu hiệu bệnh. Đây là một bài toán điển hình của thị giác máy tính (computer vision), một lĩnh vực ứng dụng của khoa học dữ liệu. Máy tính đóng vai trò nào để xử lý lượng dữ liệu hình ảnh khổng lồ này?

15 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 15: Điện toán đám mây mang lại lợi ích về tính linh hoạt và khả năng mở rộng cho khoa học dữ liệu. Điều này có ý nghĩa gì khi nhu cầu tính toán của một dự án tăng lên đột ngột?

16 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 16: Trong quá trình làm sạch dữ liệu, máy tính có thể giúp phát hiện và xử lý các giá trị thiếu, ngoại lai (outliers) hoặc không nhất quán. Điều này được thực hiện chủ yếu thông qua:

17 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 17: Khoa học dữ liệu thường liên quan đến việc xây dựng các mô hình dự báo. Ví dụ, dự đoán giá nhà dựa trên diện tích, vị trí, số phòng ngủ, v.v. Máy tính hỗ trợ quá trình này bằng cách nào?

18 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 18: Một công ty thương mại điện tử muốn phân tích dữ liệu lịch sử mua hàng để đưa ra gợi ý sản phẩm phù hợp cho từng khách hàng (hệ thống khuyến nghị). Đây là một ứng dụng của khoa học dữ liệu. Máy tính đóng vai trò nào quan trọng nhất trong việc này?

19 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 19: Khi làm việc với dữ liệu lớn, việc tải toàn bộ dữ liệu vào bộ nhớ RAM của một máy tính duy nhất thường là không khả thi. Máy tính và hệ thống phân tán giải quyết vấn đề này như thế nào?

20 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 20: Một trong những thách thức khi ứng dụng khoa học dữ liệu là đảm bảo tính riêng tư và bảo mật của dữ liệu nhạy cảm. Máy tính hỗ trợ giải quyết thách thức này bằng cách nào?

21 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 21: Phân tích cảm xúc (Sentiment Analysis) là một kỹ thuật khoa học dữ liệu dùng để xác định thái độ (tích cực, tiêu cực, trung lập) của người viết đối với một chủ đề nào đó dựa trên văn bản. Máy tính hỗ trợ phân tích cảm xúc bằng cách nào?

22 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 22: Mô hình hóa dữ liệu (Data Modeling) là quá trình tạo ra cấu trúc hoặc biểu diễn dữ liệu để dễ dàng lưu trữ, truy cập và phân tích. Máy tính hỗ trợ bước này như thế nào trong khoa học dữ liệu?

23 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 23: Một nhà khoa học dữ liệu đang sử dụng máy tính để chạy một thuật toán học sâu (deep learning) trên một bộ dữ liệu hình ảnh rất lớn. Quá trình này mất nhiều giờ đồng hồ ngay cả trên máy tính mạnh. Điều này minh họa thách thức nào khi làm việc với dữ liệu lớn và các mô hình phức tạp?

24 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 24: Trong y học, khoa học dữ liệu được ứng dụng để phân tích dữ liệu bệnh nhân nhằm tìm ra phác đồ điều trị hiệu quả. Máy tính giúp sức trong việc này chủ yếu thông qua:

25 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 25: Tích hợp dữ liệu từ nhiều nguồn khác nhau (ví dụ: cơ sở dữ liệu bán hàng, dữ liệu website, dữ liệu mạng xã hội) là một bước quan trọng trong khoa học dữ liệu. Máy tính hỗ trợ quá trình tích hợp này bằng cách nào?

26 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 26: Một nhà khoa học dữ liệu muốn so sánh hiệu quả của hai thuật toán phân loại khác nhau trên cùng một tập dữ liệu. Máy tính hỗ trợ quá trình này bằng cách nào hiệu quả nhất?

27 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 27: Khả năng xử lý lặp (iteration) và điều kiện (condition) của máy tính là nền tảng cho việc triển khai các thuật toán trong khoa học dữ liệu. Điều này đặc biệt quan trọng trong giai đoạn nào của quy trình khoa học dữ liệu, nơi các phép tính cần được lặp lại hàng triệu, hàng tỷ lần?

28 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 28: Một công ty muốn phân tích dữ liệu bán hàng theo thời gian để dự báo doanh số cho quý tiếp theo. Đây là một bài toán chuỗi thời gian (time series forecasting). Máy tính hỗ trợ bài toán này bằng cách nào?

29 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 29: Khi làm việc với dữ liệu có cấu trúc phức tạp hoặc dữ liệu phi cấu trúc (ví dụ: văn bản, hình ảnh, âm thanh), máy tính cần có khả năng xử lý các định dạng dữ liệu đa dạng này. Điều này liên quan đến khả năng nào của máy tính trong khoa học dữ liệu?

30 / 30

Category: Trắc nghiệm Tin học 12 Kết nối tri thức Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 30: Vai trò của máy tính trong việc thúc đẩy sự hợp tác trong các dự án khoa học dữ liệu quy mô lớn (như HGP) được thể hiện rõ nhất qua khía cạnh nào?

Xem kết quả