Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành trải nghiệm trích rút thông tin và tri thức - Đề 08
Trắc nghiệm Tin học 12 Kết nối tri thức Bài 28: Thực hành trải nghiệm trích rút thông tin và tri thức - Đề 08 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Khi bắt đầu một dự án trích rút thông tin từ một bảng dữ liệu thô tải về từ Internet chứa nhiều cột và hàng, bước đầu tiên quan trọng nhất trong quy trình xử lý dữ liệu là gì để đảm bảo dữ liệu sẵn sàng cho phân tích?
- A. Trực quan hóa dữ liệu bằng biểu đồ.
- B. Áp dụng các thuật toán học máy.
- C. Tiền xử lý dữ liệu (Data Preprocessing).
- D. Viết báo cáo kết quả phân tích.
Câu 2: Bạn đang sử dụng Power Query để làm sạch dữ liệu khách hàng. Cột "Ngày sinh" có một số giá trị bị nhập sai định dạng hoặc bỏ trống. Thao tác nào trong Power Query giúp bạn xử lý vấn đề này một cách hiệu quả?
- A. Sử dụng chức năng "Group By".
- B. Tạo "Conditional Column" dựa trên ngày sinh.
- C. Áp dụng "Pivot Column".
- D. Thay đổi kiểu dữ liệu của cột và xử lý các giá trị lỗi/trống.
Câu 3: Một bảng dữ liệu bán hàng có cột "Doanh thu" và cột "Khu vực". Bạn muốn biết tổng doanh thu của từng khu vực. Công cụ nào trong Excel giúp bạn tổng hợp thông tin này một cách nhanh chóng mà không cần dùng công thức phức tạp?
- A. PivotTable.
- B. Conditional Formatting.
- C. Data Validation.
- D. Goal Seek.
Câu 4: Khi sử dụng PivotTable để phân tích dữ liệu bán hàng, bạn kéo cột "Khu vực" vào vùng "Rows" và cột "Doanh thu" vào vùng "Values". Kết quả mặc định bạn nhận được trong vùng "Values" thường là gì?
- A. Số lượng đơn hàng trong từng khu vực.
- B. Tổng doanh thu của từng khu vực.
- C. Doanh thu trung bình của từng khu vực.
- D. Doanh thu lớn nhất trong từng khu vực.
Câu 5: Bạn có một cột "Điểm số" trong bảng dữ liệu và muốn phân loại học sinh thành các nhóm "Giỏi", "Khá", "Trung bình", "Yếu" dựa trên điểm số. Trong Power Query, chức năng nào phù hợp nhất để thực hiện việc phân loại này dựa trên các điều kiện (ví dụ: Điểm > 8 là Giỏi, 6.5 <= Điểm <= 8 là Khá, ...)?
- A. Merge Queries.
- B. Append Queries.
- C. Conditional Column.
- D. Group By.
Câu 6: Bạn đã tạo một PivotTable tổng hợp số lượng sản phẩm bán ra theo từng loại sản phẩm và từng tháng. Để dễ dàng so sánh tỷ lệ đóng góp của mỗi loại sản phẩm vào tổng doanh số hàng tháng, bạn nên điều chỉnh cách hiển thị trong vùng "Values" của PivotTable như thế nào?
- A. Hiển thị dưới dạng "Count".
- B. Hiển thị dưới dạng "Average".
- C. Hiển thị dưới dạng "Show Values As -> % of Grand Total".
- D. Hiển thị dưới dạng "Show Values As -> % of Column Total".
Câu 7: Sau khi tổng hợp dữ liệu bán hàng bằng PivotTable, bạn muốn tạo biểu đồ để trực quan hóa xu hướng doanh thu của các khu vực theo thời gian. Loại biểu đồ nào thường được sử dụng để thể hiện xu hướng thay đổi của dữ liệu theo một trục liên tục như thời gian?
- A. Line Chart (Biểu đồ đường).
- B. Pie Chart (Biểu đồ tròn).
- C. Scatter Plot (Biểu đồ phân tán).
- D. Bar Chart (Biểu đồ cột ngang).
Câu 8: Bạn nhận được một bảng dữ liệu khảo sát ý kiến khách hàng. Cột "Ý kiến" chứa các câu trả lời dạng văn bản. Mục tiêu của bạn là trích rút ra các từ khóa hoặc chủ đề chính mà khách hàng đề cập nhiều nhất. Đây là một ví dụ về việc trích rút loại thông tin/tri thức nào?
- A. Trích rút thông tin định lượng.
- B. Trích rút thông tin phi cấu trúc (ví dụ: từ văn bản).
- C. Trích rút thông tin từ cơ sở dữ liệu quan hệ.
- D. Trích rút thông tin địa lý.
Câu 9: Trong quá trình làm sạch dữ liệu bằng Power Query, bạn phát hiện cột "Giá sản phẩm" chứa cả số và ký tự tiền tệ ("USD", "VNĐ"). Để cột này sẵn sàng cho các phép tính toán, bạn cần thực hiện thao tác nào trước tiên?
- A. Nhân tất cả giá trị với 1000.
- B. Sử dụng chức năng "Fill Down".
- C. Tạo "Index Column".
- D. Loại bỏ các ký tự không phải số và chuyển đổi kiểu dữ liệu sang dạng số.
Câu 10: Bạn có một bảng dữ liệu nhân viên bao gồm các cột "Mã nhân viên", "Họ tên", "Phòng ban", "Chức vụ", "Lương". Bạn muốn tạo một danh sách duy nhất các phòng ban hiện có trong công ty. Thao tác nào trong Power Query giúp bạn làm điều này một cách nhanh chóng?
- A. Sử dụng chức năng "Remove Duplicates" trên cột "Phòng ban".
- B. Sử dụng chức năng "Split Column" trên cột "Phòng ban".
- C. Sử dụng chức năng "Pivot Column" trên cột "Phòng ban".
- D. Sử dụng chức năng "Transpose" bảng.
Câu 11: Khi phân tích kết quả từ PivotTable, bạn nhận thấy tổng số khách hàng trong một nhóm thu nhập cụ thể là 250 người, chiếm 10% tổng số khách hàng. Thông tin này giúp bạn rút ra kết luận gì về nhóm thu nhập đó so với tổng thể?
- A. Nhóm thu nhập này có doanh thu cao nhất.
- B. Nhóm thu nhập này có ít khách hàng nhất.
- C. Nhóm thu nhập này chiếm một tỷ lệ nhỏ (10%) trong tổng số khách hàng.
- D. Tất cả khách hàng trong nhóm này đều có khả năng tín dụng tốt.
Câu 12: Bạn đang xây dựng một mô hình dự đoán khả năng tín dụng của khách hàng dựa trên dữ liệu lịch sử. Sau khi thu thập dữ liệu, bước tiếp theo trong quy trình khai phá dữ liệu (data mining) mà bạn cần thực hiện trước khi xây dựng mô hình là gì?
- A. Đánh giá hiệu suất mô hình.
- B. Triển khai mô hình vào thực tế.
- C. Xây dựng thuật toán dự đoán.
- D. Chuẩn bị và làm sạch dữ liệu.
Câu 13: Giả sử bạn có bảng dữ liệu về các giao dịch mua sắm của khách hàng, bao gồm "Mã khách hàng", "Mã sản phẩm", "Ngày mua", "Số lượng", "Tổng tiền". Bạn muốn trích rút thông tin về "Tổng số tiền mỗi khách hàng đã chi tiêu". Bạn sẽ sử dụng công cụ nào và thao tác nào là phù hợp nhất?
- A. Power Query: Sử dụng "Pivot Column" trên cột "Mã khách hàng".
- B. Power Query: Sử dụng "Group By" theo cột "Mã khách hàng" và tính "Sum" cho cột "Tổng tiền".
- C. PivotTable: Kéo "Tổng tiền" vào "Rows" và "Mã khách hàng" vào "Values".
- D. Power Query: Sử dụng "Merge Queries" với chính bảng đó.
Câu 14: Trong quá trình làm việc với Power Query, bạn thực hiện nhiều bước biến đổi dữ liệu (lọc, đổi tên cột, thêm cột mới...). Các bước này được ghi lại ở đâu trong giao diện Power Query Editor?
- A. Applied Steps (Các bước đã áp dụng).
- B. Query Settings (Cài đặt truy vấn).
- C. Formula Bar (Thanh công thức).
- D. Source Settings (Cài đặt nguồn).
Câu 15: Bạn đã tạo một PivotTable hiển thị doanh số theo từng quý trong năm. Bạn muốn thêm một cột mới hiển thị "Tăng trưởng doanh số" so với quý trước. Mặc dù PivotTable không có chức năng trực tiếp cho việc này, bạn có thể sử dụng tính năng nào trong PivotTable để thêm các phép tính tùy chỉnh dựa trên dữ liệu đã tổng hợp?
- A. Conditional Formatting.
- B. Data Validation.
- C. Calculated Field hoặc Calculated Item.
- D. Slicer.
Câu 16: Mục đích chính của việc trực quan hóa dữ liệu (ví dụ: sử dụng biểu đồ) sau khi đã trích rút và tổng hợp thông tin là gì?
- A. Làm cho dữ liệu trông đẹp mắt hơn.
- B. Giúp người xem dễ dàng nhận diện xu hướng, mẫu hình và hiểu được ý nghĩa của dữ liệu.
- C. Thay thế hoàn toàn cho việc phân tích số liệu chi tiết.
- D. Ẩn đi những điểm bất thường trong dữ liệu.
Câu 17: Bạn đang phân tích dữ liệu khảo sát về mức độ hài lòng của khách hàng (thang điểm từ 1 đến 5). Bạn muốn biết tỷ lệ khách hàng đánh giá từ 4 sao trở lên. Sau khi tổng hợp dữ liệu bằng PivotTable, bạn cần thao tác gì để hiển thị kết quả dưới dạng tỷ lệ phần trăm trên tổng số khách hàng?
- A. Trong vùng Values, chọn "Show Values As" -> "% of Grand Total".
- B. Trong vùng Rows, chọn "Sort" theo tỷ lệ phần trăm.
- C. Trong vùng Columns, áp dụng bộ lọc cho điểm số.
- D. Tạo một cột mới trong dữ liệu nguồn tính tỷ lệ.
Câu 18: Khi trích rút thông tin từ một tập dữ liệu lớn, việc xác định các giá trị ngoại lai (outliers) là quan trọng. Giá trị ngoại lai là gì trong bối cảnh phân tích dữ liệu?
- A. Các giá trị trung bình của cột dữ liệu.
- B. Các giá trị xuất hiện nhiều lần nhất trong dữ liệu.
- C. Các giá trị khác biệt đáng kể so với phần lớn dữ liệu còn lại.
- D. Các giá trị bị thiếu hoặc trống.
Câu 19: Bạn có hai bảng dữ liệu trong Power Query: một bảng "Đơn hàng" (chứa Mã khách hàng, Mã sản phẩm, Ngày mua, Số lượng) và một bảng "Khách hàng" (chứa Mã khách hàng, Tên khách hàng, Địa chỉ). Bạn muốn kết hợp hai bảng này để phân tích doanh số theo tên khách hàng. Thao tác nào trong Power Query là phù hợp nhất?
- A. Append Queries.
- B. Group By.
- C. Transpose.
- D. Merge Queries.
Câu 20: Giả sử bạn có dữ liệu về kết quả học tập của học sinh bao gồm "Điểm Toán", "Điểm Văn", "Điểm Anh". Bạn muốn tạo một cột mới tên là "Điểm trung bình" bằng cách tính trung bình cộng của ba môn này. Thao tác nào trong Power Query giúp bạn thực hiện điều này?
- A. Conditional Column.
- B. Custom Column (hoặc Add Column from Examples).
- C. Pivot Column.
- D. Unpivot Columns.
Câu 21: Khi phân tích dữ liệu từ PivotTable, bạn nhận thấy có một số giá trị tổng hợp rất lớn hoặc rất nhỏ so với phần còn lại, cho thấy có thể có lỗi nhập liệu hoặc ngoại lai. Bước tiếp theo hợp lý nhất để xử lý tình huống này là gì?
- A. Quay lại Power Query Editor để kiểm tra và làm sạch dữ liệu nguồn.
- B. Xóa trực tiếp các giá trị đó trong PivotTable.
- C. Thay đổi loại biểu đồ được sử dụng.
- D. Áp dụng thêm bộ lọc trong PivotTable mà không kiểm tra dữ liệu nguồn.
Câu 22: Bạn muốn tạo một báo cáo tóm tắt về số lượng nhân viên theo từng "Chức vụ" và "Phòng ban" từ bảng dữ liệu nhân viên. Công cụ nào trong Excel là hiệu quả nhất để tạo báo cáo tổng hợp này một cách linh hoạt?
- A. Sử dụng hàm SUMIF.
- B. Sử dụng bộ lọc tự động.
- C. Sử dụng PivotTable.
- D. Sử dụng chức năng Sort.
Câu 23: Giả sử bạn có dữ liệu về thời gian phản hồi của tổng đài chăm sóc khách hàng. Cột "Thời gian phản hồi" được ghi bằng phút. Bạn muốn phân loại thời gian phản hồi thành các nhóm "Nhanh" (dưới 5 phút), "Trung bình" (từ 5 đến 15 phút), "Chậm" (trên 15 phút). Bạn sẽ sử dụng chức năng nào trong Power Query?
- A. Conditional Column.
- B. Unpivot Columns.
- C. Append Queries.
- D. Fill Down.
Câu 24: Khi phân tích dữ liệu bằng PivotTable, bạn có thể kéo cùng một cột (ví dụ: "Doanh thu") vào vùng "Values" nhiều lần. Khi đó, bạn có thể thiết lập mỗi lần kéo để hiển thị một loại tổng hợp khác nhau. Điều này cho phép bạn làm gì?
- A. Loại bỏ các giá trị trùng lặp.
- B. Thay đổi thứ tự sắp xếp của các hàng.
- C. Chỉ hiển thị dữ liệu cho một khu vực cụ thể.
- D. Xem cùng dữ liệu theo các góc nhìn khác nhau (ví dụ: Tổng doanh thu, Số lượng giao dịch, Doanh thu trung bình).
Câu 25: Bạn đã hoàn thành việc làm sạch và biến đổi dữ liệu trong Power Query Editor. Để đưa dữ liệu đã xử lý này vào một sheet mới trong Excel để tiếp tục phân tích hoặc tạo báo cáo, thao tác cuối cùng cần thực hiện trong Power Query là gì?
- A. Save As.
- B. Close & Load.
- C. Refresh All.
- D. Run Query.
Câu 26: Bạn có một bảng dữ liệu chứa thông tin về các sản phẩm và giá của chúng qua các năm ("Năm", "Tên sản phẩm", "Giá"). Bạn muốn biến đổi bảng này sao cho mỗi hàng là một sản phẩm và các cột là giá của sản phẩm đó qua các năm (ví dụ: "Tên sản phẩm", "Giá 2020", "Giá 2021", "Giá 2022"). Thao tác nào trong Power Query giúp bạn làm điều này?
- A. Append Queries.
- B. Merge Queries.
- C. Pivot Column.
- D. Unpivot Columns.
Câu 27: Ngược lại với câu 26, bạn có bảng dữ liệu về doanh số bán hàng với các cột "Khu vực", "Sản phẩm A", "Sản phẩm B", "Sản phẩm C". Bạn muốn biến đổi bảng này thành dạng dài hơn, nơi mỗi hàng là một giao dịch bán hàng cho một sản phẩm cụ thể ("Khu vực", "Tên sản phẩm", "Doanh số"). Thao tác nào trong Power Query phù hợp?
- A. Unpivot Columns.
- B. Pivot Column.
- C. Group By.
- D. Conditional Column.
Câu 28: Tri thức (Knowledge) khác biệt với dữ liệu (Data) và thông tin (Information) ở điểm cốt lõi nào trong bối cảnh trích rút và phân tích?
- A. Tri thức luôn được lưu trữ dưới dạng số.
- B. Tri thức là dữ liệu đã được làm sạch.
- C. Tri thức chỉ là tập hợp các sự kiện rời rạc.
- D. Tri thức là sự hiểu biết sâu sắc, các quy luật, mẫu hình rút ra từ thông tin, cho phép đưa ra quyết định hoặc dự đoán.
Câu 29: Khi tạo biểu đồ từ PivotTable, bạn nhận thấy các cột hoặc lát cắt trên biểu đồ không hiển thị theo thứ tự logic (ví dụ: các tháng không theo thứ tự lịch). Để khắc phục, bạn nên điều chỉnh thứ tự sắp xếp ở đâu?
- A. Trong cài đặt của biểu đồ (Chart Options).
- B. Trong cài đặt trường của PivotTable (Field Settings) hoặc bằng cách kéo thả trực tiếp trong PivotTable.
- C. Trong cài đặt chung của Excel.
- D. Bạn phải tạo lại biểu đồ từ đầu.
Câu 30: Bạn đã trích rút thông tin về hiệu suất bán hàng của các nhân viên. Bạn nhận thấy nhân viên A có doanh số cao nhất nhưng tỷ lệ đơn hàng bị trả lại cũng cao nhất. Nhân viên B có doanh số thấp hơn nhưng tỷ lệ trả lại hàng rất thấp. Việc so sánh và phân tích các chỉ số khác nhau này giúp bạn rút ra loại tri thức nào?
- A. Hiểu biết sâu sắc hơn về hiệu quả làm việc thực sự của từng nhân viên (không chỉ dựa vào doanh số tuyệt đối).
- B. Chỉ là dữ liệu thô về hiệu suất.
- C. Xác định lỗi trong hệ thống tính lương.
- D. Dự đoán doanh số bán hàng trong tương lai một cách chính xác.