Bài Tập, Đề Thi Trắc Nghiệm Online – Môn Khai Phá Dữ Liệu – Đề 01

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Môn Khai Phá Dữ Liệu

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu - Đề 01

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu - Đề 01 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong quy trình Khai phá Dữ liệu (KDD), giai đoạn nào tập trung vào việc chuyển đổi dữ liệu thô sang định dạng phù hợp cho phân tích, bao gồm xử lý dữ liệu bị thiếu, loại bỏ nhiễu và chuẩn hóa dữ liệu?

  • A. Lựa chọn dữ liệu (Data Selection)
  • B. Tiền xử lý dữ liệu (Data Preprocessing)
  • C. Khai phá dữ liệu (Data Mining)
  • D. Đánh giá tri thức (Knowledge Evaluation)

Câu 2: Phương pháp khai phá dữ liệu nào thường được sử dụng để khám phá các mối quan hệ thú vị giữa các biến trong một lượng lớn dữ liệu giao dịch, ví dụ như phân tích giỏ hàng trong bán lẻ?

  • A. Phân cụm (Clustering)
  • B. Phân lớp (Classification)
  • C. Khai phá luật kết hợp (Association Rule Mining)
  • D. Hồi quy (Regression)

Câu 3: Thuật toán Apriori và FP-Growth là hai thuật toán phổ biến trong khai phá dữ liệu, chúng được sử dụng chủ yếu để giải quyết bài toán nào?

  • A. Tìm kiếm tập mục phổ biến (Frequent Itemset Mining)
  • B. Phân lớp dữ liệu (Data Classification)
  • C. Phân cụm dữ liệu (Data Clustering)
  • D. Dự báo chuỗi thời gian (Time Series Forecasting)

Câu 4: Độ đo "độ hỗ trợ" (support) và "độ tin cậy" (confidence) thường được sử dụng để đánh giá chất lượng của luật kết hợp. Độ hỗ trợ của một luật kết hợp {A} -> {B} được tính như thế nào?

  • A. Số giao dịch chứa A chia cho số giao dịch chứa B.
  • B. Tỷ lệ giao dịch chứa cả A và B trong tổng số giao dịch.
  • C. Tỷ lệ giao dịch chứa B trong số giao dịch chứa A.
  • D. Tổng số giao dịch chứa A và B.

Câu 5: Trong phân cụm dữ liệu, phương pháp phân cụm nào chia dữ liệu thành các cụm không giao nhau, sao cho mỗi điểm dữ liệu thuộc về đúng một cụm duy nhất?

  • A. Phân cụm thứ bậc (Hierarchical Clustering)
  • B. Phân cụm dựa trên mật độ (Density-based Clustering)
  • C. Phân cụm mờ (Fuzzy Clustering)
  • D. Phân cụm phân hoạch (Partitional Clustering)

Câu 6: Thuật toán K-means là một thuật toán phân cụm phổ biến. Điều gì KHÔNG phải là một bước trong thuật toán K-means?

  • A. Khởi tạo ngẫu nhiên K centroids (trung tâm cụm).
  • B. Gán mỗi điểm dữ liệu vào cụm có centroid gần nhất.
  • C. Xây dựng cây quyết định dựa trên thuộc tính phân tách tốt nhất.
  • D. Cập nhật centroids bằng cách tính trung bình của các điểm dữ liệu trong mỗi cụm.

Câu 7: Trong phân lớp dữ liệu, mục tiêu chính là gì?

  • A. Tìm kiếm các mẫu ẩn trong dữ liệu không có nhãn.
  • B. Gán một đối tượng vào một trong số các lớp (categories) đã được xác định trước.
  • C. Phân nhóm các đối tượng tương tự lại với nhau.
  • D. Dự đoán giá trị số liên tục của một thuộc tính.

Câu 8: Cây quyết định (Decision Tree) là một phương pháp phân lớp phổ biến. Khi xây dựng cây quyết định, tiêu chí phân tách nút nào thường được sử dụng để chọn thuộc tính tốt nhất để phân chia dữ liệu?

  • A. Khoảng cách Euclidean
  • B. Độ tương tự Cosine
  • C. Entropy và Information Gain
  • D. Hệ số tương quan Pearson

Câu 9: Phương pháp "Naive Bayes" là một thuật toán phân lớp dựa trên định lý Bayes. Giả định "naive" (ngây thơ) trong Naive Bayes là gì?

  • A. Các thuộc tính là độc lập có điều kiện với nhau khi biết lớp.
  • B. Dữ liệu tuân theo phân phối chuẩn.
  • C. Các lớp là cân bằng về số lượng mẫu.
  • D. Mô hình là tuyến tính.

Câu 10: Trong đánh giá mô hình phân lớp, độ đo "độ chính xác" (accuracy) được tính như thế nào?

  • A. Tỷ lệ dự đoán đúng cho lớp dương tính.
  • B. Tỷ lệ dự đoán đúng trên tổng số dự đoán.
  • C. Tỷ lệ dự đoán sai trên tổng số dự đoán.
  • D. Tỷ lệ mẫu dương tính được dự đoán đúng trong số tất cả mẫu thực tế là dương tính.

Câu 11: ROC curve (Receiver Operating Characteristic curve) và AUC (Area Under the Curve) thường được sử dụng để đánh giá hiệu suất của mô hình phân lớp nhị phân. AUC thể hiện điều gì?

  • A. Độ chính xác của mô hình trên tập huấn luyện.
  • B. Độ phức tạp của mô hình.
  • C. Khả năng phân biệt giữa lớp dương tính và lớp âm tính của mô hình.
  • D. Thời gian huấn luyện mô hình.

Câu 12: Phương pháp giảm chiều dữ liệu (dimensionality reduction) được sử dụng để làm gì trong khai phá dữ liệu?

  • A. Tăng số lượng thuộc tính trong dữ liệu.
  • B. Tăng độ phức tạp của mô hình khai phá.
  • C. Chuẩn hóa dữ liệu về cùng một thang đo.
  • D. Giảm số lượng thuộc tính đầu vào trong khi vẫn giữ lại thông tin quan trọng.

Câu 13: PCA (Principal Component Analysis) là một kỹ thuật giảm chiều dữ liệu phổ biến. PCA hoạt động bằng cách nào?

  • A. Chọn ngẫu nhiên một tập con các thuộc tính ban đầu.
  • B. Tìm kiếm các thành phần chính là tổ hợp tuyến tính của các thuộc tính ban đầu.
  • C. Loại bỏ các thuộc tính có phương sai thấp.
  • D. Phân cụm dữ liệu và chọn thuộc tính đại diện cho mỗi cụm.

Câu 14: Trong khai phá dữ liệu chuỗi thời gian, mục tiêu chính thường là gì?

  • A. Phân cụm các chuỗi thời gian tương tự.
  • B. Phân lớp các chuỗi thời gian vào các danh mục khác nhau.
  • C. Dự báo giá trị tương lai của chuỗi thời gian.
  • D. Giảm chiều dữ liệu chuỗi thời gian.

Câu 15: Phương pháp "outlier detection" (phát hiện ngoại lệ) được sử dụng để làm gì trong khai phá dữ liệu?

  • A. Xác định các điểm dữ liệu bất thường hoặc khác biệt so với phần lớn dữ liệu.
  • B. Phân nhóm các điểm dữ liệu tương tự lại với nhau.
  • C. Dự đoán giá trị bị thiếu trong dữ liệu.
  • D. Chuẩn hóa dữ liệu về cùng một thang đo.

Câu 16: Trong ngữ cảnh khai phá web, "web usage mining" (khai phá sử dụng web) tập trung vào việc phân tích loại dữ liệu nào?

  • A. Nội dung văn bản trên các trang web.
  • B. Dữ liệu nhật ký máy chủ web (web server logs).
  • C. Cấu trúc liên kết giữa các trang web.
  • D. Hình ảnh và video trên web.

Câu 17: "Data warehouse" (kho dữ liệu) khác biệt với "database" (cơ sở dữ liệu) truyền thống chủ yếu ở điểm nào?

  • A. Kho dữ liệu chứa ít dữ liệu hơn cơ sở dữ liệu.
  • B. Kho dữ liệu được cập nhật thường xuyên theo thời gian thực.
  • C. Kho dữ liệu chỉ chứa dữ liệu hiện tại, không lưu trữ dữ liệu lịch sử.
  • D. Kho dữ liệu được thiết kế để hỗ trợ phân tích và ra quyết định, trong khi cơ sở dữ liệu truyền thống thường tập trung vào xử lý giao dịch.

Câu 18: ETL (Extract, Transform, Load) là một quy trình quan trọng trong xây dựng kho dữ liệu. Giai đoạn "Transform" (biến đổi) trong ETL bao gồm các hoạt động nào?

  • A. Lấy dữ liệu từ các nguồn khác nhau.
  • B. Lưu trữ dữ liệu vào kho dữ liệu.
  • C. Làm sạch, chuyển đổi, và chuẩn hóa dữ liệu.
  • D. Lập chỉ mục dữ liệu để tăng tốc độ truy vấn.

Câu 19: "Data mining" (khai phá dữ liệu) và "business intelligence" (BI - thông minh doanh nghiệp) có mối quan hệ như thế nào?

  • A. Khai phá dữ liệu là một thành phần quan trọng của thông minh doanh nghiệp.
  • B. Thông minh doanh nghiệp là một thành phần của khai phá dữ liệu.
  • C. Khai phá dữ liệu và thông minh doanh nghiệp là hai lĩnh vực hoàn toàn độc lập.
  • D. Khai phá dữ liệu chỉ tập trung vào dữ liệu lớn, trong khi thông minh doanh nghiệp tập trung vào dữ liệu nhỏ.

Câu 20: "Big data" (dữ liệu lớn) thường được mô tả bởi 4Vs: Volume, Velocity, Variety, và Veracity. "Variety" (đa dạng) trong Big Data đề cập đến khía cạnh nào?

  • A. Tốc độ tạo ra và xử lý dữ liệu.
  • B. Sự đa dạng về loại và nguồn dữ liệu.
  • C. Khối lượng dữ liệu khổng lồ.
  • D. Độ tin cậy và chính xác của dữ liệu.

Câu 21: Trong bối cảnh "dữ liệu lớn" (Big Data), các nền tảng như Hadoop và Spark thường được sử dụng để làm gì?

  • A. Quản lý cơ sở dữ liệu quan hệ truyền thống.
  • B. Trực quan hóa dữ liệu trên web.
  • C. Lưu trữ và xử lý dữ liệu lớn phân tán.
  • D. Xây dựng mô hình học máy trên dữ liệu nhỏ.

Câu 22: "Feature engineering" (kỹ thuật tạo đặc trưng) là một bước quan trọng trong khai phá dữ liệu. Mục tiêu của feature engineering là gì?

  • A. Giảm số lượng thuộc tính trong dữ liệu.
  • B. Chuẩn hóa dữ liệu về cùng một thang đo.
  • C. Làm sạch dữ liệu bị thiếu và nhiễu.
  • D. Tạo ra các thuộc tính mới, có ý nghĩa và phù hợp hơn từ dữ liệu thô.

Câu 23: Trong khai phá dữ liệu văn bản (text mining), kỹ thuật "TF-IDF" được sử dụng để làm gì?

  • A. Phân tích cảm xúc của văn bản.
  • B. Đánh trọng số của từ trong tài liệu dựa trên tần suất xuất hiện và độ hiếm.
  • C. Phân loại văn bản vào các chủ đề khác nhau.
  • D. Trích xuất thông tin quan trọng từ văn bản.

Câu 24: "Recommendation system" (hệ thống gợi ý) sử dụng các kỹ thuật khai phá dữ liệu để làm gì?

  • A. Phân tích rủi ro tài chính.
  • B. Dự báo thời tiết.
  • C. Đưa ra gợi ý sản phẩm hoặc nội dung cho người dùng.
  • D. Phát hiện gian lận trực tuyến.

Câu 25: "Data visualization" (trực quan hóa dữ liệu) đóng vai trò quan trọng trong khai phá dữ liệu vì lý do chính nào?

  • A. Tăng tốc độ tính toán của thuật toán khai phá dữ liệu.
  • B. Tự động hóa hoàn toàn quá trình khai phá dữ liệu.
  • C. Thay thế các thuật toán khai phá dữ liệu phức tạp.
  • D. Giúp con người dễ dàng hiểu và nhận diện các mẫu và thông tin quan trọng trong dữ liệu.

Câu 26: Trong khai phá dữ liệu y tế, kỹ thuật phân lớp có thể được ứng dụng để làm gì?

  • A. Dự đoán khả năng mắc bệnh của bệnh nhân dựa trên các yếu tố nguy cơ.
  • B. Phân cụm bệnh nhân thành các nhóm dựa trên triệu chứng tương tự.
  • C. Tìm kiếm luật kết hợp giữa các loại thuốc và tác dụng phụ.
  • D. Dự báo số lượng bệnh nhân nhập viện trong tương lai.

Câu 27: "Bias" (thiên vị) trong dữ liệu huấn luyện có thể ảnh hưởng tiêu cực đến mô hình học máy như thế nào?

  • A. Làm tăng độ chính xác của mô hình trên tập huấn luyện.
  • B. Dẫn đến mô hình hoạt động kém trên một số nhóm dữ liệu nhất định và gây ra sự không công bằng.
  • C. Giảm độ phức tạp của mô hình.
  • D. Không ảnh hưởng đến hiệu suất của mô hình.

Câu 28: "Cross-validation" (kiểm định chéo) là một kỹ thuật được sử dụng để làm gì trong quá trình xây dựng mô hình học máy?

  • A. Tăng kích thước tập dữ liệu huấn luyện.
  • B. Tối ưu hóa siêu tham số của mô hình.
  • C. Đánh giá hiệu suất của mô hình trên dữ liệu mới và ước lượng khả năng tổng quát hóa.
  • D. Giảm thời gian huấn luyện mô hình.

Câu 29: "Overfitting" (quá khớp) xảy ra khi mô hình học máy như thế nào?

  • A. Học quá kỹ dữ liệu huấn luyện, dẫn đến hoạt động kém trên dữ liệu mới.
  • B. Không học đủ dữ liệu huấn luyện, dẫn đến hoạt động kém cả trên dữ liệu huấn luyện và dữ liệu mới.
  • C. Hoạt động tốt trên cả dữ liệu huấn luyện và dữ liệu mới.
  • D. Chỉ hoạt động tốt trên dữ liệu huấn luyện.

Câu 30: Trong khai phá dữ liệu, "interpretability" (khả năng diễn giải) của mô hình là gì và tại sao nó quan trọng?

  • A. Tốc độ tính toán của mô hình.
  • B. Độ chính xác của mô hình.
  • C. Khả năng mô hình xử lý dữ liệu lớn.
  • D. Khả năng con người hiểu được cách mô hình đưa ra quyết định, giúp tăng độ tin cậy và cung cấp insights.

1 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 1: Trong quy trình Khai phá Dữ liệu (KDD), giai đoạn nào tập trung vào việc chuyển đổi dữ liệu thô sang định dạng phù hợp cho phân tích, bao gồm xử lý dữ liệu bị thiếu, loại bỏ nhiễu và chuẩn hóa dữ liệu?

2 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 2: Phương pháp khai phá dữ liệu nào thường được sử dụng để khám phá các mối quan hệ thú vị giữa các biến trong một lượng lớn dữ liệu giao dịch, ví dụ như phân tích giỏ hàng trong bán lẻ?

3 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 3: Thuật toán Apriori và FP-Growth là hai thuật toán phổ biến trong khai phá dữ liệu, chúng được sử dụng chủ yếu để giải quyết bài toán nào?

4 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 4: Độ đo 'độ hỗ trợ' (support) và 'độ tin cậy' (confidence) thường được sử dụng để đánh giá chất lượng của luật kết hợp. Độ hỗ trợ của một luật kết hợp {A} -> {B} được tính như thế nào?

5 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 5: Trong phân cụm dữ liệu, phương pháp phân cụm nào chia dữ liệu thành các cụm không giao nhau, sao cho mỗi điểm dữ liệu thuộc về đúng một cụm duy nhất?

6 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 6: Thuật toán K-means là một thuật toán phân cụm phổ biến. Điều gì KHÔNG phải là một bước trong thuật toán K-means?

7 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 7: Trong phân lớp dữ liệu, mục tiêu chính là gì?

8 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 8: Cây quyết định (Decision Tree) là một phương pháp phân lớp phổ biến. Khi xây dựng cây quyết định, tiêu chí phân tách nút nào thường được sử dụng để chọn thuộc tính tốt nhất để phân chia dữ liệu?

9 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 9: Phương pháp 'Naive Bayes' là một thuật toán phân lớp dựa trên định lý Bayes. Giả định 'naive' (ngây thơ) trong Naive Bayes là gì?

10 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 10: Trong đánh giá mô hình phân lớp, độ đo 'độ chính xác' (accuracy) được tính như thế nào?

11 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 11: ROC curve (Receiver Operating Characteristic curve) và AUC (Area Under the Curve) thường được sử dụng để đánh giá hiệu suất của mô hình phân lớp nhị phân. AUC thể hiện điều gì?

12 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 12: Phương pháp giảm chiều dữ liệu (dimensionality reduction) được sử dụng để làm gì trong khai phá dữ liệu?

13 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 13: PCA (Principal Component Analysis) là một kỹ thuật giảm chiều dữ liệu phổ biến. PCA hoạt động bằng cách nào?

14 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 14: Trong khai phá dữ liệu chuỗi thời gian, mục tiêu chính thường là gì?

15 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 15: Phương pháp 'outlier detection' (phát hiện ngoại lệ) được sử dụng để làm gì trong khai phá dữ liệu?

16 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 16: Trong ngữ cảnh khai phá web, 'web usage mining' (khai phá sử dụng web) tập trung vào việc phân tích loại dữ liệu nào?

17 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 17: 'Data warehouse' (kho dữ liệu) khác biệt với 'database' (cơ sở dữ liệu) truyền thống chủ yếu ở điểm nào?

18 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 18: ETL (Extract, Transform, Load) là một quy trình quan trọng trong xây dựng kho dữ liệu. Giai đoạn 'Transform' (biến đổi) trong ETL bao gồm các hoạt động nào?

19 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 19: 'Data mining' (khai phá dữ liệu) và 'business intelligence' (BI - thông minh doanh nghiệp) có mối quan hệ như thế nào?

20 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 20: 'Big data' (dữ liệu lớn) thường được mô tả bởi 4Vs: Volume, Velocity, Variety, và Veracity. 'Variety' (đa dạng) trong Big Data đề cập đến khía cạnh nào?

21 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 21: Trong bối cảnh 'dữ liệu lớn' (Big Data), các nền tảng như Hadoop và Spark thường được sử dụng để làm gì?

22 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 22: 'Feature engineering' (kỹ thuật tạo đặc trưng) là một bước quan trọng trong khai phá dữ liệu. Mục tiêu của feature engineering là gì?

23 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 23: Trong khai phá dữ liệu văn bản (text mining), kỹ thuật 'TF-IDF' được sử dụng để làm gì?

24 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 24: 'Recommendation system' (hệ thống gợi ý) sử dụng các kỹ thuật khai phá dữ liệu để làm gì?

25 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 25: 'Data visualization' (trực quan hóa dữ liệu) đóng vai trò quan trọng trong khai phá dữ liệu vì lý do chính nào?

26 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 26: Trong khai phá dữ liệu y tế, kỹ thuật phân lớp có thể được ứng dụng để làm gì?

27 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 27: 'Bias' (thiên vị) trong dữ liệu huấn luyện có thể ảnh hưởng tiêu cực đến mô hình học máy như thế nào?

28 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 28: 'Cross-validation' (kiểm định chéo) là một kỹ thuật được sử dụng để làm gì trong quá trình xây dựng mô hình học máy?

29 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 29: 'Overfitting' (quá khớp) xảy ra khi mô hình học máy như thế nào?

30 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khai Phá Dữ Liệu

Tags: Bộ đề 1

Câu 30: Trong khai phá dữ liệu, 'interpretability' (khả năng diễn giải) của mô hình là gì và tại sao nó quan trọng?

Xem kết quả