Bài Tập, Đề Thi Trắc Nghiệm Online – Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh – Đề 05

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh - Đề 05

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh - Đề 05 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Một công ty bán lẻ trực tuyến muốn cải thiện hệ thống đề xuất sản phẩm của mình. Họ thu thập dữ liệu về lịch sử mua hàng, lượt xem sản phẩm và thông tin nhân khẩu học của khách hàng. Phương pháp khoa học dữ liệu nào sau đây phù hợp nhất để xây dựng hệ thống đề xuất cá nhân hóa?

  • A. Phân tích hồi quy tuyến tính
  • B. Phân tích chuỗi thời gian
  • C. Phân tích phân cụm (Clustering)
  • D. Hệ thống đề xuất (Recommender Systems)

Câu 2: Trong quá trình phân tích dữ liệu bán hàng, bạn nhận thấy một số lượng lớn giá trị bị thiếu ở cột "Độ tuổi khách hàng". Biện pháp xử lý dữ liệu bị thiếu nào sau đây có thể dẫn đến sai lệch kết quả phân tích lớn nhất?

  • A. Loại bỏ toàn bộ hàng chứa giá trị thiếu
  • B. Điền giá trị trung bình của cột "Độ tuổi"
  • C. Điền giá trị trung vị của cột "Độ tuổi"
  • D. Điền giá trị bằng 0

Câu 3: Một ngân hàng muốn dự đoán khả năng khách hàng trả nợ vay để đưa ra quyết định phê duyệt tín dụng. Họ có dữ liệu lịch sử về thông tin khách hàng (thu nhập, lịch sử tín dụng,...) và trạng thái trả nợ (đúng hạn/quá hạn). Thuật toán học máy nào sau đây phù hợp nhất cho bài toán này?

  • A. K-Means Clustering
  • B. Cây quyết định (Decision Tree)
  • C. Phân tích thành phần chính (PCA)
  • D. Hồi quy tuyến tính đa biến

Câu 4: Để đánh giá hiệu quả của mô hình phân loại khách hàng tiềm năng (khách hàng có khả năng mua sản phẩm mới), bạn sử dụng ma trận nhầm lẫn (Confusion Matrix). Ô nào trong ma trận nhầm lẫn thể hiện số lượng khách hàng thực tế là tiềm năng nhưng mô hình dự đoán là không tiềm năng?

  • A. True Positive (TP)
  • B. True Negative (TN)
  • C. False Negative (FN)
  • D. False Positive (FP)

Câu 5: Một công ty thương mại điện tử muốn phân tích hành vi duyệt web của khách hàng để tối ưu hóa bố cục trang web. Họ thu thập dữ liệu nhật ký web (web logs) bao gồm các trang đã xem, thời gian xem trang, và luồng di chuyển giữa các trang. Kỹ thuật trực quan hóa dữ liệu nào sau đây phù hợp nhất để khám phá luồng di chuyển của người dùng trên trang web?

  • A. Biểu đồ phân tán (Scatter plot)
  • B. Sơ đồ Sankey (Sankey diagram)
  • C. Biểu đồ cột (Bar chart)
  • D. Biểu đồ đường (Line chart)

Câu 6: Trong mô hình hồi quy tuyến tính, hệ số hồi quy (regression coefficient) cho biết điều gì?

  • A. Mức độ phù hợp của mô hình với dữ liệu
  • B. Sai số dự đoán trung bình của mô hình
  • C. Mức độ thay đổi của biến mục tiêu khi biến đầu vào tương ứng thay đổi một đơn vị
  • D. Giá trị dự đoán của biến mục tiêu khi tất cả biến đầu vào bằng 0

Câu 7: Một công ty bảo hiểm muốn phát hiện các yêu cầu bồi thường gian lận. Họ có dữ liệu về các yêu cầu bồi thường đã được xử lý, bao gồm thông tin về người yêu cầu, loại hình tổn thất, và các dấu hiệu nghi vấn. Phương pháp học máy nào sau đây phù hợp để xác định các yêu cầu bồi thường có khả năng gian lận cao?

  • A. Phân tích tương quan (Correlation Analysis)
  • B. Phân tích phương sai (ANOVA)
  • C. Phân tích luật kết hợp (Association Rule Mining)
  • D. Phát hiện dị thường (Anomaly Detection)

Câu 8: Trong quá trình xây dựng mô hình học máy, việc chia dữ liệu thành tập huấn luyện (training set) và tập kiểm thử (testing set) nhằm mục đích gì?

  • A. Tăng tốc độ huấn luyện mô hình
  • B. Đánh giá khả năng khái quát hóa của mô hình trên dữ liệu mới
  • C. Giảm thiểu hiện tượng quá khớp (overfitting) trên tập huấn luyện
  • D. Cải thiện độ chính xác của mô hình trên tập huấn luyện

Câu 9: Một chuỗi siêu thị muốn phân tích giỏ hàng của khách hàng để tìm ra các sản phẩm thường được mua cùng nhau. Họ có dữ liệu giao dịch bán hàng chi tiết. Kỹ thuật khai thác dữ liệu nào sau đây phù hợp nhất để khám phá các mối quan hệ này?

  • A. Khai thác luật kết hợp (Association Rule Mining)
  • B. Phân tích hồi quy (Regression Analysis)
  • C. Phân tích chuỗi thời gian (Time Series Analysis)
  • D. Phân tích phân cụm (Clustering Analysis)

Câu 10: Chỉ số F1-score là gì và khi nào nó được ưu tiên sử dụng hơn Accuracy trong đánh giá mô hình phân loại?

  • A. F1-score là tỷ lệ dự đoán đúng trên tổng số dự đoán
  • B. F1-score là tỷ lệ dự đoán đúng trên tổng số mẫu thực tế dương tính
  • C. F1-score là trung bình điều hòa của Precision và Recall, ưu tiên khi dữ liệu phân lớp không cân bằng
  • D. F1-score là trung bình cộng của Precision và Recall, luôn ưu tiên hơn Accuracy

Câu 11: Một công ty năng lượng muốn dự báo nhu cầu tiêu thụ điện hàng giờ cho ngày hôm sau. Họ có dữ liệu lịch sử về nhu cầu điện, nhiệt độ, độ ẩm, và các yếu tố thời tiết khác. Phương pháp nào sau đây phù hợp nhất để dự báo chuỗi thời gian với yếu tố ngoại sinh (exogenous variables) như thời tiết?

  • A. Trung bình trượt (Moving Average)
  • B. San bằng mũ (Exponential Smoothing)
  • C. ARIMA
  • D. ARIMAX

Câu 12: Đâu là thách thức đạo đức chính trong việc sử dụng khoa học dữ liệu trong kinh doanh, đặc biệt khi phân tích dữ liệu cá nhân của khách hàng?

  • A. Thiếu hụt nhân lực có kỹ năng khoa học dữ liệu
  • B. Nguy cơ xâm phạm quyền riêng tư và bảo mật dữ liệu cá nhân
  • C. Chi phí đầu tư vào cơ sở hạ tầng và công nghệ dữ liệu lớn
  • D. Khó khăn trong việc tích hợp khoa học dữ liệu vào quy trình kinh doanh hiện tại

Câu 13: Phương pháp giảm chiều dữ liệu (dimensionality reduction) nào sau đây giúp giữ lại tối đa phương sai (variance) của dữ liệu gốc khi chiếu dữ liệu sang không gian chiều thấp hơn?

  • A. Lựa chọn thuộc tính (Feature Selection)
  • B. Rừng cây ngẫu nhiên (Random Forest)
  • C. Phân tích thành phần chính (PCA)
  • D. Lập mô hình hóa chiều (Manifold Learning)

Câu 14: Trong bối cảnh kinh doanh, "dữ liệu lớn" (Big Data) thường được mô tả bởi 4V: Volume, Velocity, Variety và Veracity. "Veracity" đề cập đến khía cạnh nào của dữ liệu lớn?

  • A. Khối lượng dữ liệu khổng lồ
  • B. Tốc độ tạo và xử lý dữ liệu nhanh chóng
  • C. Sự đa dạng về loại và nguồn dữ liệu
  • D. Tính xác thực và độ tin cậy của dữ liệu

Câu 15: Một công ty tài chính muốn xây dựng hệ thống cảnh báo sớm rủi ro tín dụng. Họ muốn mô hình của mình có độ nhạy (Recall) cao, tức là giảm thiểu tối đa việc bỏ sót các trường hợp khách hàng có khả năng vỡ nợ. Chỉ số đánh giá nào sau đây tập trung đo lường độ nhạy của mô hình?

  • A. Precision
  • B. Recall
  • C. Accuracy
  • D. F1-score

Câu 16: Kỹ thuật "one-hot encoding" được sử dụng để xử lý loại dữ liệu nào trong học máy?

  • A. Dữ liệu danh mục (Categorical data)
  • B. Dữ liệu số liên tục (Continuous numerical data)
  • C. Dữ liệu thứ tự (Ordinal data)
  • D. Dữ liệu thời gian (Time series data)

Câu 17: Trong phân tích chuỗi thời gian, thành phần "mùa vụ" (seasonality) đề cập đến điều gì?

  • A. Xu hướng tăng hoặc giảm dài hạn của chuỗi thời gian
  • B. Các biến động ngẫu nhiên và không thể dự đoán
  • C. Các biến động lặp lại theo chu kỳ thời gian cố định (ví dụ: hàng năm, hàng quý, hàng tháng)
  • D. Sự thay đổi đột ngột và bất thường trong chuỗi thời gian

Câu 18: Phương pháp phân tích phân cụm (clustering) K-Means hoạt động dựa trên nguyên tắc nào?

  • A. Tìm kiếm các cụm có mật độ điểm dữ liệu cao
  • B. Tối thiểu hóa tổng khoảng cách bình phương từ mỗi điểm dữ liệu đến trung tâm cụm gần nhất
  • C. Xây dựng cây phân cấp phân cụm từ trên xuống hoặc từ dưới lên
  • D. Phân chia dữ liệu dựa trên các đường biên quyết định tuyến tính

Câu 19: Trong quá trình tiền xử lý văn bản (text preprocessing), "stemming" và "lemmatization" là các kỹ thuật nhằm mục đích gì?

  • A. Loại bỏ các từ dừng (stop words) không có nghĩa
  • B. Chuyển đổi văn bản thành dạng số để phân tích
  • C. Rút gọn từ về dạng gốc để giảm số lượng từ khác nhau
  • D. Phân tích cú pháp và ngữ nghĩa của văn bản

Câu 20: Biểu đồ hộp (boxplot) thích hợp nhất để trực quan hóa thông tin thống kê mô tả nào của một biến số?

  • A. Tần suất xuất hiện của các giá trị khác nhau
  • B. Mối quan hệ giữa hai biến số
  • C. Xu hướng biến đổi theo thời gian
  • D. Phân vị (quartiles), giá trị trung vị, và giá trị ngoại lai

Câu 21: Trong kiến trúc mạng nơ-ron, hàm kích hoạt (activation function) có vai trò gì?

  • A. Tính toán tổng trọng số của các đầu vào
  • B. Giới thiệu tính phi tuyến vào mạng
  • C. Chuẩn hóa đầu ra của mỗi lớp
  • D. Tối ưu hóa trọng số của mạng

Câu 22: Để xử lý dữ liệu hình ảnh trong các bài toán thị giác máy tính (computer vision), loại mạng nơ-ron nào thường được sử dụng?

  • A. Mạng nơ-ron truyền thẳng (Feedforward Neural Network)
  • B. Mạng nơ-ron hồi quy (Recurrent Neural Network)
  • C. Mạng nơ-ron tích chập (Convolutional Neural Network - CNN)
  • D. Mạng tự mã hóa (Autoencoder)

Câu 23: Trong quá trình xây dựng mô hình, hiện tượng "quá khớp" (overfitting) xảy ra khi nào?

  • A. Mô hình hoạt động rất tốt trên tập huấn luyện nhưng kém trên tập kiểm thử
  • B. Mô hình hoạt động kém cả trên tập huấn luyện và tập kiểm thử
  • C. Mô hình hoạt động tốt trên cả tập huấn luyện và tập kiểm thử
  • D. Mô hình quá phức tạp và khó diễn giải

Câu 24: Phương pháp lấy mẫu (sampling) nào sau đây thường được sử dụng để khắc phục tình trạng dữ liệu phân lớp không cân bằng (imbalanced dataset)?

  • A. Lấy mẫu ngẫu nhiên đơn giản (Simple Random Sampling)
  • B. Lấy mẫu quá mức (Oversampling) lớp thiểu số
  • C. Lấy mẫu phân tầng (Stratified Sampling)
  • D. Lấy mẫu hệ thống (Systematic Sampling)

Câu 25: Trong ngữ cảnh kinh doanh, "dashboard" dữ liệu được sử dụng chủ yếu để làm gì?

  • A. Thực hiện phân tích thống kê chuyên sâu
  • B. Xây dựng mô hình dự đoán phức tạp
  • C. Theo dõi và giám sát các chỉ số kinh doanh quan trọng một cách trực quan
  • D. Lưu trữ và quản lý dữ liệu lớn

Câu 26: Đâu là ví dụ về dữ liệu "phi cấu trúc" (unstructured data) trong kinh doanh?

  • A. Dữ liệu giao dịch bán hàng trong cơ sở dữ liệu quan hệ
  • B. Thông tin nhân khẩu học khách hàng trong bảng tính Excel
  • C. Giá cổ phiếu theo thời gian
  • D. Bình luận của khách hàng trên mạng xã hội

Câu 27: Trong phân tích luật kết hợp (association rule mining), chỉ số "lift" đo lường điều gì?

  • A. Tần suất xuất hiện đồng thời của các mục
  • B. Mức độ liên kết giữa các mục vượt trội so với mức độ liên kết ngẫu nhiên
  • C. Xác suất mua một mục khi đã mua mục khác
  • D. Tỷ lệ giao dịch chứa tất cả các mục trong luật

Câu 28: Công cụ hoặc thư viện nào sau đây phổ biến nhất cho phân tích và thao tác dữ liệu dạng bảng (tabular data) trong Python?

  • A. Pandas
  • B. NumPy
  • C. Scikit-learn
  • D. Matplotlib

Câu 29: Mô hình học máy nào sau đây thuộc loại "học không giám sát" (unsupervised learning)?

  • A. Hồi quy Logistic (Logistic Regression)
  • B. Cây quyết định (Decision Tree)
  • C. Máy vectơ hỗ trợ (Support Vector Machine - SVM)
  • D. K-Means Clustering

Câu 30: Trong quá trình triển khai mô hình khoa học dữ liệu vào thực tế kinh doanh, bước nào sau đây quan trọng nhất để đảm bảo mô hình mang lại giá trị liên tục?

  • A. Lựa chọn thuật toán học máy phức tạp nhất
  • B. Tối ưu hóa mô hình trên tập huấn luyện lớn nhất có thể
  • C. Giám sát và tái huấn luyện mô hình định kỳ
  • D. Trình bày kết quả mô hình một cách trực quan và đẹp mắt

1 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 1: Một công ty bán lẻ trực tuyến muốn cải thiện hệ thống đề xuất sản phẩm của mình. Họ thu thập dữ liệu về lịch sử mua hàng, lượt xem sản phẩm và thông tin nhân khẩu học của khách hàng. Phương pháp khoa học dữ liệu nào sau đây phù hợp nhất để xây dựng hệ thống đề xuất cá nhân hóa?

2 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 2: Trong quá trình phân tích dữ liệu bán hàng, bạn nhận thấy một số lượng lớn giá trị bị thiếu ở cột 'Độ tuổi khách hàng'. Biện pháp xử lý dữ liệu bị thiếu nào sau đây có thể dẫn đến sai lệch kết quả phân tích lớn nhất?

3 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 3: Một ngân hàng muốn dự đoán khả năng khách hàng trả nợ vay để đưa ra quyết định phê duyệt tín dụng. Họ có dữ liệu lịch sử về thông tin khách hàng (thu nhập, lịch sử tín dụng,...) và trạng thái trả nợ (đúng hạn/quá hạn). Thuật toán học máy nào sau đây phù hợp nhất cho bài toán này?

4 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 4: Để đánh giá hiệu quả của mô hình phân loại khách hàng tiềm năng (khách hàng có khả năng mua sản phẩm mới), bạn sử dụng ma trận nhầm lẫn (Confusion Matrix). Ô nào trong ma trận nhầm lẫn thể hiện số lượng khách hàng thực tế là tiềm năng nhưng mô hình dự đoán là không tiềm năng?

5 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 5: Một công ty thương mại điện tử muốn phân tích hành vi duyệt web của khách hàng để tối ưu hóa bố cục trang web. Họ thu thập dữ liệu nhật ký web (web logs) bao gồm các trang đã xem, thời gian xem trang, và luồng di chuyển giữa các trang. Kỹ thuật trực quan hóa dữ liệu nào sau đây phù hợp nhất để khám phá luồng di chuyển của người dùng trên trang web?

6 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 6: Trong mô hình hồi quy tuyến tính, hệ số hồi quy (regression coefficient) cho biết điều gì?

7 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 7: Một công ty bảo hiểm muốn phát hiện các yêu cầu bồi thường gian lận. Họ có dữ liệu về các yêu cầu bồi thường đã được xử lý, bao gồm thông tin về người yêu cầu, loại hình tổn thất, và các dấu hiệu nghi vấn. Phương pháp học máy nào sau đây phù hợp để xác định các yêu cầu bồi thường có khả năng gian lận cao?

8 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 8: Trong quá trình xây dựng mô hình học máy, việc chia dữ liệu thành tập huấn luyện (training set) và tập kiểm thử (testing set) nhằm mục đích gì?

9 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 9: Một chuỗi siêu thị muốn phân tích giỏ hàng của khách hàng để tìm ra các sản phẩm thường được mua cùng nhau. Họ có dữ liệu giao dịch bán hàng chi tiết. Kỹ thuật khai thác dữ liệu nào sau đây phù hợp nhất để khám phá các mối quan hệ này?

10 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 10: Chỉ số F1-score là gì và khi nào nó được ưu tiên sử dụng hơn Accuracy trong đánh giá mô hình phân loại?

11 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 11: Một công ty năng lượng muốn dự báo nhu cầu tiêu thụ điện hàng giờ cho ngày hôm sau. Họ có dữ liệu lịch sử về nhu cầu điện, nhiệt độ, độ ẩm, và các yếu tố thời tiết khác. Phương pháp nào sau đây phù hợp nhất để dự báo chuỗi thời gian với yếu tố ngoại sinh (exogenous variables) như thời tiết?

12 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 12: Đâu là thách thức đạo đức chính trong việc sử dụng khoa học dữ liệu trong kinh doanh, đặc biệt khi phân tích dữ liệu cá nhân của khách hàng?

13 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 13: Phương pháp giảm chiều dữ liệu (dimensionality reduction) nào sau đây giúp giữ lại tối đa phương sai (variance) của dữ liệu gốc khi chiếu dữ liệu sang không gian chiều thấp hơn?

14 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 14: Trong bối cảnh kinh doanh, 'dữ liệu lớn' (Big Data) thường được mô tả bởi 4V: Volume, Velocity, Variety và Veracity. 'Veracity' đề cập đến khía cạnh nào của dữ liệu lớn?

15 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 15: Một công ty tài chính muốn xây dựng hệ thống cảnh báo sớm rủi ro tín dụng. Họ muốn mô hình của mình có độ nhạy (Recall) cao, tức là giảm thiểu tối đa việc bỏ sót các trường hợp khách hàng có khả năng vỡ nợ. Chỉ số đánh giá nào sau đây tập trung đo lường độ nhạy của mô hình?

16 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 16: Kỹ thuật 'one-hot encoding' được sử dụng để xử lý loại dữ liệu nào trong học máy?

17 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 17: Trong phân tích chuỗi thời gian, thành phần 'mùa vụ' (seasonality) đề cập đến điều gì?

18 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 18: Phương pháp phân tích phân cụm (clustering) K-Means hoạt động dựa trên nguyên tắc nào?

19 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 19: Trong quá trình tiền xử lý văn bản (text preprocessing), 'stemming' và 'lemmatization' là các kỹ thuật nhằm mục đích gì?

20 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 20: Biểu đồ hộp (boxplot) thích hợp nhất để trực quan hóa thông tin thống kê mô tả nào của một biến số?

21 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 21: Trong kiến trúc mạng nơ-ron, hàm kích hoạt (activation function) có vai trò gì?

22 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 22: Để xử lý dữ liệu hình ảnh trong các bài toán thị giác máy tính (computer vision), loại mạng nơ-ron nào thường được sử dụng?

23 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 23: Trong quá trình xây dựng mô hình, hiện tượng 'quá khớp' (overfitting) xảy ra khi nào?

24 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 24: Phương pháp lấy mẫu (sampling) nào sau đây thường được sử dụng để khắc phục tình trạng dữ liệu phân lớp không cân bằng (imbalanced dataset)?

25 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 25: Trong ngữ cảnh kinh doanh, 'dashboard' dữ liệu được sử dụng chủ yếu để làm gì?

26 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 26: Đâu là ví dụ về dữ liệu 'phi cấu trúc' (unstructured data) trong kinh doanh?

27 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 27: Trong phân tích luật kết hợp (association rule mining), chỉ số 'lift' đo lường điều gì?

28 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 28: Công cụ hoặc thư viện nào sau đây phổ biến nhất cho phân tích và thao tác dữ liệu dạng b??ng (tabular data) trong Python?

29 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 29: Mô hình học máy nào sau đây thuộc loại 'học không giám sát' (unsupervised learning)?

30 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Khoa Học Dữ Liệu Trong Kinh Tế Và Kinh Doanh

Tags: Bộ đề 5

Câu 30: Trong quá trình triển khai mô hình khoa học dữ liệu vào thực tế kinh doanh, bước nào sau đây quan trọng nhất để đảm bảo mô hình mang lại giá trị liên tục?

Xem kết quả