Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Thống Kê Ứng Dụng - Đề 10 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Biến định lượng liên tục khác với biến định lượng rời rạc ở điểm nào?
- A. Biến liên tục có thể đo lường, biến rời rạc thì không.
- B. Biến rời rạc có thể có giá trị âm, biến liên tục thì không.
- C. Biến liên tục có thể nhận giá trị thập phân, biến rời rạc thì không (thường).
- D. Biến rời rạc được sử dụng trong thống kê mô tả, biến liên tục trong thống kê suy diễn.
Câu 2: Để mô tả xu hướng trung tâm của dữ liệu có phân phối lệch (ví dụ: thu nhập hộ gia đình), biện pháp nào sau đây là phù hợp nhất?
- A. Trung bình cộng (Mean)
- B. Trung vị (Median)
- C. Mode (Mode)
- D. Khoảng biến thiên (Range)
Câu 3: Trong một nghiên cứu về hiệu quả của thuốc hạ huyết áp mới, nhóm nghiên cứu chia ngẫu nhiên bệnh nhân cao huyết áp thành hai nhóm: nhóm dùng thuốc mới và nhóm dùng giả dược. Thiết kế nghiên cứu này thuộc loại nào?
- A. Nghiên cứu quan sát (Observational study)
- B. Nghiên cứu thuần tập (Cohort study)
- C. Nghiên cứu bệnh chứng (Case-control study)
- D. Thử nghiệm lâm sàng ngẫu nhiên có đối chứng (Randomized Controlled Trial - RCT)
Câu 4: Giá trị P (p-value) trong kiểm định giả thuyết có ý nghĩa gì?
- A. Xác suất giả thuyết nghiên cứu (H1) là đúng.
- B. Ngưỡng ý nghĩa thống kê cần đạt được.
- C. Xác suất quan sát được kết quả như vậy nếu giả thuyết không (H0) là đúng.
- D. Mức độ quan trọng thực tế của kết quả nghiên cứu.
Câu 5: Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
- A. Bác bỏ giả thuyết không (H0) khi H0 thực sự đúng.
- B. Không bác bỏ giả thuyết không (H0) khi H0 thực sự sai.
- C. Luôn chấp nhận giả thuyết không (H0).
- D. Luôn bác bỏ giả thuyết không (H0).
Câu 6: Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
- A. Mức độ và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
- B. Mức độ quan hệ phi tuyến tính giữa hai biến định lượng.
- C. Mức độ khác biệt trung bình giữa hai nhóm.
- D. Tỷ lệ biến thiên của một biến được giải thích bởi biến khác.
Câu 7: Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope) cho biết điều gì?
- A. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0.
- B. Mức độ phù hợp của mô hình hồi quy.
- C. Sự thay đổi trung bình của biến phụ thuộc khi biến độc lập tăng lên một đơn vị.
- D. Sai số chuẩn của ước lượng hồi quy.
Câu 8: Phương pháp nào sau đây thích hợp để so sánh trung bình của ba nhóm độc lập trở lên?
- A. Kiểm định t cặp (Paired t-test)
- B. Phân tích phương sai (ANOVA)
- C. Kiểm định Chi-bình phương (Chi-square test)
- D. Hồi quy tuyến tính đa biến (Multiple linear regression)
Câu 9: Khoảng tin cậy 95% cho trung bình mẫu được hiểu như thế nào?
- A. 95% dữ liệu mẫu nằm trong khoảng này.
- B. Xác suất trung bình tổng thể nằm trong khoảng này là 95%.
- C. Khoảng này chắc chắn chứa trung bình tổng thể.
- D. Nếu lặp lại lấy mẫu nhiều lần, khoảng 95% các khoảng tin cậy sẽ chứa trung bình tổng thể thực sự.
Câu 10: Để kiểm tra sự độc lập giữa hai biến định tính (ví dụ: giới tính và nhóm máu), kiểm định thống kê nào sau đây phù hợp?
- A. Kiểm định t độc lập (Independent t-test)
- B. Phân tích phương sai (ANOVA)
- C. Kiểm định Chi-bình phương (Chi-square test)
- D. Hồi quy logistic (Logistic regression)
Câu 11: Chọn mẫu ngẫu nhiên phân tầng (Stratified random sampling) được sử dụng khi nào?
- A. Khi muốn chọn mẫu một cách nhanh chóng và dễ dàng.
- B. Khi tổng thể có thể chia thành các nhóm (strata) đồng nhất và muốn đảm bảo đại diện từ mỗi nhóm.
- C. Khi không có danh sách đầy đủ các đơn vị tổng thể.
- D. Khi muốn tập trung vào một nhóm cụ thể trong tổng thể.
Câu 12: Độ lệch chuẩn (Standard Deviation) đo lường điều gì?
- A. Độ phân tán của dữ liệu xung quanh giá trị trung bình.
- B. Xu hướng trung tâm của dữ liệu.
- C. Hình dạng phân phối của dữ liệu.
- D. Giá trị lớn nhất trừ giá trị nhỏ nhất của dữ liệu.
Câu 13: Trong biểu đồ hộp (boxplot), "râu" (whiskers) thường kéo dài đến giá trị nào?
- A. Giá trị lớn nhất và nhỏ nhất trong dữ liệu.
- B. Phần trăm thứ 10 và phần trăm thứ 90.
- C. Giá trị lớn nhất và nhỏ nhất không phải là ngoại lai (thường trong phạm vi 1.5 lần IQR từ hộp).
- D. Trung bình cộng và độ lệch chuẩn.
Câu 14: Ma trận nhầm lẫn (Confusion matrix) được sử dụng chủ yếu trong lĩnh vực nào?
- A. Hồi quy tuyến tính.
- B. Phân loại (Classification).
- C. Phân cụm (Clustering).
- D. Giảm chiều dữ liệu (Dimensionality reduction).
Câu 15: ROC curve (Receiver Operating Characteristic curve) được dùng để đánh giá điều gì?
- A. Mức độ phù hợp của mô hình hồi quy tuyến tính.
- B. Độ phân tán của dữ liệu.
- C. Mối quan hệ tuyến tính giữa hai biến.
- D. Hiệu suất của mô hình phân loại nhị phân ở các ngưỡng phân loại khác nhau.
Câu 16: Trong phân tích phương sai hai yếu tố (Two-way ANOVA), yếu tố tương tác (interaction effect) kiểm tra điều gì?
- A. Ảnh hưởng riêng biệt của từng yếu tố lên biến phụ thuộc.
- B. Tổng ảnh hưởng của cả hai yếu tố lên biến phụ thuộc.
- C. Ảnh hưởng kết hợp của hai yếu tố, tức là ảnh hưởng của một yếu tố có khác nhau tùy thuộc vào mức độ của yếu tố khác.
- D. Sai số ngẫu nhiên trong mô hình.
Câu 17: Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
- A. Khi muốn có kết quả chính xác tuyệt đối.
- B. Khi dữ liệu không tuân theo phân phối chuẩn hoặc cỡ mẫu nhỏ.
- C. Khi muốn so sánh trung bình của hai nhóm.
- D. Khi biến phụ thuộc là biến định tính.
Câu 18: Phân phối chuẩn (Normal distribution) có những đặc điểm chính nào?
- A. Lệch trái, một đỉnh.
- B. Lệch phải, nhiều đỉnh.
- C. Hình chữ nhật, đều.
- D. Đối xứng, hình chuông, trung bình, trung vị và mode bằng nhau.
Câu 19: Trong phân tích dữ liệu lớn (Big Data), kỹ thuật nào sau đây thường được sử dụng để giảm chiều dữ liệu và giữ lại thông tin quan trọng nhất?
- A. Phân tích thành phần chính (Principal Component Analysis - PCA).
- B. Phân tích phương sai (ANOVA).
- C. Hồi quy tuyến tính đa biến (Multiple linear regression).
- D. Kiểm định Chi-bình phương (Chi-square test).
Câu 20: Bootstrap resampling là kỹ thuật thống kê dùng để làm gì?
- A. Tăng kích thước mẫu.
- B. Ước lượng sai số chuẩn và khoảng tin cậy của thống kê mẫu.
- C. Kiểm tra tính chuẩn của dữ liệu.
- D. Xử lý dữ liệu ngoại lai.
Câu 21: Khi nào thì sử dụng kiểm định t một mẫu (One-sample t-test)?
- A. So sánh trung bình của hai mẫu độc lập.
- B. So sánh trung bình của hai mẫu phụ thuộc.
- C. So sánh trung bình mẫu với một giá trị trung bình tổng thể đã biết hoặc giả định.
- D. So sánh phương sai của hai mẫu.
Câu 22: Odds ratio (OR) được sử dụng phổ biến trong loại nghiên cứu nào?
- A. Nghiên cứu thuần tập (Cohort study).
- B. Nghiên cứu bệnh chứng (Case-control study).
- C. Thử nghiệm lâm sàng ngẫu nhiên có đối chứng (RCT).
- D. Nghiên cứu cắt ngang (Cross-sectional study).
Câu 23: Trong hồi quy logistic, biến phụ thuộc (dependent variable) thuộc loại nào?
- A. Biến định lượng liên tục.
- B. Biến định lượng rời rạc.
- C. Biến định tính thứ bậc.
- D. Biến định tính nhị phân.
Câu 24: Biểu đồ phân tán (Scatter plot) thích hợp để thể hiện mối quan hệ giữa loại biến số nào?
- A. Hai biến định lượng.
- B. Hai biến định tính.
- C. Một biến định lượng và một biến định tính.
- D. Một biến định lượng và một biến thứ bậc.
Câu 25: Phương pháp nào sau đây dùng để khám phá cấu trúc ẩn của dữ liệu, ví dụ như phân nhóm khách hàng dựa trên hành vi mua sắm?
- A. Hồi quy tuyến tính (Linear Regression).
- B. Phân tích phương sai (ANOVA).
- C. Phân cụm (Clustering).
- D. Kiểm định giả thuyết (Hypothesis Testing).
Câu 26: Trong phân tích chuỗi thời gian (Time series analysis), thành phần xu hướng (trend) thể hiện điều gì?
- A. Biến động ngắn hạn và ngẫu nhiên.
- B. Biến động dài hạn theo thời gian.
- C. Biến động theo mùa.
- D. Biến động theo chu kỳ kinh tế.
Câu 27: Độ tin cậy (Reliability) của một công cụ đo lường (ví dụ: bảng hỏi) đề cập đến điều gì?
- A. Khả năng đo lường đúng khái niệm cần đo.
- B. Tính dễ sử dụng của công cụ đo lường.
- C. Mức độ chấp nhận của công cụ đo lường đối với người tham gia.
- D. Tính nhất quán và ổn định của kết quả đo lường.
Câu 28: Để kiểm tra tính chuẩn của dữ liệu định lượng, phương pháp nào sau đây thường được sử dụng?
- A. Histogram và kiểm định Shapiro-Wilk.
- B. Biểu đồ hộp (Boxplot) và kiểm định Chi-bình phương.
- C. Biểu đồ phân tán (Scatter plot) và kiểm định t.
- D. Biểu đồ đường (Line chart) và ANOVA.
Câu 29: Trong thống kê Bayes (Bayesian statistics), "prior probability" (xác suất tiên nghiệm) là gì?
- A. Xác suất quan sát dữ liệu.
- B. Xác suất dữ liệu sau khi quan sát.
- C. Xác suất ban đầu về một giả thuyết trước khi có dữ liệu quan sát.
- D. Xác suất cuối cùng về một giả thuyết sau khi có dữ liệu quan sát.
Câu 30: Phân tích sống còn (Survival analysis) được sử dụng để nghiên cứu loại dữ liệu nào?
- A. Dữ liệu định tính.
- B. Dữ liệu thời gian đến sự kiện (time-to-event data).
- C. Dữ liệu chuỗi thời gian.
- D. Dữ liệu không gian.