Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Thống Kê Ứng Dụng - Đề 05 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Một nhà nghiên cứu muốn ước tính chiều cao trung bình của sinh viên đại học trong một trường đại học lớn. Thay vì đo chiều cao của tất cả sinh viên, họ chọn ngẫu nhiên 200 sinh viên và đo chiều cao của nhóm này. Phương pháp thống kê nào sau đây được sử dụng trong tình huống này?
- A. Thống kê mô tả
- B. Thống kê suy luận
- C. Phân tích hồi quy
- D. Kiểm định giả thuyết
Câu 2: Biểu đồ hộp (boxplot) thích hợp nhất để thể hiện điều gì?
- A. Mối quan hệ giữa hai biến định lượng
- B. Tần số của các biến định tính
- C. Phân phối và sự phân tán của một biến định lượng
- D. Xu hướng theo thời gian của một biến số
Câu 3: Trong một nghiên cứu về hiệu quả của một loại thuốc mới, nhóm bệnh nhân dùng thuốc thật được gọi là gì?
- A. Nhóm can thiệp
- B. Nhóm chứng
- C. Nhóm giả dược
- D. Nhóm đối chứng lịch sử
Câu 4: Giá trị P (p-value) trong kiểm định giả thuyết thể hiện điều gì?
- A. Xác suất giả thuyết đúng là đúng.
- B. Mức độ ý nghĩa thống kê mong muốn.
- C. Sai số loại I (Type I error) cho phép.
- D. Xác suất quan sát được kết quả mẫu nếu giả thuyết không đúng.
Câu 5: Khi nào thì nên sử dụng kiểm định Chi-bình phương (Chi-square test)?
- A. So sánh trung bình của hai nhóm độc lập
- B. Kiểm tra tính độc lập giữa hai biến định tính
- C. Phân tích phương sai giữa nhiều nhóm
- D. Đo lường mức độ tương quan tuyến tính giữa hai biến định lượng
Câu 6: Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
- A. Mối quan hệ nhân quả giữa hai biến
- B. Sự khác biệt trung bình giữa hai biến
- C. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng
- D. Sự phù hợp của dữ liệu với phân phối chuẩn
Câu 7: Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
- A. Bác bỏ giả thuyết không khi nó thực sự đúng.
- B. Không bác bỏ giả thuyết không khi nó thực sự sai.
- C. Tính toán sai giá trị p.
- D. Chọn mức ý nghĩa thống kê (alpha) quá cao.
Câu 8: Phương pháp lấy mẫu nào đảm bảo mỗi đơn vị trong tổng thể có cơ hội được chọn vào mẫu như nhau?
- A. Lấy mẫu thuận tiện
- B. Lấy mẫu phân tầng
- C. Lấy mẫu ngẫu nhiên đơn giản
- D. Lấy mẫu cụm
Câu 9: Độ lệch chuẩn (standard deviation) đo lường điều gì?
- A. Độ phân tán của dữ liệu xung quanh giá trị trung bình
- B. Giá trị trung tâm của dữ liệu
- C. Hình dạng phân phối của dữ liệu
- D. Mức độ tin cậy của ước lượng trung bình
Câu 10: Trong phân tích hồi quy tuyến tính, hệ số góc (slope) cho biết điều gì?
- A. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0.
- B. Mức độ thay đổi trung bình của biến phụ thuộc khi biến độc lập tăng một đơn vị.
- C. Độ mạnh của mối quan hệ tuyến tính.
- D. Phần trăm biến thiên của biến phụ thuộc được giải thích bởi mô hình.
Câu 11: Loại biểu đồ nào phù hợp nhất để so sánh tỷ lệ phần trăm giữa các nhóm khác nhau?
- A. Biểu đồ cột (Bar chart)
- B. Biểu đồ đường (Line chart)
- C. Biểu đồ phân tán (Scatter plot)
- D. Biểu đồ hộp (Box plot)
Câu 12: Khoảng tin cậy 95% (95% confidence interval) có ý nghĩa gì?
- A. Có 95% khả năng tham số tổng thể nằm trong khoảng này.
- B. Sai số chuẩn của ước lượng là 5%.
- C. Nếu lặp lại quá trình lấy mẫu nhiều lần, khoảng 95% các khoảng tin cậy sẽ chứa tham số tổng thể thực sự.
- D. Mức độ ý nghĩa thống kê là 0.05.
Câu 13: Biến số nào sau đây là biến định lượng liên tục?
- A. Số con trong gia đình
- B. Chiều cao
- C. Nhóm máu (A, B, AB, O)
- D. Mức độ hài lòng (Rất hài lòng, Hài lòng, Bình thường, Không hài lòng)
Câu 14: Khi dữ liệu không tuân theo phân phối chuẩn, thước đo xu hướng trung tâm nào thường được ưu tiên sử dụng hơn so với giá trị trung bình (mean)?
- A. Trung bình (Mean)
- B. Mốt (Mode)
- C. Trung vị (Median)
- D. Khoảng tứ phân vị (Interquartile range)
Câu 15: Phân tích phương sai (ANOVA) được sử dụng để làm gì?
- A. Kiểm tra mối quan hệ tuyến tính giữa hai biến
- B. So sánh tỷ lệ của hai nhóm
- C. Đo lường độ phân tán của dữ liệu
- D. So sánh trung bình của ba nhóm hoặc nhiều hơn
Câu 16: Trong nghiên cứu bệnh chứng (case-control study), thước đo nào thường được sử dụng để đánh giá mối liên quan giữa yếu tố nguy cơ và bệnh tật?
- A. Nguy cơ tương đối (Relative Risk)
- B. Tỷ số odds (Odds Ratio)
- C. Tỷ lệ hiện mắc (Prevalence)
- D. Tỷ lệ mới mắc (Incidence)
Câu 17: Biến số "màu mắt" thuộc loại thang đo nào?
- A. Định danh (Nominal)
- B. Thứ bậc (Ordinal)
- C. Khoảng (Interval)
- D. Tỷ lệ (Ratio)
Câu 18: Khi nào thì kiểm định t (t-test) một mẫu được sử dụng?
- A. So sánh trung bình của hai mẫu phụ thuộc
- B. So sánh trung bình của hai mẫu độc lập
- C. So sánh trung bình mẫu với một giá trị trung bình tổng thể đã biết
- D. Phân tích phương sai giữa các nhóm
Câu 19: Phương pháp thống kê nào thích hợp để dự đoán giá nhà dựa trên diện tích, số phòng ngủ và vị trí?
- A. Kiểm định t độc lập
- B. Phân tích phương sai một yếu tố (One-way ANOVA)
- C. Tương quan Pearson
- D. Hồi quy đa biến (Multiple regression)
Câu 20: Giá trị ngoại lai (outlier) là gì?
- A. Giá trị trung bình của dữ liệu
- B. Giá trị dữ liệu nằm rất xa so với các giá trị khác
- C. Giá trị xuất hiện nhiều nhất trong dữ liệu
- D. Giá trị trung vị của dữ liệu
Câu 21: Trong kiểm định giả thuyết, mức ý nghĩa thống kê (alpha) thường được đặt ở mức 0.05. Điều này có nghĩa là gì?
- A. Xác suất mắc sai số loại II là 5%.
- B. Độ tin cậy của kết quả kiểm định là 95%.
- C. Chúng ta chấp nhận 5% khả năng bác bỏ giả thuyết không khi nó thực sự đúng.
- D. Giá trị p phải nhỏ hơn 0.05 để bác bỏ giả thuyết không.
Câu 22: Biểu đồ tần suất (histogram) được sử dụng để thể hiện điều gì?
- A. Phân phối tần suất của một biến định lượng
- B. Mối quan hệ giữa hai biến định tính
- C. Tỷ lệ phần trăm của các nhóm khác nhau
- D. Xu hướng theo thời gian của một biến số
Câu 23: Ước lượng điểm (point estimate) là gì?
- A. Một khoảng giá trị có khả năng chứa tham số tổng thể.
- B. Một phương pháp lấy mẫu ngẫu nhiên.
- C. Mức độ tin cậy của ước lượng.
- D. Một giá trị duy nhất được sử dụng để ước tính tham số tổng thể.
Câu 24: Trong phân tích sống còn (survival analysis), đường cong Kaplan-Meier được sử dụng để làm gì?
- A. So sánh trung bình thời gian sống của hai nhóm.
- B. Ước tính và biểu diễn hàm sống còn theo thời gian.
- C. Xác định các yếu tố tiên lượng ảnh hưởng đến thời gian sống.
- D. Kiểm tra mối quan hệ giữa hai biến định lượng liên quan đến thời gian sống.
Câu 25: Khi nào thì nên sử dụng kiểm định Kruskal-Wallis?
- A. So sánh trung bình của hai nhóm độc lập khi dữ liệu tuân theo phân phối chuẩn.
- B. Kiểm tra tính độc lập giữa hai biến định tính.
- C. So sánh trung vị của ba nhóm hoặc nhiều hơn khi dữ liệu không tuân theo phân phối chuẩn.
- D. Phân tích phương sai cho dữ liệu phân phối chuẩn.
Câu 26: Phương pháp nào sau đây giúp giảm thiểu tác động của các biến số gây nhiễu (confounding variables) trong nghiên cứu quan sát?
- A. Ngẫu nhiên hóa (Randomization)
- B. Che giấu (Blinding)
- C. Thiết kế bắt cặp (Matching)
- D. Phân tích đa biến (Multivariable analysis)
Câu 27: Trong thống kê Bayes, khái niệm "prior" đề cập đến điều gì?
- A. Phân phối xác suất ban đầu về tham số trước khi xem xét dữ liệu.
- B. Phân phối xác suất của dữ liệu.
- C. Hàm правдоподобия (likelihood function).
- D. Phân phối xác suất sau khi cập nhật thông tin từ dữ liệu (posterior).
Câu 28: Ma trận nhầm lẫn (confusion matrix) thường được sử dụng để đánh giá hiệu suất của mô hình nào?
- A. Mô hình hồi quy tuyến tính
- B. Mô hình phân loại (Classification model)
- C. Mô hình phân cụm (Clustering model)
- D. Mô hình giảm chiều dữ liệu (Dimensionality reduction model)
Câu 29: ROC curve (Receiver Operating Characteristic curve) được sử dụng để đánh giá điều gì?
- A. Sự phù hợp của mô hình hồi quy tuyến tính.
- B. Độ phân tán của dữ liệu.
- C. Hiệu suất của mô hình phân loại nhị phân ở các ngưỡng khác nhau.
- D. Phân phối tần suất của biến số.
Câu 30: Trong phân tích thời gian chuỗi (time series analysis), thành phần "xu hướng" (trend) đề cập đến điều gì?
- A. Biến động ngắn hạn và ngẫu nhiên.
- B. Biến động theo mùa.
- C. Biến động theo chu kỳ kinh tế.
- D. Sự biến đổi dài hạn và có hệ thống của chuỗi thời gian.