Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Thống Kê Ứng Dụng - Đề 06 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Biến định lượng liên tục khác với biến định lượng rời rạc ở điểm nào?
- A. Biến liên tục có thể đo lường, biến rời rạc thì không.
- B. Biến liên tục có thể sắp xếp thứ tự, biến rời rạc thì không.
- C. Biến liên tục có thể nhận giá trị trong một khoảng, biến rời rạc chỉ nhận giá trị đếm được.
- D. Biến liên tục biểu thị thuộc tính, biến rời rạc biểu thị số lượng.
Câu 2: Thang đo nào sau đây cho phép xác định mức độ hơn kém giữa các giá trị và có điểm gốc 0 thực sự?
- A. Thang đo định danh
- B. Thang đo thứ bậc
- C. Thang đo khoảng
- D. Thang đo tỷ lệ
Câu 3: Một nhà nghiên cứu muốn khảo sát mức độ hài lòng của khách hàng về dịch vụ của một công ty. Phương pháp thu thập dữ liệu nào sau đây phù hợp nhất để thu thập thông tin định tính?
- A. Bảng hỏi khảo sát trực tuyến
- B. Phỏng vấn sâu và thảo luận nhóm tập trung
- C. Quan sát hành vi mua hàng tại cửa hàng
- D. Thu thập dữ liệu từ hồ sơ giao dịch
Câu 4: Biểu đồ hộp (boxplot) thích hợp nhất để thể hiện đặc điểm nào của một tập dữ liệu?
- A. Tần số xuất hiện của các giá trị
- B. Mối quan hệ giữa hai biến số định lượng
- C. Phân vị và sự phân tán của dữ liệu
- D. Xu hướng biến đổi của dữ liệu theo thời gian
Câu 5: Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope) cho biết điều gì?
- A. Giá trị trung bình của biến phụ thuộc
- B. Mức độ thay đổi của biến phụ thuộc khi biến độc lập tăng 1 đơn vị
- C. Độ mạnh của mối quan hệ tuyến tính
- D. Sai số dự đoán của mô hình
Câu 6: Giá trị P (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?
- A. Xác suất giả thuyết không (H0) là đúng
- B. Mức độ ý nghĩa thống kê của kết quả
- C. Sai số loại I trong kiểm định
- D. Xác suất quan sát được kết quả mẫu hoặc cực đoan hơn nếu H0 đúng
Câu 7: Khoảng tin cậy 95% cho trung bình tổng thể được tính toán từ một mẫu ngẫu nhiên là (10.5, 12.3). Phát biểu nào sau đây là đúng?
- A. Trung bình mẫu chắc chắn nằm trong khoảng (10.5, 12.3).
- B. Có 95% khả năng trung bình tổng thể nằm trong khoảng (10.5, 12.3).
- C. Nếu lặp lại lấy mẫu nhiều lần, khoảng 95% các khoảng tin cậy sẽ chứa trung bình tổng thể.
- D. Khoảng (10.5, 12.3) chứa 95% dữ liệu của tổng thể.
Câu 8: Loại sai số nào xảy ra khi chúng ta bác bỏ giả thuyết không (H0) trong khi thực tế H0 là đúng?
- A. Sai số loại I
- B. Sai số loại II
- C. Sai số hệ thống
- D. Sai số ngẫu nhiên
Câu 9: Phương pháp nào sau đây KHÔNG phải là phương pháp lấy mẫu ngẫu nhiên?
- A. Lấy mẫu ngẫu nhiên đơn giản
- B. Lấy mẫu phân tầng
- C. Lấy mẫu hệ thống
- D. Lấy mẫu thuận tiện
Câu 10: Một nghiên cứu so sánh hiệu quả của hai phương pháp giảng dạy (A và B) trên kết quả học tập của sinh viên. Sinh viên được chia ngẫu nhiên vào hai nhóm để học theo phương pháp A hoặc B. Thiết kế nghiên cứu này là gì?
- A. Nghiên cứu quan sát
- B. Nghiên cứu mô tả
- C. Thử nghiệm ngẫu nhiên có đối chứng (RCT)
- D. Nghiên cứu cắt ngang
Câu 11: Để so sánh trung bình của hai nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn, kiểm định phi tham số nào sau đây phù hợp?
- A. Kiểm định t-Student
- B. Kiểm định Mann-Whitney U
- C. Kiểm định ANOVA
- D. Kiểm định Chi-bình phương
Câu 12: Hệ số tương quan Pearson (r) đo lường điều gì?
- A. Mối quan hệ nhân quả giữa hai biến
- B. Sự khác biệt giữa trung bình của hai biến
- C. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến
- D. Tỷ lệ biến thiên của một biến được giải thích bởi biến kia
Câu 13: Phương pháp thống kê nào được sử dụng để dự đoán giá trị của một biến phụ thuộc dựa trên một hoặc nhiều biến độc lập?
- A. Thống kê mô tả
- B. Phân tích hồi quy
- C. Kiểm định giả thuyết
- D. Phân tích phương sai (ANOVA)
Câu 14: Khi nào thì nên sử dụng biểu đồ phân tán (scatter plot)?
- A. Để thể hiện mối quan hệ giữa hai biến định lượng
- B. Để so sánh phân phối của một biến giữa các nhóm
- C. Để thể hiện tần số của các giá trị trong một biến
- D. Để thể hiện xu hướng theo thời gian của một biến
Câu 15: Trong kiểm định Chi-bình phương về tính độc lập, giả thuyết không (H0) thường là gì?
- A. Các biến có mối quan hệ tuyến tính.
- B. Các biến là độc lập với nhau.
- C. Trung bình của các nhóm là bằng nhau.
- D. Phương sai của các nhóm là bằng nhau.
Câu 16: Giá trị trung vị (median) của tập dữ liệu {2, 5, 8, 3, 5, 10, 6} là bao nhiêu?
Câu 17: Độ lệch chuẩn (standard deviation) đo lường điều gì?
- A. Giá trị trung bình của dữ liệu
- B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình
- C. Vị trí trung tâm của dữ liệu
- D. Hình dạng phân phối của dữ liệu
Câu 18: Trong phân tích phương sai (ANOVA), giả thuyết không (H0) thường là gì?
- A. Tất cả các nhóm có phương sai bằng nhau.
- B. Tất cả các nhóm đều tuân theo phân phối chuẩn.
- C. Trung bình của tất cả các nhóm là bằng nhau.
- D. Có ít nhất một cặp nhóm có trung bình khác nhau.
Câu 19: Loại biểu đồ nào phù hợp để so sánh tỷ lệ phần trăm giữa các danh mục?
- A. Biểu đồ tròn (pie chart)
- B. Biểu đồ đường (line chart)
- C. Biểu đồ tần suất (histogram)
- D. Biểu đồ hộp (boxplot)
Câu 20: Một công ty muốn ước tính tỷ lệ khách hàng hài lòng với sản phẩm của họ. Họ tiến hành khảo sát ngẫu nhiên 200 khách hàng và thấy 160 người hài lòng. Ước lượng điểm (point estimate) cho tỷ lệ khách hàng hài lòng là bao nhiêu?
- A. 160
- B. 0.8
- C. 200
- D. 80%
Câu 21: Để kiểm tra xem có sự khác biệt về trung bình chiều cao giữa nam và nữ sinh viên, kiểm định thống kê nào sau đây là phù hợp nhất nếu giả định dữ liệu tuân theo phân phối chuẩn và phương sai bằng nhau?
- A. Kiểm định Chi-bình phương
- B. Kiểm định Mann-Whitney U
- C. Kiểm định tương quan Pearson
- D. Kiểm định t-Student cho hai mẫu độc lập
Câu 22: Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
- A. Biến phụ thuộc không tuân theo phân phối chuẩn.
- B. Mô hình hồi quy không phù hợp với dữ liệu.
- C. Các biến độc lập có tương quan cao với nhau.
- D. Sai số của mô hình hồi quy quá lớn.
Câu 23: Khi nào thì nên sử dụng kiểm định Chi-bình phương?
- A. Để so sánh trung bình của hai nhóm.
- B. Để phân tích mối quan hệ giữa các biến định tính.
- C. Để dự đoán giá trị của biến định lượng.
- D. Để đo lường độ mạnh của mối quan hệ tuyến tính.
Câu 24: Tứ phân vị thứ nhất (Q1) chia dữ liệu thành hai phần như thế nào?
- A. 50% dữ liệu nhỏ hơn và 50% lớn hơn.
- B. 10% dữ liệu nhỏ hơn và 90% lớn hơn.
- C. 75% dữ liệu nhỏ hơn và 25% lớn hơn.
- D. 25% dữ liệu nhỏ hơn và 75% lớn hơn.
Câu 25: Trong phân tích dữ liệu thời gian, thành phần xu hướng (trend) thể hiện điều gì?
- A. Sự biến đổi dài hạn của chuỗi thời gian.
- B. Sự biến đổi theo mùa vụ.
- C. Sự biến đổi ngẫu nhiên.
- D. Sự biến đổi theo chu kỳ kinh tế.
Câu 26: Khi mức ý nghĩa α (alpha) được đặt là 0.05, điều đó có nghĩa là gì?
- A. Xác suất giả thuyết không (H0) là đúng là 5%.
- B. Độ tin cậy của kết quả là 95%.
- C. Có 5% khả năng mắc sai số loại I.
- D. Có 95% khả năng mắc sai số loại II.
Câu 27: Phương pháp nào sau đây được sử dụng để giảm chiều dữ liệu (dimensionality reduction)?
- A. Phân tích hồi quy
- B. Phân tích thành phần chính (PCA)
- C. Phân tích phương sai (ANOVA)
- D. Phân tích tương quan
Câu 28: Để kiểm tra sự phù hợp của dữ liệu với phân phối chuẩn, kiểm định nào sau đây thường được sử dụng?
- A. Kiểm định Shapiro-Wilk
- B. Kiểm định t-Student
- C. Kiểm định Chi-bình phương
- D. Kiểm định ANOVA
Câu 29: Trong thống kê Bayes, khái niệm "prior" (tiền nghiệm) đề cập đến điều gì?
- A. Dữ liệu quan sát được.
- B. Phân phối xác suất của dữ liệu.
- C. Hàm правдоподобия (likelihood).
- D. Niềm tin ban đầu về tham số trước khi quan sát dữ liệu.
Câu 30: Một nhà máy sản xuất bóng đèn tiến hành kiểm tra chất lượng bằng cách lấy ngẫu nhiên 500 bóng đèn và kiểm tra thời gian cháy. Họ muốn ước tính thời gian cháy trung bình của toàn bộ lô bóng đèn. Phương pháp thống kê nào phù hợp để ước tính khoảng tin cậy cho trung bình tổng thể?
- A. Thống kê mô tả
- B. Thống kê suy diễn
- C. Phân tích hồi quy
- D. Phân tích phương sai (ANOVA)