Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Thống Kê Ứng Dụng bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Một nhà nghiên cứu muốn khảo sát mức độ hài lòng của khách hàng đối với một dòng sản phẩm mới. Họ tiến hành thu thập dữ liệu từ 200 khách hàng đã mua sản phẩm này. Tổng thể trong nghiên cứu này là gì?
- A. 200 khách hàng được khảo sát
- B. Dòng sản phẩm mới
- C. Tất cả khách hàng đã mua dòng sản phẩm mới
- D. Mức độ hài lòng của khách hàng
Câu 2: Biến số nào sau đây là biến định tính (qualitative variable)?
- A. Chiều cao (cm)
- B. Nhóm máu (A, B, AB, O)
- C. Cân nặng (kg)
- D. Điểm thi (thang điểm 100)
Câu 3: Thang đo nào phù hợp nhất để đo lường "mức độ đồng ý" với một phát biểu, với các lựa chọn: Hoàn toàn không đồng ý, Không đồng ý, Trung lập, Đồng ý, Hoàn toàn đồng ý?
- A. Tỷ lệ (Ratio)
- B. Thứ bậc (Ordinal)
- C. Khoảng (Interval)
- D. Định danh (Nominal)
Câu 4: Trong một nghiên cứu về chiều cao của sinh viên, chiều cao trung bình mẫu (sample mean) được tính là 165cm. Giá trị 165cm này được gọi là gì?
- A. Tham số của tổng thể
- B. Sai số chuẩn
- C. Thống kê mẫu
- D. Giá trị kỳ vọng
Câu 5: Biểu đồ nào sau đây thích hợp nhất để thể hiện tần suất của các loại trái cây yêu thích trong một nhóm người?
- A. Biểu đồ cột (Bar chart)
- B. Biểu đồ tần suất (Histogram)
- C. Biểu đồ đường (Line chart)
- D. Biểu đồ hộp (Box plot)
Câu 6: Giá trị trung vị (median) của bộ dữ liệu sau: 10, 15, 8, 22, 12 là bao nhiêu?
- A. 12
- B. 13.4
- C. 12.5
- D. 15
Câu 7: Độ lệch chuẩn (standard deviation) đo lường điều gì?
- A. Giá trị trung bình của dữ liệu
- B. Mức độ phân tán của dữ liệu so với giá trị trung bình
- C. Giá trị lớn nhất của dữ liệu
- D. Vị trí trung tâm của dữ liệu
Câu 8: Khoảng tứ phân vị (Interquartile Range - IQR) được tính bằng công thức nào?
- A. Q3 + Q1
- B. Q3 / Q1
- C. Q1 - Q3
- D. Q3 - Q1
Câu 9: Trong kiểm định giả thuyết, giả thuyết H0 (giả thuyết không) thường phát biểu điều gì?
- A. Có sự khác biệt đáng kể
- B. Không có sự khác biệt hoặc không có tác động
- C. Kết quả nghiên cứu là đúng
- D. Mẫu không đại diện cho tổng thể
Câu 10: Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
- A. Xác suất giả thuyết H0 là đúng
- B. Mức độ quan trọng thực tế của kết quả
- C. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu H0 là đúng
- D. Ngưỡng ý nghĩa thống kê
Câu 11: Mức ý nghĩa thống kê (alpha - α) thường được sử dụng là bao nhiêu trong các nghiên cứu khoa học xã hội?
- A. 0.1
- B. 0.05
- C. 0.01
- D. 0.5
Câu 12: Sai lầm loại I (Type I error) xảy ra khi nào?
- A. Bác bỏ giả thuyết H0 khi H0 đúng
- B. Không bác bỏ giả thuyết H0 khi H0 sai
- C. Chấp nhận giả thuyết H1 khi H1 sai
- D. Không có sai sót trong kiểm định
Câu 13: Phân tích phương sai (ANOVA) được sử dụng để so sánh trung bình của bao nhiêu nhóm?
- A. 1 nhóm
- B. 2 nhóm
- C. 3 nhóm trở lên
- D. Tất cả các nhóm
Câu 14: Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
- A. Sự khác biệt giữa hai biến số
- B. Mức độ phân tán của dữ liệu
- C. Xu hướng trung tâm của dữ liệu
- D. Mức độ và hướng của mối quan hệ tuyến tính giữa hai biến số định lượng
Câu 15: Giá trị của hệ số tương quan Pearson nằm trong khoảng nào?
- A. 0 đến 1
- B. -1 đến +1
- C. 0 đến vô cực
- D. -vô cực đến +vô cực
Câu 16: Trong hồi quy tuyến tính đơn giản, phương trình đường hồi quy có dạng Y = a + bX. "b" đại diện cho điều gì?
- A. Giá trị dự đoán của Y khi X = 0
- B. Giá trị trung bình của Y
- C. Độ dốc của đường hồi quy, sự thay đổi của Y khi X tăng 1 đơn vị
- D. Sai số ngẫu nhiên
Câu 17: Mục đích chính của việc sử dụng biểu đồ phân tán (scatter plot) là gì?
- A. Khám phá mối quan hệ giữa hai biến số định lượng
- B. So sánh trung bình của các nhóm
- C. Thể hiện tần suất của một biến số
- D. Mô tả phân bố của dữ liệu
Câu 18: Phương pháp nào sau đây là phù hợp nhất để thu thập dữ liệu về ý kiến của người dân về một chính sách công mới?
- A. Quan sát trực tiếp
- B. Khảo sát bằng bảng hỏi (Survey)
- C. Thí nghiệm trong phòng thí nghiệm
- D. Phân tích dữ liệu thứ cấp
Câu 19: Nghiên cứu nào sau đây là nghiên cứu quan sát (observational study)?
- A. Thử nghiệm lâm sàng ngẫu nhiên
- B. Nghiên cứu can thiệp cộng đồng
- C. Thí nghiệm đối chứng
- D. Nghiên cứu thuần tập (Cohort study) về hút thuốc lá và ung thư phổi
Câu 20: Trong nghiên cứu bệnh chứng (case-control study), nhóm chứng (control group) được chọn như thế nào?
- A. Ngẫu nhiên từ tổng thể chung
- B. Những người có bệnh nền tương tự
- C. Những người không mắc bệnh đang nghiên cứu nhưng có đặc điểm tương tự nhóm bệnh
- D. Những người khỏe mạnh nhất trong cộng đồng
Câu 21: Ưu điểm chính của thiết kế nghiên cứu thử nghiệm lâm sàng ngẫu nhiên có đối chứng (RCT) là gì?
- A. Giảm thiểu sai lệch và tăng cường khả năng suy luận nhân quả
- B. Dễ thực hiện và chi phí thấp
- C. Phù hợp với mọi loại nghiên cứu
- D. Luôn cho kết quả chính xác tuyệt đối
Câu 22: Khi nào nên sử dụng kiểm định Chi-square?
- A. So sánh trung bình của hai nhóm độc lập
- B. Kiểm tra mối liên hệ giữa hai biến số định tính
- C. So sánh trung bình của nhiều nhóm
- D. Phân tích phương sai
Câu 23: Khoảng tin cậy 95% (95% Confidence Interval) cho trung bình mẫu có ý nghĩa gì?
- A. 95% dữ liệu mẫu nằm trong khoảng này
- B. Trung bình mẫu chắc chắn nằm trong khoảng này
- C. Khoảng này chứa 95% giá trị có thể của trung bình mẫu
- D. Nếu lặp lại quá trình lấy mẫu nhiều lần, 95% các khoảng tin cậy được tạo ra sẽ chứa trung bình tổng thể thực sự
Câu 24: Để giảm độ rộng của khoảng tin cậy, ta có thể làm gì?
- A. Giảm mức độ tin cậy
- B. Giảm kích thước mẫu
- C. Tăng kích thước mẫu
- D. Tăng độ lệch chuẩn của mẫu
Câu 25: Khi nào thì giá trị trung bình (mean) và trung vị (median) gần nhau trong một phân phối dữ liệu?
- A. Khi phân phối lệch trái
- B. Khi phân phối đối xứng
- C. Khi phân phối lệch phải
- D. Khi dữ liệu có nhiều giá trị ngoại lệ
Câu 26: Biểu đồ hộp (box plot) thể hiện thông tin nào về phân phối dữ liệu?
- A. Giá trị trung bình và độ lệch chuẩn
- B. Tần suất và phần trăm
- C. Trung vị, tứ phân vị, giá trị nhỏ nhất và lớn nhất (trong phạm vi không ngoại lệ)
- D. Mốt và khoảng biến thiên
Câu 27: Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
- A. Sự tương quan cao giữa các biến độc lập
- B. Sự tương quan cao giữa biến độc lập và biến phụ thuộc
- C. Phân phối không chuẩn của sai số
- D. Kích thước mẫu quá nhỏ
Câu 28: Loại kiểm định giả thuyết nào phù hợp để so sánh tỷ lệ thành công của hai phương pháp điều trị khác nhau?
- A. Kiểm định t cặp парный (Paired t-test)
- B. Phân tích phương sai (ANOVA)
- C. Kiểm định t độc lập (Independent t-test)
- D. Kiểm định Chi-square hoặc kiểm định Z cho tỷ lệ
Câu 29: Phương pháp lấy mẫu nào đảm bảo mọi đơn vị trong tổng thể đều có cơ hội được chọn vào mẫu và cơ hội này có thể tính được?
- A. Lấy mẫu thuận tiện
- B. Lấy mẫu phán đoán
- C. Lấy mẫu ngẫu nhiên (Random sampling)
- D. Lấy mẫu theo hạn ngạch
Câu 30: Giả sử bạn thực hiện một kiểm định giả thuyết và nhận được giá trị p = 0.02. Với mức ý nghĩa α = 0.05, bạn đưa ra kết luận gì?
- A. Bác bỏ giả thuyết H0 vì p < α
- B. Chấp nhận giả thuyết H0 vì p < α
- C. Không thể đưa ra kết luận vì p quá nhỏ
- D. Chấp nhận giả thuyết H1 vì p > α