Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Thống Kê Ứng Dụng - Đề 09 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Trong một nghiên cứu về hiệu quả của một chương trình can thiệp dinh dưỡng đối với trẻ em suy dinh dưỡng, nhóm can thiệp được cung cấp bữa ăn bổ sung hàng ngày, trong khi nhóm đối chứng không nhận được can thiệp. Sau 6 tháng, cân nặng trung bình của trẻ ở nhóm can thiệp tăng lên đáng kể so với nhóm đối chứng. Loại phân tích thống kê nào phù hợp nhất để so sánh sự khác biệt về cân nặng giữa hai nhóm?
- A. Phân tích hồi quy tuyến tính (Linear Regression)
- B. Kiểm định t độc lập (Independent t-test)
- C. Phân tích phương sai (ANOVA)
- D. Kiểm định Chi bình phương (Chi-square test)
Câu 2: Một nhà nghiên cứu muốn khảo sát mối liên hệ giữa số giờ học mỗi tuần và điểm thi cuối kỳ của sinh viên. Dữ liệu được thu thập từ 100 sinh viên và kết quả cho thấy hệ số tương quan Pearson (r) là 0.75. Giá trị này cho thấy điều gì?
- A. Không có mối liên hệ tuyến tính giữa số giờ học và điểm thi.
- B. Mối liên hệ tuyến tính yếu giữa số giờ học và điểm thi.
- C. Mối liên hệ tuyến tính dương mạnh giữa số giờ học và điểm thi.
- D. Mối liên hệ tuyến tính âm mạnh giữa số giờ học và điểm thi.
Câu 3: Trong một nghiên cứu về tỷ lệ mắc bệnh tim mạch ở người hút thuốc lá và người không hút thuốc lá, người ta thu thập dữ liệu từ một mẫu lớn dân số. Kết quả cho thấy tỷ lệ mắc bệnh tim mạch ở người hút thuốc lá cao hơn đáng kể so với người không hút thuốc lá (p < 0.05). Phát biểu nào sau đây là diễn giải đúng về kết quả này?
- A. Không có sự khác biệt về tỷ lệ mắc bệnh tim mạch giữa hai nhóm.
- B. Sự khác biệt về tỷ lệ mắc bệnh tim mạch có thể là do yếu tố ngẫu nhiên.
- C. Cần có thêm nghiên cứu để xác nhận sự khác biệt này.
- D. Có bằng chứng thống kê cho thấy người hút thuốc lá có tỷ lệ mắc bệnh tim mạch cao hơn.
Câu 4: Một công ty muốn dự báo doanh số bán hàng trong quý tới dựa trên dữ liệu doanh số của 12 quý trước đó. Phương pháp thống kê nào phù hợp nhất để thực hiện dự báo này?
- A. Phân tích hồi quy đa biến (Multiple Regression)
- B. Phân tích chuỗi thời gian (Time Series Analysis)
- C. Phân tích phương sai (ANOVA)
- D. Phân tích nhân tố (Factor Analysis)
Câu 5: Biến số nào sau đây là biến định tính (qualitative variable)?
- A. Nhóm máu (A, B, AB, O)
- B. Chiều cao (cm)
- C. Cân nặng (kg)
- D. Huyết áp (mmHg)
Câu 6: Để mô tả sự phân tán của một tập dữ liệu số, thước đo nào sau đây được sử dụng phổ biến nhất?
- A. Trung vị (Median)
- B. Độ lệch chuẩn (Standard Deviation)
- C. Trung bình (Mean)
- D. Mốt (Mode)
Câu 7: Trong một cuộc khảo sát về mức độ hài lòng của khách hàng, thang đo Likert 5 mức độ (từ "Rất không hài lòng" đến "Rất hài lòng") được sử dụng. Loại thang đo này thuộc loại nào?
- A. Định danh (Nominal)
- B. Thứ bậc (Ordinal)
- C. Khoảng (Interval)
- D. Tỷ lệ (Ratio)
Câu 8: Khi nào thì việc sử dụng trung vị (median) thích hợp hơn trung bình (mean) để mô tả giá trị trung tâm của một tập dữ liệu?
- A. Khi dữ liệu phân phối chuẩn.
- B. Khi dữ liệu có tính đối xứng.
- C. Khi dữ liệu có giá trị ngoại lệ (outliers).
- D. Khi muốn tính tổng các giá trị.
Câu 9: Giả thuyết không (null hypothesis) trong kiểm định giả thuyết thường phát biểu điều gì?
- A. Không có sự khác biệt hoặc mối quan hệ trong tổng thể.
- B. Có sự khác biệt hoặc mối quan hệ đáng kể trong tổng thể.
- C. Sự khác biệt hoặc mối quan hệ là do yếu tố ngẫu nhiên.
- D. Mẫu dữ liệu không đại diện cho tổng thể.
Câu 10: Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
- A. Bác bỏ giả thuyết không khi nó thực sự đúng.
- B. Chấp nhận giả thuyết không khi nó thực sự đúng.
- C. Không bác bỏ giả thuyết không khi nó thực sự sai.
- D. Không đưa ra kết luận về giả thuyết không.
Câu 11: Để so sánh tỷ lệ thành công của hai phương pháp điều trị khác nhau cho một bệnh, kiểm định thống kê nào phù hợp?
- A. Kiểm định t độc lập (Independent t-test)
- B. Phân tích phương sai (ANOVA)
- C. Hồi quy tuyến tính (Linear Regression)
- D. Kiểm định Chi bình phương (Chi-square test)
Câu 12: Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope) của đường hồi quy biểu thị điều gì?
- A. Giá trị trung bình của biến phụ thuộc.
- B. Mức độ thay đổi của biến phụ thuộc khi biến độc lập tăng một đơn vị.
- C. Mức độ phân tán của dữ liệu xung quanh đường hồi quy.
- D. Độ mạnh của mối quan hệ tuyến tính giữa hai biến.
Câu 13: Biểu đồ nào sau đây thích hợp nhất để thể hiện phân phối tần số của một biến số liên tục?
- A. Biểu đồ tròn (Pie chart)
- B. Biểu đồ cột (Bar chart)
- C. Biểu đồ tần suất (Histogram)
- D. Biểu đồ hộp (Box plot)
Câu 14: Phương pháp lấy mẫu nào đảm bảo mỗi đơn vị trong tổng thể có cơ hội được chọn vào mẫu như nhau?
- A. Lấy mẫu ngẫu nhiên đơn giản (Simple Random Sampling)
- B. Lấy mẫu phân tầng (Stratified Sampling)
- C. Lấy mẫu cụm (Cluster Sampling)
- D. Lấy mẫu thuận tiện (Convenience Sampling)
Câu 15: Hệ số xác định (R-squared) trong phân tích hồi quy đa biến đo lường điều gì?
- A. Độ mạnh của mối quan hệ tuyến tính giữa các biến độc lập.
- B. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
- C. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
- D. Sai số chuẩn của các hệ số hồi quy.
Câu 16: Để kiểm tra xem có sự khác biệt về điểm trung bình của một bài kiểm tra giữa ba nhóm sinh viên khác nhau (Nhóm A, Nhóm B, Nhóm C), kiểm định nào phù hợp nhất?
- A. Phân tích phương sai (ANOVA)
- B. Kiểm định t ghép cặp (Paired t-test)
- C. Kiểm định t độc lập (Independent t-test)
- D. Kiểm định Chi bình phương (Chi-square test)
Câu 17: Giá trị P (p-value) trong kiểm định giả thuyết được định nghĩa là gì?
- A. Xác suất giả thuyết không là đúng.
- B. Xác suất quan sát được kết quả mẫu (hoặc cực đoan hơn) nếu giả thuyết không là đúng.
- C. Mức ý nghĩa thống kê được chọn trước (ví dụ: 0.05).
- D. Sai số loại I cho phép trong kiểm định.
Câu 18: Trong phân tích phương sai (ANOVA), giả thuyết không (null hypothesis) thường là gì?
- A. Trung bình của ít nhất một nhóm khác biệt so với các nhóm khác.
- B. Phương sai giữa các nhóm khác nhau đáng kể.
- C. Trung bình của tất cả các nhóm bằng nhau.
- D. Không có sự khác biệt về phân phối giữa các nhóm.
Câu 19: Để phân tích mối quan hệ giữa hai biến số định tính, phương pháp thống kê nào thích hợp?
- A. Tương quan Pearson (Pearson correlation)
- B. Hồi quy tuyến tính (Linear Regression)
- C. Kiểm định t độc lập (Independent t-test)
- D. Kiểm định Chi bình phương (Chi-square test)
Câu 20: Biểu đồ hộp (box plot) thường được sử dụng để thể hiện điều gì về phân phối của dữ liệu?
- A. Mốt và độ lệch chuẩn.
- B. Trung vị, tứ phân vị, và giá trị ngoại lệ.
- C. Trung bình và khoảng tin cậy.
- D. Tần số và tỷ lệ phần trăm.
Câu 21: Trong thống kê suy diễn, mục tiêu chính là gì?
- A. Mô tả đặc điểm của mẫu dữ liệu.
- B. Trực quan hóa dữ liệu bằng biểu đồ.
- C. Đưa ra kết luận về tổng thể dựa trên dữ liệu mẫu.
- D. Tính toán các chỉ số thống kê mô tả.
Câu 22: Khi thực hiện kiểm định giả thuyết, mức ý nghĩa (alpha, α) thường được chọn là 0.05. Điều này có nghĩa là gì?
- A. Xác suất mắc sai số loại II là 5%.
- B. Độ tin cậy của kết quả kiểm định là 95%.
- C. P-value phải nhỏ hơn 0.05 để bác bỏ giả thuyết không.
- D. Có 5% rủi ro bác bỏ giả thuyết không khi nó thực sự đúng.
Câu 23: Phương pháp thống kê nào được sử dụng để khám phá cấu trúc ẩn bên dưới một tập hợp lớn các biến số?
- A. Phân tích hồi quy tuyến tính (Linear Regression)
- B. Phân tích nhân tố (Factor Analysis)
- C. Phân tích phương sai (ANOVA)
- D. Phân tích phân biệt (Discriminant Analysis)
Câu 24: Để kiểm tra tính phân phối chuẩn của một tập dữ liệu, kiểm định nào sau đây có thể được sử dụng?
- A. Kiểm định Shapiro-Wilk
- B. Kiểm định t độc lập (Independent t-test)
- C. Kiểm định Chi bình phương (Chi-square test)
- D. Phân tích phương sai (ANOVA)
Câu 25: Trong phân tích hồi quy đa biến, khi nào xảy ra hiện tượng đa cộng tuyến (multicollinearity)?
- A. Khi biến phụ thuộc không phân phối chuẩn.
- B. Khi mô hình hồi quy không phù hợp với dữ liệu.
- C. Khi các biến độc lập có tương quan cao với nhau.
- D. Khi kích thước mẫu quá nhỏ.
Câu 26: Loại biểu đồ nào phù hợp để so sánh giá trị trung bình của một biến số giữa các nhóm khác nhau?
- A. Biểu đồ phân tán (Scatter plot)
- B. Biểu đồ cột (Bar chart)
- C. Biểu đồ đường (Line chart)
- D. Biểu đồ tròn (Pie chart)
Câu 27: Khoảng tin cậy 95% cho trung bình quần thể được diễn giải như thế nào?
- A. Có 95% xác suất trung bình mẫu nằm trong khoảng này.
- B. Trung bình quần thể chắc chắn nằm trong khoảng này.
- C. Nếu lặp lại lấy mẫu nhiều lần, 95% các khoảng tin cậy sẽ chứa trung bình quần thể.
- D. Khoảng này chứa 95% dữ liệu trong mẫu.
Câu 28: Để đánh giá mối quan hệ phi tuyến tính giữa hai biến số, phương pháp nào sau đây có thể hữu ích?
- A. Tương quan Pearson (Pearson correlation)
- B. Hồi quy tuyến tính (Linear Regression)
- C. Kiểm định t độc lập (Independent t-test)
- D. Hồi quy phi tuyến (Nonlinear Regression)
Câu 29: Trong phân tích sống sót (survival analysis), hàm Kaplan-Meier được sử dụng để làm gì?
- A. Ước tính hàm sống sót (survival function).
- B. So sánh thời gian sống trung bình giữa các nhóm.
- C. Xác định các yếu tố tiên lượng ảnh hưởng đến thời gian sống.
- D. Kiểm tra tỷ lệ rủi ro (hazard ratio).
Câu 30: Để giảm thiểu sai số lấy mẫu, biện pháp nào sau đây hiệu quả nhất?
- A. Sử dụng phương pháp lấy mẫu thuận tiện.
- B. Tăng kích thước mẫu.
- C. Sử dụng phương pháp thống kê mô tả.
- D. Giảm mức ý nghĩa (alpha).