Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Nguyên Lý Thống Kê - Đề 05 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Trong một nghiên cứu về mức độ hài lòng của khách hàng đối với dịch vụ của một công ty viễn thông, nhà nghiên cứu thu thập dữ liệu từ 2000 khách hàng ngẫu nhiên. Biến số "mức độ hài lòng" được đo bằng thang điểm từ 1 (rất không hài lòng) đến 5 (rất hài lòng). Để mô tả xu hướng trung tâm của mức độ hài lòng, biện pháp thống kê mô tả phù hợp nhất là:
- A. Giá trị trung bình (Mean)
- B. Phương sai (Variance)
- C. Trung vị (Median)
- D. Độ lệch chuẩn (Standard Deviation)
Câu 2: Một nhà sinh vật học muốn ước tính chiều cao trung bình của một loài cây mới được phát hiện trong một khu rừng nguyên sinh. Ông đo chiều cao của 100 cây ngẫu nhiên và tính được trung bình mẫu là 15.5 mét và độ lệch chuẩn mẫu là 2.0 mét. Khoảng tin cậy 95% cho chiều cao trung bình của loài cây này là bao nhiêu? (Giả định phân phối chiều cao là gần chuẩn và sử dụng giá trị z ≈ 1.96 cho độ tin cậy 95%)
- A. (15.3, 15.7)
- B. (15.1, 15.9)
- C. (14.5, 16.5)
- D. (13.5, 17.5)
Câu 3: Một công ty dược phẩm phát triển một loại thuốc mới hạ huyết áp. Để kiểm tra hiệu quả của thuốc, họ thực hiện một thử nghiệm lâm sàng ngẫu nhiên có đối chứng. Nhóm điều trị (n=50) dùng thuốc mới, nhóm đối chứng (n=50) dùng giả dược. Sau 8 tuần, huyết áp trung bình của nhóm điều trị giảm 10 mmHg, nhóm đối chứng giảm 2 mmHg. Để so sánh sự khác biệt về mức giảm huyết áp giữa hai nhóm, kiểm định giả thuyết thống kê nào là phù hợp nhất?
- A. Kiểm định t độc lập (Independent samples t-test)
- B. Kiểm định t ghép cặp (Paired samples t-test)
- C. Kiểm định Chi-bình phương (Chi-square test)
- D. Phân tích phương sai ANOVA (Analysis of Variance)
Câu 4: Trong kiểm định giả thuyết ở Câu 3, giả thuyết không (Null hypothesis - H0) thường được phát biểu như thế nào?
- A. Thuốc mới có hiệu quả hạ huyết áp cao hơn giả dược.
- B. Không có sự khác biệt về hiệu quả hạ huyết áp giữa thuốc mới và giả dược.
- C. Huyết áp trung bình của nhóm dùng thuốc mới giảm nhiều hơn 10 mmHg.
- D. Huyết áp trung bình của cả hai nhóm đều giảm như nhau.
Câu 5: Kết quả kiểm định giả thuyết ở Câu 3 cho ra giá trị p = 0.03. Với mức ý nghĩa α = 0.05, kết luận nào sau đây là đúng?
- A. Chấp nhận giả thuyết không, kết luận thuốc mới không hiệu quả hơn giả dược.
- B. Không thể đưa ra kết luận vì giá trị p lớn hơn mức ý nghĩa.
- C. Bác bỏ giả thuyết không, kết luận thuốc mới có hiệu quả hạ huyết áp tốt hơn giả dược.
- D. Cần tăng mức ý nghĩa α để có thể bác bỏ giả thuyết không.
Câu 6: Một nhà nghiên cứu thị trường muốn tìm hiểu mối quan hệ giữa chi tiêu cho quảng cáo (biến X) và doanh thu bán hàng (biến Y) của một chuỗi cửa hàng bán lẻ. Họ thu thập dữ liệu từ 30 cửa hàng và thực hiện phân tích hồi quy tuyến tính đơn giản. Hệ số hồi quy (slope) ước tính được là 2.5. Ý nghĩa của hệ số hồi quy này là gì?
- A. Doanh thu bán hàng tăng 2.5% khi chi tiêu quảng cáo tăng 1%.
- B. Chi tiêu quảng cáo chiếm 2.5% doanh thu bán hàng.
- C. Khi doanh thu bán hàng tăng 1 đơn vị, chi tiêu quảng cáo tăng 2.5 đơn vị.
- D. Khi chi tiêu quảng cáo tăng 1 đơn vị, doanh thu bán hàng tăng trung bình 2.5 đơn vị.
Câu 7: Trong phân tích phương sai (ANOVA) một yếu tố, để so sánh trung bình của doanh số giữa 3 nhóm cửa hàng (Nhóm A, B, C) với các chiến lược marketing khác nhau, giả thuyết không (H0) là gì?
- A. Trung bình doanh số của Nhóm A = Trung bình doanh số của Nhóm B = Trung bình doanh số của Nhóm C.
- B. Trung bình doanh số của Nhóm A ≠ Trung bình doanh số của Nhóm B ≠ Trung bình doanh số của Nhóm C.
- C. Trung bình doanh số của Nhóm A > Trung bình doanh số của Nhóm B > Trung bình doanh số của Nhóm C.
- D. Doanh số của cả ba nhóm cửa hàng đều có phương sai bằng nhau.
Câu 8: Biểu đồ hộp (Box plot) thường được sử dụng để:
- A. So sánh trung bình của hai nhóm dữ liệu.
- B. Mô tả hình dạng phân phối, trung vị và độ trải giữa của một tập dữ liệu.
- C. Thể hiện mối quan hệ giữa hai biến định lượng.
- D. Phân tích tần số của các biến định tính.
Câu 9: Trong một nghiên cứu bệnh chứng về mối liên hệ giữa hút thuốc lá và ung thư phổi, nhóm bệnh nhân ung thư phổi (nhóm bệnh) được so sánh với nhóm người không mắc ung thư phổi (nhóm chứng) về tiền sử hút thuốc lá. Ước lượng đo lường mối liên hệ phù hợp nhất trong nghiên cứu bệnh chứng là:
- A. Nguy cơ tương đối (Relative Risk - RR)
- B. Tỷ số hiện mắc (Prevalence Ratio - PR)
- C. Tỷ số chênh (Odds Ratio - OR)
- D. Tỷ lệ mới mắc tích lũy (Cumulative Incidence - CI)
Câu 10: Giá trị P (P-value) trong kiểm định thống kê thể hiện:
- A. Xác suất giả thuyết không là đúng.
- B. Xác suất mắc lỗi loại I.
- C. Mức ý nghĩa thống kê của kiểm định.
- D. Xác suất quan sát được kết quả mẫu (hoặc cực đoan hơn) nếu giả thuyết không là đúng.
Câu 11: Một nhà tâm lý học thực hiện nghiên cứu về ảnh hưởng của phương pháp học tập mới (A) so với phương pháp truyền thống (B) đến điểm số bài kiểm tra. Sinh viên được phân ngẫu nhiên vào một trong hai nhóm. Điểm số bài kiểm tra được ghi lại. Loại biến số "phương pháp học tập" là:
- A. Biến định lượng liên tục (Continuous quantitative variable)
- B. Biến định tính danh mục (Categorical qualitative variable)
- C. Biến định lượng rời rạc (Discrete quantitative variable)
- D. Biến thứ bậc (Ordinal variable)
Câu 12: Trong một phân tích tương quan, hệ số tương quan Pearson (r) đo lường:
- A. Mức độ khác biệt trung bình giữa hai biến.
- B. Tỷ lệ biến thiên của một biến được giải thích bởi biến kia.
- C. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
- D. Khả năng biến này gây ra biến kia.
Câu 13: Phương pháp lấy mẫu nào đảm bảo mỗi đơn vị trong tổng thể có cơ hội được chọn vào mẫu như nhau?
- A. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling)
- B. Lấy mẫu phân tầng (Stratified sampling)
- C. Lấy mẫu cụm (Cluster sampling)
- D. Lấy mẫu thuận tiện (Convenience sampling)
Câu 14: Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi:
- A. Bác bỏ giả thuyết không khi nó thực sự đúng.
- B. Chấp nhận giả thuyết không khi nó thực sự đúng.
- C. Không bác bỏ giả thuyết không khi nó thực sự sai.
- D. Đưa ra quyết định sai lầm trong phân tích dữ liệu.
Câu 15: Để kiểm tra sự độc lập giữa hai biến định tính (ví dụ: giới tính và ý kiến về một vấn đề xã hội), kiểm định thống kê nào phù hợp?
- A. Kiểm định t (t-test)
- B. Kiểm định Chi-bình phương (Chi-square test)
- C. Phân tích hồi quy (Regression analysis)
- D. Phân tích phương sai (ANOVA)
Câu 16: Một nghiên cứu thuần tập theo dõi nhóm người hút thuốc và nhóm người không hút thuốc trong 20 năm để xem xét tỷ lệ mắc bệnh tim mạch. Thiết kế nghiên cứu này phù hợp nhất để:
- A. Xác định tỷ lệ mắc bệnh tim mạch và nguy cơ tương đối liên quan đến hút thuốc lá.
- B. Xác định tỷ lệ hiện mắc bệnh tim mạch tại thời điểm bắt đầu nghiên cứu.
- C. So sánh chi phí điều trị bệnh tim mạch giữa hai nhóm.
- D. Khám phá ý kiến chủ quan của người tham gia về bệnh tim mạch.
Câu 17: Trong thống kê suy diễn, mục tiêu chính là:
- A. Mô tả và tóm tắt dữ liệu mẫu.
- B. Đưa ra kết luận hoặc suy luận về tổng thể dựa trên dữ liệu mẫu.
- C. Thu thập và tổ chức dữ liệu.
- D. Trình bày dữ liệu bằng biểu đồ và bảng.
Câu 18: Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
- A. Khi kích thước mẫu lớn.
- B. Khi dữ liệu tuân theo phân phối chuẩn.
- C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
- D. Khi muốn so sánh trung bình của hai nhóm.
Câu 19: Hiện tượng "phương sai thổi phồng" (Variance Inflation Factor - VIF) thường gặp trong phân tích hồi quy đa biến, VIF đo lường điều gì?
- A. Phương sai của sai số ngẫu nhiên trong mô hình hồi quy.
- B. Phương sai của biến phụ thuộc.
- C. Phương sai của hệ số hồi quy ước lượng.
- D. Mức độ đa cộng tuyến giữa các biến độc lập.
Câu 20: Trong lý thuyết xác suất, quy tắc cộng xác suất (Addition rule) được áp dụng khi nào?
- A. Khi muốn tính xác suất của giao hai biến cố (A và B).
- B. Khi muốn tính xác suất của hợp hai biến cố (A hoặc B).
- C. Khi các biến cố độc lập.
- D. Khi các biến cố có điều kiện.
Câu 21: Trong thống kê Bayesian, khái niệm "tiền nghiệm phân phối" (Prior distribution) đề cập đến:
- A. Phân phối xác suất biểu diễn niềm tin ban đầu về tham số trước khi quan sát dữ liệu.
- B. Phân phối xác suất của dữ liệu mẫu.
- C. Phân phối xác suất của sai số ngẫu nhiên.
- D. Phân phối xác suất được tính toán sau khi quan sát dữ liệu.
Câu 22: Biến số nào sau đây là biến định lượng liên tục?
- A. Số con trong một gia đình.
- B. Số tầng của một tòa nhà.
- C. Chiều cao của một người.
- D. Nhóm máu (A, B, AB, O).
Câu 23: Độ lệch chuẩn (Standard Deviation) đo lường điều gì?
- A. Xu hướng trung tâm của dữ liệu.
- B. Độ phân tán của dữ liệu xung quanh giá trị trung bình.
- C. Giá trị lớn nhất trừ giá trị nhỏ nhất của dữ liệu.
- D. Vị trí trung tâm của dữ liệu đã sắp xếp.
Câu 24: Trong phân tích sống còn (Survival analysis), hàm Kaplan-Meier được sử dụng để:
- A. So sánh trung bình thời gian sống sót giữa hai nhóm.
- B. Ước lượng nguy cơ tương đối của tử vong.
- C. Phân tích các yếu tố tiên lượng ảnh hưởng đến thời gian sống sót.
- D. Ước tính hàm sống còn theo thời gian.
Câu 25: Thế nào là "giá trị ngoại lệ" (Outlier) trong thống kê?
- A. Giá trị quan sát được khác biệt đáng kể so với các giá trị khác trong tập dữ liệu.
- B. Giá trị trung bình của tập dữ liệu.
- C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
- D. Giá trị nằm ở giữa tập dữ liệu đã sắp xếp.
Câu 26: Để đánh giá độ tin cậy bên trong (internal consistency) của một thang đo tâm lý gồm nhiều mục, hệ số Cronbach"s alpha thường được sử dụng. Giá trị Cronbach"s alpha lý tưởng nên nằm trong khoảng nào để đảm bảo độ tin cậy chấp nhận được?
- A. Dưới 0.50
- B. Từ 0.70 đến 0.90
- C. Từ 0.95 trở lên
- D. Không phụ thuộc vào giá trị Cronbach"s alpha
Câu 27: Trong phân tích hồi quy logistic, Odds Ratio (OR) được sử dụng để đo lường:
- A. Nguy cơ tương đối của biến cốOutcome.
- B. Xác suất của biến cốOutcome.
- C. Sự thay đổi về odds của biến cốOutcome khi biến predictor thay đổi 1 đơn vị.
- D. Tỷ lệ hiện mắc của biến cốOutcome.
Câu 28: Biểu đồ phân tán (Scatter plot) thường được sử dụng để:
- A. Khám phá mối quan hệ giữa hai biến định lượng.
- B. So sánh phân phối của một biến giữa các nhóm.
- C. Thể hiện tần số của các giá trị trong một biến.
- D. Mô tả xu hướng thời gian của một biến.
Câu 29: Giả sử bạn thực hiện kiểm định giả thuyết và thu được giá trị p = 0.08. Nếu bạn đặt mức ý nghĩa α = 0.05, quyết định của bạn là gì?
- A. Bác bỏ giả thuyết không.
- B. Không bác bỏ giả thuyết không.
- C. Chấp nhận giả thuyết đối thuyết.
- D. Cần thực hiện lại kiểm định với mẫu lớn hơn.
Câu 30: Trong phân tích hồi quy, hệ số xác định R-squared (R²) đo lường:
- A. Độ mạnh của mối quan hệ tuyến tính giữa các biến độc lập.
- B. Ý nghĩa thống kê của các hệ số hồi quy.
- C. Phương sai của sai số ngẫu nhiên.
- D. Tỷ lệ biến thiên của biến phụ thuộc được giải thích bởi mô hình hồi quy.