Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Thống Kê Ứng Dụng - Đề 01 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Một nhà nghiên cứu muốn ước tính chiều cao trung bình của sinh viên đại học tại Việt Nam. Thay vì đo chiều cao của tất cả sinh viên, họ chọn ngẫu nhiên 1000 sinh viên từ các trường đại học khác nhau để đo. Phương pháp này được gọi là gì?
- A. Điều tra toàn bộ (Census)
- B. Thống kê mô tả (Descriptive Statistics)
- C. Lấy mẫu thống kê (Statistical Sampling)
- D. Phân tích hồi quy (Regression Analysis)
Câu 2: Biến số nào sau đây là biến định tính (qualitative) trong một nghiên cứu về nhân khẩu học?
- A. Thu nhập hàng tháng (VND)
- B. Tuổi (năm)
- C. Số con trong gia đình
- D. Dân tộc
Câu 3: Thang đo nào sau đây cho phép xác định tỷ lệ giữa các giá trị, ví dụ như "gấp đôi" hay "bằng một nửa"?
- A. Thang đo định danh (Nominal scale)
- B. Thang đo thứ bậc (Ordinal scale)
- C. Thang đo khoảng (Interval scale)
- D. Thang đo tỷ lệ (Ratio scale)
Câu 4: Một cửa hàng ghi lại số lượng khách hàng ghé thăm mỗi ngày trong một tuần. Dữ liệu này thuộc loại dữ liệu nào?
- A. Định tính liên tục (Continuous qualitative)
- B. Định lượng rời rạc (Discrete quantitative)
- C. Định tính thứ bậc (Ordinal qualitative)
- D. Định lượng liên tục (Continuous quantitative)
Câu 5: Biểu đồ nào sau đây thích hợp nhất để thể hiện tỷ lệ phần trăm phân bổ của các loại trái cây bán được trong một tháng tại một siêu thị?
- A. Biểu đồ đường (Line chart)
- B. Biểu đồ cột (Bar chart)
- C. Biểu đồ tròn (Pie chart)
- D. Biểu đồ tần số (Histogram)
Câu 6: Giá trị trung vị (median) của một tập dữ liệu là gì?
- A. Giá trị trung bình cộng của tập dữ liệu
- B. Giá trị nằm ở vị trí chính giữa của tập dữ liệu đã sắp xếp
- C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu
- D. Tổng của tất cả các giá trị chia cho số lượng giá trị
Câu 7: Phương sai (variance) đo lường điều gì về một tập dữ liệu?
- A. Giá trị trung tâm của dữ liệu
- B. Hình dạng phân phối của dữ liệu
- C. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình
- D. Giá trị lớn nhất và nhỏ nhất trong dữ liệu
Câu 8: Hệ số tương quan (correlation coefficient) Pearson đo lường điều gì?
- A. Mức độ và hướng của mối quan hệ tuyến tính giữa hai biến định lượng
- B. Mức độ khác biệt giữa trung bình của hai nhóm
- C. Mức độ phù hợp của một mô hình hồi quy
- D. Mức độ phân tán của dữ liệu trong một mẫu
Câu 9: Trong kiểm định giả thuyết thống kê, "giá trị p" (p-value) thể hiện điều gì?
- A. Xác suất giả thuyết không là đúng
- B. Xác suất quan sát được kết quả như kết quả hiện tại nếu giả thuyết không là đúng
- C. Ngưỡng ý nghĩa thống kê thường được đặt là 0.05
- D. Kích thước của hiệu ứng nghiên cứu
Câu 10: Sai lầm loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?
- A. Chấp nhận giả thuyết không khi nó sai
- B. Không bác bỏ giả thuyết không khi nó đúng
- C. Bác bỏ giả thuyết không khi nó đúng
- D. Không đưa ra quyết định về giả thuyết không
Câu 11: Khoảng tin cậy (confidence interval) 95% cho trung bình tổng thể có nghĩa là gì?
- A. Trung bình mẫu nằm trong khoảng này với xác suất 95%
- B. 95% dữ liệu mẫu nằm trong khoảng này
- C. Chúng ta chắc chắn 95% rằng trung bình tổng thể nằm trong khoảng này
- D. Nếu lặp lại lấy mẫu nhiều lần, 95% các khoảng tin cậy sẽ chứa trung bình tổng thể thực sự
Câu 12: Phân tích hồi quy tuyến tính (linear regression) được sử dụng để làm gì?
- A. Mô hình hóa mối quan hệ tuyến tính giữa biến phụ thuộc và biến độc lập
- B. So sánh trung bình của hai nhóm
- C. Xác định sự khác biệt giữa các tỷ lệ
- D. Phân loại dữ liệu vào các nhóm khác nhau
Câu 13: Trong phân tích phương sai (ANOVA), giả thuyết không (null hypothesis) thường là gì?
- A. Có ít nhất một cặp trung bình nhóm khác nhau
- B. Trung bình của tất cả các nhóm bằng nhau
- C. Phương sai của tất cả các nhóm bằng nhau
- D. Dữ liệu tuân theo phân phối chuẩn
Câu 14: Kiểm định Chi-bình phương (Chi-square test) thường được sử dụng để làm gì?
- A. So sánh trung bình của hai mẫu độc lập
- B. Kiểm tra sự khác biệt giữa trung bình của nhiều nhóm
- C. Kiểm tra tính độc lập giữa hai biến định tính
- D. Ước lượng khoảng tin cậy cho trung bình tổng thể
Câu 15: Phân tích dữ liệu thứ cấp (secondary data analysis) là gì?
- A. Thu thập dữ liệu gốc từ đối tượng nghiên cứu
- B. Phân tích dữ liệu đã được thu thập cho mục đích khác
- C. Sử dụng phần mềm thống kê để phân tích dữ liệu
- D. Trình bày kết quả nghiên cứu bằng biểu đồ và bảng
Câu 16: Một nghiên cứu bệnh chứng (case-control study) thường được sử dụng để nghiên cứu điều gì?
- A. Tỷ lệ mắc bệnh trong một quần thể theo thời gian
- B. Hiệu quả của một can thiệp y tế
- C. Yếu tố nguy cơ liên quan đến một bệnh cụ thể
- D. Mô tả đặc điểm của một quần thể tại một thời điểm
Câu 17: Nghiên cứu thuần tập (cohort study) khác biệt với nghiên cứu bệnh chứng (case-control study) ở điểm nào?
- A. Nghiên cứu thuần tập theo dõi đối tượng theo thời gian, còn nghiên cứu bệnh chứng thì hồi cứu
- B. Nghiên cứu thuần tập luôn can thiệp vào đối tượng, còn nghiên cứu bệnh chứng thì không
- C. Nghiên cứu thuần tập chỉ sử dụng dữ liệu định lượng, còn nghiên cứu bệnh chứng thì chỉ dùng định tính
- D. Nghiên cứu thuần tập tập trung vào bệnh hiếm gặp, còn bệnh chứng thì bệnh phổ biến
Câu 18: Trong một thử nghiệm lâm sàng ngẫu nhiên có đối chứng (RCT), việc "ngẫu nhiên hóa" (randomization) nhằm mục đích gì?
- A. Tăng kích thước mẫu nghiên cứu
- B. Cân bằng các yếu tố gây nhiễu giữa nhóm can thiệp và nhóm đối chứng
- C. Đảm bảo tính đại diện của mẫu so với tổng thể
- D. Giảm thiểu sai số do đo lường
Câu 19: "Giá trị tới hạn" (critical value) trong kiểm định giả thuyết xác định điều gì?
- A. Xác suất mắc sai lầm loại II
- B. Mức độ mạnh mẽ của bằng chứng ủng hộ giả thuyết nghiên cứu
- C. Ranh giới để bác bỏ hay không bác bỏ giả thuyết không
- D. Kích thước của hiệu ứng cần thiết để đạt ý nghĩa thống kê
Câu 20: Khi nào nên sử dụng kiểm định t (t-test) cho mẫu độc lập?
- A. Khi so sánh trung bình của hai nhóm độc lập
- B. Khi so sánh trung bình của hai nhóm phụ thuộc
- C. Khi so sánh tỷ lệ của hai nhóm
- D. Khi phân tích mối quan hệ giữa hai biến định tính
Câu 21: "Phương sai giải thích" (explained variance) trong mô hình hồi quy cho biết điều gì?
- A. Tổng phương sai của biến phụ thuộc
- B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình
- C. Phương sai của sai số (residuals) trong mô hình
- D. Mức độ ý nghĩa thống kê của mô hình
Câu 22: "Độ mạnh kiểm định" (statistical power) của một kiểm định thống kê là gì?
- A. Xác suất mắc sai lầm loại I
- B. Xác suất chấp nhận giả thuyết không khi nó đúng
- C. Xác suất mắc sai lầm loại II
- D. Xác suất bác bỏ giả thuyết không khi nó sai
Câu 23: Khi dữ liệu không tuân theo phân phối chuẩn, phương pháp thống kê nào sau đây thường được sử dụng?
- A. Kiểm định t Student (Student"s t-test)
- B. Phân tích phương sai (ANOVA)
- C. Kiểm định Mann-Whitney U (Mann-Whitney U test)
- D. Hồi quy tuyến tính (Linear Regression)
Câu 24: Trong phân tích sống còn (survival analysis), "hàm sống còn" (survival function) mô tả điều gì?
- A. Thời gian trung bình đến khi xảy ra biến cố
- B. Xác suất sống sót vượt quá một thời điểm nhất định
- C. Tỷ lệ đối tượng gặp biến cố trong một khoảng thời gian
- D. Nguy cơ xảy ra biến cố tại một thời điểm cụ thể
Câu 25: Phương pháp nào sau đây được sử dụng để giảm chiều dữ liệu (dimensionality reduction) trong thống kê?
- A. Hồi quy logistic (Logistic Regression)
- B. Phân tích cụm (Cluster Analysis)
- C. Kiểm định giả thuyết (Hypothesis Testing)
- D. Phân tích thành phần chính (Principal Component Analysis - PCA)
Câu 26: Khi nào thì kiểm định Kruskal-Wallis được ưu tiên sử dụng hơn ANOVA một yếu tố?
- A. Khi so sánh trung bình của hai nhóm
- B. Khi dữ liệu không tuân theo phân phối chuẩn
- C. Khi kích thước mẫu lớn
- D. Khi các nhóm có phương sai bằng nhau
Câu 27: Trong phân tích hồi quy logistic, biến phụ thuộc có đặc điểm gì?
- A. Biến định lượng liên tục
- B. Biến định lượng rời rạc
- C. Biến định tính nhị phân
- D. Biến thứ bậc
Câu 28: "Odds ratio" (tỷ sốOdds) được sử dụng phổ biến trong loại nghiên cứu nào?
- A. Nghiên cứu bệnh chứng (Case-control study)
- B. Nghiên cứu thuần tập (Cohort study)
- C. Thử nghiệm lâm sàng (Clinical trial)
- D. Nghiên cứu cắt ngang (Cross-sectional study)
Câu 29: Phân tích "meta-analysis" (phân tích tổng hợp) có mục đích chính là gì?
- A. Phân tích dữ liệu định tính
- B. Thực hiện nghiên cứu định lượng ban đầu
- C. Đánh giá chất lượng của từng nghiên cứu
- D. Tổng hợp kết quả từ nhiều nghiên cứu để đưa ra kết luận chung
Câu 30: Để kiểm tra xem có mối liên hệ giữa "mức độ hài lòng của khách hàng" (đo bằng thang đo thứ bậc) và "tần suất mua hàng" (đo bằng thang đo thứ bậc) tại một siêu thị, kiểm định thống kê nào phù hợp nhất?
- A. Tương quan Pearson (Pearson correlation)
- B. Hồi quy tuyến tính (Linear Regression)
- C. Tương quan Spearman (Spearman rank correlation)
- D. Kiểm định t Student (Student"s t-test)