Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Thống Kê Học - Đề 04 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Biến định lượng (quantitative variable) khác với biến định tính (qualitative variable) ở điểm nào sau đây?
- A. Biến định lượng luôn được biểu diễn bằng số nguyên, biến định tính thì không.
- B. Biến định lượng có thể đo lường được, biến định tính thì không.
- C. Giá trị của biến định lượng thể hiện độ lớn hoặc số lượng, trong khi giá trị biến định tính thể hiện thuộc tính hoặc phẩm chất.
- D. Biến định lượng chỉ được sử dụng trong thống kê mô tả, biến định tính chỉ được dùng trong thống kê suy luận.
Câu 2: Trong một nghiên cứu về chiều cao của sinh viên, bạn thu thập dữ liệu và tính được trung bình mẫu là 165cm và độ lệch chuẩn mẫu là 5cm. Khoảng biến thiên (range) ước tính của chiều cao trong mẫu này là bao nhiêu, biết rằng dữ liệu phân phối xấp xỉ chuẩn?
- A. 5cm
- B. 30cm
- C. 10cm
- D. Không thể xác định từ thông tin đã cho.
Câu 3: Biểu đồ nào sau đây thích hợp nhất để so sánh phân phối của một biến số định lượng giữa hai nhóm đối tượng khác nhau?
- A. Biểu đồ tròn (Pie chart)
- B. Biểu đồ đường (Line chart)
- C. Biểu đồ tần số (Histogram)
- D. Biểu đồ hộp (Box plot)
Câu 4: Một nhà nghiên cứu muốn kiểm tra giả thuyết rằng "Tỷ lệ người thuận tay phải trong dân số là 85%". Họ thu thập mẫu ngẫu nhiên 200 người và thấy 180 người thuận tay phải. Kiểm định giả thuyết nào sau đây là phù hợp?
- A. Kiểm định Z một mẫu cho tỷ lệ (One-sample Z-test for proportion)
- B. Kiểm định t một mẫu (One-sample t-test)
- C. Kiểm định Chi bình phương (Chi-square test)
- D. Phân tích phương sai ANOVA
Câu 5: Giá trị P (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?
- A. Xác suất giả thuyết không (H0) là đúng.
- B. Xác suất quan sát được kết quả mẫu Extreme hơn nếu giả thuyết không (H0) là đúng.
- C. Mức độ quan trọng thực tế của kết quả nghiên cứu.
- D. Ngưỡng ý nghĩa thống kê (alpha) cần đạt được.
Câu 6: Trong phân tích hồi quy tuyến tính đơn giản, hệ số hồi quy (regression coefficient) cho biết điều gì?
- A. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
- B. Mức độ tương quan giữa biến độc lập và biến phụ thuộc.
- C. Mức độ thay đổi trung bình của biến phụ thuộc khi biến độc lập tăng lên một đơn vị.
- D. Sai số chuẩn của ước lượng hệ số hồi quy.
Câu 7: Khi nào thì việc sử dụng trung vị (median) là thước đo trung tâm phù hợp hơn so với trung bình (mean)?
- A. Khi dữ liệu có phân phối chuẩn.
- B. Khi dữ liệu bị lệch hoặc có giá trị ngoại lai.
- C. Khi kích thước mẫu lớn.
- D. Khi muốn tính tổng các giá trị.
Câu 8: Sai số loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?
- A. Bác bỏ giả thuyết không (H0) khi H0 thực sự đúng.
- B. Không bác bỏ giả thuyết không (H0) khi H0 thực sự sai.
- C. Chọn mức ý nghĩa thống kê (alpha) quá cao.
- D. Mẫu nghiên cứu quá nhỏ.
Câu 9: Độ lệch chuẩn (standard deviation) đo lường điều gì?
- A. Giá trị trung tâm của dữ liệu.
- B. Hình dạng phân phối của dữ liệu.
- C. Tổng của các giá trị dữ liệu.
- D. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
Câu 10: Phương pháp chọn mẫu nào đảm bảo mỗi đơn vị trong tổng thể có cơ hội được chọn vào mẫu như nhau?
- A. Chọn mẫu thuận tiện (Convenience sampling)
- B. Chọn mẫu phân tầng (Stratified sampling)
- C. Chọn mẫu ngẫu nhiên đơn giản (Simple random sampling)
- D. Chọn mẫu cụm (Cluster sampling)
Câu 11: Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường mối quan hệ tuyến tính giữa hai biến định lượng. Giá trị của hệ số này nằm trong khoảng nào?
- A. 0 đến 1
- B. -1 đến +1
- C. 0 đến vô cùng
- D. - vô cùng đến + vô cùng
Câu 12: Phân phối nhị thức (Binomial distribution) mô tả số lần thành công trong một chuỗi phép thử Bernoulli độc lập. Điều kiện nào không cần thiết cho phân phối nhị thức?
- A. Các phép thử phải độc lập với nhau.
- B. Mỗi phép thử chỉ có hai kết quả có thể xảy ra (thành công hoặc thất bại).
- C. Xác suất thành công phải không đổi trong mỗi phép thử.
- D. Dữ liệu gốc phải có phân phối chuẩn.
Câu 13: Khoảng tin cậy (confidence interval) 95% cho trung bình quần thể được hiểu như thế nào?
- A. Có 95% xác suất trung bình quần thể nằm trong khoảng này.
- B. Khoảng này chứa 95% dữ liệu mẫu.
- C. Nếu lặp lại lấy mẫu nhiều lần, khoảng 95% các khoảng tin cậy tính được sẽ chứa trung bình quần thể thực sự.
- D. Độ chính xác của trung bình mẫu là 95%.
Câu 14: Trong phân tích phương sai (ANOVA), giả thuyết không (H0) thường là gì?
- A. Trung bình của tất cả các nhóm khác nhau.
- B. Trung bình của tất cả các nhóm bằng nhau.
- C. Phương sai của tất cả các nhóm bằng nhau.
- D. Phương sai của tất cả các nhóm khác nhau.
Câu 15: Một nghiên cứu bệnh chứng (case-control study) thường được sử dụng để nghiên cứu về:
- A. Tỷ lệ mắc bệnh mới trong một quần thể theo thời gian.
- B. Hiệu quả của một can thiệp y tế.
- C. Mô tả đặc điểm của một quần thể tại một thời điểm.
- D. Các yếu tố nguy cơ liên quan đến một bệnh hiếm gặp.
Câu 16: Thang đo nào sau đây là thang đo định danh (nominal scale)?
- A. Màu sắc mắt (xanh, nâu, đen)
- B. Mức độ hài lòng (rất không hài lòng, không hài lòng, trung lập, hài lòng, rất hài lòng)
- C. Nhiệt độ (độ C)
- D. Thu nhập (VND)
Câu 17: Trong kiểm định Chi bình phương (Chi-square test) về tính độc lập, giả thuyết không (H0) là gì?
- A. Hai biến định tính có mối quan hệ nhân quả.
- B. Hai biến định tính có tương quan tuyến tính.
- C. Hai biến định tính là độc lập với nhau.
- D. Phân phối của hai biến định tính giống nhau.
Câu 18: Khi kích thước mẫu tăng lên, điều gì thường xảy ra với sai số chuẩn (standard error) của trung bình mẫu?
- A. Sai số chuẩn tăng lên.
- B. Sai số chuẩn giảm xuống.
- C. Sai số chuẩn không thay đổi.
- D. Sai số chuẩn trở nên không xác định.
Câu 19: Biểu đồ phân tán (scatterplot) được sử dụng để:
- A. Khám phá mối quan hệ giữa hai biến định lượng.
- B. So sánh trung bình của một biến số giữa các nhóm.
- C. Hiển thị tần số phân phối của một biến định tính.
- D. Biểu diễn sự thay đổi của một biến số theo thời gian.
Câu 20: Giá trị IQR (Interquartile Range - Khoảng tứ phân vị) đo lường điều gì?
- A. Toàn bộ phạm vi của dữ liệu.
- B. Độ lệch trung bình tuyệt đối.
- C. Độ phân tán của 50% dữ liệu trung tâm.
- D. Khoảng cách từ giá trị nhỏ nhất đến trung vị.
Câu 21: Điều kiện tiên quyết quan trọng nhất để sử dụng kiểm định t (t-test) độc lập hai mẫu khi so sánh trung bình của hai nhóm là gì?
- A. Dữ liệu của cả hai nhóm phải có phân phối chuẩn.
- B. Phương sai của hai nhóm phải bằng nhau.
- C. Kích thước mẫu của hai nhóm phải bằng nhau.
- D. Các quan sát trong hai nhóm phải độc lập với nhau.
Câu 22: Trong thống kê mô tả, "mode" (mốt) là gì?
- A. Giá trị trung bình của dữ liệu.
- B. Giá trị xuất hiện nhiều lần nhất trong dữ liệu.
- C. Giá trị nằm giữa của dữ liệu khi sắp xếp theo thứ tự.
- D. Tổng của tất cả các giá trị chia cho số lượng giá trị.
Câu 23: Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
- A. Khi kích thước mẫu lớn.
- B. Khi muốn tăng độ mạnh của kiểm định.
- C. Khi các giả định của kiểm định tham số không được thỏa mãn.
- D. Khi dữ liệu có phân phối chuẩn.
Câu 24: Khái niệm "phương sai" (variance) trong thống kê đo lường điều gì?
- A. Giá trị trung tâm của dữ liệu.
- B. Hình dạng phân phối của dữ liệu.
- C. Khoảng biến thiên của dữ liệu.
- D. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình (bình phương độ lệch).
Câu 25: Trong một nghiên cứu thuần tập (cohort study), thước đo nguy cơ (risk measure) chính thường được sử dụng là gì?
- A. Tỷ số Odds (Odds Ratio)
- B. Nguy cơ tương đối (Relative Risk)
- C. Tỷ lệ hiện mắc (Prevalence)
- D. Tỷ lệ mới mắc (Incidence)
Câu 26: Biểu đồ thân và lá (stem-and-leaf plot) chủ yếu được sử dụng để:
- A. So sánh phân phối của nhiều biến số.
- B. Hiển thị mối quan hệ giữa hai biến định lượng.
- C. Hiển thị phân phối và hình dạng của một tập dữ liệu số.
- D. Biểu diễn dữ liệu theo tỷ lệ phần trăm.
Câu 27: Hệ số xác định (R-squared) trong hồi quy tuyến tính bội (multiple linear regression) đo lường điều gì?
- A. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình.
- B. Mức độ tương quan giữa các biến độc lập.
- C. Ý nghĩa thống kê của từng biến độc lập trong mô hình.
- D. Độ chính xác của các hệ số hồi quy ước lượng.
Câu 28: Trong kiểm định giả thuyết, "mức ý nghĩa thống kê" (alpha level) thường được chọn là 0.05. Điều này có nghĩa là:
- A. Xác suất giả thuyết không (H0) là đúng là 5%.
- B. Có 95% cơ hội kết quả nghiên cứu là đúng.
- C. Sai số loại II (beta) là 5%.
- D. Chúng ta chấp nhận rủi ro 5% bác bỏ giả thuyết không (H0) khi H0 thực sự đúng.
Câu 29: Khi so sánh hai phương pháp đo huyết áp khác nhau trên cùng một nhóm bệnh nhân, loại kiểm định nào phù hợp để kiểm tra xem có sự khác biệt trung bình giữa hai phương pháp này không?
- A. Kiểm định t độc lập hai mẫu (Independent samples t-test)
- B. Kiểm định Z một mẫu (One-sample Z-test)
- C. Kiểm định t ghép cặp (Paired t-test)
- D. Phân tích phương sai ANOVA
Câu 30: Để ước tính tỷ lệ cử tri ủng hộ một ứng cử viên chính trị trong một thành phố lớn, phương pháp chọn mẫu nào sau đây có khả năng cho kết quả ít chệch (biased) nhất?
- A. Chọn mẫu thuận tiện (Convenience sampling) tại trung tâm thành phố.
- B. Chọn mẫu ngẫu nhiên phân tầng (Stratified random sampling) theo khu vực dân cư.
- C. Chọn mẫu hệ thống (Systematic sampling) từ danh sách cử tri theo thứ tự alphabet.
- D. Chọn mẫu tuyết lăn (Snowball sampling) bắt đầu từ một nhóm nhỏ người ủng hộ ứng cử viên.