Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Thống Kê Học - Đề 06 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Biến định lượng nào sau đây là biến liên tục?
- A. Số lượng sách trong thư viện
- B. Chiều cao của sinh viên
- C. Số lần một người đi khám bác sĩ trong năm
- D. Số thành viên trong một gia đình
Câu 2: Để mô tả xu hướng trung tâm của điểm thi trong một lớp học, biện pháp nào sau đây là phù hợp nhất nếu dữ liệu điểm thi bị lệch phải (có nhiều điểm thấp và một vài điểm cao)?
- A. Trung bình (Mean)
- B. Phương sai (Variance)
- C. Trung vị (Median)
- D. Độ lệch chuẩn (Standard Deviation)
Câu 3: Trong một cuộc khảo sát về mức độ hài lòng của khách hàng, thang đo Likert 5 mức độ (1 - Rất không hài lòng đến 5 - Rất hài lòng) được sử dụng. Loại thang đo này thuộc về loại thang đo nào?
- A. Định danh (Nominal)
- B. Thứ bậc (Ordinal)
- C. Khoảng (Interval)
- D. Tỷ lệ (Ratio)
Câu 4: Một nhà nghiên cứu muốn so sánh chiều cao trung bình của sinh viên nam và sinh viên nữ trong trường đại học. Kiểm định giả thuyết thống kê nào sau đây là phù hợp nhất?
- A. Kiểm định Chi-bình phương (Chi-square test)
- B. Phân tích phương sai ANOVA
- C. Kiểm định t độc lập (Independent Samples t-test)
- D. Kiểm định tương quan Pearson
Câu 5: Giá trị P (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?
- A. Xác suất giả thuyết không là đúng.
- B. Mức độ ý nghĩa thống kê của kết quả.
- C. Sai số loại I mà chúng ta chấp nhận.
- D. Xác suất quan sát được kết quả mẫu hoặc cực đoan hơn nếu giả thuyết không là đúng.
Câu 6: Trong phân tích hồi quy tuyến tính đơn giản, hệ số hồi quy (regression coefficient) cho biết điều gì?
- A. Mức độ thay đổi của biến phụ thuộc khi biến độc lập tăng một đơn vị.
- B. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
- C. Mức độ tương quan giữa biến độc lập và biến phụ thuộc.
- D. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0.
Câu 7: Biểu đồ nào sau đây thích hợp nhất để thể hiện phân phối tần số của một biến định lượng liên tục?
- A. Biểu đồ tròn (Pie chart)
- B. Biểu đồ Histogram
- C. Biểu đồ hộp (Box plot)
- D. Biểu đồ đường (Line chart)
Câu 8: Phương pháp lấy mẫu nào sau đây đảm bảo mỗi đơn vị trong tổng thể đều có cơ hội được chọn vào mẫu như nhau?
- A. Lấy mẫu ngẫu nhiên đơn giản (Simple Random Sampling)
- B. Lấy mẫu phân tầng (Stratified Sampling)
- C. Lấy mẫu cụm (Cluster Sampling)
- D. Lấy mẫu thuận tiện (Convenience Sampling)
Câu 9: Độ lệch chuẩn (Standard Deviation) đo lường điều gì?
- A. Xu hướng trung tâm của dữ liệu.
- B. Hình dạng phân phối của dữ liệu.
- C. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
- D. Giá trị lớn nhất và nhỏ nhất của dữ liệu.
Câu 10: Trong lý thuyết xác suất, hai sự kiện được gọi là độc lập nếu:
- A. Chúng không thể xảy ra đồng thời.
- B. Tổng xác suất của chúng bằng 1.
- C. Chúng có chung một số yếu tố nguyên nhân.
- D. Sự xảy ra của sự kiện này không ảnh hưởng đến xác suất xảy ra của sự kiện kia.
Câu 11: Một hộp chứa 5 bi đỏ và 3 bi xanh. Nếu bạn rút ngẫu nhiên 2 bi mà không hoàn lại, xác suất để cả hai bi đều là đỏ là bao nhiêu?
- A. 25/64
- B. 5/14
- C. 1/2
- D. 10/14
Câu 12: Khoảng tin cậy 95% cho trung bình tổng thể được tính từ mẫu là (45, 55). Điều này có nghĩa là:
- A. 95% dữ liệu mẫu nằm trong khoảng (45, 55).
- B. Trung bình mẫu chắc chắn nằm trong khoảng (45, 55).
- C. Chúng ta tin tưởng 95% rằng trung bình tổng thể nằm trong khoảng (45, 55).
- D. Có 95% cơ hội trung bình tổng thể bằng 50.
Câu 13: Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
- A. Bác bỏ giả thuyết không khi nó thực sự đúng.
- B. Không bác bỏ giả thuyết không khi nó thực sự sai.
- C. Luôn chấp nhận giả thuyết không.
- D. Luôn bác bỏ giả thuyết không.
Câu 14: Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
- A. Mức độ và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
- B. Mức độ quan hệ phi tuyến tính giữa hai biến.
- C. Sự khác biệt giữa trung bình của hai biến.
- D. Mức độ phân tán của dữ liệu.
Câu 15: Trong phân tích phương sai (ANOVA), mục tiêu chính là gì?
- A. Đo lường mối quan hệ giữa hai biến định lượng.
- B. So sánh trung bình của ba nhóm hoặc nhiều hơn.
- C. Kiểm tra tính độc lập giữa hai biến định tính.
- D. Ước lượng khoảng tin cậy cho trung bình tổng thể.
Câu 16: Một nghiên cứu quan sát khác với một nghiên cứu thực nghiệm chủ yếu ở điểm nào?
- A. Nghiên cứu quan sát luôn sử dụng mẫu lớn hơn.
- B. Nghiên cứu thực nghiệm không thu thập dữ liệu định lượng.
- C. Trong nghiên cứu thực nghiệm, nhà nghiên cứu can thiệp vào biến độc lập.
- D. Nghiên cứu quan sát luôn chính xác hơn nghiên cứu thực nghiệm.
Câu 17: Để kiểm tra xem có mối liên hệ giữa nhóm máu (A, B, AB, O) và nguy cơ mắc một bệnh nào đó hay không, kiểm định thống kê nào phù hợp?
- A. Kiểm định Chi-bình phương (Chi-square test)
- B. Kiểm định t độc lập (Independent Samples t-test)
- C. Phân tích phương sai ANOVA
- D. Hồi quy tuyến tính
Câu 18: Biểu đồ hộp (Box plot) cung cấp thông tin về điều gì của một tập dữ liệu?
- A. Xu hướng trung tâm duy nhất.
- B. Độ lệch chuẩn duy nhất.
- C. Phân phối tần số chi tiết.
- D. Tóm tắt 5 số và sự phân tán của dữ liệu.
Câu 19: Xác suất của biến cố chắc chắn là bao nhiêu?
- A. 0
- B. 0.5
- C. 1
- D. Vô cùng lớn
Câu 20: Chọn câu phát biểu đúng về mối quan hệ giữa phương sai và độ lệch chuẩn:
- A. Phương sai luôn lớn hơn độ lệch chuẩn.
- B. Độ lệch chuẩn là căn bậc hai của phương sai.
- C. Phương sai và độ lệch chuẩn là hai khái niệm hoàn toàn độc lập.
- D. Độ lệch chuẩn là bình phương của phương sai.
Câu 21: Giả sử bạn muốn nghiên cứu về mức độ hài lòng của sinh viên về chất lượng giảng dạy của các khoa trong trường đại học. Bạn nên sử dụng phương pháp lấy mẫu nào để đảm bảo tính đại diện từ mỗi khoa?
- A. Lấy mẫu cụm (Cluster Sampling)
- B. Lấy mẫu phân tầng (Stratified Sampling)
- C. Lấy mẫu ngẫu nhiên đơn giản (Simple Random Sampling)
- D. Lấy mẫu thuận tiện (Convenience Sampling)
Câu 22: Trong một phân phối chuẩn, khoảng bao nhiêu phần trăm dữ liệu nằm trong khoảng một độ lệch chuẩn so với trung bình?
- A. Khoảng 68%
- B. Khoảng 95%
- C. Khoảng 99.7%
- D. 100%
Câu 23: Nếu hệ số tương quan giữa hai biến X và Y là -0.8, điều này có nghĩa là:
- A. X và Y không có mối quan hệ tuyến tính.
- B. Khi X tăng, Y có xu hướng tăng mạnh.
- C. Khi X tăng, Y không thay đổi.
- D. Khi X tăng, Y có xu hướng giảm mạnh.
Câu 24: Để dự đoán doanh số bán hàng dựa trên chi phí quảng cáo, kỹ thuật thống kê nào sau đây phù hợp nhất?
- A. Thống kê mô tả
- B. Kiểm định giả thuyết
- C. Phân tích hồi quy
- D. Phân tích phương sai
Câu 25: Biến ngẫu nhiên rời rạc khác với biến ngẫu nhiên liên tục ở điểm nào?
- A. Biến rời rạc luôn có giá trị nguyên, biến liên tục luôn có giá trị thập phân.
- B. Biến rời rạc nhận giá trị đếm được, biến liên tục nhận giá trị trong khoảng liên tục.
- C. Biến rời rạc không thể âm, biến liên tục có thể âm.
- D. Biến rời rạc dễ đo lường hơn biến liên tục.
Câu 26: Trong kiểm định một đuôi (one-tailed test) so với kiểm định hai đuôi (two-tailed test), sự khác biệt chính là gì?
- A. Kiểm định một đuôi luôn mạnh hơn kiểm định hai đuôi.
- B. Kiểm định hai đuôi chỉ dùng cho mẫu lớn.
- C. Kiểm định một đuôi không sử dụng giá trị P.
- D. Kiểm định một đuôi kiểm tra sự khác biệt theo một hướng, hai đuôi kiểm tra cả hai hướng.
Câu 27: Nếu bạn tăng kích thước mẫu trong một nghiên cứu thống kê, điều gì thường xảy ra với sai số chuẩn (standard error)?
- A. Sai số chuẩn tăng lên.
- B. Sai số chuẩn không thay đổi.
- C. Sai số chuẩn giảm xuống.
- D. Sai số chuẩn trở nên không xác định.
Câu 28: Để so sánh tỷ lệ thành công của hai phương pháp điều trị bệnh, kiểm định thống kê nào sau đây là phù hợp nhất?
- A. Kiểm định t độc lập (Independent Samples t-test)
- B. Kiểm định Z cho sự khác biệt giữa hai tỷ lệ (Z-test for two proportions)
- C. Phân tích phương sai ANOVA
- D. Hồi quy tuyến tính
Câu 29: Trong bối cảnh thống kê suy diễn, "tổng thể" (population) đề cập đến:
- A. Toàn bộ nhóm đối tượng mà nghiên cứu quan tâm.
- B. Một phần nhỏ của nhóm đối tượng được chọn để nghiên cứu.
- C. Chỉ những đối tượng tham gia trực tiếp vào nghiên cứu.
- D. Các kết quả thu được từ mẫu nghiên cứu.
Câu 30: Khi nào thì việc sử dụng thống kê phi tham số (non-parametric statistics) được ưu tiên hơn thống kê tham số (parametric statistics)?
- A. Khi kích thước mẫu rất lớn.
- B. Khi dữ liệu tuân theo phân phối chuẩn.
- C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc thang đo thứ bậc.
- D. Khi muốn tính toán trung bình và độ lệch chuẩn.