Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Thống Kê Học - Đề 01 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Biến định lượng liên tục khác với biến định lượng rời rạc ở điểm nào sau đây?
- A. Biến liên tục được đo bằng số nguyên, biến rời rạc bằng số thập phân.
- B. Biến liên tục không thể sắp xếp thứ tự, biến rời rạc có thể.
- C. Biến liên tục có thể nhận vô số giá trị giữa hai giá trị bất kỳ, biến rời rạc thì không.
- D. Biến liên tục chỉ áp dụng cho dữ liệu thời gian, biến rời rạc cho dữ liệu không gian.
Câu 2: Thang đo nào sau đây cho phép xác định mức độ hơn kém giữa các giá trị, nhưng không có điểm gốc 0 thực sự?
- A. Thang đo danh nghĩa (Nominal)
- B. Thang đo khoảng (Interval)
- C. Thang đo thứ bậc (Ordinal)
- D. Thang đo tỷ lệ (Ratio)
Câu 3: Một nhà nghiên cứu muốn mô tả thu nhập hàng tháng của người dân trong một khu vực. Biện pháp thống kê mô tả nào sau đây không bị ảnh hưởng bởi giá trị ngoại lệ (outlier) trong dữ liệu?
- A. Giá trị trung bình (Mean)
- B. Độ lệch chuẩn (Standard deviation)
- C. Giá trị trung vị (Median)
- D. Phương sai (Variance)
Câu 4: Biểu đồ hộp (Box plot) thích hợp nhất để so sánh phân phối của biến số định lượng giữa các nhóm khác nhau khi nào?
- A. Khi muốn thể hiện tần số xuất hiện của từng giá trị.
- B. Khi cần so sánh tổng giá trị của biến số giữa các nhóm.
- C. Khi dữ liệu tuân theo phân phối chuẩn.
- D. Khi muốn so sánh hình dạng phân phối, đặc biệt là sự phân tán và giá trị ngoại lệ giữa các nhóm.
Câu 5: Trong một hộp có 5 bi đỏ và 3 bi xanh. Nếu bạn rút ngẫu nhiên 2 bi không hoàn lại, xác suất để cả hai bi đều màu đỏ là bao nhiêu?
- A. 25/64
- B. 5/14
- C. 10/28
- D. 1/4
Câu 6: Phân phối chuẩn (Normal distribution) thường được sử dụng để mô hình hóa hiện tượng nào trong tự nhiên và xã hội?
- A. Số lượng sự kiện hiếm gặp xảy ra trong một khoảng thời gian cố định.
- B. Xác suất thành công trong một chuỗi các thử nghiệm độc lập.
- C. Các biến số đo lường có xu hướng tập trung quanh giá trị trung bình.
- D. Thời gian sống của các thiết bị điện tử.
Câu 7: Phương pháp chọn mẫu ngẫu nhiên phân tầng (Stratified random sampling) được ưu tiên sử dụng khi nào?
- A. Khi tổng thể nghiên cứu có thể chia thành các nhóm đồng nhất (strata) và muốn đảm bảo tính đại diện của mỗi nhóm.
- B. Khi việc tiếp cận toàn bộ tổng thể nghiên cứu là dễ dàng và tiết kiệm chi phí.
- C. Khi không có thông tin gì về cấu trúc của tổng thể.
- D. Khi muốn chọn mẫu nhanh chóng và không đòi hỏi độ chính xác cao.
Câu 8: Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu rằng phân phối của trung bình mẫu sẽ tiến gần đến phân phối chuẩn khi kích thước mẫu đủ lớn, bất kể điều gì?
- A. Khi phương sai của tổng thể đã biết.
- B. Hình dạng phân phối của tổng thể gốc.
- C. Khi kích thước tổng thể là hữu hạn.
- D. Khi mẫu được chọn bằng phương pháp ngẫu nhiên đơn giản.
Câu 9: Khoảng tin cậy 95% cho trung bình chiều cao của nam giới Việt Nam là (168cm, 170cm). Phát biểu nào sau đây diễn giải đúng ý nghĩa của khoảng tin cậy này?
- A. 95% nam giới Việt Nam có chiều cao trong khoảng từ 168cm đến 170cm.
- B. Chiều cao trung bình của nam giới Việt Nam chắc chắn nằm trong khoảng từ 168cm đến 170cm.
- C. Có 95% khả năng chiều cao trung bình mẫu nằm trong khoảng từ 168cm đến 170cm.
- D. Nếu lặp lại quá trình lấy mẫu nhiều lần, khoảng 95% các khoảng tin cậy được tạo ra sẽ chứa chiều cao trung bình thực sự của nam giới Việt Nam.
Câu 10: Trong kiểm định giả thuyết, sai lầm Loại I (Type I error) xảy ra khi nào?
- A. Bác bỏ giả thuyếtNull (H0) khi nó thực sự đúng.
- B. Không bác bỏ giả thuyết Null (H0) khi nó thực sự sai.
- C. Chấp nhận giả thuyết đối (H1) khi nó thực sự sai.
- D. Không đưa ra kết luận về giả thuyết Null (H0).
Câu 11: Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
- A. Xác suất giả thuyết Null (H0) là đúng.
- B. Xác suất quan sát được kết quả kiểm định (hoặc cực đoan hơn) nếu giả thuyết Null (H0) là đúng.
- C. Mức độ quan trọng thực tế của kết quả nghiên cứu.
- D. Ngưỡng ý nghĩa thống kê được đặt ra trước khi kiểm định.
Câu 12: Kiểm định t độc lập (Independent samples t-test) được sử dụng để so sánh trung bình của hai nhóm khi nào?
- A. Khi so sánh trung bình của một nhóm trước và sau can thiệp.
- B. Khi so sánh trung bình của hai biến số khác nhau trên cùng một nhóm đối tượng.
- C. Khi so sánh trung bình của hai nhóm đối tượng không liên quan.
- D. Khi so sánh trung bình của nhiều hơn hai nhóm đối tượng.
Câu 13: Phân tích phương sai (ANOVA) được sử dụng để làm gì?
- A. So sánh phương sai của hai mẫu.
- B. So sánh trung bình của ba nhóm hoặc nhiều hơn.
- C. Đo lường mức độ tương quan tuyến tính giữa hai biến số.
- D. Phân tích sự khác biệt giữa tỷ lệ của hai nhóm.
Câu 14: Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
- A. Mức độ phù hợp của mô hình hồi quy tuyến tính.
- B. Sự khác biệt trung bình giữa hai biến số.
- C. Mức độ biến thiên của một biến số.
- D. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến số định lượng.
Câu 15: Trong hồi quy tuyến tính đơn giản, hệ số góc (slope) cho biết điều gì?
- A. Mức độ thay đổi trung bình của biến phụ thuộc khi biến độc lập tăng lên một đơn vị.
- B. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0.
- C. Độ mạnh của mối quan hệ phi tuyến tính giữa hai biến.
- D. Phương sai của phần dư (residuals) trong mô hình hồi quy.
Câu 16: Kiểm định Chi-bình phương (Chi-square test) thường được sử dụng để phân tích loại dữ liệu nào?
- A. Dữ liệu định lượng liên tục.
- B. Dữ liệu định tính (categorical data).
- C. Dữ liệu thứ bậc (ordinal data).
- D. Dữ liệu tỷ lệ (ratio data).
Câu 17: Nguy cơ tương đối (Relative Risk - RR) được sử dụng phổ biến trong loại hình nghiên cứu dịch tễ học nào?
- A. Nghiên cứu bệnh chứng (Case-control study).
- B. Nghiên cứu cắt ngang (Cross-sectional study).
- C. Nghiên cứu thuần tập (Cohort study).
- D. Thử nghiệm lâm sàng ngẫu nhiên có đối chứng (RCT).
Câu 18: Tỷ sốOdds (Odds Ratio - OR) thường được sử dụng trong loại hình nghiên cứu dịch tễ học nào?
- A. Nghiên cứu bệnh chứng (Case-control study).
- B. Nghiên cứu thuần tập (Cohort study).
- C. Nghiên cứu mô tả (Descriptive study).
- D. Nghiên cứu sinh thái (Ecological study).
Câu 19: Sai số hệ thống (Systematic error) trong nghiên cứu thống kê có đặc điểm gì?
- A. Giảm dần khi tăng kích thước mẫu.
- B. Luôn luôn làm cho kết quả ước lượng lớn hơn giá trị thực.
- C. Có thể được loại bỏ hoàn toàn bằng cách lặp lại thí nghiệm nhiều lần.
- D. Xảy ra theo một hướng nhất định và không ngẫu nhiên, làm lệch kết quả khỏi giá trị thực.
Câu 20: Hiện tượng "nhiễu" (confounding) trong nghiên cứu quan sát có nghĩa là gì?
- A. Sai số đo lường ngẫu nhiên trong quá trình thu thập dữ liệu.
- B. Sự tồn tại của một biến số thứ ba liên quan đến cả yếu tố phơi nhiễm và kết quả, gây ra mối liên hệ giả tạo.
- C. Mẫu nghiên cứu không đủ lớn để đại diện cho tổng thể.
- D. Sự thay đổi kết quả nghiên cứu theo thời gian.
Câu 21: "Mức ý nghĩa thống kê" (statistical significance) có ý nghĩa gì?
- A. Kết quả nghiên cứu chắc chắn đúng trong thực tế.
- B. Kết quả nghiên cứu có ý nghĩa quan trọng về mặt thực tiễn.
- C. Kết quả quan sát được ít có khả năng xảy ra chỉ do yếu tố ngẫu nhiên, nếu giả thuyết Null (H0) là đúng.
- D. Xác suất mắc sai lầm Loại II là rất thấp.
Câu 22: "Cỡ mẫu" (sample size) cần thiết cho một nghiên cứu phụ thuộc vào yếu tố nào sau đây?
- A. Loại biến số nghiên cứu (định lượng hay định tính).
- B. Phương pháp phân tích thống kê dự định sử dụng.
- C. Mức độ tin cậy và lực kiểm định mong muốn, cũng như độ lớn hiệu ứng dự kiến.
- D. Tất cả các yếu tố trên.
Câu 23: Trong thống kê Bayes, "xác suất tiên nghiệm" (prior probability) là gì?
- A. Xác suất được tính toán dựa trên dữ liệu quan sát được.
- B. Niềm tin ban đầu hoặc thông tin có sẵn về một sự kiện hoặc tham số trước khi thu thập dữ liệu.
- C. Xác suất của một sự kiện trong tương lai.
- D. Mức độ tin cậy của kết quả thống kê.
Câu 24: Phân tích chuỗi thời gian (Time series analysis) chủ yếu tập trung vào việc nghiên cứu đặc điểm nào của dữ liệu?
- A. Mối quan hệ giữa các biến số tại một thời điểm cố định.
- B. Sự khác biệt giữa các nhóm đối tượng khác nhau.
- C. Sự biến đổi của dữ liệu theo thời gian và các mô hình thời gian.
- D. Phân phối xác suất của dữ liệu.
Câu 25: "Số chỉ số" (index number) thường được sử dụng để đo lường điều gì trong kinh tế và thống kê xã hội?
- A. Sự thay đổi tương đối của một tập hợp các biến số theo thời gian hoặc không gian.
- B. Giá trị tuyệt đối của một biến số tại một thời điểm cụ thể.
- C. Độ phân tán của dữ liệu xung quanh giá trị trung bình.
- D. Mức độ tương quan giữa hai biến số kinh tế.
Câu 26: Trong phân tích dữ liệu lớn (Big Data), thách thức chính về mặt thống kê là gì?
- A. Sự thiếu hụt các phương pháp thống kê phù hợp.
- B. Chi phí cao cho việc thu thập dữ liệu.
- C. Khó khăn trong việc trực quan hóa dữ liệu.
- D. Xử lý lượng dữ liệu khổng lồ, tốc độ, sự đa dạng và nhiễu trong dữ liệu.
Câu 27: Sự khác biệt giữa "ý nghĩa thống kê" và "ý nghĩa thực tiễn" là gì?
- A. Ý nghĩa thống kê liên quan đến cỡ mẫu, ý nghĩa thực tiễn liên quan đến độ tin cậy.
- B. Ý nghĩa thống kê chỉ ra kết quả không do ngẫu nhiên, ý nghĩa thực tiễn đánh giá tầm quan trọng và tác động thực tế của kết quả.
- C. Ý nghĩa thống kê được xác định bằng giá trị p, ý nghĩa thực tiễn được xác định bằng khoảng tin cậy.
- D. Không có sự khác biệt, hai khái niệm này có thể hoán đổi cho nhau.
Câu 28: Khi đọc các nghiên cứu thống kê trên báo chí, cần cảnh giác với điều gì để tránh bị "lừa" bởi số liệu?
- A. Các nghiên cứu khoa học luôn khách quan và đáng tin cậy.
- B. Số liệu thống kê luôn phản ánh đúng bản chất của vấn đề.
- C. Diễn giải sai ý nghĩa thống kê, suy diễn nhân quả từ tương quan, và phóng đại kết quả nhỏ.
- D. Chỉ cần quan tâm đến kết luận cuối cùng, không cần xem xét phương pháp nghiên cứu.
Câu 29: Phần mềm thống kê nào sau đây là mã nguồn mở và miễn phí?
- A. SPSS
- B. R
- C. SAS
- D. Excel
Câu 30: Trong nghiên cứu khoa học, đạo đức thống kê đòi hỏi điều gì?
- A. Chỉ công bố kết quả có ý nghĩa thống kê.
- B. Tối đa hóa lợi ích của nghiên cứu, bất kể phương pháp.
- C. Bảo vệ dữ liệu cá nhân của đối tượng nghiên cứu, ngay cả khi điều đó hạn chế phân tích.
- D. Tính trung thực, khách quan, minh bạch trong thiết kế, thu thập, phân tích và báo cáo kết quả nghiên cứu.