Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Nguyên Lý Thống Kê bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Trong một nghiên cứu về mức độ hài lòng của khách hàng đối với dịch vụ của một nhà hàng, người quản lý quyết định thu thập dữ liệu từ tất cả khách hàng đến nhà hàng vào một tối thứ Bảy cụ thể. Phương pháp chọn mẫu này dễ bị ảnh hưởng bởi loại sai lệch chọn mẫu nào?
- A. Sai lệch tự chọn (Self-selection bias)
- B. Sai lệch theo cụm (Cluster bias)
- C. Sai lệch thời gian (Temporal bias)
- D. Không có sai lệch chọn mẫu trong trường hợp này
Câu 2: Biểu đồ hộp (boxplot) thường được sử dụng để trực quan hóa đặc điểm nào của một tập dữ liệu?
- A. Mối quan hệ giữa hai biến số định lượng
- B. Tần số xuất hiện của các giá trị trong dữ liệu phân loại
- C. Sự phân tán và hình dạng phân phối của dữ liệu định lượng
- D. Xu hướng thay đổi của dữ liệu theo thời gian
Câu 3: Một nhà nghiên cứu muốn so sánh chiều cao trung bình của sinh viên đại học giữa hai trường đại học A và B. Họ lấy mẫu ngẫu nhiên 50 sinh viên từ mỗi trường và tính chiều cao trung bình mẫu cho mỗi nhóm. Để xác định xem có sự khác biệt đáng kể về chiều cao trung bình giữa hai trường hay không, nhà nghiên cứu nên sử dụng kiểm định thống kê nào?
- A. Kiểm định Chi-bình phương (Chi-squared test)
- B. Kiểm định t-test hai mẫu độc lập (Independent samples t-test)
- C. Phân tích phương sai (ANOVA)
- D. Hồi quy tuyến tính (Linear Regression)
Câu 4: Trong một nghiên cứu về hiệu quả của một loại thuốc mới, các nhà nghiên cứu chia ngẫu nhiên bệnh nhân thành hai nhóm: một nhóm dùng thuốc mới và một nhóm dùng giả dược. Đây là loại thiết kế nghiên cứu nào?
- A. Nghiên cứu quan sát (Observational study)
- B. Nghiên cứu bệnh chứng (Case-control study)
- C. Nghiên cứu thuần tập (Cohort study)
- D. Thử nghiệm lâm sàng ngẫu nhiên có đối chứng (Randomized controlled trial - RCT)
Câu 5: Giá trị P (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?
- A. Xác suất quan sát được kết quả nghiên cứu (hoặc cực đoan hơn) nếu giả thuyết null là đúng
- B. Xác suất giả thuyết null là đúng
- C. Mức độ quan trọng thực tế của kết quả nghiên cứu
- D. Kích thước của hiệu ứng nghiên cứu
Câu 6: Khi nào thì trung vị (median) là thước đo xu hướng trung tâm phù hợp hơn so với trung bình (mean)?
- A. Khi dữ liệu có phân phối chuẩn (normal distribution)
- B. Khi dữ liệu bị lệch hoặc có giá trị ngoại lệ
- C. Khi muốn tính tổng tất cả các giá trị trong tập dữ liệu
- D. Khi dữ liệu là định tính (qualitative)
Câu 7: Trong phân tích hồi quy tuyến tính đơn giản, hệ số hồi quy (regression coefficient) cho biết điều gì?
- A. Mức độ phù hợp của mô hình hồi quy với dữ liệu
- B. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0
- C. Mức độ thay đổi trung bình của biến phụ thuộc ứng với mỗi đơn vị thay đổi của biến độc lập
- D. Mức độ tương quan giữa biến độc lập và biến phụ thuộc
Câu 8: Phương sai (variance) đo lường điều gì về một tập dữ liệu?
- A. Xu hướng trung tâm của dữ liệu
- B. Hình dạng phân phối của dữ liệu
- C. Giá trị lớn nhất và nhỏ nhất trong dữ liệu
- D. Độ phân tán của dữ liệu xung quanh giá trị trung bình
Câu 9: Loại biểu đồ nào phù hợp nhất để so sánh tỷ lệ phần trăm của các hạng mục khác nhau trong một tổng thể?
- A. Biểu đồ tròn (Pie chart)
- B. Biểu đồ cột (Bar chart)
- C. Biểu đồ đường (Line chart)
- D. Biểu đồ tán xạ (Scatter plot)
Câu 10: Thế nào là một biến số định lượng liên tục?
- A. Biến số chỉ có thể nhận một số lượng giá trị hữu hạn
- B. Biến số được đo bằng thang đo thứ bậc
- C. Biến số có thể nhận bất kỳ giá trị nào trong một khoảng giá trị nhất định
- D. Biến số được sử dụng để phân loại đối tượng vào các nhóm khác nhau
Câu 11: Trong thống kê suy diễn, mục tiêu chính là gì?
- A. Mô tả và tóm tắt các đặc điểm chính của dữ liệu mẫu
- B. Sử dụng dữ liệu mẫu để đưa ra kết luận hoặc dự đoán về quần thể
- C. Thu thập và tổ chức dữ liệu
- D. Trình bày dữ liệu một cách trực quan
Câu 12: Mức ý nghĩa thống kê (alpha - α) thường được sử dụng trong kiểm định giả thuyết là bao nhiêu?
- A. 0.1
- B. 0.01
- C. 0.05
- D. 0.5
Câu 13: Sai số loại II (Type II error) xảy ra khi nào trong kiểm định giả thuyết?
- A. Bác bỏ giả thuyết null khi nó thực sự đúng
- B. Không bác bỏ giả thuyết null khi nó thực sự sai
- C. Mắc lỗi trong quá trình thu thập dữ liệu
- D. Tính toán sai giá trị p
Câu 14: Điều gì KHÔNG phải là một đặc điểm của phân phối chuẩn?
- A. Đối xứng qua trung bình
- B. Hình chuông
- C. Trung bình, trung vị và mốt bằng nhau
- D. Lệch phải
Câu 15: Hệ số tương quan (correlation coefficient) đo lường điều gì?
- A. Sự khác biệt giữa trung bình của hai nhóm
- B. Độ phân tán của dữ liệu
- C. Mức độ và hướng của mối quan hệ tuyến tính giữa hai biến số
- D. Khả năng một sự kiện xảy ra
Câu 16: Trong nghiên cứu bệnh chứng (case-control study), nhóm chứng (control group) được chọn như thế nào?
- A. Ngẫu nhiên từ quần thể chung
- B. Từ những người không mắc bệnh và tương đồng với nhóm bệnh về các đặc điểm liên quan
- C. Từ người thân của nhóm bệnh
- D. Từ những người có phơi nhiễm với yếu tố nghiên cứu
Câu 17: Điều gì KHÔNG phải là một loại biến số định tính (qualitative variable)?
- A. Màu sắc yêu thích
- B. Nhóm máu
- C. Tình trạng hôn nhân
- D. Cân nặng
Câu 18: Ưu điểm chính của việc sử dụng cỡ mẫu lớn trong nghiên cứu thống kê là gì?
- A. Giảm chi phí nghiên cứu
- B. Đơn giản hóa quá trình phân tích dữ liệu
- C. Tăng độ chính xác của ước lượng và tăng khả năng phát hiện hiệu ứng
- D. Đảm bảo tính nhân quả trong nghiên cứu quan sát
Câu 19: Giá trị ngoại lệ (outlier) là gì trong thống kê?
- A. Một giá trị dữ liệu nằm xa so với phần lớn các giá trị khác trong tập dữ liệu
- B. Giá trị trung bình của tập dữ liệu
- C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu
- D. Giá trị trung vị của tập dữ liệu
Câu 20: Thế nào là một quần thể (population) trong thống kê?
- A. Một nhóm nhỏ được chọn ra từ tổng thể để nghiên cứu
- B. Toàn bộ tập hợp các cá thể, đối tượng hoặc sự kiện mà chúng ta quan tâm nghiên cứu
- C. Số lượng cá thể trong một mẫu
- D. Một phần của mẫu được sử dụng để kiểm định giả thuyết
Câu 21: Đơn vị nào sau đây KHÔNG phải là thước đo độ phân tán?
- A. Phương sai (Variance)
- B. Độ lệch chuẩn (Standard Deviation)
- C. Trung vị (Median)
- D. Phạm vi tứ phân vị (Interquartile Range)
Câu 22: Biểu đồ tần suất (histogram) thích hợp nhất để biểu diễn loại dữ liệu nào?
- A. Dữ liệu định tính (qualitative data)
- B. Dữ liệu định lượng liên tục (continuous quantitative data)
- C. Dữ liệu thứ bậc (ordinal data)
- D. Dữ liệu nhị phân (binary data)
Câu 23: Chọn phát biểu ĐÚNG về mối quan hệ giữa tương quan và nhân quả.
- A. Tương quan luôn chứng minh mối quan hệ nhân quả
- B. Nhân quả luôn ngụ ý tương quan
- C. Tương quan không nhất thiết ngụ ý mối quan hệ nhân quả
- D. Tương quan và nhân quả là hai khái niệm đồng nghĩa
Câu 24: Phương pháp chọn mẫu ngẫu nhiên phân tầng (stratified random sampling) được sử dụng khi nào?
- A. Khi muốn chọn mẫu một cách nhanh chóng và tiện lợi
- B. Khi quần thể có thể được chia thành các nhóm đồng nhất và muốn đại diện đầy đủ các nhóm
- C. Khi không có danh sách đầy đủ của quần thể
- D. Khi muốn chọn mẫu từ một khu vực địa lý cụ thể
Câu 25: Trong phân tích phương sai (ANOVA), giả thuyết null thường là gì?
- A. Trung bình của tất cả các nhóm đều khác nhau
- B. Phương sai của tất cả các nhóm đều bằng nhau
- C. Có sự khác biệt đáng kể giữa trung bình của ít nhất hai nhóm
- D. Không có sự khác biệt về trung bình giữa các nhóm
Câu 26: Loại nghiên cứu nào phù hợp nhất để xác định tỷ lệ hiện mắc của một bệnh trong một cộng đồng tại một thời điểm nhất định?
- A. Nghiên cứu cắt ngang (Cross-sectional study)
- B. Nghiên cứu bệnh chứng (Case-control study)
- C. Nghiên cứu thuần tập (Cohort study)
- D. Thử nghiệm lâm sàng (Clinical trial)
Câu 27: Ý nghĩa của độ lệch chuẩn lớn là gì?
- A. Dữ liệu tập trung gần giá trị trung bình
- B. Dữ liệu phân tán rộng xung quanh giá trị trung bình
- C. Dữ liệu có phân phối chuẩn
- D. Dữ liệu không có giá trị ngoại lệ
Câu 28: Trong kiểm định giả thuyết, khi giá trị p nhỏ hơn mức ý nghĩa α, chúng ta đưa ra kết luận gì?
- A. Chấp nhận giả thuyết null
- B. Không có đủ bằng chứng để bác bỏ giả thuyết null
- C. Bác bỏ giả thuyết null
- D. Kết luận không có ý nghĩa thống kê
Câu 29: Biến số nào sau đây là biến thứ bậc (ordinal variable)?
- A. Nhiệt độ (°C)
- B. Thu nhập (VNĐ)
- C. Chiều cao (cm)
- D. Mức độ hài lòng (Rất hài lòng, Hài lòng, Trung bình, Không hài lòng, Rất không hài lòng)
Câu 30: Mục đích chính của thống kê mô tả là gì?
- A. Tóm tắt và mô tả các đặc điểm chính của dữ liệu
- B. Dự đoán giá trị tương lai dựa trên dữ liệu quá khứ
- C. Kiểm định giả thuyết về quần thể
- D. Xác định mối quan hệ nhân quả giữa các biến số