Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Nguyên Lý Thống Kê - Đề 01 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Trong một nghiên cứu về chiều cao của sinh viên đại học, nhà nghiên cứu thu thập dữ liệu từ 200 sinh viên ngẫu nhiên tại một trường đại học lớn. Tổng thể trong nghiên cứu này là gì?
- A. 200 sinh viên được chọn
- B. Chiều cao của 200 sinh viên
- C. Tất cả sinh viên của trường đại học đó
- D. Các trường đại học lớn trên toàn quốc
Câu 2: Biến số nào sau đây là biến định tính (qualitative variable)?
- A. Cân nặng (kg)
- B. Nhóm máu (A, B, AB, O)
- C. Số lượng sách trong thư viện
- D. Nhiệt độ cơ thể (°C)
Câu 3: Phân loại dữ liệu theo thang đo nào sau đây là cao nhất, cho phép thực hiện tất cả các phép toán số học (cộng, trừ, nhân, chia) một cách có ý nghĩa?
- A. Thang đo danh nghĩa (Nominal)
- B. Thang đo thứ bậc (Ordinal)
- C. Thang đo khoảng (Interval)
- D. Thang đo tỷ lệ (Ratio)
Câu 4: Biểu đồ nào sau đây thích hợp nhất để mô tả phân phối tần số của biến số định lượng liên tục?
- A. Biểu đồ tròn (Pie chart)
- B. Biểu đồ cột (Bar chart)
- C. Biểu đồ tần suất (Histogram)
- D. Biểu đồ đường (Line chart)
Câu 5: Giá trị trung vị (median) của một tập dữ liệu có ý nghĩa gì?
- A. Giá trị trung bình cộng của tập dữ liệu
- B. Giá trị ở vị trí chính giữa của tập dữ liệu đã sắp xếp
- C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu
- D. Tổng của tất cả các giá trị trong tập dữ liệu
Câu 6: Độ lệch chuẩn (standard deviation) đo lường điều gì?
- A. Mức độ phân tán của dữ liệu so với giá trị trung bình
- B. Giá trị trung tâm của tập dữ liệu
- C. Hình dạng phân phối của dữ liệu
- D. Mức độ tin cậy của dữ liệu
Câu 7: Trong kiểm định giả thuyết thống kê, "giá trị p" (p-value) thể hiện điều gì?
- A. Xác suất giả thuyết null là đúng
- B. Mức độ ý nghĩa thực tế của kết quả
- C. Sai số loại I
- D. Xác suất quan sát được kết quả như (hoặc cực đoan hơn) kết quả đã thấy nếu giả thuyết null đúng
Câu 8: Sai số loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?
- A. Chấp nhận giả thuyết null khi nó sai
- B. Bác bỏ giả thuyết null khi nó đúng
- C. Không đưa ra quyết định về giả thuyết null
- D. Mắc cả sai số loại II
Câu 9: Hệ số tương quan (correlation coefficient) đo lường điều gì giữa hai biến số định lượng?
- A. Mức độ khác biệt trung bình giữa hai biến
- B. Nguyên nhân và kết quả giữa hai biến
- C. Mức độ và hướng của mối quan hệ tuyến tính giữa hai biến
- D. Độ mạnh của mối quan hệ phi tuyến tính
Câu 10: Giá trị của hệ số tương quan Pearson (Pearson correlation coefficient) nằm trong khoảng nào?
- A. 0 đến +1
- B. -1 đến +1
- C. 0 đến 100%
- D. Bất kỳ giá trị nào lớn hơn 0
Câu 11: Phân tích hồi quy (regression analysis) được sử dụng để làm gì?
- A. Mô hình hóa và dự đoán mối quan hệ giữa các biến số
- B. So sánh trung bình của hai nhóm
- C. Đo lường mức độ phân tán của dữ liệu
- D. Mô tả dữ liệu bằng biểu đồ
Câu 12: Trong phân tích phương sai (ANOVA), giả thuyết null thường là gì?
- A. Có sự khác biệt đáng kể giữa trung bình các nhóm
- B. Các nhóm có phương sai khác nhau
- C. Không có sự khác biệt về trung bình giữa các nhóm
- D. Phân phối của các nhóm không phải là chuẩn
Câu 13: Phương pháp lấy mẫu ngẫu nhiên đơn giản (simple random sampling) đảm bảo điều gì?
- A. Mẫu thu được chắc chắn đại diện hoàn hảo cho tổng thể
- B. Mỗi đơn vị trong tổng thể có cơ hội được chọn vào mẫu như nhau
- C. Việc lấy mẫu được thực hiện một cách nhanh chóng và dễ dàng
- D. Chỉ những đơn vị điển hình mới được chọn
Câu 14: Khoảng tin cậy (confidence interval) cho trung bình tổng thể ước lượng điều gì?
- A. Khoảng giá trị mà trung bình tổng thể có khả năng nằm trong đó
- B. Giá trị trung bình mẫu
- C. Độ lệch chuẩn của tổng thể
- D. Kích thước mẫu cần thiết
Câu 15: Ý nghĩa thống kê (statistical significance) khác với ý nghĩa thực tế (practical significance) như thế nào?
- A. Chúng là hai khái niệm giống nhau
- B. Ý nghĩa thống kê luôn đảm bảo ý nghĩa thực tế
- C. Ý nghĩa thực tế dễ dàng đạt được hơn ý nghĩa thống kê
- D. Ý nghĩa thống kê nói về khả năng không do ngẫu nhiên, ý nghĩa thực tế nói về tầm quan trọng/ứng dụng của kết quả
Câu 16: Trong một nghiên cứu bệnh chứng (case-control study), thước đo mối liên hệ thường được sử dụng là gì?
- A. Nguy cơ tương đối (Relative Risk - RR)
- B. Tỷ số Odds (Odds Ratio - OR)
- C. Tỷ lệ hiện mắc (Prevalence)
- D. Tỷ lệ mới mắc (Incidence)
Câu 17: Điều gì KHÔNG phải là một đặc điểm của nghiên cứu thuần tập (cohort study)?
- A. Theo dõi nhóm người theo thời gian
- B. Bắt đầu bằng việc xác định nhóm phơi nhiễm và không phơi nhiễm
- C. Bắt đầu bằng việc chọn nhóm có bệnh và nhóm không bệnh
- D. Có thể tính được tỷ lệ mới mắc
Câu 18: Phương pháp thống kê nào phù hợp để so sánh trung bình chiều cao của sinh viên nam và sinh viên nữ?
- A. Kiểm định t-Student cho hai mẫu độc lập
- B. Phân tích phương sai (ANOVA)
- C. Hồi quy tuyến tính (Linear Regression)
- D. Kiểm định Chi bình phương (Chi-square test)
Câu 19: Giả sử bạn muốn kiểm tra xem có mối liên quan giữa hút thuốc lá và mắc bệnh ung thư phổi hay không. Kiểm định thống kê nào phù hợp?
- A. Kiểm định t-Student
- B. Phân tích phương sai (ANOVA)
- C. Hồi quy tuyến tính
- D. Kiểm định Chi bình phương (Chi-square test)
Câu 20: Trong thống kê mô tả, giá trị nào sau đây KHÔNG bị ảnh hưởng bởi giá trị ngoại lai (outlier)?
- A. Trung bình (Mean)
- B. Độ lệch chuẩn (Standard Deviation)
- C. Trung vị (Median)
- D. Phương sai (Variance)
Câu 21: Một nhà máy sản xuất bóng đèn tiến hành kiểm tra chất lượng bằng cách lấy ngẫu nhiên 100 bóng đèn từ lô hàng 10,000 bóng. 100 bóng đèn này được gọi là gì?
- A. Tổng thể
- B. Mẫu
- C. Tham số
- D. Thống kê mô tả
Câu 22: Nếu xác suất của một sự kiện A là P(A) = 0.3 và xác suất của sự kiện B là P(B) = 0.4, và A và B là hai sự kiện độc lập, thì xác suất cả A và B cùng xảy ra là bao nhiêu?
- A. 0.7
- B. 0.1
- C. 0.12
- D. Không thể xác định
Câu 23: Trong phân tích dữ liệu định tính, phương pháp nào sau đây thường được sử dụng để tìm ra các chủ đề và mẫu lặp lại trong dữ liệu văn bản?
- A. Phân tích nội dung (Content analysis)
- B. Phân tích hồi quy (Regression analysis)
- C. Kiểm định t-Student
- D. Phân tích phương sai (ANOVA)
Câu 24: "Phương sai" (variance) là bình phương của độ đo thống kê nào sau đây?
- A. Trung bình (Mean)
- B. Trung vị (Median)
- C. Mốt (Mode)
- D. Độ lệch chuẩn (Standard deviation)
Câu 25: Biểu đồ hộp (boxplot) thường được sử dụng để thể hiện điều gì?
- A. Mối quan hệ giữa hai biến số
- B. Phân phối và độ phân tán của một biến số
- C. Tần số xuất hiện của các giá trị
- D. Xu hướng theo thời gian của dữ liệu
Câu 26: Trong kiểm định một đuôi (one-tailed test) so với kiểm định hai đuôi (two-tailed test), sự khác biệt chính là gì?
- A. Kiểm định một đuôi luôn mạnh hơn kiểm định hai đuôi
- B. Kiểm định hai đuôi dễ bác bỏ giả thuyết null hơn
- C. Kiểm định một đuôi kiểm tra sự khác biệt theo một hướng cụ thể, hai đuôi kiểm tra cả hai hướng
- D. Không có sự khác biệt về bản chất
Câu 27: Loại sai số nào xảy ra khi chúng ta không bác bỏ giả thuyết null trong khi nó thực sự sai?
- A. Sai số loại I
- B. Sai số loại II
- C. Sai số ngẫu nhiên
- D. Không có sai số
Câu 28: Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope) của đường hồi quy cho biết điều gì?
- A. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0
- B. Mức độ tương quan giữa hai biến
- C. Độ lệch chuẩn của biến phụ thuộc
- D. Mức độ thay đổi của biến phụ thuộc khi biến độc lập tăng một đơn vị
Câu 29: Khi nào thì việc sử dụng thống kê phi tham số (non-parametric statistics) thích hợp hơn thống kê tham số (parametric statistics)?
- A. Khi dữ liệu không tuân theo phân phối chuẩn hoặc cỡ mẫu nhỏ
- B. Khi dữ liệu là định lượng và có phân phối chuẩn
- C. Khi muốn tính trung bình và độ lệch chuẩn
- D. Thống kê phi tham số không bao giờ được sử dụng
Câu 30: Biểu đồ phân tán (scatter plot) được sử dụng để làm gì?
- A. So sánh các nhóm dữ liệu
- B. Thể hiện phân phối tần số của một biến
- C. Trực quan hóa mối quan hệ giữa hai biến số
- D. Thể hiện xu hướng thời gian của dữ liệu