Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Thống Kê Ứng Dụng - Đề 04 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Một nhà nghiên cứu muốn ước tính tỷ lệ ủng hộ một chính sách mới của chính phủ trong dân số trưởng thành của một thành phố lớn. Phương pháp chọn mẫu nào sau đây là phù hợp nhất để đảm bảo tính đại diện của mẫu nghiên cứu?
- A. Chọn mẫu thuận tiện (Convenience sampling)
- B. Chọn mẫuSnowball (Snowball sampling)
- C. Chọn mẫu ngẫu nhiên phân tầng (Stratified random sampling)
- D. Chọn mẫu phán đoán (Purposive sampling)
Câu 2: Biến số "mức độ hài lòng của khách hàng về dịch vụ" được đo bằng thang đo từ 1 (rất không hài lòng) đến 5 (rất hài lòng). Đây là loại thang đo nào?
- A. Định danh (Nominal)
- B. Thứ bậc (Ordinal)
- C. Khoảng (Interval)
- D. Tỷ lệ (Ratio)
Câu 3: Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope) cho biết điều gì?
- A. Giá trị trung bình của biến phụ thuộc.
- B. Độ lệch chuẩn của biến độc lập.
- C. Mức độ phù hợp của mô hình.
- D. Mức độ thay đổi trung bình của biến phụ thuộc khi biến độc lập tăng thêm một đơn vị.
Câu 4: Một công ty muốn kiểm tra xem liệu có sự khác biệt về doanh số bán hàng trung bình giữa ba khu vực thị trường khác nhau hay không. Kiểm định giả thuyết thống kê nào là phù hợp?
- A. Kiểm định t cặp đôi (Paired t-test)
- B. Kiểm định t độc lập (Independent t-test)
- C. Kiểm định ANOVA một yếu tố (One-way ANOVA)
- D. Kiểm định Chi-bình phương (Chi-square test)
Câu 5: Giá trị P (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?
- A. Xác suất quan sát thấy kết quả kiểm định (hoặc cực đoan hơn) nếu giả thuyết không là đúng.
- B. Xác suất giả thuyết không là đúng.
- C. Mức ý nghĩa thống kê được chọn (alpha).
- D. Sai số loại II (Beta).
Câu 6: Một nghiên cứu khảo sát mối quan hệ giữa "số giờ học mỗi tuần" và "điểm thi cuối kỳ" của sinh viên. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
- A. Mối quan hệ nhân quả giữa hai biến.
- B. Mức độ và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
- C. Sự khác biệt trung bình giữa hai biến.
- D. Tỷ lệ biến thiên của một biến được giải thích bởi biến kia.
Câu 7: Trong phân tích phương sai (ANOVA), yếu tố "yếu tố" (factor) đề cập đến điều gì?
- A. Biến phụ thuộc được đo lường.
- B. Tổng phương sai của dữ liệu.
- C. Biến độc lập phân loại dùng để chia tổng thể thành các nhóm.
- D. Mức ý nghĩa thống kê trong kiểm định.
Câu 8: Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
- A. Khi cỡ mẫu lớn hơn 30.
- B. Khi dữ liệu không tuân theo phân phối chuẩn hoặc thang đo không phải khoảng/tỷ lệ.
- C. Khi muốn so sánh trung bình của hai nhóm.
- D. Khi biến phụ thuộc là biến định lượng.
Câu 9: Sai số loại I (Type I error) trong kiểm định giả thuyết thống kê là gì?
- A. Chấp nhận giả thuyết không khi nó sai.
- B. Không đưa ra quyết định về giả thuyết không.
- C. Bác bỏ giả thuyết không khi nó đúng.
- D. Đưa ra kết luận sai về cỡ mẫu cần thiết.
Câu 10: Một nhà máy sản xuất bóng đèn tiến hành kiểm tra chất lượng bằng cách chọn ngẫu nhiên 100 bóng đèn từ lô hàng 10,000 bóng. Đây là loại điều tra nào?
- A. Điều tra chọn mẫu (Sample survey)
- B. Điều tra toàn bộ (Census)
- C. Điều tra trọng điểm (Focus survey)
- D. Điều tra chuyên sâu (In-depth survey)
Câu 11: Trong phân tích dữ liệu định tính, phương pháp "mã hóa" (coding) được sử dụng để làm gì?
- A. Tính toán thống kê mô tả.
- B. Phân loại và gắn nhãn cho các đoạn dữ liệu văn bản để tìm ra các chủ đề và mẫu.
- C. Kiểm định giả thuyết về mối quan hệ giữa các biến.
- D. Trực quan hóa dữ liệu bằng biểu đồ.
Câu 12: Độ lệch chuẩn (standard deviation) đo lường điều gì?
- A. Giá trị trung bình của dữ liệu.
- B. Vị trí trung tâm của dữ liệu.
- C. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
- D. Hình dạng phân phối của dữ liệu.
Câu 13: Biểu đồ hộp (boxplot) thích hợp để biểu diễn loại dữ liệu nào?
- A. Dữ liệu định danh.
- B. Dữ liệu thứ bậc.
- C. Tần số của dữ liệu.
- D. Dữ liệu định lượng và phát hiện giá trị ngoại lệ.
Câu 14: Trong nghiên cứu khoa học, "tính giá trị" (validity) của một công cụ đo lường đề cập đến điều gì?
- A. Mức độ nhất quán của kết quả đo lường.
- B. Mức độ công cụ đo lường thực sự đo lường được khái niệm cần đo lường.
- C. Khả năng áp dụng kết quả nghiên cứu cho các bối cảnh khác.
- D. Mức độ khách quan của quá trình đo lường.
Câu 15: Một nhà nghiên cứu muốn so sánh hiệu quả của hai phương pháp giảng dạy khác nhau trên điểm thi của sinh viên. Sinh viên được phân ngẫu nhiên vào một trong hai nhóm học. Thiết kế nghiên cứu này là gì?
- A. Nghiên cứu quan sát (Observational study)
- B. Nghiên cứu cắt ngang (Cross-sectional study)
- C. Nghiên cứu bệnh chứng (Case-control study)
- D. Thử nghiệm ngẫu nhiên có đối chứng (Randomized controlled trial - RCT)
Câu 16: Trong phân tích hồi quy đa biến, hiện tượng "đa cộng tuyến" (multicollinearity) xảy ra khi nào?
- A. Khi có mối tương quan cao giữa các biến độc lập.
- B. Khi biến phụ thuộc không tuân theo phân phối chuẩn.
- C. Khi cỡ mẫu quá nhỏ.
- D. Khi mô hình hồi quy không phù hợp với dữ liệu.
Câu 17: "Khoảng tin cậy 95%" cho trung bình tổng thể có ý nghĩa gì?
- A. Xác suất trung bình mẫu nằm trong khoảng này là 95%.
- B. Khoảng này chứa 95% dữ liệu mẫu.
- C. Nếu lặp lại quá trình chọn mẫu nhiều lần, khoảng 95% các khoảng tin cậy tạo ra sẽ chứa trung bình tổng thể thực sự.
- D. Giá trị trung bình tổng thể chắc chắn nằm trong khoảng này với xác suất 95%.
Câu 18: Trong kiểm định Chi-bình phương (Chi-square test) về tính độc lập, giả thuyết không (H0) thường là gì?
- A. Các biến phân loại có mối liên hệ tuyến tính.
- B. Các biến phân loại là độc lập với nhau.
- C. Trung bình của các nhóm là bằng nhau.
- D. Phương sai của các nhóm là khác nhau.
Câu 19: Phương pháp nào sau đây KHÔNG phải là phương pháp thu thập dữ liệu định lượng?
- A. Khảo sát bằng bảng hỏi đóng.
- B. Thực nghiệm.
- C. Quan sát có hệ thống.
- D. Phỏng vấn sâu.
Câu 20: Một nhà nghiên cứu muốn dự đoán doanh số bán hàng dựa trên chi phí quảng cáo và số lượng nhân viên bán hàng. Phương pháp thống kê nào phù hợp nhất?
- A. Thống kê mô tả.
- B. Kiểm định t.
- C. Hồi quy đa biến.
- D. Phân tích phương sai (ANOVA).
Câu 21: Trong phân tích chuỗi thời gian, thành phần "xu hướng" (trend) mô tả điều gì?
- A. Sự biến động dài hạn và có hệ thống của chuỗi thời gian.
- B. Sự biến động ngắn hạn và ngẫu nhiên.
- C. Sự biến động theo mùa.
- D. Sự biến động theo chu kỳ kinh tế.
Câu 22: "Phương sai" (variance) đo lường điều gì?
- A. Giá trị trung tâm của dữ liệu.
- B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình (bình phương độ lệch).
- C. Hình dạng phân phối của dữ liệu.
- D. Mức độ tin cậy của ước lượng trung bình.
Câu 23: Biểu đồ phân tán (scatterplot) được sử dụng để làm gì?
- A. So sánh phân phối của nhiều biến số.
- B. Biểu diễn tần số của dữ liệu phân loại.
- C. Trực quan hóa mối quan hệ giữa hai biến số định lượng.
- D. Phân tích chuỗi thời gian.
Câu 24: Trong phân tích dữ liệu bảng (panel data), lợi ích chính của việc sử dụng dữ liệu bảng so với dữ liệu cắt ngang là gì?
- A. Giảm thiểu sai số đo lường.
- B. Tăng cỡ mẫu nghiên cứu.
- C. Đơn giản hóa quá trình phân tích.
- D. Kiểm soát các yếu tố không quan sát được và thay đổi theo thời gian.
Câu 25: "Độ tin cậy" (reliability) của một công cụ đo lường đề cập đến điều gì?
- A. Mức độ nhất quán và ổn định của kết quả đo lường.
- B. Mức độ công cụ đo lường thực sự đo lường được khái niệm cần đo lường.
- C. Khả năng khái quát hóa kết quả nghiên cứu.
- D. Mức độ chính xác của dữ liệu.
Câu 26: Phương pháp lấy mẫu nào mà mỗi đơn vị trong tổng thể có cơ hội được chọn vào mẫu như nhau?
- A. Lấy mẫu phân tầng (Stratified sampling)
- B. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling)
- C. Lấy mẫu hệ thống (Systematic sampling)
- D. Lấy mẫu cụm (Cluster sampling)
Câu 27: Khi trình bày kết quả nghiên cứu định lượng, phần nào thường chứa các bảng biểu và đồ thị?
- A. Phần Mở đầu (Introduction)
- B. Phần Phương pháp (Methodology)
- C. Phần Kết quả (Results)
- D. Phần Thảo luận (Discussion)
Câu 28: Trong phân tích hồi quy logistic, biến phụ thuộc thuộc loại thang đo nào?
- A. Tỷ lệ (Ratio)
- B. Khoảng (Interval)
- C. Thứ bậc (Ordinal)
- D. Định danh nhị phân (Binary Nominal)
Câu 29: "Giá trị trung vị" (median) là gì?
- A. Giá trị trung bình cộng của dữ liệu.
- B. Giá trị nằm ở vị trí chính giữa của dữ liệu đã sắp xếp.
- C. Giá trị xuất hiện nhiều nhất trong dữ liệu.
- D. Khoảng cách giữa giá trị lớn nhất và nhỏ nhất.
Câu 30: Khi nào thì sử dụng kiểm định Kruskal-Wallis?
- A. So sánh trung bình của hai nhóm phụ thuộc.
- B. So sánh trung bình của hai nhóm độc lập khi dữ liệu tuân theo phân phối chuẩn.
- C. So sánh trung vị của ba nhóm độc lập trở lên khi dữ liệu không tuân theo phân phối chuẩn.
- D. Kiểm tra mối quan hệ giữa hai biến phân loại.