Trắc nghiệm Tin học 10 Kết nối tri thức Bài 3: Một số kiểu dữ liệu và dữ liệu văn bản - Đề 01
Trắc nghiệm Tin học 10 Kết nối tri thức Bài 3: Một số kiểu dữ liệu và dữ liệu văn bản - Đề 01 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Khi thông tin được đưa vào máy tính để xử lý, nó cần được biểu diễn dưới một dạng mà máy tính có thể hiểu và thao tác. Dạng biểu diễn cơ bản nhất mà máy tính sử dụng là gì?
- A. Dạng văn bản (text)
- B. Dạng nhị phân (binary)
- C. Dạng âm thanh (audio)
- D. Dạng hình ảnh (image)
Câu 2: Việc phân loại dữ liệu thành các kiểu khác nhau (như số, văn bản, lôgic) mang lại lợi ích chính nào trong xử lý thông tin bằng máy tính?
- A. Giúp người dùng dễ dàng đọc hiểu dữ liệu hơn.
- B. Làm cho dữ liệu có kích thước nhỏ gọn hơn khi lưu trữ.
- C. Giúp máy tính áp dụng các phương pháp xử lý và lưu trữ phù hợp, hiệu quả cho từng loại dữ liệu.
- D. Hạn chế virus máy tính tấn công dữ liệu.
Câu 3: Trong lập trình, khi bạn cần lưu trữ giá trị điểm trung bình môn học của một học sinh (ví dụ: 8.75, 9.0), kiểu dữ liệu nào trong các kiểu cơ bản (số, văn bản, lôgic) là phù hợp nhất để cho phép thực hiện các phép tính toán và có phần thập phân?
- A. Kiểu số (có thể bao gồm số thực)
- B. Kiểu văn bản
- C. Kiểu lôgic
- D. Kiểu đa phương tiện
Câu 4: Một hệ thống đăng ký trực tuyến yêu cầu người dùng tích chọn vào ô
- A. Kiểu số
- B. Kiểu văn bản
- C. Kiểu lôgic
- D. Kiểu danh sách
Câu 5: Dữ liệu văn bản được cấu tạo từ các đơn vị cơ bản nào?
- A. Các từ
- B. Các dòng
- C. Các đoạn văn
- D. Các kí tự (characters)
Câu 6: Để máy tính có thể lưu trữ, xử lý và hiển thị dữ liệu văn bản, cần có một quy tắc ánh xạ giữa mỗi kí tự (chữ cái, số, ký hiệu...) và một dãy bit tương ứng. Quy tắc ánh xạ này được gọi là gì?
- A. Bảng mã kí tự (Character encoding)
- B. Định dạng tệp văn bản (Text file format)
- C. Kiểu dữ liệu văn bản (Text data type)
- D. Nén dữ liệu (Data compression)
Câu 7: Bảng mã ASCII gốc (chuẩn) sử dụng 7 bit để mã hóa kí tự. Điều này có nghĩa là nó có thể biểu diễn tối đa bao nhiêu kí tự khác nhau?
- A. 64
- B. 128
- C. 256
- D. 512
Câu 8: Bảng mã ASCII mở rộng ra đời để tăng số lượng kí tự có thể biểu diễn, nhưng vẫn còn hạn chế lớn. Hạn chế chính đó là gì khiến nó không phù hợp cho việc trao đổi văn bản toàn cầu?
- A. Chỉ có thể biểu diễn số và các phép toán cơ bản.
- B. Không thể biểu diễn các kí tự viết hoa.
- C. Không đủ chỗ để biểu diễn tất cả các kí tự của mọi ngôn ngữ trên thế giới (ví dụ: tiếng Việt có dấu, tiếng Trung, tiếng Nhật...).
- D. Chỉ dùng được trên các máy tính cấu hình thấp.
Câu 9: Unicode ra đời nhằm giải quyết vấn đề gì trong việc biểu diễn kí tự trên máy tính?
- A. Giảm kích thước tệp văn bản.
- B. Mã hóa âm thanh và hình ảnh.
- C. Chỉ tập trung vào các ngôn ngữ châu Âu.
- D. Cung cấp một bảng mã thống nhất duy nhất cho tất cả các kí tự của mọi ngôn ngữ trên thế giới.
Câu 10: Trong Unicode, mỗi kí tự được gán một mã số duy nhất, gọi là code point. Code point này là gì?
- A. Một giá trị số trừu tượng đại diện cho một kí tự cụ thể.
- B. Dãy bit cụ thể được lưu trữ trong tệp.
- C. Kích thước (số byte) của kí tự đó.
- D. Tên gọi của kí tự đó.
Câu 11: UTF-8 là một trong những chuẩn mã hóa (encoding form) phổ biến nhất của Unicode. Một đặc điểm nổi bật của UTF-8 là gì?
- A. Mọi kí tự đều được mã hóa bằng đúng 4 byte.
- B. Sử dụng số lượng byte thay đổi tùy theo kí tự (từ 1 đến 4 byte), giúp tiết kiệm không gian cho các kí tự phổ biến như Latin.
- C. Chỉ hỗ trợ các kí tự của ngôn ngữ tiếng Anh.
- D. Không tương thích ngược với ASCII.
Câu 12: Khi sử dụng bảng mã UTF-8 để biểu diễn văn bản tiếng Việt, hầu hết các kí tự tiếng Việt có dấu (ví dụ: "à", "ẽ", "ị", "ọ", "ũ") thường được mã hóa bằng bao nhiêu byte?
- A. 1 byte, giống như các kí tự Latin cơ bản.
- B. 3 byte, nhiều hơn các kí tự không dấu.
- C. 2 byte, nhiều hơn kí tự Latin cơ bản nhưng ít hơn một số kí tự phức tạp khác.
- D. 4 byte, kích thước cố định cho mọi kí tự tiếng Việt.
Câu 13: Tệp văn bản (text file) là loại tệp dùng để lưu trữ dữ liệu văn bản thuần túy. Nội dung bên trong tệp văn bản thường được biểu diễn dưới dạng nào?
- A. Dãy các kí tự được mã hóa theo một bảng mã nhất định.
- B. Mã máy (machine code) sẵn sàng để thực thi.
- C. Các đối tượng đồ họa và định dạng phức tạp.
- D. Dữ liệu đã được nén theo thuật toán riêng.
Câu 14: Khác biệt cơ bản giữa tệp văn bản thuần túy (plain text file) và tệp nhị phân (binary file) là gì?
- A. Tệp văn bản chỉ chứa chữ cái, còn tệp nhị phân chứa số.
- B. Tệp văn bản chứa dữ liệu mã hóa các kí tự theo một bảng mã, có thể đọc được bằng trình soạn thảo văn bản đơn giản. Tệp nhị phân chứa dữ liệu ở dạng mà chỉ phần mềm chuyên dụng mới hiểu được cấu trúc.
- C. Tệp văn bản nhỏ hơn tệp nhị phân.
- D. Tệp văn bản chỉ lưu trữ trên bộ nhớ trong, tệp nhị phân lưu trữ trên bộ nhớ ngoài.
Câu 15: Khi bạn nhập dòng chữ
- A. Tìm kiếm thông tin liên quan trên internet.
- B. Thực hiện các phép tính toán.
- C. Hiển thị trực tiếp lên màn hình.
- D. Biểu diễn thông tin (dòng chữ) thành dữ liệu nhị phân mà máy tính hiểu được.
Câu 16: Một ứng dụng cần lưu trữ nhiệt độ đo được từ một cảm biến (ví dụ: 25.7°C, -3.2°C). Kiểu dữ liệu nào phù hợp nhất để lưu trữ giá trị nhiệt độ này, cho phép biểu diễn số âm và phần thập phân?
- A. Kiểu số thực
- B. Kiểu số nguyên
- C. Kiểu văn bản
- D. Kiểu lôgic
Câu 17: Để lưu trữ nội dung của một bài thơ, bao gồm các chữ cái, dấu câu, xuống dòng và khoảng trắng, bạn nên sử dụng kiểu dữ liệu nào?
- A. Kiểu số
- B. Kiểu văn bản
- C. Kiểu lôgic
- D. Kiểu cấu trúc
Câu 18: Tại sao việc sử dụng một bảng mã kí tự chuẩn và thống nhất (như Unicode/UTF-8) lại quan trọng trong trao đổi dữ liệu văn bản trên phạm vi toàn cầu?
- A. Để làm cho tệp văn bản nhỏ hơn.
- B. Để chỉ cho phép dùng một ngôn ngữ duy nhất trong mỗi tài liệu.
- C. Để tăng tốc độ xử lý văn bản.
- D. Để đảm bảo văn bản được hiển thị chính xác và nhất quán trên các hệ thống máy tính khác nhau, bất kể ngôn ngữ sử dụng.
Câu 19: Nếu bạn mở một tệp văn bản được tạo bằng bảng mã TCVN3 (một bảng mã cũ của Việt Nam) trên một máy tính chỉ cài đặt và sử dụng bảng mã Unicode (UTF-8) mặc định, hiện tượng gì có thể xảy ra?
- A. Văn bản sẽ bị lỗi hiển thị, xuất hiện các kí tự không đúng (lỗi font/mojibake).
- B. Tệp sẽ không mở được.
- C. Máy tính sẽ tự động chuyển đổi sang bảng mã phù hợp.
- D. Văn bản sẽ hiển thị bình thường nhưng không thể chỉnh sửa.
Câu 20: Giả sử bạn có một tệp văn bản chứa 500 kí tự Latin cơ bản (không dấu). Nếu tệp này được lưu bằng bảng mã ASCII (8-bit), kích thước tệp sẽ khoảng bao nhiêu byte?
- A. 50 byte
- B. 500 byte
- C. 1000 byte
- D. 4000 byte
Câu 21: So với bảng mã ASCII mở rộng (8-bit), ưu điểm chính của bảng mã Unicode là gì?
- A. Mã hóa kí tự bằng số bit ít hơn.
- B. Chỉ hỗ trợ các kí tự số.
- C. Tốc độ xử lý nhanh hơn.
- D. Khả năng mã hóa số lượng kí tự lớn hơn rất nhiều, bao gồm hầu hết các hệ thống chữ viết trên thế giới.
Câu 22: Khi một chương trình máy tính cần thực hiện phép cộng giữa hai giá trị, điều kiện tiên quyết về kiểu dữ liệu của hai giá trị đó là gì?
- A. Chúng phải là kiểu dữ liệu số.
- B. Chúng phải là kiểu dữ liệu văn bản.
- C. Chúng phải là kiểu dữ liệu lôgic.
- D. Kiểu dữ liệu không quan trọng, máy tính sẽ tự chuyển đổi.
Câu 23: Dữ liệu đa phương tiện (multimedia data) là một kiểu dữ liệu quan trọng. Loại dữ liệu nào sau đây KHÔNG được coi là dữ liệu đa phương tiện trong ngữ cảnh tin học cơ bản?
- A. Hình ảnh (image)
- B. Âm thanh (audio)
- C. Video
- D. Tệp văn bản thuần túy (.txt)
Câu 24: Giả sử bạn cần lưu trữ trạng thái bật/tắt của một thiết bị điện. Kiểu dữ liệu nào là lựa chọn tối ưu nhất về mặt bộ nhớ và xử lý cho mục đích này?
- A. Kiểu số nguyên (0 cho tắt, 1 cho bật)
- B. Kiểu văn bản (
- C. Kiểu lôgic (True/False)
- D. Kiểu số thực
Câu 25: Trong các kiểu dữ liệu số, kiểu nào thường được sử dụng để biểu diễn các số nguyên âm hoặc dương mà không có phần thập phân?
- A. Kiểu số nguyên (integer)
- B. Kiểu số thực (floating-point)
- C. Kiểu văn bản
- D. Kiểu lôgic
Câu 26: Khi một máy tính xử lý dữ liệu, nó không làm việc trực tiếp với thông tin (ý nghĩa) mà làm việc với dữ liệu (biểu diễn nhị phân). Quá trình biến đổi thông tin thành dữ liệu nhị phân được gọi là gì?
- A. Nén dữ liệu
- B. Mã hóa thông tin (Biểu diễn thông tin)
- C. Giải mã thông tin
- D. Xử lý thông tin
Câu 27: Tại sao dữ liệu nhị phân (chỉ gồm 0 và 1) lại là nền tảng cho mọi hoạt động của máy tính?
- A. Vì nó là ngôn ngữ tự nhiên của con người.
- B. Vì nó giúp máy tính hiển thị hình ảnh đẹp hơn.
- C. Vì các thành phần điện tử cơ bản trong máy tính (như bóng bán dẫn) chỉ có hai trạng thái (bật/tắt, tương ứng với 1/0).
- D. Vì nó giúp lưu trữ dữ liệu với dung lượng lớn nhất.
Câu 28: Bảng mã Unicode có nhiều dạng mã hóa khác nhau như UTF-8, UTF-16, UTF-32. Sự khác biệt chính giữa các dạng mã hóa này nằm ở đâu?
- A. Cách chúng biểu diễn các code point của Unicode thành dãy bit (số byte sử dụng cho mỗi kí tự có thể khác nhau).
- B. Số lượng kí tự Unicode mà chúng hỗ trợ.
- C. Khả năng nén dữ liệu văn bản.
- D. Tốc độ truyền dữ liệu qua mạng.
Câu 29: Giả sử bạn có một đoạn văn bản gồm 1000 kí tự, trong đó có 800 kí tự Latin cơ bản (không dấu) và 200 kí tự tiếng Việt có dấu. Khi lưu đoạn văn bản này bằng bảng mã UTF-8, kích thước tệp (ước lượng) sẽ khoảng bao nhiêu byte, biết rằng kí tự Latin cơ bản dùng 1 byte, kí tự tiếng Việt có dấu dùng 2 byte trong UTF-8?
- A. 1000 byte
- B. 1200 byte (8001 + 2002)
- C. 1600 byte
- D. 2000 byte
Câu 30: Khi một trình soạn thảo văn bản hiển thị nội dung từ một tệp, nó cần biết tệp đó được lưu bằng bảng mã nào để diễn dịch đúng dãy bit thành kí tự. Nếu thông tin về bảng mã bị sai hoặc thiếu, hiện tượng gì thường xảy ra?
- A. Tệp sẽ bị xóa tự động.
- B. Máy tính sẽ bị treo.
- C. Trình soạn thảo sẽ tự động sửa lỗi chính tả.
- D. Văn bản sẽ hiển thị sai kí tự (lỗi font).