Trắc nghiệm Tin 10 Cánh diều Bài 3: Số hóa văn bản - Đề 02 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.
Câu 1: Quá trình số hóa văn bản chuyển đổi thông tin từ dạng vật lý (như trên giấy) sang dạng mà máy tính có thể lưu trữ và xử lý. Thành phần cốt lõi nào của văn bản được số hóa để máy tính hiểu được nghĩa của nó?
- A. Hình dạng và kích thước của chữ
- B. Các ký tự và mã tương ứng của chúng
- C. Màu sắc của mực in
- D. Chất liệu giấy
Câu 2: Trước khi có các chuẩn mã hóa quốc tế, mỗi quốc gia hoặc nhà sản xuất phần mềm có thể sử dụng các bảng mã riêng. Điều này dẫn đến khó khăn gì khi chia sẻ văn bản giữa các hệ thống khác nhau?
- A. Văn bản bị thay đổi định dạng (font chữ, cỡ chữ).
- B. Tốc độ xử lý văn bản trên máy tính bị chậm lại.
- C. Các ký tự có thể hiển thị sai hoặc không đọc được (lỗi font).
- D. Kích thước tệp văn bản trở nên quá lớn.
Câu 3: Bảng mã ASCII ban đầu được thiết kế chủ yếu cho các ký tự tiếng Anh. Nếu một văn bản chỉ sử dụng các ký tự Latin cơ bản (A-Z, a-z, 0-9, dấu câu thông dụng), việc sử dụng bảng mã ASCII 7-bit có nhược điểm đáng kể nào so với Unicode trong trường hợp này?
- A. Kích thước tệp văn bản lớn hơn.
- B. Tốc độ xử lý văn bản chậm hơn.
- C. Không thể in được văn bản.
- D. Trong trường hợp này, việc sử dụng ASCII 7-bit không có nhược điểm đáng kể so với Unicode về mặt biểu diễn ký tự.
Câu 4: Một người dùng tạo văn bản tiếng Việt trên máy tính cũ sử dụng bảng mã TCVN3. Khi gửi tệp này sang một máy tính khác chỉ cài đặt font chữ theo chuẩn Unicode, hiện tượng phổ biến nhất xảy ra với văn bản là gì?
- A. Văn bản bị lỗi font, hiển thị các ký tự lạ thay vì chữ tiếng Việt có dấu.
- B. Văn bản hiển thị bình thường nhưng không thể chỉnh sửa.
- C. Văn bản bị mất hết các hình ảnh và bảng biểu.
- D. Máy tính nhận không mở được tệp văn bản.
Câu 5: Mục đích chính của việc ra đời bảng mã Unicode là gì?
- A. Giảm kích thước tệp văn bản.
- B. Tăng tốc độ gõ văn bản.
- C. Thống nhất mã ký tự cho hầu hết các ngôn ngữ trên thế giới.
- D. Chỉ hỗ trợ các ký tự đặc biệt.
Câu 6: Bảng mã Unicode sử dụng một không gian mã lớn hơn nhiều so với ASCII mở rộng (256 ký tự). Điều này mang lại lợi ích gì trong việc số hóa văn bản?
- A. Giảm thiểu số lượng bit cần thiết để biểu diễn mỗi ký tự.
- B. Cho phép biểu diễn đồng thời các ký tự từ nhiều ngôn ngữ khác nhau trong cùng một văn bản.
- C. Chỉ cho phép biểu diễn các ký tự in hoa.
- D. Làm cho quá trình in ấn văn bản nhanh hơn.
Câu 7: Để máy tính có thể hiển thị đúng một văn bản được mã hóa bằng Unicode, hệ điều hành và các ứng dụng xử lý văn bản cần có khả năng gì?
- A. Chỉ cần nhận diện được tệp văn bản có đuôi .txt.
- B. Phải cài đặt tất cả các bảng mã cũ như TCVN3, VNI.
- C. Chỉ cần có kết nối Internet ổn định.
- D. Hỗ trợ bảng mã Unicode và có các font chữ tương ứng.
Câu 8: Quá trình chuyển một ký tự từ dạng con người đọc được sang dãy bit mà máy tính hiểu bao gồm mấy bước chính?
Câu 9: Bước đầu tiên trong quá trình chuyển một ký tự thành dữ liệu số là gì?
- A. Gán cho mỗi ký tự một mã số duy nhất (mã ký tự).
- B. Chuyển mã ký tự thành dãy bit nhị phân.
- C. Lưu trữ ký tự dưới dạng hình ảnh.
- D. In ký tự ra giấy.
Câu 10: Bước thứ hai trong quá trình chuyển một ký tự thành dữ liệu số là gì?
- A. Gán cho mỗi ký tự một mã số duy nhất (mã ký tự).
- B. Chuyển mã ký tự thành dãy bit nhị phân.
- C. Hiển thị ký tự lên màn hình.
- D. So sánh mã ký tự với các mã khác.
Câu 11: Giả sử bảng mã ASCII sử dụng 7 bit để biểu diễn ký tự. Số lượng ký tự tối đa mà bảng mã này có thể biểu diễn là bao nhiêu?
- A. 127
- B. 128
- C. 2^7 = 128
- D. 2^8 = 256
Câu 12: Bảng mã ASCII mở rộng sử dụng 8 bit để biểu diễn ký tự. Số lượng ký tự tối đa mà bảng mã này có thể biểu diễn là bao nhiêu?
- A. 128
- B. 255
- C. 257
- D. 2^8 = 256
Câu 13: Phông chữ (font) là tập hợp các ký tự có cùng kiểu dáng. Khi bạn chọn một phông chữ trong phần mềm soạn thảo văn bản, mối liên hệ giữa phông chữ và bảng mã là gì?
- A. Phông chữ chứa hình ảnh hiển thị cho các mã ký tự trong một bảng mã cụ thể.
- B. Phông chữ quyết định bảng mã nào được sử dụng để lưu tệp.
- C. Bảng mã thay đổi hình dáng của ký tự trong phông chữ.
- D. Phông chữ và bảng mã hoàn toàn độc lập với nhau.
Câu 14: Font chữ nào sau đây thường được sử dụng với bảng mã Unicode?
- A. Arial
- B. VnTime
- C. VNI-Times
- D. ABC Font
Câu 15: Font chữ nào sau đây thường được sử dụng với các bảng mã tiếng Việt cũ như TCVN3 hoặc VNI?
- A. Times New Roman
- B. Tahoma
- C. Calibri
- D. VnTime
Câu 16: Việc số hóa văn bản mang lại nhiều lợi ích. Lợi ích nào sau đây liên quan trực tiếp đến khả năng tìm kiếm và xử lý tự động nội dung văn bản?
- A. Giảm không gian lưu trữ vật lý.
- B. Máy tính có thể nhận diện, tìm kiếm và thao tác với từng ký tự.
- C. Bảo quản văn bản gốc tốt hơn.
- D. Dễ dàng chia sẻ qua đường bưu điện.
Câu 17: Khi số hóa một cuốn sách cổ bằng cách quét (scan) thành các tệp ảnh, chúng ta đã tạo ra dữ liệu số. Tuy nhiên, dữ liệu này chưa phải là văn bản số theo đúng nghĩa để máy tính có thể hiểu và xử lý nội dung. Cần thực hiện thêm bước nào để chuyển dữ liệu ảnh chứa chữ thành văn bản số có thể chỉnh sửa?
- A. Lưu tệp ảnh dưới định dạng PDF.
- B. Nén tệp ảnh để giảm kích thước.
- C. Sử dụng phần mềm nhận dạng ký tự quang học (OCR).
- D. In tệp ảnh ra giấy mới.
Câu 18: Một tệp văn bản được lưu với mã hóa UTF-8 (một dạng của Unicode). Đặc điểm nào của UTF-8 giúp nó tương thích ngược với ASCII?
- A. Các ký tự ASCII (0-127) được biểu diễn bằng 1 byte giống hệt mã ASCII 7-bit.
- B. Tất cả các ký tự trong UTF-8 đều dùng 2 byte.
- C. UTF-8 chỉ hỗ trợ tiếng Anh.
- D. UTF-8 không sử dụng hệ nhị phân.
Câu 19: Tại sao việc sử dụng bảng mã Unicode ngày càng trở nên phổ biến và được khuyến khích thay vì các bảng mã cũ như ASCII mở rộng, TCVN3, VNI?
- A. Unicode làm cho văn bản có màu sắc đẹp hơn.
- B. Unicode chỉ sử dụng ít bit hơn để biểu diễn ký tự.
- C. Unicode chỉ tương thích với các hệ điều hành cũ.
- D. Unicode hỗ trợ đa ngôn ngữ, giúp trao đổi văn bản quốc tế dễ dàng hơn và giải quyết vấn đề lỗi font giữa các hệ thống.
Câu 20: Khi soạn thảo một văn bản chứa cả tiếng Việt, tiếng Anh và một vài ký tự đặc biệt của tiếng Pháp (ví dụ: "é", "à"), bảng mã nào sau đây là lựa chọn phù hợp nhất để đảm bảo hiển thị đúng tất cả các ký tự?
- A. ASCII 7-bit
- B. ASCII mở rộng (Latin-1)
- C. Unicode
- D. Chỉ cần dùng bảng mã TCVN3.
Câu 21: Sự khác biệt cơ bản giữa dữ liệu văn bản được số hóa (ví dụ: tệp .txt, .docx) và dữ liệu hình ảnh chứa văn bản (ví dụ: tệp .jpg, .png của trang sách quét) là gì?
- A. Dữ liệu văn bản số hóa biểu diễn từng ký tự bằng mã, còn dữ liệu hình ảnh chỉ lưu trữ các điểm ảnh (pixel).
- B. Dữ liệu văn bản số hóa luôn có màu, còn dữ liệu hình ảnh luôn là đen trắng.
- C. Dữ liệu văn bản số hóa có kích thước lớn hơn nhiều so với dữ liệu hình ảnh.
- D. Dữ liệu hình ảnh có thể tìm kiếm nội dung dễ dàng hơn.
Câu 22: Việc số hóa văn bản giúp tạo ra các cơ sở dữ liệu văn bản lớn. Điều này mở ra khả năng ứng dụng nào sau đây trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP)?
- A. Chỉ để lưu trữ văn bản mà không làm gì khác.
- B. Chỉ để in ấn nhanh hơn.
- C. Chỉ để xem văn bản trên màn hình.
- D. Phân tích cú pháp, dịch máy, tóm tắt văn bản, nhận dạng cảm xúc từ văn bản.
Câu 23: Bảng mã ASCII gốc (7-bit) có thể mã hóa được bao nhiêu ký tự điều khiển (không in ra màn hình, dùng cho các chức năng điều khiển thiết bị)?
Câu 24: Khi nói về số hóa văn bản, khái niệm "mã ký tự" (character code) là gì?
- A. Một số nguyên duy nhất được gán cho mỗi ký tự trong một bảng mã.
- B. Hình ảnh hiển thị của ký tự.
- C. Tên của phông chữ được sử dụng.
- D. Số lượng bit dùng để biểu diễn ký tự.
Câu 25: Giả sử bạn mở một tệp văn bản trên máy tính và thấy các ký tự hiển thị không đúng, thay vào đó là các biểu tượng hoặc ký tự lạ. Nguyên nhân có thể là do sự không tương thích giữa:
- A. Kích thước màn hình và độ phân giải.
- B. Tốc độ xử lý của CPU và RAM.
- C. Bảng mã được sử dụng để lưu tệp và bảng mã hoặc font chữ được máy tính/phần mềm sử dụng để hiển thị.
- D. Màu sắc của nền màn hình.
Câu 26: So với việc lưu trữ văn bản truyền thống trên giấy, việc số hóa văn bản và lưu trữ trên máy tính hoặc đám mây mang lại lợi ích rõ rệt nào về khả năng sao chép và chia sẻ?
- A. Sao chép và chia sẻ tệp văn bản số hóa tốn kém và mất nhiều thời gian hơn.
- B. Sao chép và chia sẻ tệp văn bản số hóa diễn ra nhanh chóng, dễ dàng và không làm giảm chất lượng nội dung.
- C. Văn bản số hóa chỉ có thể được chia sẻ qua đường bưu điện.
- D. Văn bản giấy dễ dàng sao chép và chia sẻ hơn văn bản số hóa.
Câu 27: Trong ngữ cảnh số hóa văn bản, "dữ liệu" là gì?
- A. Là thông tin đã được biểu diễn dưới dạng mà máy tính có thể xử lý (dãy bit).
- B. Là ý nghĩa của văn bản mà con người hiểu.
- C. Chỉ là các ký tự in ra giấy.
- D. Là phần mềm dùng để soạn thảo văn bản.
Câu 28: Một trong những ứng dụng quan trọng của việc số hóa văn bản là tạo ra các thư viện số. Lợi ích chính của thư viện số so với thư viện truyền thống là gì?
- A. Chỉ chứa sách mới xuất bản.
- B. Chỉ có thể truy cập vào giờ hành chính.
- C. Yêu cầu không gian lưu trữ vật lý lớn hơn.
- D. Cho phép nhiều người truy cập cùng một tài liệu cùng lúc từ xa, tiết kiệm không gian và dễ dàng tìm kiếm.
Câu 29: Khi bạn gõ một ký tự từ bàn phím vào máy tính, quá trình nào sau đây diễn ra để máy tính hiểu và hiển thị ký tự đó?
- A. Máy tính nhận diện hình dạng của phím bạn nhấn.
- B. Bàn phím gửi một tín hiệu tương ứng với ký tự, hệ điều hành chuyển tín hiệu đó thành mã ký tự dựa trên bảng mã đang dùng, sau đó phần mềm hiển thị sử dụng font chữ để vẽ ký tự tương ứng với mã đó.
- C. Máy tính chụp ảnh phím bạn nhấn và hiển thị ảnh đó.
- D. Máy tính đoán ký tự bạn muốn gõ dựa vào các ký tự đã gõ trước đó.
Câu 30: Hãy xem xét hai tệp văn bản: Tệp A được lưu bằng bảng mã TCVN3, Tệp B được lưu bằng bảng mã Unicode. Cả hai tệp đều chứa cùng một đoạn văn bản tiếng Việt. Khi mở hai tệp này trên một máy tính có hỗ trợ cả font TCVN3 và font Unicode, điều gì có thể xảy ra?
- A. Nếu phần mềm soạn thảo nhận diện đúng bảng mã của mỗi tệp và có font tương ứng, cả hai tệp sẽ hiển thị đúng nội dung tiếng Việt.
- B. Tệp A chắc chắn bị lỗi font, còn Tệp B hiển thị đúng.
- C. Tệp B chắc chắn bị lỗi font, còn Tệp A hiển thị đúng.
- D. Cả hai tệp đều bị lỗi font vì sử dụng bảng mã khác nhau.