Bài Tập, Đề Thi Trắc Nghiệm Online – Môn Xử Lí Ngôn Ngữ Tự Nhiên – Đề 03

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Môn Xử Lí Ngôn Ngữ Tự Nhiên

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên - Đề 03

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên - Đề 03 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong quá trình xử lý văn bản, bước nào sau đây giúp giảm số lượng từ cần xử lý bằng cách loại bỏ các từ phổ biến nhưng ít mang lại thông tin ngữ nghĩa đặc trưng cho văn bản?

  • A. Stemming (cắt gốc từ)
  • B. Lemmatization (nguyên mẫu hóa)
  • C. Tokenization (tách từ)
  • D. Stop word removal (loại bỏ từ dừng)

Câu 2: Xét câu: "Tôi rất thích sản phẩm này, tuy nhiên giá hơi cao.". Nhiệm vụ phân tích tình cảm (Sentiment Analysis) sẽ xác định điều gì về câu này?

  • A. Câu này thể hiện tình cảm tích cực.
  • B. Câu này thể hiện tình cảm tiêu cực.
  • C. Câu này thể hiện tình cảm hỗn hợp (vừa tích cực, vừa tiêu cực).
  • D. Câu này không thể hiện tình cảm rõ ràng.

Câu 3: Mô hình Bag-of-Words (BoW) biểu diễn văn bản dưới dạng vectơ dựa trên yếu tố nào?

  • A. Vị trí của từ trong câu.
  • B. Tần suất xuất hiện của từ trong văn bản.
  • C. Ý nghĩa ngữ nghĩa của từ.
  • D. Mối quan hệ cú pháp giữa các từ.

Câu 4: Kỹ thuật Word Embedding (ví dụ: Word2Vec, GloVe) có ưu điểm gì vượt trội so với Bag-of-Words trong biểu diễn từ?

  • A. Word Embedding tạo ra vectơ thưa thớt, tiết kiệm bộ nhớ hơn.
  • B. Word Embedding tính toán nhanh hơn Bag-of-Words.
  • C. Word Embedding thể hiện được mối quan hệ ngữ nghĩa giữa các từ.
  • D. Word Embedding không yêu cầu tiền xử lý văn bản phức tạp.

Câu 5: Trong bài toán dịch máy, mô hình Sequence-to-Sequence (Seq2Seq) thường sử dụng kiến trúc mạng nơ-ron nào?

  • A. Mạng nơ-ron hồi quy (Recurrent Neural Network - RNN).
  • B. Mạng nơ-ron tích chập (Convolutional Neural Network - CNN).
  • C. Mạng nơ-ron truyền thẳng (Feedforward Neural Network).
  • D. Mạng nơ-ron tự tổ chức (Self-Organizing Map - SOM).

Câu 6: Cơ chế Attention (chú ý) trong mô hình Transformer giúp giải quyết vấn đề gì khi xử lý các câu văn dài?

  • A. Giảm độ phức tạp tính toán của mô hình.
  • B. Cho phép mô hình tập trung vào các phần liên quan của câu khi xử lý thông tin.
  • C. Tăng tốc độ hội tụ của mô hình trong quá trình huấn luyện.
  • D. Cải thiện khả năng biểu diễn từ vựng của mô hình.

Câu 7: Mô hình ngôn ngữ BERT (Bidirectional Encoder Representations from Transformers) nổi bật với khả năng gì?

  • A. Khả năng dịch ngôn ngữ theo thời gian thực.
  • B. Khả năng sinh văn bản tự động.
  • C. Khả năng phân loại hình ảnh.
  • D. Khả năng hiểu ngữ cảnh từ theo cả hai hướng (trái và phải) trong câu.

Câu 8: Trong nhiệm vụ Nhận dạng Thực thể Có tên (Named Entity Recognition - NER), mục tiêu chính là gì?

  • A. Xác định và phân loại các thực thể có tên (ví dụ: người, tổ chức, địa điểm) trong văn bản.
  • B. Phân tích cảm xúc và thái độ của người viết.
  • C. Tóm tắt nội dung chính của văn bản.
  • D. Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.

Câu 9: Độ đo F1-score thường được sử dụng để đánh giá hiệu suất của mô hình trong các bài toán NLP nào?

  • A. Sinh văn bản.
  • B. Dịch máy.
  • C. Phân loại văn bản và nhận dạng thực thể.
  • D. Mô hình hóa ngôn ngữ.

Câu 10: Ứng dụng nào sau đây thể hiện việc sử dụng Xử lý ngôn ngữ tự nhiên (NLP) để cải thiện trải nghiệm người dùng trong tìm kiếm thông tin?

  • A. Phần mềm diệt virus.
  • B. Công cụ tìm kiếm trên web có khả năng hiểu truy vấn bằng ngôn ngữ tự nhiên.
  • C. Chương trình quản lý cơ sở dữ liệu.
  • D. Ứng dụng chỉnh sửa ảnh.

Câu 11: Thách thức lớn nhất trong Xử lý ngôn ngữ tự nhiên khi xử lý ngôn ngữ tiếng Việt là gì, so với tiếng Anh?

  • A. Tiếng Việt có ít từ vựng hơn tiếng Anh.
  • B. Tiếng Việt không có quy tắc ngữ pháp rõ ràng.
  • C. Tiếng Việt sử dụng bảng chữ cái khác biệt hoàn toàn.
  • D. Tiếng Việt là ngôn ngữ đơn lập, từ không biến đổi hình thái và có tính đa nghĩa cao.

Câu 12: Kỹ thuật "Stemming" (cắt gốc từ) trong NLP có thể dẫn đến tình trạng gì?

  • A. Tăng kích thước từ vựng.
  • B. Cải thiện khả năng hiểu nghĩa của từ.
  • C. Tạo ra các gốc từ không có nghĩa (over-stemming) hoặc khác nhau cho từ gốc giống nhau (under-stemming).
  • D. Giảm thời gian xử lý văn bản.

Câu 13: Trong mô hình ngôn ngữ N-gram, giá trị "N" đại diện cho điều gì?

  • A. Số lượng từ vựng trong tập dữ liệu.
  • B. Số lượng từ liên tiếp được xem xét trong mô hình.
  • C. Số lớp ẩn trong mạng nơ-ron.
  • D. Số lần lặp huấn luyện mô hình.

Câu 14: Phân tích cú pháp (Parsing) trong NLP nhằm mục đích gì?

  • A. Xác định cấu trúc ngữ pháp của câu và mối quan hệ giữa các từ.
  • B. Phân loại văn bản theo chủ đề.
  • C. Dịch câu từ ngôn ngữ này sang ngôn ngữ khác.
  • D. Tìm kiếm thông tin liên quan trong văn bản.

Câu 15: Trong lĩnh vực chatbot, kỹ thuật NLP nào giúp chatbot hiểu được ý định của người dùng từ câu hỏi hoặc yêu cầu?

  • A. Sinh văn bản tự động.
  • B. Phân tích tình cảm.
  • C. Nhận dạng ý định (Intent Recognition).
  • D. Tóm tắt văn bản.

Câu 16: Một công ty muốn phân tích phản hồi của khách hàng về sản phẩm trên mạng xã hội. Nhiệm vụ NLP nào phù hợp nhất để thực hiện điều này?

  • A. Nhận dạng thực thể có tên (NER).
  • B. Phân tích tình cảm (Sentiment Analysis).
  • C. Dịch máy (Machine Translation).
  • D. Tóm tắt văn bản (Text Summarization).

Câu 17: Mô hình Transformer sử dụng cơ chế Self-Attention để làm gì?

  • A. Tăng tốc độ tính toán của mô hình.
  • B. Giảm số lượng tham số của mô hình.
  • C. Phân tích cấu trúc cú pháp của câu.
  • D. Cho phép mô hình học mối quan hệ giữa các từ trong cùng một câu để hiểu ngữ cảnh.

Câu 18: Phương pháp "TF-IDF" (Term Frequency-Inverse Document Frequency) được sử dụng để làm gì trong NLP?

  • A. Đánh trọng số cho các từ trong văn bản dựa trên tần suất xuất hiện của chúng trong văn bản và độ hiếm của chúng trong toàn bộ tập văn bản.
  • B. Giảm số chiều của vectơ biểu diễn văn bản.
  • C. Phân cụm các văn bản có chủ đề tương tự.
  • D. Phân tích cảm xúc của văn bản.

Câu 19: Trong ngữ cảnh Xử lý ngôn ngữ tự nhiên, "tokenize" một văn bản nghĩa là gì?

  • A. Loại bỏ các từ dừng (stop words) khỏi văn bản.
  • B. Chia văn bản thành các đơn vị nhỏ hơn, thường là từ hoặc cụm từ.
  • C. Chuyển đổi văn bản thành chữ thường.
  • D. Tìm gốc của các từ trong văn bản.

Câu 20: Mô hình ngôn ngữ nào có khả năng dự đoán từ tiếp theo trong một chuỗi văn bản?

  • A. Mô hình phân loại văn bản.
  • B. Mô hình nhận dạng thực thể.
  • C. Mô hình ngôn ngữ (Language Model).
  • D. Mô hình phân tích tình cảm.

Câu 21: Một hệ thống dịch máy dựa trên quy tắc (rule-based) hoạt động chủ yếu dựa vào yếu tố nào?

  • A. Các quy tắc ngữ pháp và từ vựng được lập trình thủ công.
  • B. Dữ liệu song ngữ lớn để học dịch.
  • C. Mạng nơ-ron sâu để học biểu diễn ngôn ngữ.
  • D. Thống kê tần suất xuất hiện của từ và cụm từ.

Câu 22: Trong ngữ cảnh NLP, "disambiguation" (phân biệt nghĩa) đề cập đến vấn đề gì?

  • A. Loại bỏ nhiễu trong dữ liệu văn bản.
  • B. Xác định nghĩa chính xác của một từ hoặc cụm từ có nhiều nghĩa trong ngữ cảnh cụ thể.
  • C. Chuyển đổi văn bản từ dạng nói sang dạng viết.
  • D. Tóm tắt văn bản dài thành văn bản ngắn hơn.

Câu 23: Thư viện SpaCy trong Python nổi tiếng với ưu điểm gì trong xử lý ngôn ngữ tự nhiên?

  • A. Khả năng sinh văn bản tự động.
  • B. Cung cấp nhiều thuật toán học máy cổ điển.
  • C. Tốc độ xử lý nhanh và hiệu quả, đặc biệt cho các tác vụ cơ bản như tokenization, POS tagging.
  • D. Giao diện người dùng đồ họa trực quan.

Câu 24: "Coreference resolution" (giải quyết đồng tham chiếu) là một nhiệm vụ NLP nhằm mục đích gì?

  • A. Phân tích cấu trúc cú pháp của câu.
  • B. Phân loại văn bản theo chủ đề.
  • C. Dịch văn bản sang ngôn ngữ khác.
  • D. Xác định các cụm từ hoặc đại từ nào trong văn bản đề cập đến cùng một thực thể.

Câu 25: Trong đánh giá mô hình dịch máy, độ đo BLEU (Bilingual Evaluation Understudy) tập trung vào việc đo lường yếu tố nào?

  • A. Độ chính xác ngữ pháp của bản dịch.
  • B. Sự tương đồng về từ vựng và cụm từ giữa bản dịch của máy và bản dịch tham khảo.
  • C. Khả năng truyền đạt ý nghĩa chính xác của bản dịch.
  • D. Tốc độ dịch của mô hình.

Câu 26: Một hệ thống Question Answering (QA) lý tưởng cần có khả năng gì ngoài việc tìm kiếm từ khóa trong văn bản?

  • A. Hiển thị danh sách các văn bản liên quan.
  • B. Đếm số lượng từ trong văn bản.
  • C. Hiểu câu hỏi ở mức độ ngữ nghĩa và trích xuất câu trả lời chính xác từ ngữ cảnh.
  • D. Dịch câu hỏi sang nhiều ngôn ngữ khác nhau.

Câu 27: Ethical considerations (vấn đề đạo đức) trong NLP ngày càng được quan tâm, đặc biệt liên quan đến khía cạnh nào?

  • A. Chi phí tính toán của mô hình NLP.
  • B. Tính bảo mật của dữ liệu huấn luyện.
  • C. Khả năng tiếp cận công nghệ NLP cho người dùng.
  • D. Thiên kiến (bias) trong dữ liệu và thuật toán có thể dẫn đến kết quả không công bằng hoặc phân biệt đối xử.

Câu 28: Kỹ thuật "back-translation" (dịch ngược) thường được sử dụng để làm gì trong dịch máy?

  • A. Đánh giá chất lượng bản dịch của mô hình.
  • B. Tăng cường dữ liệu huấn luyện bằng cách tạo thêm dữ liệu song ngữ từ dữ liệu đơn ngữ.
  • C. Cải thiện tốc độ dịch của mô hình.
  • D. Giảm kích thước mô hình dịch máy.

Câu 29: Mô hình ngôn ngữ GPT (Generative Pre-trained Transformer) nổi tiếng với khả năng gì?

  • A. Sinh văn bản tự nhiên và mạch lạc, có khả năng tạo ra các đoạn văn, bài viết hoàn chỉnh.
  • B. Phân loại hình ảnh với độ chính xác cao.
  • C. Nhận dạng giọng nói trong môi trường ồn ào.
  • D. Dịch ngôn ngữ ký hiệu sang văn bản.

Câu 30: Trong kiến trúc Transformer, "Multi-Head Attention" (cơ chế chú ý đa đầu) có vai trò gì so với "Single-Head Attention" (cơ chế chú ý đơn đầu)?

  • A. Giảm độ phức tạp tính toán của mô hình.
  • B. Tăng tốc độ huấn luyện mô hình.
  • C. Cho phép mô hình học được nhiều khía cạnh khác nhau của mối quan hệ giữa các từ trong câu.
  • D. Giảm số lượng tham số của mô hình Transformer.

1 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 1: Trong quá trình xử lý văn bản, bước nào sau đây giúp giảm số lượng từ cần xử lý bằng cách loại bỏ các từ phổ biến nhưng ít mang lại thông tin ngữ nghĩa đặc trưng cho văn bản?

2 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 2: Xét câu: 'Tôi rất thích sản phẩm này, tuy nhiên giá hơi cao.'. Nhiệm vụ phân tích tình cảm (Sentiment Analysis) sẽ xác định điều gì về câu này?

3 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 3: Mô hình Bag-of-Words (BoW) biểu diễn văn bản dưới dạng vectơ dựa trên yếu tố nào?

4 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 4: Kỹ thuật Word Embedding (ví dụ: Word2Vec, GloVe) có ưu điểm gì vượt trội so với Bag-of-Words trong biểu diễn từ?

5 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 5: Trong bài toán dịch máy, mô hình Sequence-to-Sequence (Seq2Seq) thường sử dụng kiến trúc mạng nơ-ron nào?

6 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 6: Cơ chế Attention (chú ý) trong mô hình Transformer giúp giải quyết vấn đề gì khi xử lý các câu văn dài?

7 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 7: Mô hình ngôn ngữ BERT (Bidirectional Encoder Representations from Transformers) nổi bật với khả năng gì?

8 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 8: Trong nhiệm vụ Nhận dạng Thực thể Có tên (Named Entity Recognition - NER), mục tiêu chính là gì?

9 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 9: Độ đo F1-score thường được sử dụng để đánh giá hiệu suất của mô hình trong các bài toán NLP nào?

10 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 10: Ứng dụng nào sau đây thể hiện việc sử dụng Xử lý ngôn ngữ tự nhiên (NLP) để cải thiện trải nghiệm người dùng trong tìm kiếm thông tin?

11 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 11: Thách thức lớn nhất trong Xử lý ngôn ngữ tự nhiên khi xử lý ngôn ngữ tiếng Việt là gì, so với tiếng Anh?

12 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 12: Kỹ thuật 'Stemming' (cắt gốc từ) trong NLP có thể dẫn đến tình trạng gì?

13 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 13: Trong mô hình ngôn ngữ N-gram, giá trị 'N' đại diện cho điều gì?

14 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 14: Phân tích cú pháp (Parsing) trong NLP nhằm mục đích gì?

15 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 15: Trong lĩnh vực chatbot, kỹ thuật NLP nào giúp chatbot hiểu được ý định của người dùng từ câu hỏi hoặc yêu cầu?

16 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 16: Một công ty muốn phân tích phản hồi của khách hàng về sản phẩm trên mạng xã hội. Nhiệm vụ NLP nào phù hợp nhất để thực hiện điều này?

17 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 17: Mô hình Transformer sử dụng cơ chế Self-Attention để làm gì?

18 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 18: Phương pháp 'TF-IDF' (Term Frequency-Inverse Document Frequency) được sử dụng để làm gì trong NLP?

19 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 19: Trong ngữ cảnh Xử lý ngôn ngữ tự nhiên, 'tokenize' một văn bản nghĩa là gì?

20 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 20: Mô hình ngôn ngữ nào có khả năng dự đoán từ tiếp theo trong một chuỗi văn bản?

21 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 21: Một hệ thống dịch máy dựa trên quy tắc (rule-based) hoạt động chủ yếu dựa vào yếu tố nào?

22 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 22: Trong ngữ cảnh NLP, 'disambiguation' (phân biệt nghĩa) đề cập đến vấn đề gì?

23 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 23: Thư viện SpaCy trong Python nổi tiếng với ưu điểm gì trong xử lý ngôn ngữ tự nhiên?

24 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 24: 'Coreference resolution' (giải quyết đồng tham chiếu) là một nhiệm vụ NLP nhằm mục đích gì?

25 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 25: Trong đánh giá mô hình dịch máy, độ đo BLEU (Bilingual Evaluation Understudy) tập trung vào việc đo lường yếu tố nào?

26 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 26: Một hệ thống Question Answering (QA) lý tưởng cần có khả năng gì ngoài việc tìm kiếm từ khóa trong văn bản?

27 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 27: Ethical considerations (vấn đề đạo đức) trong NLP ngày càng được quan tâm, đặc biệt liên quan đến khía cạnh nào?

28 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 28: Kỹ thuật 'back-translation' (dịch ngược) thường được sử dụng để làm gì trong dịch máy?

29 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 29: Mô hình ngôn ngữ GPT (Generative Pre-trained Transformer) nổi tiếng với khả năng gì?

30 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 3

Câu 30: Trong kiến trúc Transformer, 'Multi-Head Attention' (cơ chế chú ý đa đầu) có vai trò gì so với 'Single-Head Attention' (cơ chế chú ý đơn đầu)?

Xem kết quả