Bài Tập, Đề Thi Trắc Nghiệm Online – Môn Xử Lí Ngôn Ngữ Tự Nhiên – Đề 04

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Môn Xử Lí Ngôn Ngữ Tự Nhiên

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên - Đề 04

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên - Đề 04 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong xử lý ngôn ngữ tự nhiên (NLP), kỹ thuật "word embedding" (biểu diễn từ) mang lại lợi ích chính nào so với phương pháp "bag-of-words" (túi từ)?

  • A. Giảm chiều dữ liệu văn bản hiệu quả hơn.
  • B. Nắm bắt được mối quan hệ ngữ nghĩa giữa các từ.
  • C. Tăng tốc độ xử lý văn bản trong các mô hình NLP.
  • D. Đơn giản hóa quá trình tiền xử lý văn bản.

Câu 2: Bạn đang xây dựng một hệ thống phân loại văn bản để xác định xem một bài đánh giá sản phẩm trực tuyến là tích cực hay tiêu cực. Phương pháp "TF-IDF" (Tần suất từ - Nghịch tần suất văn bản) sẽ hỗ trợ bạn như thế nào trong quá trình này?

  • A. Giảm số lượng từ vựng cần xử lý.
  • B. Phân tích cấu trúc cú pháp của câu trong bài đánh giá.
  • C. Đánh trọng số các từ dựa trên tần suất xuất hiện trong bài đánh giá và độ hiếm trong toàn bộ tập đánh giá.
  • D. Biểu diễn mỗi từ trong bài đánh giá thành một vectơ số cố định.

Câu 3: Mô hình ngôn ngữ "Transformer" đã đạt được hiệu suất vượt trội trong nhiều nhiệm vụ NLP nhờ cơ chế "attention" (chú ý). Cơ chế này hoạt động như thế nào?

  • A. Mã hóa tuần tự văn bản đầu vào và giải mã tuần tự văn bản đầu ra.
  • B. Sử dụng mạng nơ-ron tích chập để trích xuất đặc trưng từ văn bản.
  • C. Phân tích tần suất xuất hiện của các từ trong văn bản.
  • D. Cho phép mô hình học cách gán trọng số khác nhau cho các phần khác nhau của dữ liệu đầu vào khi tạo ra đầu ra.

Câu 4: Trong ngữ cảnh của mô hình ngôn ngữ, "perplexity" là một thước đo đánh giá. Perplexity càng thấp thường được hiểu là:

  • A. Mô hình dự đoán chuỗi văn bản tốt hơn.
  • B. Mô hình có số lượng tham số ít hơn.
  • C. Mô hình huấn luyện nhanh hơn.
  • D. Mô hình dễ bị "overfitting" hơn.

Câu 5: Khi xử lý văn bản tiếng Việt, việc "tokenization" (phân tách từ) có thể gặp thách thức đặc biệt nào so với tiếng Anh?

  • A. Tiếng Việt có ít từ vựng hơn tiếng Anh.
  • B. Tiếng Việt có nhiều từ ghép và từ láy mà không có dấu cách rõ ràng.
  • C. Tiếng Việt không sử dụng bảng chữ cái Latinh.
  • D. Tiếng Việt có cấu trúc ngữ pháp phức tạp hơn tiếng Anh.

Câu 6: Nhiệm vụ "Named Entity Recognition" (NER - Nhận dạng thực thể được đặt tên) trong NLP nhằm mục đích chính là gì?

  • A. Phân loại văn bản thành các chủ đề khác nhau.
  • B. Phân tích cảm xúc và thái độ trong văn bản.
  • C. Xác định và phân loại các thực thể có tên như người, tổ chức, địa điểm trong văn bản.
  • D. Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.

Câu 7: "Stemming" và "Lemmatization" là hai kỹ thuật tiền xử lý văn bản thường được sử dụng. Sự khác biệt chính giữa chúng là gì?

  • A. Stemming phức tạp hơn Lemmatization và sử dụng từ điển.
  • B. Lemmatization nhanh hơn Stemming và ít gây lỗi hơn.
  • C. Stemming đưa từ về dạng gốc có nghĩa, còn Lemmatization chỉ loại bỏ hậu tố.
  • D. Stemming loại bỏ các hậu tố để đưa từ về dạng gốc, có thể không phải từ có nghĩa; Lemmatization đưa từ về dạng từ điển (lemma), là từ có nghĩa.

Câu 8: Trong bài toán dịch máy (Machine Translation), kỹ thuật "back-translation" (dịch ngược) được sử dụng để làm gì?

  • A. Đánh giá chất lượng bản dịch của mô hình.
  • B. Tăng cường dữ liệu huấn luyện bằng cách tạo ra các cặp câu song ngữ mới.
  • C. Cải thiện tốc độ dịch của mô hình dịch máy.
  • D. Chuẩn hóa định dạng văn bản đầu vào trước khi dịch.

Câu 9: Mô hình "Word2Vec" tạo ra "word embeddings" bằng cách nào?

  • A. Phân tích cấu trúc cú pháp của câu để xác định mối quan hệ giữa các từ.
  • B. Đếm tần suất xuất hiện của các từ trong toàn bộ tập văn bản.
  • C. Dự đoán từ mục tiêu dựa trên các từ ngữ cảnh xung quanh hoặc ngược lại.
  • D. Sử dụng mạng nơ-ron tích chập để học biểu diễn từ.

Câu 10: Khi đánh giá mô hình phân loại văn bản, "precision" (độ chính xác) và "recall" (độ phủ) là hai thước đo quan trọng. "Precision" đo lường điều gì?

  • A. Tỷ lệ các trường hợp dự đoán là lớp tích cực và thực sự là lớp tích cực.
  • B. Tỷ lệ các trường hợp thực sự là lớp tích cực được dự đoán đúng là lớp tích cực.
  • C. Tổng số trường hợp dự đoán đúng trên tổng số trường hợp.
  • D. Mức độ mô hình khái quát hóa tốt trên dữ liệu mới.

Câu 11: Trong NLP, "stop words" (từ dừng) là gì và tại sao chúng thường được loại bỏ trong quá trình tiền xử lý văn bản?

  • A. Các từ mang cảm xúc tiêu cực và cần loại bỏ để tránh sai lệch trong phân tích cảm xúc.
  • B. Các từ xuất hiện thường xuyên nhưng ít mang ý nghĩa trong ngữ cảnh cụ thể, loại bỏ để giảm nhiễu và tăng hiệu quả xử lý.
  • C. Các từ không có trong từ điển và cần loại bỏ để giảm kích thước từ vựng.
  • D. Các từ chỉ liên kết câu và cần loại bỏ để đơn giản hóa cấu trúc văn bản.

Câu 12: Kỹ thuật "n-gram" được sử dụng trong NLP để làm gì?

  • A. Biểu diễn văn bản dưới dạng đồ thị.
  • B. Phân tích cấu trúc cú pháp của câu.
  • C. Phân tích chuỗi n từ liên tiếp trong văn bản, hữu ích trong mô hình hóa ngôn ngữ và các nhiệm vụ khác.
  • D. Tóm tắt văn bản bằng cách chọn ra các câu quan trọng nhất.

Câu 13: "Chunking" (phân đoạn cú pháp nông) là một bước trung gian trong phân tích cú pháp. Mục tiêu của chunking là gì?

  • A. Xác định mối quan hệ phụ thuộc giữa các từ trong câu.
  • B. Gán nhãn từ loại (POS tagging) cho mỗi từ trong câu.
  • C. Phân tích ý nghĩa ngữ nghĩa của câu.
  • D. Nhóm các từ liên tiếp thành các cụm từ cú pháp như cụm danh từ, cụm động từ.

Câu 14: Trong lĩnh vực chatbot và trợ lý ảo, "intent recognition" (nhận dạng ý định) là một thành phần quan trọng. Nhiệm vụ này nhằm mục đích gì?

  • A. Xác định mục đích hoặc ý định của người dùng đằng sau câu nói của họ.
  • B. Tạo ra phản hồi tự nhiên và trôi chảy cho người dùng.
  • C. Lưu trữ lịch sử hội thoại với người dùng.
  • D. Chuyển đổi giọng nói của người dùng thành văn bản.

Câu 15: "Knowledge graph" (đồ thị tri thức) có thể được ứng dụng trong NLP để làm gì?

  • A. Phân tích cảm xúc trong văn bản.
  • B. Lưu trữ và truy xuất thông tin, hỗ trợ trả lời câu hỏi và suy luận.
  • C. Tạo ra văn bản tự động.
  • D. Dịch văn bản giữa các ngôn ngữ.

Câu 16: Kỹ thuật "data augmentation" (tăng cường dữ liệu) có thể được áp dụng trong NLP như thế nào để cải thiện hiệu suất mô hình?

  • A. Giảm kích thước dữ liệu huấn luyện để tăng tốc độ huấn luyện.
  • B. Loại bỏ dữ liệu nhiễu khỏi tập huấn luyện.
  • C. Tạo ra các biến thể của dữ liệu hiện có (ví dụ: thay thế từ đồng nghĩa, xáo trộn câu) để tăng tính đa dạng của tập huấn luyện.
  • D. Chia nhỏ dữ liệu huấn luyện thành các phần nhỏ hơn để huấn luyện song song.

Câu 17: "Zero-shot learning" trong NLP đề cập đến khả năng của mô hình như thế nào?

  • A. Huấn luyện mô hình trên dữ liệu tổng hợp (synthetic data).
  • B. Huấn luyện mô hình với dữ liệu ít nhiễu.
  • C. Huấn luyện mô hình mà không cần nhãn dữ liệu.
  • D. Thực hiện nhiệm vụ mà không cần được huấn luyện trực tiếp trên nhiệm vụ đó, dựa trên khả năng khái quát hóa từ các nhiệm vụ đã học.

Câu 18: Mô hình ngôn ngữ "BERT" (Bidirectional Encoder Representations from Transformers) khác biệt so với các mô hình trước đó như "Word2Vec" và "GloVe" ở điểm nào quan trọng?

  • A. BERT chỉ có thể xử lý văn bản tiếng Anh, trong khi Word2Vec và GloVe có thể xử lý đa ngôn ngữ.
  • B. BERT tạo ra biểu diễn từ theo ngữ cảnh (contextualized word embeddings), trong khi Word2Vec và GloVe tạo ra biểu diễn từ tĩnh (static word embeddings).
  • C. BERT sử dụng mạng nơ-ron hồi quy (RNN), trong khi Word2Vec và GloVe sử dụng mạng nơ-ron tích chập (CNN).
  • D. BERT đòi hỏi ít dữ liệu huấn luyện hơn so với Word2Vec và GloVe.

Câu 19: "Dependency parsing" (phân tích cú pháp phụ thuộc) trong NLP nhằm mục đích chính là gì?

  • A. Phân loại văn bản theo chủ đề.
  • B. Nhận dạng các thực thể có tên trong văn bản.
  • C. Xác định cấu trúc cú pháp của câu bằng cách phân tích mối quan hệ phụ thuộc giữa các từ.
  • D. Dịch câu từ ngôn ngữ này sang ngôn ngữ khác.

Câu 20: Khi xử lý văn bản dài, mô hình "Recurrent Neural Network" (RNN) có thể gặp vấn đề "vanishing gradients" (gradient biến mất). Vấn đề này ảnh hưởng đến hiệu suất mô hình như thế nào?

  • A. Mô hình huấn luyện chậm hơn.
  • B. Mô hình dễ bị "overfitting" hơn.
  • C. Mô hình tiêu thụ nhiều bộ nhớ hơn.
  • D. Mô hình khó học được các phụ thuộc dài hạn trong chuỗi văn bản, làm giảm khả năng xử lý văn bản dài.

Câu 21: "Character-level embedding" (biểu diễn mức ký tự) có ưu điểm gì so với "word-level embedding" (biểu diễn mức từ) trong một số ứng dụng NLP?

  • A. Khả năng xử lý tốt hơn với các từ ngoài từ vựng (out-of-vocabulary words) và lỗi chính tả.
  • B. Tạo ra biểu diễn từ giàu ngữ nghĩa hơn.
  • C. Huấn luyện nhanh hơn và hiệu quả hơn.
  • D. Yêu cầu ít dữ liệu huấn luyện hơn.

Câu 22: Trong mô hình ngôn ngữ dựa trên Transformer, "positional encoding" (mã hóa vị trí) được sử dụng để làm gì?

  • A. Giảm chiều dữ liệu đầu vào.
  • B. Cung cấp thông tin về vị trí của các từ trong câu cho mô hình.
  • C. Tăng cường khả năng song song hóa trong quá trình huấn luyện.
  • D. Chuẩn hóa độ dài của các câu đầu vào.

Câu 23: "F1-score" là một thước đo tổng hợp thường được sử dụng để đánh giá mô hình phân loại. F1-score được tính dựa trên những thước đo nào?

  • A. Accuracy và Precision.
  • B. Accuracy và Recall.
  • C. Precision và Recall.
  • D. Specificity và Sensitivity.

Câu 24: Trong NLP, "coreference resolution" (giải quyết đồng tham chiếu) là nhiệm vụ gì?

  • A. Phân tích cấu trúc cú pháp của câu.
  • B. Phân tích cảm xúc trong văn bản.
  • C. Nhận dạng các thực thể có tên trong văn bản.
  • D. Xác định tất cả các biểu thức ngôn ngữ (ví dụ: đại từ, cụm danh từ) trong văn bản cùng tham chiếu đến cùng một thực thể thực tế.

Câu 25: "Beam search" là một thuật toán tìm kiếm thường được sử dụng trong các nhiệm vụ tạo văn bản (text generation) như dịch máy hoặc tóm tắt văn bản. Beam search hoạt động như thế nào?

  • A. Tìm kiếm tất cả các khả năng tạo văn bản và chọn ra kết quả tốt nhất.
  • B. Duy trì một số lượng cố định (beam width) các ứng viên đầu ra tiềm năng tốt nhất tại mỗi bước giải mã, thay vì chỉ chọn một ứng viên tốt nhất.
  • C. Sử dụng tìm kiếm theo chiều sâu để khám phá không gian đầu ra.
  • D. Áp dụng thuật toán di truyền để tối ưu hóa văn bản đầu ra.

Câu 26: "Cross-lingual transfer learning" (học chuyển giao đa ngôn ngữ) trong NLP có nghĩa là gì?

  • A. Dịch văn bản giữa nhiều ngôn ngữ khác nhau.
  • B. Huấn luyện mô hình trên dữ liệu đa ngôn ngữ cùng một lúc.
  • C. Chuyển giao kiến thức học được từ một ngôn ngữ (thường là ngôn ngữ có nhiều tài nguyên) sang một ngôn ngữ khác (thường là ngôn ngữ ít tài nguyên hơn).
  • D. Đánh giá mô hình NLP trên nhiều ngôn ngữ.

Câu 27: "Active learning" (học chủ động) có thể hữu ích trong NLP khi nào?

  • A. Khi việc thu thập dữ liệu gán nhãn là tốn kém hoặc mất thời gian, active learning giúp chọn lọc dữ liệu có giá trị thông tin cao để gán nhãn.
  • B. Khi dữ liệu huấn luyện rất lớn và cần giảm kích thước dữ liệu.
  • C. Khi muốn tăng tốc độ huấn luyện mô hình.
  • D. Khi mô hình đã đạt được độ chính xác cao và cần cải thiện thêm một chút.

Câu 28: "Few-shot learning" (học với ít mẫu) là gì trong ngữ cảnh của NLP?

  • A. Huấn luyện mô hình trên dữ liệu tổng hợp (synthetic data).
  • B. Khả năng của mô hình học được một nhiệm vụ mới chỉ với một vài ví dụ huấn luyện.
  • C. Huấn luyện mô hình với dữ liệu ít nhiễu.
  • D. Huấn luyện mô hình mà không cần nhãn dữ liệu.

Câu 29: "Explainable AI" (XAI - AI giải thích được) ngày càng quan trọng trong NLP. Tại sao?

  • A. Để tăng độ chính xác của mô hình NLP.
  • B. Để giảm thời gian huấn luyện mô hình NLP.
  • C. Để hiểu rõ hơn quyết định của mô hình NLP, tăng tính minh bạch và độ tin cậy, đặc biệt trong các ứng dụng nhạy cảm.
  • D. Để dễ dàng triển khai mô hình NLP trên các thiết bị di động.

Câu 30: "Bias" (thiên kiến) trong dữ liệu huấn luyện có thể ảnh hưởng đến mô hình NLP như thế nào?

  • A. Bias trong dữ liệu không ảnh hưởng đến mô hình NLP.
  • B. Bias trong dữ liệu chỉ làm giảm hiệu suất của mô hình trên dữ liệu kiểm tra.
  • C. Bias trong dữ liệu có thể làm mô hình hoạt động tốt hơn trên một số nhóm dữ liệu nhất định.
  • D. Bias trong dữ liệu có thể dẫn đến mô hình đưa ra các dự đoán không công bằng hoặc phân biệt đối xử với một số nhóm người nhất định.

1 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 1: Trong xử lý ngôn ngữ tự nhiên (NLP), kỹ thuật 'word embedding' (biểu diễn từ) mang lại lợi ích chính nào so với phương pháp 'bag-of-words' (túi từ)?

2 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 2: Bạn đang xây dựng một hệ thống phân loại văn bản để xác định xem một bài đánh giá sản phẩm trực tuyến là tích cực hay tiêu cực. Phương pháp 'TF-IDF' (Tần suất từ - Nghịch tần suất văn bản) sẽ hỗ trợ bạn như thế nào trong quá trình này?

3 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 3: Mô hình ngôn ngữ 'Transformer' đã đạt được hiệu suất vượt trội trong nhiều nhiệm vụ NLP nhờ cơ chế 'attention' (chú ý). Cơ chế này hoạt động như thế nào?

4 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 4: Trong ngữ cảnh của mô hình ngôn ngữ, 'perplexity' là một thước đo đánh giá. Perplexity càng thấp thường được hiểu là:

5 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 5: Khi xử lý văn b??n tiếng Việt, việc 'tokenization' (phân tách từ) có thể gặp thách thức đặc biệt nào so với tiếng Anh?

6 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 6: Nhiệm vụ 'Named Entity Recognition' (NER - Nhận dạng thực thể được đặt tên) trong NLP nhằm mục đích chính là gì?

7 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 7: 'Stemming' và 'Lemmatization' là hai kỹ thuật tiền xử lý văn bản thường được sử dụng. Sự khác biệt chính giữa chúng là gì?

8 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 8: Trong bài toán dịch máy (Machine Translation), kỹ thuật 'back-translation' (dịch ngược) được sử dụng để làm gì?

9 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 9: Mô hình 'Word2Vec' tạo ra 'word embeddings' bằng cách nào?

10 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 10: Khi đánh giá mô hình phân loại văn bản, 'precision' (độ chính xác) và 'recall' (độ phủ) là hai thước đo quan trọng. 'Precision' đo lường điều gì?

11 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 11: Trong NLP, 'stop words' (từ dừng) là gì và tại sao chúng thường được loại bỏ trong quá trình tiền xử lý văn bản?

12 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 12: Kỹ thuật 'n-gram' được sử dụng trong NLP để làm gì?

13 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 13: 'Chunking' (phân đoạn cú pháp nông) là một bước trung gian trong phân tích cú pháp. Mục tiêu của chunking là gì?

14 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 14: Trong lĩnh vực chatbot và trợ lý ảo, 'intent recognition' (nhận dạng ý định) là một thành phần quan trọng. Nhiệm vụ này nhằm mục đích gì?

15 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 15: 'Knowledge graph' (đồ thị tri thức) có thể được ứng dụng trong NLP để làm gì?

16 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 16: Kỹ thuật 'data augmentation' (tăng cường dữ liệu) có thể được áp dụng trong NLP như thế nào để cải thiện hiệu suất mô hình?

17 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 17: 'Zero-shot learning' trong NLP đề cập đến khả năng của mô hình như thế nào?

18 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 18: Mô hình ngôn ngữ 'BERT' (Bidirectional Encoder Representations from Transformers) khác biệt so với các mô hình trước đó như 'Word2Vec' và 'GloVe' ở điểm nào quan trọng?

19 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 19: 'Dependency parsing' (phân tích cú pháp phụ thuộc) trong NLP nhằm mục đích chính là gì?

20 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 20: Khi xử lý văn bản dài, mô hình 'Recurrent Neural Network' (RNN) có thể gặp vấn đề 'vanishing gradients' (gradient biến mất). Vấn đề này ảnh hưởng đến hiệu suất mô hình như thế nào?

21 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 21: 'Character-level embedding' (biểu diễn mức ký tự) có ưu điểm gì so với 'word-level embedding' (biểu diễn mức từ) trong một số ứng dụng NLP?

22 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 22: Trong mô hình ngôn ngữ dựa trên Transformer, 'positional encoding' (mã hóa vị trí) được sử dụng để làm gì?

23 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 23: 'F1-score' là một thước đo tổng hợp thường được sử dụng để đánh giá mô hình phân loại. F1-score được tính dựa trên những thước đo nào?

24 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 24: Trong NLP, 'coreference resolution' (giải quyết đồng tham chiếu) là nhiệm vụ gì?

25 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 25: 'Beam search' là một thuật toán tìm kiếm thường được sử dụng trong các nhiệm vụ tạo văn bản (text generation) như dịch máy hoặc tóm tắt văn bản. Beam search hoạt động như thế nào?

26 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 26: 'Cross-lingual transfer learning' (học chuyển giao đa ngôn ngữ) trong NLP có nghĩa là gì?

27 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 27: 'Active learning' (học chủ động) có thể hữu ích trong NLP khi nào?

28 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 28: 'Few-shot learning' (học với ít mẫu) là gì trong ngữ cảnh của NLP?

29 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 29: 'Explainable AI' (XAI - AI giải thích được) ngày càng quan trọng trong NLP. Tại sao?

30 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 4

Câu 30: 'Bias' (thiên kiến) trong dữ liệu huấn luyện có thể ảnh hưởng đến mô hình NLP như thế nào?

Xem kết quả