Bài Tập, Đề Thi Trắc Nghiệm Online – Môn Xử Lí Ngôn Ngữ Tự Nhiên – Đề 09

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Môn Xử Lí Ngôn Ngữ Tự Nhiên

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên - Đề 09

Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên - Đề 09 bao gồm nhiều câu hỏi hay, bám sát chương trình. Cùng làm bài tập trắc nghiệm ngay.

Câu 1: Trong xử lý ngôn ngữ tự nhiên (NLP), kỹ thuật nào sau đây được sử dụng để chia một văn bản thành các đơn vị nhỏ hơn, chẳng hạn như từ, cụm từ, ký hiệu hoặc các thành phần có ý nghĩa khác?

  • A. Lemmatization
  • B. Tokenization
  • C. Stemming
  • D. Parsing

Câu 2: Mục tiêu chính của "phân tích cú pháp phụ thuộc" (dependency parsing) trong NLP là gì?

  • A. Xác định chủ đề chính của văn bản
  • B. Phân loại văn bản dựa trên tình cảm
  • C. Xác định cấu trúc ngữ pháp và mối quan hệ phụ thuộc giữa các từ trong câu
  • D. Chuyển đổi văn bản thành dạng số để xử lý bằng máy

Câu 3: Phương pháp "Bag-of-Words" (BoW) biểu diễn văn bản như thế nào trong NLP?

  • A. Một tập hợp không có thứ tự các từ, trong đó chỉ quan tâm đến tần suất xuất hiện của mỗi từ
  • B. Một chuỗi các vectơ từ được sắp xếp theo thứ tự xuất hiện trong văn bản
  • C. Một đồ thị biểu diễn mối quan hệ ngữ nghĩa giữa các từ
  • D. Một cây cú pháp thể hiện cấu trúc câu

Câu 4: Nhiệm vụ "Named Entity Recognition" (NER) nhằm mục đích gì trong NLP?

  • A. Phân tích cảm xúc và thái độ trong văn bản
  • B. Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác
  • C. Tóm tắt nội dung chính của văn bản
  • D. Xác định và phân loại các thực thể có tên trong văn bản, như tên người, tổ chức, địa điểm, thời gian, v.v.

Câu 5: Trong ngữ cảnh của Word Embeddings (ví dụ: Word2Vec, GloVe), điều gì thể hiện "tính tương tự về ngữ nghĩa" giữa hai từ?

  • A. Khoảng cách Euclidean lớn giữa vectơ biểu diễn của chúng
  • B. Góc nhỏ hoặc cosine similarity cao giữa vectơ biểu diễn của chúng
  • C. Tần suất xuất hiện cùng nhau của chúng trong văn bản
  • D. Vị trí tương đối của chúng trong câu

Câu 6: Mô hình ngôn ngữ (Language Model) được sử dụng để làm gì trong NLP?

  • A. Phân tích cấu trúc cú pháp của câu
  • B. Xác định các thực thể có tên trong văn bản
  • C. Dự đoán xác suất xuất hiện của một từ hoặc một chuỗi từ trong một ngữ cảnh nhất định
  • D. Phân loại văn bản theo chủ đề

Câu 7: Kỹ thuật "Stemming" và "Lemmatization" có điểm chung gì trong tiền xử lý văn bản?

  • A. Cả hai đều chuyển đổi văn bản thành dạng số
  • B. Cả hai đều xác định cấu trúc ngữ pháp của câu
  • C. Cả hai đều loại bỏ các từ dừng (stop words) khỏi văn bản
  • D. Cả hai đều cố gắng đưa các từ về dạng gốc hoặc dạng cơ bản của chúng

Câu 8: Trong kiến trúc Transformer, cơ chế "Attention" (chú ý) đóng vai trò quan trọng như thế nào?

  • A. Để giảm thiểu số lượng tham số trong mô hình
  • B. Cho phép mô hình tập trung vào các phần liên quan nhất của dữ liệu đầu vào khi xử lý thông tin
  • C. Để tăng tốc độ tính toán của mô hình
  • D. Để chuẩn hóa dữ liệu đầu vào

Câu 9: "Phân tích tình cảm" (Sentiment Analysis) trong NLP nhằm mục đích gì?

  • A. Xác định cảm xúc, thái độ hoặc quan điểm được thể hiện trong văn bản
  • B. Dịch văn bản sang ngôn ngữ khác
  • C. Tóm tắt văn bản thành các ý chính
  • D. Sửa lỗi chính tả và ngữ pháp trong văn bản

Câu 10: Để đánh giá hiệu suất của một mô hình dịch máy, thước đo BLEU (Bilingual Evaluation Understudy) tập trung vào điều gì?

  • A. Độ chính xác ngữ pháp của bản dịch
  • B. Tính trôi chảy và tự nhiên của bản dịch
  • C. Mức độ trùng lặp n-gram giữa bản dịch của mô hình và bản dịch tham khảo
  • D. Khả năng bảo toàn ý nghĩa của bản dịch so với văn bản gốc

Câu 11: Xét tình huống bạn muốn xây dựng một hệ thống chatbot. Nhiệm vụ NLP nào sau đây là quan trọng nhất để chatbot có thể hiểu ý định của người dùng?

  • A. Phân tích cú pháp phụ thuộc
  • B. Nhận dạng ý định (Intent Recognition)
  • C. Sinh văn bản (Text Generation)
  • D. Phân tích tình cảm

Câu 12: Trong lĩnh vực "Sinh văn bản" (Text Generation), kỹ thuật "lấy mẫu nhiệt độ" (temperature sampling) ảnh hưởng đến đầu ra như thế nào?

  • A. Thay đổi tốc độ sinh văn bản
  • B. Điều chỉnh độ dài của văn bản được sinh ra
  • C. Kiểm soát tính ngẫu nhiên và đa dạng của văn bản được sinh ra; nhiệt độ cao hơn tạo ra văn bản ngẫu nhiên và sáng tạo hơn
  • D. Cải thiện tính nhất quán ngữ pháp của văn bản

Câu 13: Để xử lý ngôn ngữ có cấu trúc phức tạp và mối quan hệ phụ thuộc xa, kiến trúc mạng nơ-ron nào thường được ưu tiên hơn so với mạng nơ-ron truyền thẳng (Feedforward Neural Networks) thông thường?

  • A. Mạng nơ-ron hồi quy (Recurrent Neural Networks - RNNs) hoặc Transformer
  • B. Mạng nơ-ron tích chập (Convolutional Neural Networks - CNNs)
  • C. Mạng tự mã hóa (Autoencoders)
  • D. Mạng đối nghịch sinh (Generative Adversarial Networks - GANs)

Câu 14: Giả sử bạn có một tập dữ liệu lớn các bài đánh giá sản phẩm trực tuyến và bạn muốn phân loại chúng thành "tích cực", "tiêu cực" hoặc "trung lập". Nhiệm vụ NLP này được gọi là gì?

  • A. Nhận dạng thực thể có tên
  • B. Tóm tắt văn bản
  • C. Dịch máy
  • D. Phân loại tình cảm

Câu 15: Trong ngữ cảnh của mô hình Transformer, "Multi-Head Attention" (chú ý đa đầu) mang lại lợi ích gì so với "Single-Head Attention" (chú ý đơn đầu)?

  • A. Giảm độ phức tạp tính toán
  • B. Cho phép mô hình học được nhiều khía cạnh khác nhau của mối quan hệ giữa các từ trong câu, từ các "không gian biểu diễn" khác nhau
  • C. Tăng tốc độ hội tụ của mô hình
  • D. Cải thiện khả năng khái quát hóa của mô hình trên dữ liệu mới

Câu 16: Kỹ thuật nào sau đây giúp giảm thiểu vấn đề "từ không có trong từ vựng" (out-of-vocabulary - OOV) khi xử lý văn bản?

  • A. Stemming
  • B. Lemmatization
  • C. Sử dụng Byte-Pair Encoding (BPE) hoặc WordPiece
  • D. Loại bỏ các từ hiếm gặp khỏi văn bản

Câu 17: Trong quá trình huấn luyện mô hình ngôn ngữ, "Masked Language Modeling" (mô hình hóa ngôn ngữ che mặt nạ) là gì và nó được sử dụng trong mô hình nào nổi tiếng?

  • A. Một phương pháp huấn luyện mà trong đó mô hình được yêu cầu dự đoán các từ bị che ngẫu nhiên trong câu; được sử dụng trong BERT
  • B. Một phương pháp để tăng cường dữ liệu huấn luyện bằng cách tạo ra các biến thể của câu gốc
  • C. Một kỹ thuật để giảm thiểu overfitting bằng cách che giấu một số kết nối nơ-ron
  • D. Một phương pháp để đánh giá hiệu suất của mô hình ngôn ngữ bằng cách che giấu một phần văn bản và xem mô hình có thể khôi phục nó tốt đến đâu

Câu 18: Để xây dựng một hệ thống hỏi đáp tự động (Question Answering system), nhiệm vụ NLP nào sau đây là quan trọng để trích xuất thông tin chính xác từ văn bản cho trước để trả lời câu hỏi?

  • A. Phân tích tình cảm
  • B. Trích xuất thông tin (Information Extraction)
  • C. Sinh văn bản
  • D. Dịch máy

Câu 19: So sánh mô hình Word2Vec và GloVe trong việc tạo word embeddings. Điểm khác biệt chính giữa hai mô hình này là gì?

  • A. Word2Vec sử dụng ma trận đồng xuất hiện toàn cục, trong khi GloVe sử dụng cửa sổ trượt
  • B. GloVe dựa trên mạng nơ-ron, còn Word2Vec dựa trên phân tích ma trận
  • C. Word2Vec chỉ học được ngữ nghĩa, còn GloVe học được cả ngữ nghĩa và cú pháp
  • D. Word2Vec dự đoán ngữ cảnh từ từ trung tâm hoặc ngược lại, trong khi GloVe trực tiếp học các vectơ từ dựa trên ma trận đồng xuất hiện toàn cục

Câu 20: Trong ngữ cảnh NLP, "zero-shot learning" (học không cú nhảy) có nghĩa là gì?

  • A. Mô hình được huấn luyện trên dữ liệu tổng hợp
  • B. Mô hình có thể học từ rất ít dữ liệu huấn luyện
  • C. Mô hình có khả năng thực hiện nhiệm vụ hoặc phân loại các lớp mà nó chưa từng được thấy trong quá trình huấn luyện
  • D. Mô hình có thể học mà không cần bất kỳ dữ liệu huấn luyện nào

Câu 21: Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của Xử lý ngôn ngữ tự nhiên (NLP)?

  • A. Trợ lý ảo (ví dụ: Siri, Alexa)
  • B. Dịch máy (Google Translate)
  • C. Phân loại thư rác
  • D. Phân tích thành phần hóa học của hợp chất

Câu 22: Để đánh giá chất lượng của một hệ thống tóm tắt văn bản tự động, thước đo ROUGE (Recall-Oriented Understudy for Gisting Evaluation) tập trung vào điều gì?

  • A. Độ chính xác của các thông tin trong bản tóm tắt
  • B. Mức độ bao phủ thông tin quan trọng từ văn bản gốc trong bản tóm tắt (Recall)
  • C. Tính trôi chảy và dễ đọc của bản tóm tắt
  • D. Thời gian cần thiết để hệ thống tạo ra bản tóm tắt

Câu 23: Trong quy trình NLP, bước nào sau đây thường được thực hiện ĐẦU TIÊN?

  • A. Thu thập và tiền xử lý dữ liệu văn bản
  • B. Huấn luyện mô hình học máy
  • C. Đánh giá mô hình
  • D. Triển khai mô hình

Câu 24: "Stop words" (từ dừng) là gì và tại sao chúng thường được loại bỏ trong tiền xử lý văn bản?

  • A. Các từ mang tính xúc phạm hoặc không phù hợp
  • B. Các từ hiếm gặp và ít quan trọng
  • C. Các từ xuất hiện thường xuyên nhưng ít mang ý nghĩa trong ngữ cảnh cụ thể (ví dụ: "là", "và", "của"); loại bỏ để giảm nhiễu và tập trung vào các từ khóa quan trọng
  • D. Các từ có nhiều nghĩa khác nhau, gây khó khăn cho việc phân tích

Câu 25: Để cải thiện hiệu suất của mô hình NLP trên các ngôn ngữ khác nhau, kỹ thuật "Cross-lingual transfer learning" (học chuyển giao đa ngôn ngữ) được sử dụng như thế nào?

  • A. Dịch dữ liệu huấn luyện sang nhiều ngôn ngữ khác nhau
  • B. Tận dụng kiến thức học được từ một ngôn ngữ (thường là ngôn ngữ giàu tài nguyên) để cải thiện hiệu suất trên các ngôn ngữ khác (đặc biệt là ngôn ngữ nghèo tài nguyên)
  • C. Huấn luyện mô hình trên dữ liệu đa ngôn ngữ cùng một lúc
  • D. Sử dụng các mô hình ngôn ngữ đa ngôn ngữ được đào tạo trước

Câu 26: Xét một ứng dụng phân tích đánh giá sản phẩm. Nếu mô hình phân tích tình cảm dự đoán một đánh giá là "tích cực", nhưng thực tế đánh giá đó là "tiêu cực", đây được gọi là lỗi gì?

  • A. Lỗi loại 1 (Type I error)
  • B. Độ lệch (Bias)
  • C. Phương sai (Variance)
  • D. Sai âm tính (False Negative) - mô hình bỏ sót trường hợp tích cực (trong ngữ cảnh đánh giá, "tích cực" có thể hiểu là dự đoán tích cực, nhưng thực tế là tiêu cực, vậy là bỏ sót tiêu cực, nhưng theo chuẩn sai âm tính là bỏ sót tích cực, câu này cần diễn đạt lại. -> Sai dương tính (False Positive): Mô hình báo đúng là tích cực, nhưng thực tế là tiêu cực.)

Câu 27: Trong lĩnh vực đối thoại tự động, "Entity recognition" (nhận dạng thực thể) giúp chatbot hiểu người dùng như thế nào?

  • A. Bằng cách xác định các thông tin quan trọng mà người dùng đề cập, như tên sản phẩm, địa điểm, thời gian, v.v.
  • B. Bằng cách phân tích cảm xúc của người dùng trong câu hỏi
  • C. Bằng cách dịch câu hỏi của người dùng sang ngôn ngữ máy
  • D. Bằng cách tóm tắt câu hỏi của người dùng

Câu 28: Để xử lý văn bản tiếng Việt, thư viện Python nào sau đây cung cấp các công cụ chuyên biệt và hiệu quả?

  • A. NLTK
  • B. spaCy
  • C. underthesea
  • D. Stanford CoreNLP

Câu 29: "Contextual word embeddings" (word embeddings theo ngữ cảnh), như ELMo và BERT, khác biệt so với "static word embeddings" (word embeddings tĩnh), như Word2Vec và GloVe, như thế nào?

  • A. Static word embeddings có kích thước cố định, trong khi contextual word embeddings thay đổi kích thước tùy theo ngữ cảnh
  • B. Contextual word embeddings tạo ra các biểu diễn khác nhau cho cùng một từ dựa trên ngữ cảnh xuất hiện của nó trong câu, trong khi static word embeddings tạo ra một biểu diễn duy nhất cho mỗi từ
  • C. Static word embeddings được huấn luyện trên dữ liệu lớn hơn contextual word embeddings
  • D. Contextual word embeddings chỉ phù hợp với các ngôn ngữ có ngữ pháp phức tạp

Câu 30: Trong quá trình phát triển ứng dụng NLP, vấn đề "thiên kiến dữ liệu" (data bias) có thể gây ra hậu quả gì?

  • A. Giảm độ chính xác của mô hình trên dữ liệu huấn luyện
  • B. Tăng tốc độ huấn luyện mô hình
  • C. Mô hình có thể đưa ra các dự đoán không công bằng hoặc phân biệt đối xử đối với một số nhóm người nhất định do dữ liệu huấn luyện không đại diện hoặc phản ánh các định kiến xã hội
  • D. Mô hình trở nên khó diễn giải hơn

1 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 1: Trong xử lý ngôn ngữ tự nhiên (NLP), kỹ thuật nào sau đây được sử dụng để chia một văn bản thành các đơn vị nhỏ hơn, chẳng hạn như từ, cụm từ, ký hiệu hoặc các thành phần có ý nghĩa khác?

2 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 2: Mục tiêu chính của 'phân tích cú pháp phụ thuộc' (dependency parsing) trong NLP là gì?

3 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 3: Phương pháp 'Bag-of-Words' (BoW) biểu diễn văn bản như thế nào trong NLP?

4 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 4: Nhiệm vụ 'Named Entity Recognition' (NER) nhằm mục đích gì trong NLP?

5 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 5: Trong ngữ cảnh của Word Embeddings (ví dụ: Word2Vec, GloVe), điều gì thể hiện 'tính tương tự về ngữ nghĩa' giữa hai từ?

6 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 6: Mô hình ngôn ngữ (Language Model) được sử dụng để làm gì trong NLP?

7 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 7: Kỹ thuật 'Stemming' và 'Lemmatization' có điểm chung gì trong tiền xử lý văn bản?

8 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 8: Trong kiến trúc Transformer, cơ chế 'Attention' (chú ý) đóng vai trò quan trọng như thế nào?

9 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 9: 'Phân tích tình cảm' (Sentiment Analysis) trong NLP nhằm mục đích gì?

10 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 10: Để đánh giá hiệu suất của một mô hình dịch máy, thước đo BLEU (Bilingual Evaluation Understudy) tập trung vào điều gì?

11 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 11: Xét tình huống bạn muốn xây dựng một hệ thống chatbot. Nhiệm vụ NLP nào sau đây là quan trọng nhất để chatbot có thể hiểu ý định của người dùng?

12 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 12: Trong lĩnh vực 'Sinh văn bản' (Text Generation), kỹ thuật 'lấy mẫu nhiệt độ' (temperature sampling) ảnh hưởng đến đầu ra như thế nào?

13 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 13: Để xử lý ngôn ngữ có cấu trúc phức tạp và mối quan hệ phụ thuộc xa, kiến trúc mạng nơ-ron nào thường được ưu tiên hơn so với mạng nơ-ron truyền thẳng (Feedforward Neural Networks) thông thường?

14 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 14: Giả sử bạn có một tập dữ liệu lớn các bài đánh giá sản phẩm trực tuyến và bạn muốn phân loại chúng thành 'tích cực', 'tiêu cực' hoặc 'trung lập'. Nhiệm vụ NLP này được gọi là gì?

15 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 15: Trong ngữ cảnh của mô hình Transformer, 'Multi-Head Attention' (chú ý đa đầu) mang lại lợi ích gì so với 'Single-Head Attention' (chú ý đơn đầu)?

16 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 16: Kỹ thuật nào sau đây giúp giảm thiểu vấn đề 'từ không có trong từ vựng' (out-of-vocabulary - OOV) khi xử lý văn bản?

17 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 17: Trong quá trình huấn luyện mô hình ngôn ngữ, 'Masked Language Modeling' (mô hình hóa ngôn ngữ che mặt nạ) là gì và nó được sử dụng trong mô hình nào nổi tiếng?

18 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 18: Để xây dựng một hệ thống hỏi đáp tự động (Question Answering system), nhiệm vụ NLP nào sau đây là quan trọng để trích xuất thông tin chính xác từ văn bản cho trước để trả lời câu hỏi?

19 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 19: So sánh mô hình Word2Vec và GloVe trong việc tạo word embeddings. Điểm khác biệt chính giữa hai mô hình này là gì?

20 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 20: Trong ngữ cảnh NLP, 'zero-shot learning' (học không cú nhảy) có nghĩa là gì?

21 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 21: Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của Xử lý ngôn ngữ tự nhiên (NLP)?

22 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 22: Để đánh giá chất lượng của một hệ thống tóm tắt văn bản tự động, thước đo ROUGE (Recall-Oriented Understudy for Gisting Evaluation) tập trung vào điều gì?

23 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 23: Trong quy trình NLP, bước nào sau đây thường được thực hiện ĐẦU TIÊN?

24 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 24: 'Stop words' (từ dừng) là gì và tại sao chúng thường được loại bỏ trong tiền xử lý văn bản?

25 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 25: Để cải thiện hiệu suất của mô hình NLP trên các ngôn ngữ khác nhau, kỹ thuật 'Cross-lingual transfer learning' (học chuyển giao đa ngôn ngữ) được sử dụng như thế nào?

26 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 26: Xét một ứng dụng phân tích đánh giá sản phẩm. Nếu mô hình phân tích tình cảm dự đoán một đánh giá là 'tích cực', nhưng thực tế đánh giá đó là 'tiêu cực', đây được gọi là lỗi gì?

27 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 27: Trong lĩnh vực đối thoại tự động, 'Entity recognition' (nhận dạng thực thể) giúp chatbot hiểu người dùng như thế nào?

28 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 28: Để xử lý văn bản tiếng Việt, thư viện Python nào sau đây cung cấp các công cụ chuyên biệt và hiệu quả?

29 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 29: 'Contextual word embeddings' (word embeddings theo ngữ cảnh), như ELMo và BERT, khác biệt so với 'static word embeddings' (word embeddings tĩnh), như Word2Vec và GloVe, như thế nào?

30 / 30

Category: Bài Tập, Đề Thi Trắc Nghiệm Online - Môn Xử Lí Ngôn Ngữ Tự Nhiên

Tags: Bộ đề 9

Câu 30: Trong quá trình phát triển ứng dụng NLP, vấn đề 'thiên kiến dữ liệu' (data bias) có thể gây ra hậu quả gì?

Xem kết quả