Ứng dụng trí tuệ nhân tạo trong công tác biên mục: cơ hội, thách thức và đề xuất triển khai tại Việt Nam

ỨNG DỤNG TRÍ TUỆ NHÂN TẠO TRONG CÔNG TÁC BIÊN MỤC: CƠ HỘI, THÁCH THỨC VÀ ĐỀ XUẤT TRIỂN KHAI TẠI VIỆT NAM

Doãn Anh Đức

Trưởng phòng Nghiên cứu khoa học và Hướng dẫn nghiệp vụ,

Thư viện Quốc gia Việt Nam

__________________________

Tóm tắt: Trong bối cảnh chuyển đổi số, sự gia tăng nhanh chóng của tài nguyên thông tin số, tài liệu in truyền thống và tài liệu nội sinh đang tạo áp lực lớn đối với công tác biên mục tại các thư viện. Bài viết phân tích khả năng ứng dụng trí tuệ nhân tạo (AI), đặc biệt là AI tạo sinh, xử lý ngôn ngữ tự nhiên và học máy, trong hỗ trợ tự động hóa một số khâu của quy trình tạo lập biểu ghi thư mục. Trên cơ sở tổng quan tài liệu, phân tích các ứng dụng thực tiễn và đối chiếu với yêu cầu nghiệp vụ thư viện tại Việt Nam, bài viết chỉ ra rằng AI có thể hỗ trợ trích xuất siêu dữ liệu, gợi ý trường MARC 21, khởi tạo tóm tắt trường 520, đề xuất từ khóa và chỉ số phân loại. Tuy nhiên, các rủi ro như ảo giác dữ liệu, sai lệch chuẩn nghiệp vụ, thiên lệch thuật toán, bảo mật dữ liệu và hạn chế xử lý tiếng Việt đòi hỏi phải có cơ chế kiểm soát nghiêm ngặt. Bài viết khẳng định mô hình Human-in-the-Loop là hướng tiếp cận phù hợp, trong đó AI đóng vai trò trợ lý tăng tốc quy trình, còn người làm thư viện chịu trách nhiệm thẩm định và bảo chứng chất lượng. Từ đó, bài viết đề xuất lộ trình triển khai, tiêu chí đánh giá và giải pháp quản trị rủi ro phù hợp với bối cảnh thư viện Việt Nam.

Từ khóa: trí tuệ nhân tạo; biên mục; MARC 21; DDC; RDA; Human-in-the-Loop.

1. Đặt vấn đề và phương pháp nghiên cứu

Biên mục là một trong những khâu nền tảng của hoạt động thư viện, quyết định khả năng nhận diện, mô tả, tổ chức, truy hồi, chia sẻ và tái sử dụng tài nguyên thông tin. Trong môi trường số, vai trò của biên mục không chỉ dừng lại ở việc tạo lập biểu ghi mô tả tài liệu, mà còn gắn với quản trị siêu dữ liệu, liên thông dữ liệu, phát hiện tài nguyên và hỗ trợ người dùng tiếp cận tri thức một cách chính xác, nhất quán. MARC 21, RDA, DDC, LCSH, FAS và các chuẩn dữ liệu liên quan tiếp tục giữ vai trò quan trọng trong việc bảo đảm tính chuẩn hóa, khả năng trao đổi và tính bền vững của dữ liệu thư mục (Library of Congress, n.d.; RDA Steering Committee, n.d.; Riva et al., 2017).

Tuy nhiên, các thư viện hiện nay đang đối mặt với tình trạng gia tăng nhanh về khối lượng và loại hình tài liệu cần xử lý. Ngoài sách in truyền thống, thư viện còn phải mô tả tài liệu số, luận văn, luận án, tài liệu nội sinh, tài nguyên đa phương tiện và các bộ sưu tập số hóa. Áp lực này dẫn đến tình trạng quá tải biên mục, nhất là tại những đơn vị có số lượng tài liệu bổ sung lớn nhưng nguồn nhân lực biên mục chuyên sâu còn hạn chế.

Có thể khái quát 5 nhóm thách thức chính trong công tác biên mục hiện nay: khối lượng tài liệu cần xử lý ngày càng lớn; yêu cầu nghiệp vụ ngày càng phức tạp; nhu cầu liên thông, chia sẻ và tái sử dụng dữ liệu ngày càng cao; quy trình thủ công còn tốn nhiều thời gian; sự khác biệt về kinh nghiệm giữa những người làm biên mục có thể dẫn tới chất lượng biểu ghi chưa thật sự nhất quán. Những thách thức này khó có thể giải quyết chỉ bằng cách tăng nhân sự, mà cần những phương thức tổ chức và quy trình mới, trong đó công nghệ giữ vai trò hỗ trợ quan trọng.

Trong bối cảnh đó, trí tuệ nhân tạo (Artificial Intelligence - AI) nổi lên như một công cụ có tiềm năng hỗ trợ công tác biên mục. AI có thể tham gia vào các tác vụ như trích xuất dữ liệu từ trang tên sách và mục lục, nhận diện thực thể, gợi ý trường MARC 21, tạo tóm tắt nội dung, đề xuất từ khóa và hỗ trợ phân loại chủ đề. Một số thử nghiệm gần đây cho thấy AI có thể giúp rút ngắn thời gian xử lý và hỗ trợ người làm biên mục trong các khâu lặp lại, tuy nhiên kết quả do AI sinh ra vẫn cần được kiểm chứng bởi cán bộ chuyên môn (Aycock, 2025; Library of Congress, 2024; Mahmud, 2024; OCLC, 2025).

Bài viết này nhằm hệ thống hóa cơ sở lý luận về ứng dụng AI trong biên mục, phân tích các khả năng ứng dụng chủ yếu, nhận diện rủi ro và đề xuất mô hình triển khai phù hợp với điều kiện của hệ thống thư viện tại Việt Nam. Trọng tâm của bài viết không phải là đề xuất thay thế người làm biên mục bằng AI, mà là xây dựng cách tiếp cận trong đó AI được xem như công cụ hỗ trợ nghiệp vụ, còn con người giữ vai trò kiểm soát chất lượng, thẩm định nghiệp vụ và bảo đảm trách nhiệm chuyên môn.

Bài viết sử dụng phương pháp tổng quan tài liệu, phân tích - tổng hợp và tiếp cận các chuẩn nghiệp vụ về công tác biên mục. Trước hết, bài viết tổng hợp các tài liệu liên quan đến chuẩn mô tả thư mục, mô hình dữ liệu thư viện và các ứng dụng AI trong biên mục, bao gồm tài liệu chuẩn nghiệp vụ, nghiên cứu học thuật, thông tin từ tổ chức nghề nghiệp và các thử nghiệm thực tiễn. Tiếp đó, bài viết phân tích khả năng ứng dụng AI theo từng nhóm tác vụ trong quy trình biên mục: trích xuất siêu dữ liệu, gợi ý trường MARC 21, tóm tắt nội dung, định chủ đề và phân loại. Cuối cùng, bài viết đối chiếu các khả năng này với đặc thù thư viện Việt Nam để đề xuất mô hình triển khai, tiêu chí đánh giá và giải pháp quản trị rủi ro.

2. Cơ sở lý luận và ứng dụng AI trong quy trình biên mục

Trí tuệ nhân tạo có thể hiểu là tập hợp các phương pháp giúp máy tính thực hiện những nhiệm vụ vốn đòi hỏi năng lực nhận thức của con người, như học từ dữ liệu, nhận dạng mẫu, xử lý ngôn ngữ, phân loại, dự đoán và tạo sinh nội dung. Trong hoạt động thư viện, AI không phải là một công nghệ đơn lẻ mà là một hệ sinh thái gồm nhiều kỹ thuật khác nhau, trong đó có AI tạo sinh, xử lý ngôn ngữ tự nhiên, nhận dạng ký tự quang học, học máy, học sâu, mô hình ngôn ngữ lớn, cơ sở dữ liệu vector và truy xuất tăng cường sinh (Retrieval-Augmented Generation - RAG).

AI tạo sinh có khả năng tạo ra nội dung mới dựa trên dữ liệu đầu vào và ngữ cảnh được cung cấp. Trong biên mục, AI tạo sinh có thể hỗ trợ soạn thảo bản nháp biểu ghi, tạo tóm tắt/chú giải cho trường 520, phân tích mục lục và đề xuất từ khóa. Xử lý ngôn ngữ tự nhiên kết hợp nhận dạng ký tự quang học giúp hệ thống nhận diện và trích xuất thông tin từ trang tên sách, trang bìa, lời nói đầu, mục lục hoặc toàn văn tài liệu. Học máy và học sâu có thể hỗ trợ phân loại chủ đề, phát hiện mẫu tương đồng giữa các biểu ghi, nhận diện lỗi định dạng và đề xuất trường dữ liệu dựa trên các biểu ghi đã có.

Từ góc độ nghiệp vụ thư viện, AI chỉ thực sự có giá trị khi được đặt trong hệ thống chuẩn mô tả và kiểm soát dữ liệu. MARC 21 quy định cấu trúc mã hóa dữ liệu thư mục thông qua trường, chỉ thị và trường con; RDA cung cấp hướng dẫn mô tả và truy cập tài nguyên; IFLA LRM cung cấp mô hình khái niệm cho dữ liệu thư mục; còn DDC, LCSH và FAST hỗ trợ phân loại và kiểm soát chủ đề (Library of Congress, n.d.; OCLC, n.d.; RDA Steering Committee, n.d.; Riva et al., 2017). Vì vậy, AI trong biên mục không thể vận hành như một công cụ sinh văn bản tự do, mà cần được điều khiển bằng chuẩn nghiệp vụ, dữ liệu tham chiếu đáng tin cậy và quy trình kiểm định rõ ràng.

Các nghiên cứu gần đây đều nhấn mạnh rằng AI có tiềm năng nâng cao hiệu quả biên mục nhưng cũng có giới hạn rõ rệt. Mahmud (2024) cho rằng AI có thể hỗ trợ tự động hóa biên mục và phân loại, song việc triển khai đòi hỏi dữ liệu huấn luyện chất lượng, cơ chế đánh giá và sự tham gia của chuyên gia. Aycock (2025), qua một trường hợp sử dụng AI tạo sinh để hỗ trợ biên mục, cũng cho thấy kết quả phụ thuộc đáng kể vào chất lượng câu lệnh, dữ liệu đầu vào và năng lực kiểm tra của người làm biên mục. Điều này cho thấy AI nên được hiểu là công cụ tăng cường năng lực chuyên môn, không phải nguồn dữ liệu thẩm quyền độc lập.

2.1. Trích xuất và khởi tạo siêu dữ liệu

Trong giai đoạn đầu của quy trình xử lý tài liệu, AI có thể kết hợp OCR và NLP để đọc, nhận diện và bóc tách thông tin từ trang tên sách, trang bìa, lời nói đầu, mục lục hoặc tài liệu số toàn văn. Các thông tin có thể trích xuất gồm nhan đề chính, nhan đề song song, tác giả, người biên soạn, nhà xuất bản, nơi xuất bản, năm xuất bản, ISBN, số trang, phụ chú thư mục và thông tin trách nhiệm... Đây là các dữ liệu thường được sử dụng để khởi tạo những trường mô tả cơ bản của một biểu ghi thư mục.

Lợi ích nổi bật của AI ở khâu này là giảm thời gian nhập liệu thủ công và hạn chế sai sót do thao tác lặp lại. Đối với các thư viện có khối lượng sách mới bổ sung lớn, AI có thể tạo bản nháp ban đầu để người làm biên mục kiểm tra, chỉnh sửa và hoàn thiện. Tuy nhiên, chất lượng đầu ra phụ thuộc vào độ rõ của hình ảnh, chất lượng OCR, bố cục trang tên sách, ngôn ngữ tài liệu và khả năng nhận diện tên riêng. Với tài liệu tiếng Việt, đặc biệt là tài liệu có dấu, tên người Việt Nam, địa danh, thuật ngữ chuyên ngành hoặc tài liệu có bố cục phức tạp, cần có bước kiểm tra thủ công bắt buộc.

2.2. Gợi ý trường MARC21 và tạo bản nháp biểu ghi

Một hướng ứng dụng quan trọng của AI là gợi ý cấu trúc biểu ghi theo khổ mẫu MARC 21. Với dữ liệu đầu vào phù hợp, AI có thể đề xuất các trường như 020, 041, 082, 100, 245, 250, 264, 300, 336, 337, 338, 500, 504, 520, 650 và 700. Đặc biệt, AI có thể hỗ trợ tạo bản nháp trường 520 dưới dạng tóm tắt trung lập, phản ánh nội dung chính của tài liệu mà không thay thế nhận định chuyên môn của người làm thư viện.

Tuy nhiên, MARC 21 là hệ thống có cấu trúc chặt chẽ, đòi hỏi sự chính xác ở cả nhãn trường, chỉ thị và trường con. AI có thể sinh ra biểu ghi có vẻ hợp lý về hình thức nhưng sai về quy tắc, ví dụ dùng sai chỉ thị, thiếu trường 33X, nhầm vai trò tác giả, tự tạo ISBN không có trong tài liệu hoặc diễn giải quá mức nội dung. Vì vậy, bản nháp do AI tạo ra cần được đánh dấu là kết quả đề xuất, không được đưa trực tiếp vào hệ thống nếu chưa qua kiểm tra nghiệp vụ.

2.3. Hỗ trợ định chủ đề, đề xuất từ khóa và phân loại

Định chủ đề và phân loại là nhóm tác vụ đòi hỏi năng lực phân tích nội dung, hiểu quan hệ khái niệm và vận dụng chuẩn nghiệp vụ. AI có thể hỗ trợ bằng cách phân tích nhan đề, tóm tắt, mục lục hoặc toàn văn để đề xuất chủ đề, từ khóa, chỉ số DDC hoặc LCC. OCLC (2025) đã công bố các tính năng AI trong WorldShare Record Manager và Connexion nhằm gợi ý số phân loại DDC, LCC và đề mục LCSH trong quá trình tạo hoặc chỉnh sửa biểu ghi. FAST, với đặc điểm là hệ thống chủ đề dạng phân diện và dễ áp dụng hơn LCSH, cũng là một nguồn tham chiếu có thể hỗ trợ các công cụ tự động trong môi trường dữ liệu liên kết (OCLC, n.d.).

Đối với thư viện Việt Nam, việc ứng dụng AI trong phân loại cần được thiết kế theo nguyên tắc ưu tiên nguồn dữ liệu bản địa và bối cảnh sử dụng trong nước. Khi đề xuất chỉ số phân loại hoặc từ khóa cho tài liệu tiếng Việt, hệ thống nên tham chiếu trước các biểu ghi chuẩn trong nước, đặc biệt là dữ liệu của Thư viện Quốc gia Việt Nam, các thư viện lớn, trung tâm học liệu và thư viện đại học có chất lượng biên mục ổn định. Nguồn quốc tế như Thư viện Quốc hội Mỹ, OCLC hoặc các kho dữ liệu mở nên được sử dụng như nguồn đối chiếu bổ sung, nhất là với tài liệu ngoại văn hoặc tài liệu chuyên ngành.

Một mô hình kỹ thuật phù hợp là kết hợp AI tạo sinh với RAG (Lewis et al., 2020). Thay vì để mô hình tự suy đoán, hệ thống truy xuất các biểu ghi tương tự, dữ liệu thẩm quyền, bảng phân loại, từ khóa kiểm soát hoặc quy tắc nội bộ, sau đó yêu cầu AI tạo đề xuất dựa trên các bằng chứng được trích xuất. Cách làm này có thể giảm hiện tượng ảo giác và tăng khả năng giải thích kết quả, ví dụ yêu cầu AI nêu lý do đề xuất trường 082 hoặc 650, đồng thời đánh dấu các phần còn thiếu dữ liệu bằng nhãn “cần kiểm tra”.

2.4. Kỹ thuật thiết kế câu lệnh trong nghiệp vụ biên mục

Prompt Engineering là kỹ thuật thiết kế câu lệnh để định hướng AI tạo ra kết quả phù hợp với mục tiêu nghiệp vụ. Trong biên mục, prompt không nên được hiểu là một câu hỏi đơn giản, mà là một đặc tả nghiệp vụ ngắn gọn, trong đó nêu rõ vai trò của AI, chuẩn cần tuân thủ, dữ liệu đầu vào, định dạng đầu ra và mức độ thận trọng khi thiếu dữ liệu.

Một prompt hiệu quả cho tác vụ biên mục thường cần 4 thành phần. Thứ nhất, xác định vai trò, chẳng hạn: “Bạn là chuyên gia biên mục tuân thủ MARC 21, RDA và DDC”. Thứ hai, quy định chuẩn nghiệp vụ, ví dụ sử dụng MARC 21, RDA, DDC 23, từ khóa kiểm soát hoặc quy định nội bộ của thư viện. Thứ ba, cung cấp dữ liệu đầu vào đủ rõ, gồm ảnh bìa, trang tên sách, mục lục, lời nói đầu, ISBN, thông tin xuất bản hoặc toàn văn. Thứ tư, quy định định dạng đầu ra, chẳng hạn trả về danh sách trường MARC 21, giải thích lý do gán chỉ số phân loại, nêu mức độ tin cậy và đánh dấu các trường cần kiểm tra.

Kinh nghiệm thực tiễn cho thấy các câu lệnh càng cụ thể thì kết quả càng dễ kiểm soát. Đặc biệt, cần yêu cầu AI không tự tạo thông tin ngoài tài liệu gốc, không tạo khống mã ISBN, không suy đoán tên tác giả khi thiếu dữ liệu và luôn phân biệt giữa dữ liệu chắc chắn với dữ liệu cần xác minh. Đây là yêu cầu quan trọng để chuyển AI từ công cụ sinh văn bản tự do thành công cụ hỗ trợ nghiệp vụ có kiểm soát.

3. Mô hình Human-in-the-Loop trong kiểm soát chất lượng

Mặc dù AI có khả năng xử lý nhanh, công tác biên mục vẫn không thể tách rời vai trò của con người. Các công cụ AI tạo sinh có thể mắc hiện tượng ảo giác dữ liệu, đưa ra đề xuất có vẻ hợp lý nhưng không có cơ sở trong tài liệu gốc hoặc không phù hợp với chuẩn nghiệp vụ. Các thử nghiệm của Thư viện Quốc hội Mỹ về mô tả tính toán cho thấy AI có thể hỗ trợ tạo siêu dữ liệu cho tài liệu số, nhưng cũng cần quy trình đánh giá, kiểm tra và can thiệp của chuyên gia để bảo đảm chất lượng (Library of Congress, 2024; Saccucci & Potter, 2025).

Do đó, mô hình Human-in-the-Loop (HITL) là hướng tiếp cận phù hợp đối với ứng dụng AI trong biên mục. Trong mô hình này, AI đảm nhiệm các khâu có tính lặp lại, hỗ trợ phân tích ban đầu và tạo bản nháp; còn người làm thư viện chịu trách nhiệm đối chiếu tài liệu gốc, kiểm tra chuẩn mô tả, xác nhận số phân loại, chuẩn hóa từ khóa và quyết định biểu ghi cuối cùng. HITL không làm giảm vai trò chuyên môn của người làm thư viện, mà chuyển trọng tâm công việc từ nhập liệu thủ công sang thẩm định, kiểm soát và quản trị dữ liệu.

Một quy trình HITL có thể gồm 6 bước: chuẩn bị và làm sạch dữ liệu đầu vào; thiết kế prompt theo chuẩn nghiệp vụ; AI xử lý và tạo bản nháp biểu ghi; AI đề xuất tóm tắt, từ khóa và chỉ số phân loại; người làm thư viện kiểm tra, đối chiếu chéo với tài liệu gốc và nguồn thẩm quyền; hoàn thiện biểu ghi trước khi đưa vào hệ thống quản trị thư viện. Nguyên tắc cốt lõi của quy trình này là AI hỗ trợ tăng tốc, còn con người giữ vai trò bảo chứng chất lượng cuối cùng.

Để mô hình HITL vận hành hiệu quả, cần thiết lập tiêu chí đánh giá rõ ràng đối với kết quả do AI tạo ra. Các tiêu chí có thể bao gồm: độ chính xác của dữ liệu mô tả; mức độ tuân thủ MARC 21, RDA và quy định nội bộ; độ phù hợp của chỉ số phân loại; độ chính xác và nhất quán của từ khóa; tỷ lệ trường cần chỉnh sửa; thời gian tiết kiệm được so với quy trình thủ công; và tỷ lệ lỗi nghiêm trọng có thể ảnh hưởng đến truy hồi thông tin. Những tiêu chí này giúp thư viện đánh giá AI bằng dữ liệu thực nghiệm thay vì chỉ dựa trên cảm nhận về tính tiện lợi.

4. Quản trị rủi ro, điều kiện và lộ trình triển khai tại Việt Nam

Ứng dụng AI trong biên mục cần gắn với quản trị rủi ro. Có thể nhận diện 5 nhóm rủi ro chính. Thứ nhất là ảo giác dữ liệu, khi AI tạo ra thông tin không có trong tài liệu gốc như ISBN giả, tên tác giả sai, năm xuất bản không chính xác hoặc đề mục chủ đề không tồn tại. Thứ hai là sai lệch chuẩn nghiệp vụ, biểu hiện ở việc dùng sai trường MARC 21, sai chỉ thị, thiếu trường bắt buộc hoặc áp dụng không đúng quy tắc RDA. Thứ ba là thiên lệch thuật toán, đặc biệt khi mô hình được huấn luyện chủ yếu trên dữ liệu tiếng Anh và bối cảnh quốc tế, dẫn đến kết quả chưa phù hợp với tài liệu tiếng Việt. Thứ tư là rủi ro bảo mật khi đưa dữ liệu nội bộ, dữ liệu bạn đọc hoặc tài liệu chưa được phép công bố lên các nền tảng AI công cộng. Thứ năm là nguy cơ lệ thuộc công nghệ, làm suy giảm năng lực phân tích nghiệp vụ nếu người làm thư viện chỉ tiếp nhận kết quả AI mà không kiểm tra độc lập.

Đối với Việt Nam, điều kiện triển khai AI trong biên mục cần được xây dựng theo hướng thận trọng, từng bước và có kiểm soát. Trước hết, thư viện cần chuẩn hóa dữ liệu nền. Dữ liệu mẫu càng sạch thì kết quả AI càng đáng tin cậy. Việc xây dựng kho biểu ghi mẫu, chuẩn hóa tên tác giả, địa danh, chủ đề, thuật ngữ chuyên ngành và quy định nguồn tham chiếu ưu tiên là điều kiện quan trọng. Với các thư viện sử dụng DDC và MARC 21, cần có bộ mẫu biểu ghi chuẩn để AI học theo hoặc tham chiếu trong quá trình tạo đề xuất.

Thứ hai, cần khắc phục rào cản ngôn ngữ và thiên lệch dữ liệu. Tài liệu tiếng Việt có đặc thù về dấu, trật tự tên người, tên cơ quan, địa danh, thuật ngữ văn hóa, lịch sử, nghệ thuật và khoa học xã hội. Nếu không có bộ từ vựng kiểm soát và dữ liệu thẩm quyền phù hợp, AI có thể dịch máy móc khái niệm tiếng Anh hoặc đề xuất từ khóa không sát với bối cảnh trong nước. Do đó, thư viện cần từng bước xây dựng hoặc liên kết các nguồn dữ liệu tiếng Việt, đặc biệt đối với tên cá nhân, tên cơ quan, địa danh, chủ đề và thuật ngữ chuyên ngành.

Thứ ba, cần triển khai thí điểm trước khi mở rộng. Thư viện có thể bắt đầu với một nhóm tài liệu tương đối ổn định như sách mới bổ sung, luận văn, luận án hoặc tài liệu số hóa có cấu trúc rõ. Mỗi đợt thí điểm cần ghi nhận thời gian xử lý, tỷ lệ đề xuất đúng, tỷ lệ lỗi theo từng trường MARC, số lượng cần chỉnh sửa của người làm thư viện. Kết quả thí điểm là cơ sở để điều chỉnh prompt, dữ liệu tham chiếu, quy trình kiểm tra và mức độ tự động hóa.

Thứ tư, cần ban hành quy trình và chính sách sử dụng AI. Quy trình này phải xác định rõ loại dữ liệu được phép đưa vào công cụ AI, loại dữ liệu cấm chia sẻ, trách nhiệm kiểm tra của người làm biên mục, cơ chế lưu vết chỉnh sửa và cách xử lý khi phát hiện lỗi. Đặc biệt, không nên đưa dữ liệu cá nhân của bạn đọc, tài liệu bảo mật nội bộ hoặc tài liệu chưa được phép công bố lên các hệ thống AI công cộng nếu chưa có đánh giá pháp lý và kỹ thuật phù hợp.

Thứ năm, cần phát triển năng lực nhân sự. Người làm biên mục cần được đào tạo không chỉ về cách sử dụng công cụ AI, mà còn về giới hạn của AI, kỹ thuật viết prompt, phương pháp kiểm tra kết quả, quản trị dữ liệu và đạo đức nghề nghiệp trong môi trường số. Mục tiêu đào tạo không phải là biến người làm thư viện thành kỹ sư AI, mà là giúp họ trở thành người sử dụng AI có hiểu biết nghiệp vụ, có khả năng kiểm soát chất lượng và đưa ra quyết định chuyên môn độc lập.

Thứ sáu, cần thúc đẩy hợp tác liên thư viện. Nếu mỗi thư viện tự xây dựng dữ liệu huấn luyện, prompt và quy trình riêng lẻ, kết quả sẽ phân tán và khó chuẩn hóa. Thư viện Quốc gia Việt Nam, thư viện công cộng, thư viện chuyên ngành, thư viện đại học… cần phối hợp xây dựng kho biểu ghi mẫu, bộ từ vựng kiểm soát, hướng dẫn sử dụng AI và cơ chế chia sẻ kinh nghiệm. Đây là điều kiện để hình thành hệ sinh thái ứng dụng AI trong biên mục có tính bản địa, chuẩn hóa và bền vững.

Từ các phân tích trên, có thể đề xuất lộ trình triển khai AI trong biên mục tại thư viện Việt Nam theo ba giai đoạn: thí điểm, đánh giá và mở rộng có kiểm soát. Lộ trình này nhằm bảo đảm AI được đưa vào quy trình nghiệp vụ theo cách có thể đo lường, kiểm chứng và điều chỉnh.

Giai đoạn	Nội dung chính	Sản phẩm đầu ra
Thí điểm	Lựa chọn một nhóm tài liệu dễ kiểm soát; xây dựng prompt; chuẩn bị biểu ghi mẫu và nguồn tham chiếu.	Bộ prompt thử nghiệm; bộ tiêu chí kiểm tra; nhóm biểu ghi mẫu.
Đánh giá	So sánh kết quả AI với biểu ghi do người làm biên mục tạo; đo tỷ lệ lỗi theo trường MARC, chủ đề, phân loại và thời gian xử lý.	Báo cáo đánh giá; danh mục lỗi phổ biến; khuyến nghị điều chỉnh quy trình.
Mở rộng có kiểm soát	Tích hợp AI vào một số khâu của quy trình biên mục; áp dụng HITL; thiết lập cơ chế lưu vết và kiểm tra định kỳ.	Quy trình vận hành chính thức; chính sách dữ liệu; kế hoạch đào tạo và giám sát chất lượng.

Ở giai đoạn thí điểm, thư viện không nên đặt mục tiêu tự động hóa toàn bộ quy trình, mà cần tập trung vào các tác vụ có khả năng kiểm soát tốt như trích xuất dữ liệu mô tả, tạo tóm tắt trường 520 hoặc đề xuất từ khóa sơ bộ. Ở giai đoạn đánh giá, cần sử dụng các chỉ số định lượng và định tính để xác định mức độ hữu ích của AI. Ở giai đoạn mở rộng, AI chỉ nên được tích hợp vào hệ thống nghiệp vụ khi thư viện đã có quy trình kiểm tra, chính sách dữ liệu và kế hoạch đào tạo nhân sự rõ ràng.

5. Kết luận

Ứng dụng trí tuệ nhân tạo trong công tác biên mục là một hướng đi có tiềm năng nhằm giải quyết tình trạng quá tải, nâng cao hiệu quả xử lý tài liệu và hỗ trợ chuẩn hóa dữ liệu thư mục trong bối cảnh chuyển đổi số. AI có thể hỗ trợ nhiều tác vụ quan trọng như trích xuất siêu dữ liệu, khởi tạo bản nháp biểu ghi, gợi ý trường MARC 21, tạo tóm tắt, đề xuất từ khóa và hỗ trợ phân loại. Những khả năng này đặc biệt có ý nghĩa đối với các thư viện có khối lượng tài liệu lớn và yêu cầu xử lý nhanh.

Tuy nhiên, AI không thể và không nên được xem là giải pháp thay thế người làm biên mục. Bản chất của biên mục là hoạt động chuyên môn đòi hỏi sự chính xác, hiểu biết chuẩn nghiệp vụ, năng lực phân tích nội dung và trách nhiệm đối với chất lượng dữ liệu lâu dài. Các rủi ro như ảo giác dữ liệu, sai lệch chuẩn nghiệp vụ, thiên lệch ngôn ngữ và bảo mật thông tin cho thấy mọi ứng dụng AI trong biên mục đều cần đặt trong mô hình Human-in-the-Loop.

Đối với Việt Nam, triển khai AI trong biên mục cần bắt đầu từ chuẩn hóa dữ liệu, xây dựng nguồn tham chiếu bản địa, thí điểm quy mô nhỏ, đào tạo nhân sự và ban hành quy trình quản trị rủi ro. Nếu được tổ chức bài bản, AI có thể trở thành công cụ hỗ trợ hữu hiệu, giúp người làm thư viện chuyển dịch từ các thao tác nhập liệu lặp lại sang vai trò chuyên gia tổ chức, thẩm định và quản trị tri thức trong môi trường số.

Tài liệu tham khảo

Aycock, M. (2025). Prompting generative AI to catalog: The promise and the reality. College & Research Libraries News, 86(10), 423. https://doi.org/10.5860/crln.86.10.423
.Gardella, G. (2025, October 11). How AI will transform library cataloging. Liblime. https://liblime.com/2025/10/11/how-ai-will-transform-library-cataloging/
Lewis, P., Perez, E., Piktus, A., Petroni, F., Karpukhin, V., Goyal, N., Küttler, H., Lewis, M., Yih, W., Rocktäschel, T., Riedel, S., & Kiela, D. (2020). Retrieval-augmented generation for knowledge-intensive NLP tasks. In Advances in Neural Information Processing Systems 33 (pp. 9459-9474). Curran Associates. https://proceedings.neurips.cc/paper/2020/hash/6b493230205f780e1bc26945df7481e5-Abstract.html
Library of Congress. (n.d.). MARC 21 format for bibliographic data. Retrieved May 15, 2026, from https://www.loc.gov/marc/bibliographic/
Library of Congress. (2024, November 19). Could artificial intelligence help catalog thousands of digital library books? An interview with Abigail Potter and Caroline Saccucci. The Signal. https://blogs.loc.gov/thesignal/2024/11/could-artificial-intelligence-help-catalog-thousands-of-digital-library-books-an-interview-with-abigail-potter-and-caroline-saccucci/
Mahmud, M. R. (2024). AI in automating library cataloging and classification. Library Hi Tech News. https://doi.org/10.1108/LHTN-07-2024-0114
OCLC. (n.d.). FAST: Faceted Application of Subject Terminology. Retrieved May 15, 2026, from https://www.oclc.org/en/fast.html
OCLC. (2025, December 8). OCLC introduces new AI tools to make cataloging faster and smarter. https://www.oclc.org/en/news/releases/2025/20251208-ai-recordmanager-connexion.html
RDA Steering Committee. (n.d.). RDA Toolkit. Retrieved May 15, 2026, from https://www.rdatoolkit.org/
Riva, P., Le Boeuf, P., & Žumer, M. (2017). IFLA Library Reference Model: A conceptual model for bibliographic information. International Federation of Library Associations and Institutions. https://www.ifla.org/files/assets/cataloguing/frbr-lrm/ifla-lrm-august-2017_rev201712.pdf
Saccucci, C., & Potter, A. (2025). Results of AI experimentation for cataloging at the Library of Congress [Conference presentation]. 89th IFLA World Library and Information Congress. https://repository.ifla.org/items/4e25dfe1-336e-49a5-be2a-912e337e7624

Next >

Đọc thêm cùng chuyên mục:

Next page >>

THƯ VIỆN QUỐC GIA VIỆT NAM

Ứng dụng trí tuệ nhân tạo trong công tác biên mục: cơ hội, thách thức và đề xuất triển khai tại Việt Nam