Một số vấn đề trong quản lý dữ liệu nghiên cứu của các thư viện

Print

Dẫn nhập

Hoà vào xu thế phát triển của thế giới và sự phát triển mạnh mẽ của số hoá, các thư viện hiện đại đang dần nâng cao hoạt động của mình. Một trong số những yếu tố cốt lõi của các hoạt động này là lưu trữ và quản lý dữ liệu. Dữ liệu nói chung và dữ liệu nghiên cứu nói riêng đang được phát triển không ngừng và hoà vào dòng chảy dữ liệu lớn trên toàn cầu. Vấn đề này đặt ra thách thức không nhỏ cho các hệ thống thư viện trong việc quản lý và khắc phục những vấn đề phát sinh trong quá trình lưu trữ và xử lý dữ liệu nhằm mục tiêu phát triển bền vững hướng đến tương lai.

1. Vài nét về vòng đời của dữ liệu nghiên cứu

"Dữ liệu nghiên cứu, không giống như các loại thông tin khác, được thu thập, quan sát hoặc tạo ra, với mục đích phân tích để sản xuất các kết quả nghiên cứu ban đầu" (Đại học Edinburgh, Vương quốc Anh). Theo Jodi Reeves Flores và cộng sự trong nghiên cứu “Libraries and the Research Data Management Landscape” thì  trên thế giới, các tổ chức, thể chế và chính phủ đã và đang nhận ra tầm quan trọng của việc quản lý dữ liệu nghiên cứu (DLNC). Điều này được thể hiện thông qua các mối quan tâm ngày càng tăng về lưu trữ tài liệu và bảo quản DLNC. Phong trào quản lý DLNC đã được hình thành dựa trên sự gia tăng của các yêu cầu, nhiệm vụ, kỹ thuật và một lượng lớn các công cụ hỗ trợ. Các hoạt động quản lý DLNC đã góp phần đảm bảo giá trị lâu dài và hữu ích cho các phân tích và nghiên cứu tiếp theo. Tuy nhiên, do sự thiếu sót của các bên có liên quan, nhiều vấn đề trong quá trình quản lý DLNC dần lộ rõ và đòi hỏi nhiều nỗ lực khắc phục.

Những bên liên quan trong quá trình nghiên cứu có thể kể đến bao gồm: cơ quan tài trợ nghiên cứu, viện nghiên cứu và nhà nghiên cứu. Trong đó, thư viện nghiên cứu của trường đại học cũng đóng một vai trò chủ chốt. Các thư viện thường không chú trọng nhiều đến các dịch vụ nghiên cứu cho đến khi dữ liệu số ngày càng trở nên phổ biến. Xu hướng này tất yếu dẫn đến nhu cầu quản lý chúng và một số thư viện đã bắt đầu kết hợp quản lý DLNC vào các dịch vụ nghiên cứu được cung cấp. Các dịch vụ quản lý DLNC này có thể đến từ yêu cầu của các cơ quan nhà nước hoặc của các trường đại học. Thông thường, các thư viện phải đối phó với sự kết hợp của ba yếu tố là: nhu cầu nhận thức cần được duy trì, thế giới nghiên cứu kỹ thuật số đang thay đổi và sự đánh giá toàn diện về nhu cầu của các nhà nghiên cứu. Ngoài ra, khả năng hoà nhập của thư viện với tư cách là một bên chủ chốt trong bối cảnh quản lý DLNC cũng quan trọng không kém.

alt

Hình 1. Tháp quản lý DLNC cho các thư viện, được trình bày bởi Lewis [8]

Theo CASRAI Dictionary, quản lý DLNC đề cập đến việc lưu trữ, truy cập và bảo tồn dữ liệu được tạo ra từ một cuộc điều tra cụ thể. Thực hành quản lý dữ liệu bao gồm toàn bộ vòng đời của dữ liệu, từ việc lên kế hoạch điều tra, sao lưu dữ liệu khi nó được tạo ra và sử dụng để bảo quản lâu dài các dữ liệu có thể chuyển giao sau khi cuộc điều tra nghiên cứu kết thúc” [4]. Như vậy, có thể nhận thấy rằng quản lý DLNC liên quan đến việc tổ chức dữ liệu, từ khi bắt đầu vào chu trình nghiên cứu thông qua việc phổ biến và lưu trữ các kết quả có giá trị. Điều này nhằm mục đích đảm bảo sự xác minh đáng tin cậy của các kết quả, cho phép tạo ra các nghiên cứu mới dựa trên các thông tin hiện có [5].

 Coates (2014, 598) cho rằng, thư viện có thể đóng một vai trò quan trọng trong việc hướng tới quản lý DLNC như là một sự thay đổi trong thực tiễn do các công nghệ kỹ thuật số cho phép. Tuy nhiên, mặc dù “nhiều quá trình nghiên cứu đã chuyển từ in sang kỹ thuật số, các tiêu chuẩn và đào tạo được sử dụng để đảm bảo tính toàn vẹn của nghiên cứu vẫn chưa có”.  “Thay đổi văn hoá rất phức tạp và chậm chạp, vì vậy chúng ta cần phải nắm bắt được những thực tiễn nghiên cứu nào có hiệu quả trong việc thúc đẩy tính toàn vẹn và sau đó xác định làm thế nào để khuyến khích và thúc đẩy những thực tiễn đó” (Coates 2014, 599). Các thư viện học thuật ngày càng có nhiều cơ hội để cung cấp các dịch vụ thông qua các giai đoạn khác nhau của vòng đời nghiên cứu. Quản lý DLNC là một trong những lĩnh vực có thể giúp các nhà khoa học khi họ sản xuất và phổ biến nghiên cứu. Chúng tôi tin rằng, quản lý DLNC sẽ tạo cơ hội cho các thư viện định hình lại vai trò của họ trong quá trình phát triển của các trường đại học [7].

Quản lý DLNC là một vấn đề có liên quan đến nhiều tổ chức giáo dục đại học. DLNC được tạo ra bởi các nghiên cứu ngày càng được xem là một hàng hoá công cộng, cần có sẵn để xác minh và tái sử dụng. Hội đồng Nghiên cứu Anh quốc (UK Research and Innovation), đại diện cho 7 nhà tài trợ nghiên cứu lớn của Anh gần đây đã phát triển một bộ Nguyên tắc chung về Chính sách dữ liệu và yêu cầu các nhà nghiên cứu quản lý, lưu trữ các dữ liệu để tái sử dụng nếu thích hợp [10]. Hơn nữa, một nền văn hoá mới của nghiên cứu mở đang phát triển và ngày càng có nhiều nhà nghiên cứu trở nên tin tưởng vào giá trị của dữ liệu mở và tiềm năng tái sử dụng nó [6].

Vòng đời DLNC của Kho lưu trữ dữ liệu Vương quốc Anh có 6 giai đoạn, bao gồm: tạo ra dữ liệu (creating data), xử lý dữ liệu (processing data), phân tích dữ liệu (analyzing data), bảo tồn dữ liệu (preserving data), cho phép truy cập tới dữ liệu (giving access to data) và sử dụng lại dữ liệu (re- using data). Theo từng giai đoạn trong vòng đời của dữ liệu sẽ có các công việc được tiến hành tương ứng [5].

alt

Hình 2. Vòng đời DLNC của Kho lưu trữ dữ liệu Vương quốc Anh

Ở giai đoạn khi mới bắt đầu nghiên cứu, các tác giả sẽ xác định phạm vi nghiên cứu và bắt đầu thu thập để tạo ra các bộ DLNC mới. Trong quá trình thu thập dữ liệu, các nhà nghiên cứu sẽ định vị những dữ liệu nào đã có sẵn và thu thập dữ liệu (thông qua các hoạt động như: thử nghiệm, quan sát, đo lường, mô phỏng). Đồng thời, họ sẽ lập kế hoạch quản lý dữ liệu của mình và chia sẻ khi có nhu cầu tạo các mối liên kết mới phục vụ nghiên cứu.

Đến giai đoạn xử lý dữ liệu, các nhà nghiên cứu và người làm thư viện sẽ hỗ trợ việc nhập dữ liệu, số hoá, sao chép và dịch thuật (nếu có). Tiếp theo, họ sẽ kiểm tra tính đúng đắn và xác nhận làm sạch bộ dữ liệu đã thu thập được. Họ cũng sẽ xem xét các dữ liệu ẩn danh và lập các mô tả dữ liệu. Sau cùng, tiến hành quản lý và lưu trữ lại các dữ liệu đã được xử lý.

Giai đoạn kế tiếp trong vòng đời dữ liệu là phân tích các tập dữ liệu đã được lưu trữ. Ở giai đoạn này, các nhà nghiên cứu sẽ thực hiện phân tích dữ liệu thu được, từ đó thực hiện các nghiên cứu cần thiết để cho ra kết quả. Họ cùng với người làm thư viện sẽ chuẩn bị cho các bước xuất bản tác phẩm và chuẩn bị dữ liệu cho ấn phẩm sắp ra mắt.

Ở giai đoạn bảo tồn dữ liệu, các thao tác được người làm thư viện và các nhân viên quản lý kho thực hiện là: di chuyển dữ liệu sang định dạng tốt nhất, di chuyển dữ liệu sang phương tiện thích hợp, sao lưu và lưu trữ dữ liệu, tạo siêu dữ liệu (meta- data) và tài liệu. Sau đó sẽ đến bước quan trọng nhất là lưu trữ hay còn gọi là bảo tồn dữ liệu.

Sau khi tiến hành lưu trữ và bảo tồn cho bộ dữ liệu, các nhân viên kỹ thuật sẽ thực hiện giai đoạn cấp quyền truy cập vào bộ DLNC. Các bước trong giai đoạn này bao gồm: phân phối dữ liệu, chia sẻ dữ liệu, kiểm soát truy cập, thiết lập bản quyền, chỉ định giấy phép và quảng bá dữ liệu đã được lưu trữ.

Giai đoạn cuối là tái sử dụng lại dữ liệu đã được lưu trữ. Ở giai đoạn này, dữ liệu đã phục vụ tốt cho giai đoạn nghiên cứu trước sẽ được sử dụng lại cho các mục tiêu khác. Một số mục tiêu khác có thể liệt kê ra như: các nghiên cứu tiếp theo, các nghiên cứu mới, thực hiện các bài đánh giá nghiên cứu, kiểm tra và rà soát lại các kết quả nghiên cứu để phát hiện bất thường và cuối cùng là phục vụ cho việc dạy và học trong các trường học hoặc viện nghiên cứu.

Ngoài mô hình vòng đời dữ liệu trên, còn có nhiều mô hình khác cũng được xây dựng khá rõ ràng. Hình 3 trình bày một dạng khác của mô hình vòng đời DLNC.

alt

Hình 3. Các bước trong vòng đời dữ liệu

(Nguồn: http://data.library.virginia.edu/data-management/lifecycle/)

2. Phân tích các vấn đề trong quản lý dữ liệu nghiên cứu của thư viện

2.1. Tính sẵn sàng (Availability)

Tính sẵn sàng mang lại nhiều lợi thế lớn cho quá trình truy cập dữ liệu. Nó giúp cho việc truy cập, xử lý và quản lý dữ liệu thuận lợi hơn. Khi các thư viện tham gia lưu trữ dữ liệu, có một đòi hỏi về tính sẵn sàng của dữ liệu để phục vụ cho công tác nghiên cứu cũng như cho người sử dụng khi có yêu cầu. Tuy nhiên, trên thực tế để việc phục vụ nguồn dữ liệu cho các nghiên cứu được sẵn sàng hoàn toàn là điều rất khó thực hiện do các ràng buộc đến từ nhiều phía khác nhau. Nếu các thư viện có thể mở rộng khả năng tương tác và làm cho các rào cản thấp hơn đối với các nhà nghiên cứu để giúp cho dữ liệu của họ sẵn sàng thì sẽ rất tốt. Điều này cũng giúp mở rộng mạng lưới liên kết và nâng cao hiệu quả nghiên cứu.

Ngoài ra, việc hỗ trợ tích hợp các tập dữ liệu vào các dịch vụ truy xuất cũng đóng một vai trò rất quan trọng [11]. Như vậy, sẽ tận dụng được triệt để sức mạnh của công nghệ nhằm hỗ trợ cho quá trình nghiên cứu diễn ra thuận lợi và đạt hiệu quả cao hơn. Trong thời đại dữ liệu lớn và truy cập mở đang lan rộng như hiện nay, rất nhiều kho lưu trữ trực tuyến lớn đã ra đời và các dịch vụ truy xuất hiệu quả cũng đã được triển khai rất tốt. Vì thế, các thư viện có thể tận dụng các ưu thế về công nghệ này để phát triển và tiến xa hơn.

2.2. Khả năng tìm thấy (Findability)

Một trong số những thách thức của việc lưu trữ dữ liệu đến từ phương pháp tổ chức nhằm đáp ứng mục tiêu tìm kiếm và xử lý được hiệu quả. Để làm được điều này, phần lớn các thư viện cũng như kho lưu trữ lựa chọn giải pháp sử dụng mã nhận diện. Việc hỗ trợ các mã nhận diện ổn định sẽ giúp cho dữ liệu được tổ chức một cách hợp lý, phục vụ công tác tìm kiếm cũng như sửa đổi đạt được hiệu quả hơn.

Bên cạnh đó, các thư viện cũng cần cam kết tham gia trong việc phát triển các lược đồ mô tả siêu dữ liệu chung và cách thực hành trích dẫn phổ biến. Điều này giúp cho quá trình nghiên cứu được diễn ra thuận lợi hơn. Các nhà nghiên cứu sẽ phối hợp tốt với thư viện để xây dựng mạng lưới nghiên cứu và tạo nên các mối liên kết hợp lý nhằm đạt được các mục tiêu đã đề ra. Như vậy, sẽ kích thích tăng độ tương tác, thúc đẩy sử dụng các tiêu chuẩn và các công cụ phổ biến giữa các nhà nghiên cứu.

2.3. Khả năng hiểu được (Interpretability)

Các thư viện giữ vai trò trung tâm trong việc lưu trữ và điều phối các tương tác với DLNC. Song hành với quá trình nghiên cứu, các thư viện cũng cần hỗ trợ các liên kết chéo giữa các xuất bản phẩm và các tập hợp dữ liệu nhằm tối ưu hoá khả năng tích hợp và liên kết nhiều nguồn tài nguyên dữ liệu, tăng tính bền vững của hoạt động lưu trữ.

Ở một khía cạnh khác, để tạo được cơ cấu lưu trữ cũng như quản lý dữ liệu được hiệu quả, thư viện cần cung cấp và trợ giúp cho các nhà nghiên cứu hiểu các mô tả siêu dữ liệu của các tập hợp dữ liệu. Qua đó, tập hợp các đóng góp của họ theo thời gian để làm cho các bộ dữ liệu được lưu trữ ngày càng phong phú và đa dạng hơn.

Ngoài ra, các thư viện cũng cần chú trọng việc thiết lập và duy trì các cơ sở tri thức về dữ liệu và ngữ cảnh của chúng. Việc này sẽ giúp cho việc quản lý được thuận lợi thông qua một số cơ chế khác với phương thức truyền thống. Quản lý dữ liệu theo ngữ cảnh sẽ tạo được sự linh hoạt cần thiết trong cả quá trình thử nghiệm và lưu trữ dữ liệu bền vững trong hệ thống.

2.4. Khả năng sử dụng lại (Reusability)

Dữ liệu sẽ không ngừng được gia tăng và ngày càng đa dạng hơn. Vì vậy, công tác tuyển chọn và bảo tồn các tập hợp dữ liệu là rất cần thiết và là một hoạt động cốt lõi cần được tiến hành thường xuyên bởi các thư viện. Để tuyển chọn và bảo tồn những tập hợp dữ liệu có giá trị cao đòi hỏi thời gian và kế hoạch dài hạn của các thư viện. Sẽ có rất nhiều nhân sự, cộng tác viên thư viện tham gia vào công tác xem xét và chọn lọc này. Sau khi tuyển chọn và lưu trữ, các thư viện cũng cần định kỳ rà soát và kiểm tra lại để đảm bảo dữ liệu được bảo tồn ở trạng thái tốt nhất và không phát sinh các vấn đề ảnh hưởng đến hoạt động lưu trữ và xử lý.

Bên cạnh đó, các thư viện cũng cần lưu trữ các phần mềm cần thiết để phân tích lại dữ liệu. Các phần mềm này hỗ trợ việc kiểm tra các tập dữ liệu đã được lưu trữ lẫn các tập dữ liệu mới đang được xử lý. Phân tích và kiểm tra định kỳ các tập dữ liệu là một công tác có độ ưu tiên cao và luôn đòi hỏi các thư viện chú trọng ở một mức độ quan trọng nhất định.

Ngoài ra, các thư viện hãy minh bạch về các điều kiện, theo đó các tập hợp dữ liệu có thể được sử dụng lại nhằm giúp cho việc vận hành cả hệ thống được hiệu quả hơn. Các tập dữ liệu là xương sống và yếu tố then chốt làm nên khả năng phục vụ và xử lý vượt trội của thư viện. Do vậy, các tập dữ liệu cần được lưu trữ toàn vẹn, bền vững và có thể được sử dụng lại để hỗ trợ cho các mục tiêu hoặc phạm vi nghiên cứu khác.

2.5. Khả năng trích dẫn (Citability)

Các thư viện cần tham gia trong việc thiết lập các tiêu chuẩn trích dẫn dữ liệu thống nhất. Khả năng trích dẫn của dữ liệu cũng là một vấn đề được đặt ra khi các thư viện tham gia lưu trữ và quản lý DLNC. Các thư viện luôn đóng vai trò quan trọng trong việc xây dựng mạng lưới liên kết các tài nguyên và nhà nghiên cứu với nhau. Để mạng lưới này hoạt động tốt đòi hỏi một chuẩn trích dẫn dữ liệu thống nhất và hợp lý.

Mặt khác, các tiêu chuẩn trích dẫn của dữ liệu nên được xây dựng dựa theo một số tiêu chuẩn đã hoạt động hiệu quả và ổn định trong quá khứ. Điều này đảm bảo cho việc liên kết mạng lưới nghiên cứu được hiệu quả và chất lượng cao. Bên cạnh đó, các thư viện cũng cần hỗ trợ và thúc đẩy việc xây dựng các mã định danh thường trực ổn định, giúp cho việc truy cập, tìm kiếm hoặc xử lý dữ liệu được thuận lợi hơn.

2.6. Tuyển chọn và Bảo tồn (Curation  and Preservation)

Công tác tuyển chọn và bảo tồn, lưu giữ các nguồn dữ liệu sẽ là hoạt động cốt lõi của các thư viện hiện đại. Họ cần minh bạch về dữ liệu tuyển chọn và được đệ trình. Dữ liệu rất đa dạng và là sự cụ thể hoá nhiều nguồn tài nguyên có giá trị của thư viện. Việc công khai minh bạch tuyển chọn và lưu trữ dữ liệu sẽ giúp cho các thư viện hoạt động ngày càng hiệu quả và bền vững hơn.

Các thư viện cần thường xuyên thúc đẩy quá trình thực hành quản lý dữ liệu tốt. Dữ liệu không thể tự nó mà tạo nên được hệ thống. Dữ liệu được lưu trữ tốt chỉ chiếm một vị trí nhỏ trong toàn bộ vòng đời của dữ liệu. Thêm vào đó, khâu quản lý dữ liệu đóng một vai trò cốt lõi trong sự thành công của toàn bộ hệ thống.

Mặt khác, việc cộng tác với những người tạo ra dữ liệu sẽ giúp cho thư viện bổ sung và xây dựng nguồn dữ liệu ngày càng phong phú và đa dạng hơn. Ngoài ra, các thư viện cũng nên chú trọng vào việc chỉ dẫn cho các nhà nghiên cứu về thực hành chuyên ngành đặc thù trong quá trình tạo ra dữ liệu (các định dạng bảo tồn, tài liệu về thí điểm...). Điều này giúp cho họ tự tin và tạo ra nhiều nguồn DLNC có giá trị, góp phần xây dựng hệ thống ngày càng lớn mạnh và hoạt động hiệu quả.

3. Một số đề xuất của LIBER 10 cho các thư viện trong việc nâng cao chất lượng quản lý dữ liệu nghiên cứu

Liên đoàn các thư viện nghiên cứu châu Âu (Ligue des Bibliothèques Européennes de Recherche - LIBER) được thành lập vào năm 1971, gồm tập hợp các thư viện nghiên cứu quốc gia, thư viện đại học và các tổ chức hợp tác trong lĩnh vực tài liệu. Tính đến năm 2018 thành viên của LIBER bao gồm khoảng 400 tổ chức đến từ hơn 40 quốc gia của Châu Âu. LIBER luôn hướng đến mục tiêu xây dựng và hỗ trợ các mạng lưới thư viện nghiên cứu phát triển đa dạng và mạnh mẽ trong tương lai [12].

Nâng cao chất lượng quản lý DLNC là một đòi hỏi của tất cả các thư viện hiện đại. Có rất nhiều tài liệu về vai trò của các thư viện trong quản lý DLNC và giúp người làm thư viện hoàn thành tốt việc này. LIBER đã thành lập “Nhóm công tác E-Science” vào năm 2010 để nghiên cứu về vai trò của các thư viện trong lĩnh vực E-Science (khoa học điện tử). Nhóm đã quyết định tập trung vào DLNC vì nó được cho là yếu tố cấp bách nhất của khoa học điện tử có liên quan đến cộng đồng thư viện nghiên cứu. Bài viết trình bày và phân tích sơ lược khung hành động chung, 10 khuyến cáo được LIBER đưa ra vào năm 2012 về quản lý DLNC của các thư viện [3]:

- Trước hết, các thư viện cần sẵn sàng cho sự hỗ trợ quản lý DLNC, bao gồm: các kế hoạch quản lý dữ liệu cho các ứng dụng, các trợ cấp và tư vấn về các quyền sở hữu trí tuệ, các tư liệu thông tin. Hỗ trợ các nhà nghiên cứu, giảng viên bằng các kế hoạch quản lý dữ liệu, sự tích hợp quản lý dữ liệu kết hợp trong chương trình giảng dạy.

- Các thư viện nên tham gia vào quá trình phát triển siêu dữ liệu và các tiêu chuẩn dữ liệu. Qua đó, cung cấp các dịch vụ siêu dữ liệu cho DLNC. Các siêu dữ liệu đóng vai trò cốt lõi và khi được kết hợp với các tiêu chuẩn dữ liệu để giúp cho thư viện định hướng tốt hơn quá trình lưu trữ của mình.

- Hỗ trợ và nâng cao khả năng quản lý dữ liệu cho người làm thư viện. Điều này sẽ giúp họ nắm được các đặc tính cơ bản của dữ liệu để phục vụ cho việc triển khai quản lý DLNC. Hơn nữa, khi mở rộng hệ thống, người làm thư viện có thể nhanh chóng nắm bắt được các thay đổi về dữ liệu, qua đó giúp họ có thể tham gia hỗ trợ xử lý nếu có vấn đề phát sinh trong quản lý DLNC.

- Thư viện cần tích cực tham gia trong phát triển chính sách DLNC của cơ sở, bao gồm các kế hoạch về tài nguyên. Khuyến khích và tuỳ biến thích nghi các chính sách về dữ liệu mở ở những nơi thích hợp trong vòng đời DLNC.

- Để thiết lập mạng lưới trao đổi dữ liệu, các thư viện cần liên lạc và có quan hệ đối tác với các nhà nghiên cứu, nhóm nghiên cứu, kho lưu trữ và trung tâm dữ liệu nhằm tạo dựng được một cơ sở hạ tầng tốt hỗ trợ cho sự truy cập, phát hiện và chia sẻ DLNC.

- Công tác chính của các thư viện vẫn là hỗ trợ vòng đời DLNC bằng việc cung cấp các dịch vụ để lưu trữ, phát hiện và truy cập lâu dài. Việc hỗ trợ vòng đời của DLNC chiếm một vị trí quan trọng và các thư viện cần quan tâm thường xuyên trong cả quá trình lưu trữ cũng như quản lý dữ liệu. Để phát triển các dịch vụ mới, chưa được thử nghiệm, thư viện phải có quyền tiếp cận các nguồn lực đầy đủ. Các thư viện cũng cần linh hoạt và tự chủ để thực hiện việc này [9].

- Các thư viện nên hỗ trợ, thúc đẩy trích dẫn DLNC bằng việc áp dụng các mã định danh thường trực ổn định cho các DLNC. Điều này giúp cho hệ thống các thư viện tạo được mối liên kết tốt với các nhà nghiên cứu, học giả và những đối tác cung cấp dữ liệu. Nếu có thể thiết lập được một chuẩn trích dẫn dữ liệu thì càng tốt hơn nữa, sẽ giúp nâng cao hiệu quả hoạt động cho các thư viện.

- Một vấn đề rất quan trọng mà các thư viện cần chú ý đó là việc cung cấp Mục lục dữ liệu hoặc Kho dữ liệu của cơ sở. Danh mục dữ liệu về cơ bản được tạo ra dựa trên hoạt động lặp đi, lặp lại diễn ra ở các thư viện, liên quan đến nhiều sự hợp tác giữa các cộng đồng nghiên cứu [9]. Điều kiện hiện có của mỗi thư viện là khác nhau, nên cũng sẽ tạo nên khả năng đáp ứng khác nhau trong lưu trữ và xây dựng các kho dữ liệu của cơ sở.

- Các thư viện cần tham gia thực hành quản lý dữ liệu chủ đề đặc thù nhằm giúp cho quá trình tổ chức các dữ liệu chuyên ngành được tốt và mạch lạc hơn. Dữ liệu này sẽ giúp xây dựng các hệ thống danh mục và hỗ trợ quá trình tìm kiếm, truy cập, xử lý đạt hiệu quả cao.

- Các thư viện cũng nên chú trọng vào các lưu trữ gián tiếp, an toàn cho các DLNC động và tĩnh trong sự hợp tác với các đơn vị công nghệ thông tin của các cơ sở và tìm cách khai thác các dịch vụ đám mây thích hợp đối với dữ liệu lớn. Dịch vụ đám mây là một xu thế mới của thời đại, các thư viện cần nắm bắt cơ hội này để có thể tổ chức và xử lý những kho dữ liệu rất lớn một cách hiệu quả.

Mười đề xuất trên của Nhóm LIBER E-Science vào năm 2012 đã nhận được sự ủng hộ của nhiều thư viện trên thế giới. Các thư viện đã lấy đó làm nền tảng chiến lược cho các kế hoạch phát triển kho dữ liệu phục vụ nghiên cứu trong tương lai. Thông qua nghiên cứu này và nhiều nghiên cứu khác nữa, rất nhiều đề xuất cho rằng người làm thư viện cần đổi mới nhiều hơn nữa trong các hoạt động nghiệp vụ của mình, trang bị các kỹ năng quản lý dữ liệu, đáp ứng những thay đổi lớn trong thời đại mới. Nếu người làm thư viện không chấp nhận sự thay đổi hoặc vẫn giữ cách làm việc như cũ thì họ sẽ nhanh chóng bị bỏ lại phía sau và sẽ có những tổ chức khác làm tốt hơn chiếm lĩnh vị trí hàng đầu trong việc cung cấp tri thức và dữ liệu cho cộng đồng xã hội.

Kết luận

Việc lưu trữ và quản lý DLNC của các thư viện và kho lưu trữ luôn cần được chú trọng quan tâm và điều chỉnh hợp lý. Dữ liệu nói chung và DLNC nói riêng luôn tiềm ẩn những vấn đề phát sinh trong quá trình lưu trữ và xử lý chúng. Để đạt được hiệu quả tốt trong quản lý dữ liệu, các thư viện và kho lưu trữ cần có kế hoạch cụ thể trung hạn và dài hạn. Việc lựa chọn các giải pháp phù hợp, cộng thêm sự chung tay góp sức của các nhà nghiên cứu và đông đảo người sử dụng sẽ giúp các thư viện đổi mới hiệu quả, đáp ứng mục tiêu hướng đến một tương lai lớn mạnh và bền vững của các kho tri thức khổng lồ này.

TÀI LIỆU THAM KHẢO

1. Các thư viện có thể đóng vai trò chính trong quản lý dữ liệu nghiên cứu. https://letrungnghia.mangvn.org/Education/cac-thu-vien-co-the-dong-vai-tro-chinh-trong-quan-ly-du-lieu-nghien-cuu-5708.html. Truy cập ngày 28/2/2018.

2. Vai trò nổi bật của các thư viện: quản lý dữ liệu nghiên cứu. https://letrungnghia.mangvn.org/Education/ vai-tro-noi-bat-cua-cac-thu-vien-quan-ly-du-lieu-nghien-cuu-5707.html. Truy cập ngày 28/2/ 2018.

3. Birte Christensen, Dalsgaard et al. Ten recommendations for libraries to get started with research data management.http://libereurope.eu/wp-content/uploads/The%20research%20data% 20group%202012%20v7%20final.pdf. Truy cập ngày 28/2/2018.

4. CASRAI Dictionary. http://dictionary.casrai.org/ Research_data_management. Truy cập ngày 28/2/2018.

5. Research data lifecycle. https://www.ukdataservice.ac.uk/manage-data/lifecycle. Truy cập: 28/4/2018.

6. Joanna Ball. Research data management for libraries: getting started. https://insights.uksg.org/ articles/10.1629/2048-7754.70/galley/73/download/. Truy cập ngày 28/2/2018.

7. Jodi Reeves Flores, Jason J. Brodeur, Morgan G. Daniels, Natsuko Nicholls and Ece Turnator. Libraries and the Research Data Management Landscape. https://www.clir.org/wp-content/uploads/ sites/9/RDM.pdf. Truy cập ngày 28/2/2018.

8. Martin Lewis. Libraries and the management of research data. http://eprints.whiterose.ac.uk/11171/ 1/LEWIS_Chapter_v10.pdf. Truy cập ngày 28/2/2018.

9. Neil Rambo. Research Data Management: Roles for Libraries.

http://www.sr.ithaka.org/wp-content/uploads/2015/10/SR-Issue_Brief_Research_Data_Management_1022151.pdf. Truy cập: 24/2/2018

10. Common Principles on Data Policy. https:// www.ukri.org/funding/information-for-award-holders/data-policy/common-principles-on-data-policy/. Truy cập ngày 26//2018.

11. Susan Reilly, Wouter Schallier, Sabine Schrimpf, Eefke Smit, Max Wilkinson. ODE Report On Integration Of Data And Publications. http://libereurope.eu/wp-content/uploads/ODE-ReportOnIntegrationOfDataAndPublication.pdf. Truy cập ngày 28/2/2018.

12. https://libereurope.eu/. Truy cập ngày 26/8/ 2018.

_________________________

ThS. Nguyễn Danh Minh Trí

Khoa Thư viện - Thông tin học, ĐH KHXH&NV, Đại học Quốc gia Tp. HCM

Nguồn: Tạp chí Thư viện Việt Nam. - 2018. - Số 5. - Tr. 3-9.


Đọc thêm cùng chuyên mục: