Tóm tắt: Trình bày tiếp cận xây dựng thư viện điện tử (TVĐT). Xem xét khía cạnh cấu trúc, hạ tầng cơ sở kỹ thuật và phát triển kho tư liệu số hoá của TVĐT. Đề cập việc tổ chức số hoá tài liệu trong phạm vi Mạng lưới các tổ chức thông tin KHCN ở Việt Nam.

TẠP CHÍ THÔNG TIN VÀ TƯ LIỆU Số 2/2005 ISSN 859-2929

ThS. Nguyễn Tiến Đức, Trung tâm Thông tin KHCN Quốc gia

Phát triển từ thư viện truyền thống thành TVĐT đang là xu hướng tất yếu ở tất cả các nước. để xây dựng được một TVĐT theo đúng nghĩa, cần có một số quan điểm thống nhất, có cách tiếp cận đúng và  lựa chọn những bước đi thích hợp. Trong bài báo này, chúng tôi luận bàn điều kiện để xây dựng TVĐT ở Việt Nam.

I. Tiếp cận xây dựng Thư viện điện tử

Để xây dựng TVĐT, chúng ta cần quan tâm nhiều vấn đề mà nổi bật là 4 khía cạnh chủ yếu: Cấu trúc của TVĐT; Hạ tầng cơ sở kỹ thuật; Kho tư liệu số hoá; Các vấn đề bảo quản, khai thác và bản quyền.

Dưới đây sẽ điểm qua vấn đề 1, 2 và sau đó tập trung vào vấn đề thứ 3.

Cấu trúc của Thư viện điện tử

Các  TVĐT  đều  được  bố  trí  trên  “Giao  diện  web”,  trên  đó,  ngoài  những  vùng chung như: Giới thiệu về cơ quan, về hệ thống, về  thư viện; Hướng dẫn sử dụng và các công cụ trợ giúp thì phần chủ yếu là nội dung, tức là “Tài nguyên thông tin”.

Phần  thứ  nhất  của  “Tài  nguyên  thông  tin”  thông  thường  là  Danh  mục  chủ đề/Directory. Phần này được cấu trúc theo trình tự từ chung đến riêng, từ tổng quát đến chi tiết, từ ngoài vào trong theo thứ bậc, ví dụ: Mảng/vấn đề lớn; Tiếp đó là các mục/vấn đề nhỏ;  Mỗi mục này lại chia nhỏ dần theo cấu trúc hình cây: Cây – cành; Cành –nhánh to; Nhánh to –nhánh nhỏ; Nhánh nhỏ –nhánh nhỏ hơn… Cùng với các phân chia này là các điểm liên kết: đảm bảo các mối quan hệ nhiều chiều giữa các nhánh cũng như giữa nhánh với các cành. Cách tổ chức như  vậy nhằm tạo thuận tiện  cho người dùng trong khai thác thông tin. Thông thường trong  TVĐT các xuất bản phẩm điện tử (tạp chí, bản tin, kỷ yếu …) được bố trí sắp xếp theo kiểu này và để tìm kiếm tài liệu theo chủ đề ta có thể  “Click-Nháy” vào đề mục tương ứng tuần tự từ ngoài vào trong. Nếu muốn tìm/truy cập nhanh tới tài liệu cần phải có sự hỗ trợ của Máy tìm tin/Search engine thông qua các Lệnh tìm cụ thể,….

Trong TVĐT còn có phần “Tài nguyên” thứ hai – quan trọng hơn, đó là các tổ hợp CSDL, biểu hiện Danh mục các CSDL, thường được sắp xếp theo chủ đề hoặc theo vần chữ cái. Người dùng có thể tiếp cận tới các CSDL này để khai thác thông tin theo các cấp độ khác nhau: từ thư mục tới toàn văn; khai thác riêng rẽ từng CSDL hay khai thác theo Nhóm CSDL,…. Mức độ khai thác đến đâu tuỳ thuộc vào khả năng của hệ thống và đặc biệt là sự cho phép của cơ quan chủ quản,  các lệ phí tương ứng.

Thành phần thứ 3 trong TVĐT là phần Liên kết tới các  nguồn  tài nguyên thông tin  bên ngoài. đây là thế mạnh của TVĐT. Tuy nhiên, mức độ và khả năng liên kết đến đâu phụ thuộc vào sự hợp tác với các cơ quan khác và việc khai thác các tầng thông tin số hoá đó cũng có những khác biệt. Chẳng hạn: có vùng/mảng thông tin được khai thác tự do, miễn phí, nhưng có những vùng/CSDL phải có mật khẩu, phải trả tiền,….

Như vậy, TVĐT không chỉ có một hệ thống mà có thể gồm nhiều hệ khác nhau. Tuy nhiên, các tài nguyên thông tin, các CSDL đó liên kết được với nhau trong một chế độ phục vụ thống nhất. Tức là khi được yêu cầu, chúng xuất hiện đối với người dùng như thể  chúng  cùng  trong  một  hệ  thống.  để  tích  hợp  được  như  vậy,  chúng  ta  phải  có  các chương trình phần mềm hỗ trợ, phải áp dụng các chuẩn nhất định trong xử lý, trong quản trị, trong trao đổi dữ liệu cũng như phải có các công cụ tìm kiếm (search engine), chuyển tải, lưu trữ thông tin,….

Tóm lại, cấu trúc của TVĐT thực chất là cấu trúc của một Trang Web có liên kết đến các nguồn tin số hoá, trong đó quan trọng nhất là các CSDL toàn văn, được tổ chức theo cấu trúc có khả năng đáp ứng cho việc khai thác qua chế độ mạng on-line.

Vấn đề kỹ thuật, hạ tầng cơ sở và phần mềm TVĐT

Một TVĐT phải có hạ tầng cơ sở đủ mạnh, đó là:

–    Mạng Intranet có tốc độ kết nối nhanh với INTERNET;

–    Hệ thống máy chủ lớn thực hiện việc quản trị và các dịch vụ khác nhau: Máy chủ  Web,  Máy  chủ  FPT,  Mail,  các  Máy  chủ  lưu,  bảo  trì  dữ  liệu;  Máy  chủ Firewall, Máy chủ cho các ứng dụng khác,….

–    Hệ thống máy trạm để cập nhật, khai thác thông tin;

–    Các thiết bị công nghệ chuyên dụng cho TVĐT: mã vạch, quản lý và in thẻ, máy quét, máy sao CD,….

Về phần mềm: đến nay, trên thế giới có nhiều phần mềm phục vụ cho việc xây dựng và phát triển  TVĐT. Mỗi phần mềm  đều  có những ưu, nhược điểm riêng nhưng thông  thường  một  phần  mềm  khả  dĩ  phải  có  các  module  chính  của  thư  viện,  như:  Bổ sung; Biên mục; Quản lý Kho; Phục vụ bạn đọc; Mục lục trực tuyến; Phân hệ lưu hành; Quản lý tài liệu điện tử; Truy hồi và trình bày thông tin; Mượn liên thư viện; Quản trị hệ thống.

Ngoài ra, để tổ chức TVĐT ta cũng cần có: Phần mềm Hệ thống: Hệ điều hành và Hệ quản trị các CSDL; Phần mềm xuất bản điện tử, xuất bản CD/ROM.
 
Theo ước tính, để trang bị các thiết bị nêu trên cũng như có phần mềm TVĐT và tạo  lập  nội  dungTVĐT  ban  đầu  ta   phải  đầu  tư  khoảng 5-7  tỷ VND,  thậm  chí  một  số người cho rằng ít nhất phải đầu tư 1 triệu USD (16 tỷ VND) cho một TVĐT trung bình của một ngành/lĩnh vực.

II. Tạo lập và phát triển Kho tư liệu số hoá- vấn đề trọng tâm trong xây dựng TVĐT
 
Phần quan trọng nhất trong TVĐT chính là Kho tư liệu số hoá của bản thân cơ quan thông tin/thư viện chủ quản. Có 3 cách để tạo lập Kho này, đó là:

–    Tự tiến hành số hoá nguồn tư liệu trên giấy của Thư viện. Tức là chuyển tài liệu hiện có sang dạng số bằng phương pháp quét hay nhập lại thông tin từ bàn phím… đây là hướng phải đầu tư lớn, đầu tư liên tục và tốn kém thời gian, tiền của, công sức;

–    Bổ sung/tích hợp nguồn tin điện tử thông qua việc mua, trao đổi tài liệu điện tử đang được xuất bản (bản tin, tạp chí điện tử, các chế bản điện tử  trước khi in ra trên giấy). Chúng ta đều biết: hầu hết các ấn phẩm hiện nay đều vừa xuất bản trên giấy vừa tồn tại dưới dạng điện tử và nếu tận dụng được nguồn này, ta sẽ tiết kiệm được nhiều công sức, thời gian;

–    Xây  dựng  các  liên  kết  (tạo  khả  năng  truy  cập)  đến  các  nguồn  tài  liệu  trên INTERNET, nhất là  nguồn của các cơ quan có cùng diện chuyên đề bao quát.

Tạo lập và phát triển Kho tài liệu số của riêng mỗi cơ quan thông tin/thư viện là vấn đề lớn nhất trong xây dựng TVĐT. Công việc này đòi hỏi phải đầu tư lớn và liên tục. để làm tốt công việc này, các cơ quan xây dựng TVĐT cần có cách tiếp cận hợp lý, khả thi và kinh tế. Cụ thể là:

1. Nhất thiết phải lập kế hoạch sát sao và ưu tiên đầu tư cho việc thu thập, xử lý và số hoá nguồn tin cơ bản, nguồn tin tiềm năng của riêng mình. Coi đây là nhiệm vụ trọng tâm, thậm chí phải triển khai mạnh trước khi bắt tay vào xây dựng TVĐT.

Nếu không có sự đi trước này, khi ta xây dựng xong hạ tầng mạng và có các phần mềm Hệ thống, phần mềm TVĐT đầy đủ  nhưng đến lúc đó cơ quan vẫn không có hoặc có rất ít tài liệu số hoá của bản thân chắc chắn TVĐT đó không thể phát huy được hiệu quả;  và như vậy, không tương xứng với kinh phí đầu tư nhiều tỷ đồng của Nhà nước.

Trong việc lựa chọn tài liệu để số hoá, ta phải ưu tiên các tài liệu đặc thù của thư viện, các tài liệu duy nhất và có giá trị lâu dài để trao đổi, ví dụ: các tài liệu quý hiếm, các sưu tập có giá trị, không ở đâu có…; ưu tiên số hoá trước hết đối với tài liệu chưa ở đâu số hoá, tài liệu tiếng hiếm, tiếng Việt,…. Song song với việc số hoá là việc xây dựng các Siêu dữ liệu đối với từng tài liệu và cập nhật tài liệu đã được số hoá này vào CSDL tương ứng để phục vụ kịp thời cũng như làm cơ sở cho việc xây dựng TVĐT sau này.

Ngoài ra, ta cũng cần quan tâm đến chất lượng của việc số hoá tài liệu cũng như cần sao lưu đầy đủ, kịp thời các tài liệu số hoá đó để tránh rủi ro cũng như tránh phải làm đi làm lại (lãng phí công sức, tiền của). điều này phụ thuộc nhiều vào công tác tổ chức, phụ thuộc vào cán bộ thực hiện cũng như thiết bị và quy trình số hoá.
 
2. Phải phối hợp, tận dụng sản phẩm số hoá của các cơ quan thông tin/thư viện khác, nhất là của những cơ quan có cùng diện chuyên đề bao quát. Trên cơ sở đó mới  có thể tăng nhanh “nguồn tin” của mình, tiết kiệm được thời gian, công sức và tiền của.

III.  Tổ  chức  số  hoá  tài  liệu  trong  phạm  vi  quốc  gia  và  tiến  tới  Nền  Công nghiệp nội dung

Trong phạm  vi  quốc  gia,   Nhà  nước  cần  có  chiến  lược đầu  tư  và  triển  khai  kế hoạch tổng thể trong việc số hoá đối với các nguồn tin quan trọng, có ý nghĩa lâu dài.

Xác lập chính sách ưu tiên số hoá

Theo chúng tôi, Nhà nước ta nên có chính sách ưu tiên hỗ trợ cho việc số hoá đối với các tài liệu sau:

Về dạng tài liệu:

–    Văn bản quy phạm pháp luật;

–    Báo cáo kết quả các nhiệm vụ KHCN (các đề tài/đề án các cấp);

–    Tài liệu điều tra cơ bản, quy hoạch, bản đồ;

–    Luận văn sau đại học;

–    Tài liệu hội nghị, hội thảo khoa học;

–    Tài liệu tiêu chuẩn, quy phạm; Tài liệu sở hữu công nghiệp.

Về ngôn ngữ: ưu tiên số hoá tài liệu Hán nôm, tài liệu tiếng Việt. Hạn chế số hoá tài liệu tiếng Anh.

Về lĩnh vực: ưu tiên số hoá tài liệu KHCN những ngành mũi nhọn.

Xác lập  và hình thành  một mạng lưới các tổ chức số hoá tài liệu

Trong mạng lưới các cơ quan thông tin, thư viện cần có sự phân công, phối hợp giữa các cơ quan trong việc số hoá tài liệu.

Nguyên tắc đầu tiên trong phân công là cơ quan nào có kho tư liệu chuyên môn hoá với số lượng tài liệu nhiều nhất về lĩnh vực nào thì sẽ đảm nhận số hoá nguồn tư liệu về lĩnh vực đó và cơ quan này sẽ được Nhà nước hỗ trợ trong việc số hoá.

Trên cơ sở phân công như vậy, ta xác lập được một mạng lưới các tổ chức số hoá tài liệu trên quy mô lớn, hiện đại, bao quát hầu hết những dạng tài liệu, những nguồn tin quan trọng nhất, những tài liệu có giá trị lâu dài ở tầm quốc gia. Từ đó hình thành mạng trao đổi thông tin toàn quốc và tạo điều kiện thuận lợi cho các cơ quan TT-TV trọng điểm trong xây dựng và phát triển TVĐT của mình.

Nghiên cứu, lựa chọn và xác lập những chuẩn, những quy định chung trong việc số hoá tài liệu

Trong mạng lưới các cơ quan TT-TV tiến hành số hoá cần có những chuẩn cũng như các quy định thống nhất đối với việc số hoá tài liệu. Những chuẩn này được xác định trên cơ sở nghiên cứu  áp dụng chuẩn của nước ngoài  vào điều kiện cụ thể của Việt Nam. Mỗi cơ quan tham gia  mạng lưới số hoá đều phải tuân thủ nghiêm ngặt những chuẩn này sao cho các tài liệu số hoá luôn đảm bảo về mặt chất lượng cũng như về tiến độ thời gian; đồng thời chúng  được tổ chức trong các CSDL có cấu trúc tương hợp hoặc dễ dàng trong chuyển đổi. Có như vậy, các tài liệu số hoá đó mới có thể phục vụ rộng rãi trong toàn mạng lưới và mang lại hiệu quả cao.

Tổ chức số hoá tài liệu ở quy mô công nghiệp

Hoạt  động  số  hoá  ở  quy  mô  lớn  được  gọi  là  “Ngành  công  nghiệp  nội  dung” (CNND). Theo định nghĩa khái quát người ta coi CNND bao gồm: thu thập thông tin; phân tích nội dung để phân loại, lưu trong bộ nhớ hoặc đưa lên mạng máy tính; bao gói thông  tin  thành  các  CSDL  (trên  CD,  DVD,  ổ  chứng  – HDD,  thiết  bị  lưu  trữ  di  động (HDD-RAM), nhân sao và cung cấp/bán các CSDL đó.

Nhiều người cho rằng, CNND là một nhánh của CNTT, vì nó gắn với CNTT. Sản phẩm của CNND là sản phẩm của CNTT, từ công nghiệp phần mềm, thu thập thông tin, xử  lý,  lưu  trữ  thông tin đến  cung cấp  thông tin.  CNND  không chỉ  liên quan  đến  phần cứng, phần mềm mà còn liên quan đến các lĩnh vực khác như lưu trữ, sản xuất các thiết bị lưu trữ (vật mang tin hiện đại).

Như vậy, nguyên vật liệu đầu vào của ngành CNND là thông tin và đầu ra cũng là thông tin. Nhưng thông tin đầu ra là CSDL, là thông tin có cấu trúc, có nội dung cụ thể và được bán/cung cấp  cho những đối tượng cụ thể nhằm phục vụ cho một/một số hoạt động KT-XH nhất định.

Tuy nhiên, để xây dựng được một nền CNND ở tầm quốc gia cần phải:

–    Có một hành lang pháp lý đủ mạnh để: một mặt, tạo điều kiện thuận lợi cho các tổ chức, cá nhân tìm kiếm, xử lý, số hoá, bao gói, chuyển giao thông tin; mặt  khác,  bảo  vệ  thiết  thực  bản  quyền  tác  giả  đối  với  các  CSDL cũng  như những thông tin mà các cá nhân, tổ chức sở hữu và tất nhiên là bảo đảm bí mật quốc gia;

–    Có sự phối hợp chặt chẽ về mặt tổ chức, liên kết, phân công phân mảng giữa các cơ quan có hoạt động số hoá tài liệu;

–    Có  lực  lượng  cán  bộ  chuyên  trách  thu  thập,  số  hoá,  bao  gói  thông  tin  (lực lượng này không phải chỉ là cán bộ thông tin, thư viện);

–    Trang bị các thiết bị hiện đại cho các cơ sở tham gia số hoá: ví dụ các máy quét  chuyên  dụng  (nhanh,  chất  lượng  cao,  quét  được  các  khổ  lớn,  màu  sắc đẹp…); các USB, các máy chủ sao lưu với dung lượng lớn (hàng nghìn GB); các máy sao CD chuyên dụng,…

Chắc chắn rằng, nếu tổ chức tốt ở Việt Nam ta, các sản phẩm số hoá này sẽ có thị trường không phải chỉ trong nước mà cả ở nước ngoài. Nền CNND sẽ hỗ trợ, cung cấp các nguồn tin số hoá cho các TVĐT và làm cho hoạt động thông tin KHCN sôi động, hấp dẫn hơn, cán bộ thông tin sẽ có nhiều việc làm và thu nhập khá hơn.

Kết luận

Tiến tới TVĐT là xu hướng tất yếu, là mong muốn của mỗi thư viện. Tuy nhiên, để có được một TVĐT hoạt động có hiệu quả, phát huy được thế mạnh “thông tin đặc thù” của mình, cơ quan chủ quản cần có kế hoạch sát thực, lựa chọn bước đi phù hợp. Trong xây dựng và phát triển TVĐT, việc tạo lập Kho tư liệu số hoá là nhiệm vụ hàng đầu. Giải quyết nhiệm vụ này đòi hỏi cơ quan chủ quản (cơ quan thông tin, thư viện) phải có chương trình thu thập, số hoá tài liệu và tạo lập các CSDL một cách đầy đủ, kịp thời, đặc biệt là các CSDL toàn văn với các tài liệu có giá trị lâu dài thuộc phạm vi bao quát của cơ quan.

Tài liệu tham khảo
1.  What  are  digital  libraries?/Donald  J.  Waters//  CLIR,  No  4,  July/August  1999. URL: http://WWW.clir.org/pubs/issues/issue04.html.

2.  Digital  libraries:  Definitions,  issues  and  challenges  /    Gary  Cleveland  //  UDT Occasional paper #8. URL:

3.   NII,   GII   and   12,   and   IT*2   Initiatives:   Implications   to   the   digital   Library development  in  the  US  /  Ching-Chih  Chen  (edited).  IT  and  global  digital  Library development. Massachsets : MicroUse information, 1999, pp 49-64.

4.  European  development  in  digital  libraries  /  David  Raitt  //    Ching-Chih  Chen
(edited). IT and global digital Library development. Massachsets: MicroUse information,
1999, pp  345-356.

5.  Cao Minh Kiểm. Thư viện số: định nghĩa và vấn đề.-Tạp chí Thông tin & Tư liệu,
2000, số 3, tr. 5- 11.

6. Tạ Bá Hưng. Phát triển nội dung số ở Việt Nam: những nguyên tắc chỉ đạo .-Tạp chí Thông tin & Tư liệu, 2000, số  1, tr. 2-6.