Hàng nghìn trang tài liệu bằng tiếng Pháp tại ba nước Việt Nam, Lào, Campuchia từ thời Pháp thuộc đang được số hóa bằng một dự án lên đến 1,5 triệu Euro. Những tư liệu quý giá trên tất cả các lĩnh vực địa lý, lịch sử, dân tộc học, xã hội học… ở tình trạng gần như “độc bản” và có thể biến mất lúc nào lại có cơ hội đến với công chúng và các nhà nghiên cứu từ phương tiện số hoá. |
Tư liệu cổ, cách đọc mới
Dự án hợp tác của Pháp có tên “Phát huy mạng lưới phát hành sách và thư viện tại Đông Nam Á” do Chính Phủ Pháp tài trợ bắt đầu từ năm 2004 và sẽ kết thúc vào cuối năm 2008.
Theo ông Jean – Jacques Donard, Trưởng Dự án Valease – mục đích đầu tiên của dự án là thiết lập mạng lưới những người làm trong lĩnh vực liên quan đến sách và các thư viện của vùng, quảng bá và phát triển thói quen đọc sách của người dân qua những phương tiện khác nhau; mở các khóa đào tạo cơ bản về nghề sách (kinh tế thư viện, xuất bản, cửa hàng sách, lưu trữ), gặp gỡ trao đổi kinh nghiệm ở quy mô vùng và cung cấp tài liệu đến những đối tượng khác nhau. Bên cạnh đó, dự án còn có mục đích hỗ trợ ngành xuất bản ba nước xây dựng những tủ sách tiếng Pháp và sách ngôn ngữ quốc gia cho trẻ em, phát triển không gian đọc thiếu nhi các địa phương.
Ngân sách dành cho Việt Nam của dự án này là 327.000 Euros, với chương trình ở Thư viện Quốc Gia (Hà Nội) và Thư viện Khoa học Tổng hợp TPHCM. Ngoài ra còn có Viện khoa học xã hội, Trung tâm lưu trữ quốc gia, Viện trao đổi văn hóa Pháp… Trong đó, dự án số hóa tài liệu cổ tại thư viện Khoa học Tổng hợp TPHCM được chú trọng nhất. Bà Nguyễn Thị Bắc – giám đốc thư viện Khoa học Tổng hợp TPHCM – cho biết đến nay đã có 280.000 trang tài liệu đã số hóa. “Từ nay đến hết năm 2007 sẽ số hóa xong 260.000 trang nữa, tức tổng cộng khoảng 1.300 tài liệu”, bà nói.
Vấn đề tuyển chọn tài liệu để ưu tiên số hóa được một chuyên gia Pháp trực tiếp thực hiện. Tài liệu số hóa bao gồm các sách, báo, tạp chí, bản chuyên khảo, tư liệu hành chính, tác phẩm văn học, sách chuyên ngành khoa học xã hội (văn hóa, chính trị, giáo dục), tài liệu về quan hệ ngoại giao giữa Pháp và một số nước từ khi người Pháp hiện diện ở Đông Dương cho đến năm 1954. Giải pháp kỹ thuật cho việc chụp lại các trang tài liệu tuổi đời trên dưới 100 năm được công ty Direx với máy scan chuyên dụng i2s đảm trách.
Số hoá, cách thức sống còn của tài liệu
Một phát hiện quan trọng của dự án số hóa tại thư viện Khoa học tổng hợp là tìm thấy công trình của Henri Oger từ những năm 1908. Đó là tập tranh khắc có tên “Kỹ thuật của người An Nam” với 700 trang gồm 4445 hình vẽ về các hoạt động của đời sống người dân Việt Nam thời đó.
“Đây là tài liệu quý giá, bởi hiện nay ở Việt Nam chỉ còn một bản tại thư viện Khoa học tổng hợp là giữ được nguyên vẹn”, chị Thúy – cán bộ phòng nghiệp vụ nói về giá trị của bộ sách này.
Người Pháp đặc biệt chú ý đến công trình của Henri Oger, bởi từ năm 1908 – 1909, trong thời gian nghĩa vụ quân sự, Oger đã bỏ công lặn lội các ngả đường của Hà Nội và thuê người vẽ lại tất tần tật những cảnh sinh hoạt mà ông cho là ấn tượng. Đây là một nghiên cứu của Henri Oger về kỹ thuật thủ công của người An Nam có hình ảnh minh họa. Công trình này trở thành một bộ sưu tập quý giá về những hình ảnh đời thường của người Việt Nam đầu thế kỷ XX – vốn hiếm hoi trong việc nghiên cứu tập quán, cách thức lao động của người Việt đầu thế kỷ XX. Thậm chí trong loạt tranh khắc của ông người ta còn tìm được các trò chơi dân gian đã thất truyền hay hình ảnh của phố cổ Hà Nội vốn rất ít ảnh chi tiết. Một bộ sách hữu ích như thế nhưng đang có nguy cơ biến mất vì muốn giữ một cuốn sách in giấy bản qua hàng thế kỷ hoàn toàn không phải là chuyện dễ dàng. Hiện tại, công trình của Oger đang là đối tượng của một dự án nghiên cứu giữa Thư viện Khoa học Tổng hợp và Tổng lãnh sự quán Hà Lan. Trong tương lai, có thể tập sách quan trọng này sẽ được tái bản. Cùng trong xu thế đó, các nhà chơi sách quý cũng đang có xu hướng muốn số hoá các bản sách quý của mình vì “lỡ sách có vì lý do nào đó mà bị rách, cháy , mất… thì một tư liệu hiếm và bổ ích của nhân loại cũng không mất đi, vẫn sản sinh ra kiến thức cho người khác”, ông T.T.Tân, một tay chơi sách ở đường Trần Huy Liệu cho biết. Giả sử, toàn bộ số sách quý của học giả Vương Hồng Sển tại Vân Đường Phủ được số hoá thì những người yêu sách sẽ không đến nỗi nơm nớp lo các giá trị bị mất đi khi các bản sách cuối cùng của cụ vì bảo quản không tốt mà lưu lạc đâu đó hay rách nát. Vì sách quý thật sự chỉ quý khi tác động được đến tri thức con người, những trang sách được số hoá trên internet dù không còn quý theo kiểu đồ cổ thì cũng quý theo hướng phục vụ được con người.
Song song đó, trong dự án này, một chương trình thư viện điện tử có tên Bibliotheca Vietnamica cũng được tiến hành. Dự án này nằm trong khuôn khổ của Quỹ đoàn kết ưu tiên (Valease) của Pháp. Thư viện Bibliotheca Vietnamica này là một phần của thư viện điện tử Bibliotheca Indosinica sẽ tập hợp các tác phẩm tiếng Pháp trước năm 1937 dưới dạng số hóa của ba nước Việt Nam, Campuchia và Lào, cùng chia sẻ với nhau.
Hiện nay, dự án đang thực hiện việc chuyển các tài liệu quan trọng nhất từ dạng (sau khi số bằng kỹ thuật scan) sang dạng văn bản. Điều này thuận tiện hơn cho người đọc.
Đồng thời dự án cũng thiết lập một “cơ sở dữ liệu vùng” tập hợp thư mục tên của các tài liệu đã số hóa và lưu giữ tại Bibliotheca Indosinica. Tiếp theo là đưa toàn bộ Bibliotheca Indosinica lên mạng Internet và sẽ hình thành một ngân hàng hình ảnh với các hình ảnh về Việt Nam xưa trích ra từ các quyển sách đã số hóa. Triễn lãm về số hoá những tư liệu cổ sẽ còn diễn ra đến 30/9 tại Thư viện Tổng Hợp Quốc gia, Lý Tự Trọng, Q.1, TPHCM.
Theo tạp chí Thế giới số
Quy trình số hoá tư liệu sách cổ
Mở sách từ 120 độ-180 độ, chụp lại từ trang sách tuyệt đối sử dụng ánh sáng tự nhiên. Kiểm tra từ ảnh, loại những dị thường và scan lại hình ảnh. Nhập các dữ liệu về sách (trang bìa, phụ lục, nhan đề, mục lục…). Dùng phần mềm Book Restorer để chỉnh sửa hình dạng, đóng khung, làm đen chữ và khử vết bẩn. Tạo một tệp ảnh PDF, thiết kế giao diện trực giác, hỗ trợ tìm kiếm. Một cuốn sách số hoá sẽ ở lại với chúng ta lâu đến chừng nào… trái đất còn máy tính.