Bạn đang ở đây: Chuyên đề Số hóa kiến thức nhân loại

Số hóa kiến thức nhân loại

 Từ xưa, con người đã muốn thu thập thông tin để xây dựng một thư viện chung trong đó chứa đựng mọi tri thức loài người. Người ta từng xây dựng một thư viện khổng lồ ở Alexandria vào năm 300 TCN (với khoảng nửa triệu đầu sách, chiếm từ 30% đến 70% tổng số sách bấy giờ). Thế nhưng, cùng với sự bùng nổ thông tin, việc lưu trữ tất cả đầu sách vào một nơi là điều không thể. Việc xây dựng một thư viện như thế chỉ là một giấc mơ hoang đường, cho đến thế kỷ 21...

 

Nhiều thư viện đại học Mỹ đều thực hiện công tác số hóa sách in để bảo quản và dễ truy xuất

Tất cả trong một đường link

Tháng 12-2004, sự kiện Google công bố chương trình số hóa (scan) tất cả sách của 5 thư viện nghiên cứu lớn nhất thế giới cho mục đích tìm kiếm đã làm sống lại giấc mơ có một thư viện chung cho tất cả. Sự bùng nổ các trang web đã mang lại hy vọng về điều không thể cho tất cả chúng ta.

Thư viện này không giống những thư viện trước đây, không có những quyển sách thường thấy, không hạn chế người sử dụng và cho phép tìm kiếm mọi thứ với kết quả cực nhanh. Kỹ thuật scan (quét) đã được sử dụng nhiều năm qua nhưng nó chỉ thật sự cần thiết khi những công cụ tìm kiếm như Google, Yahoo!, Ask và MSN xuất hiện.

Khi đó, hàng triệu đầu sách, hàng tỷ trang web và hầu hết bài báo, tạp chí, tranh ảnh, bản nhạc và phim từ trước đến nay đều được scan để lưu trữ vào một thư viện số. Kể từ khi người Sumerian khắc chữ lên đất sét cho đến nay, con người đã cho ra đời ít nhất 32 triệu quyển sách, 750 triệu bài báo, 25 triệu bản nhạc, 500 triệu bức ảnh, 500.000 bộ phim, 3 triệu cuốn băng, vô số chương trình tivi, đoạn phim ngắn và ít nhất 100 tỷ trang web.

Hiện nay, mọi thứ đều được số hóa. Trong chừng mực nào đó, ta có thể nói thư viện chung là một thư viện không có sách. Gần 100% bài hát đã được số hóa bởi những người hâm mộ và khoảng 1/10 trong số 500.000 bộ phim đã được chuyển thành DVD. Các tập đoàn kinh doanh và thư viện trên thế giới đã và đang scan hàng triệu đầu sách mỗi ngày.

Amazon đã số hóa hàng trăm ngàn đầu sách; tại thung lũng Silicon cũng như Đại học Stanford (một trong 5 thư viện cộng tác với Google) đang scan quyển sách thứ 8 triệu, sử dụng công nghệ của công ty 4DigitalBooks (Thụy Sĩ). Với công nghệ này, họ có thể scan 1.000 trang mỗi giờ. Khi sách bắt đầu được số hóa, một câu hỏi được đặt ra: “Liệu chúng ta nên chấm dứt việc xuất bản sách in và thay vào đó là số hóa sách để đọc trên máy?”.

Các nhà nghiên cứu cho rằng vào thời điểm hiện nay, nên duy trì cả hai cách trên. Thật vậy, dù có rất nhiều người hài lòng với việc đọc sách ở dạng PDF trên trang web, mỗi năm, số lượng sách in được xuất bản vẫn ngày một tăng. Tuy nhiên, tiện ích của sách điện tử là điều không thể phủ nhận. Ngoài việc có thể đọc và lưu trữ tài liệu trên máy, số hóa sách mang lại nhiều lợi ích rất lớn.

Hai tổ chức Project Gutenberg và World eBook Library” đang chuẩn bị tổ chức “Hội chợ sách điện tử thế giới” đầu tiên trên thế giới. Sẽ có đến 300.000 đầu sách điện tử được giới thiệu và tất cả mọi người đều có thể truy cập xem hoặc tải về miễn phí trong một tháng. Hội chợ sách điện tử tổ chức từ ngày 4-7 và kết thúc ngày 4-8-2006. Sau hội chợ, độc giả chỉ cần trả 8,95 USD/năm để có thể truy cập vào kho sách điện tử với khoảng 250.000 đầu sách được cập nhật liên tục.

Trong thư viện truyền thống, trong khi mỗi quyển sách là một bản hoàn chỉnh và độc lập; giờ đây, tất cả tài liệu sẽ được liên kết với nhau trong thư viện số.

Bên cạnh việc dùng “link” (đường dẫn liên kết) để liên kết câu, từ hoặc các quyển sách với nhau, người đọc có thể sử dụng “tag” (gắn thẻ) để chú thích chung cho tất cả mọi người về một dữ liệu, tranh ảnh hay bài hát nào đó nhằm thuận tiện cho việc tìm kiếm khi cần.

Ví dụ, chúng ta chỉ cần nhấp chuột vào “link” về các chủ đề liên quan hoặc chú thích ở cuối trang để tìm kiếm những điều cần biết thêm. Chính việc số hóa sách đã cho phép thực hiện điều này mà sách truyền thống không bao giờ đạt được.

Hiện nay, chúng ta có khoảng 100 tỷ trang Web, mỗi trang chứa ít nhất 10 “link”, như vậy, có tất cả 1.000 tỷ “link” liên kết với nhau. Nói cách khác, một thư viện số cho phép ta liên kết tất cả tài liệu với nhau, giúp dễ dàng tìm kiếm mọi thứ, điều mà ta không thể làm được ở một thư viện bình thường.

Sách được số hóa đồng nghĩa với việc nó có thể được chia nhỏ thành từng trang, từng đoạn nhỏ, sau đó được sắp xếp lại tạo thành một quyển sách mới hoặc chứa trong một “giá sách ảo” – nơi tập hợp những đoạn văn ngắn hoặc cả nội dung của một quyển sách hoàn chỉnh.

Việc này thật sự có ích đối với các loại sách hướng dẫn, ví dụ như bạn có thể viết một quyển sách dạy nấu ăn cho riêng mình bằng cách tập hợp từ nhiều nguồn sách khác nhau! Khi đó, người đọc có thể sử dụng công cụ “Google Book Search” để dễ dàng tìm sách với chủ đề xác định nào đó – tất cả sách về Thụy Điển hoặc toàn bộ về đồng hồ chẳng hạn.

Thời của sách điện tử

Thiết bị sách điện tử liên tục được cải tiến theo đà bùng nổ xu hướng sách số hóa

Một trong những vấn đề liên quan xu hướng số hóa sách đối với hầu hết nhà xuất bản là họ không biết đích xác thật sự mình đang sở hữu cái gì. Thật khó để xác định rõ tác quyền của một quyển sách không còn được xuất bản.

Tác phẩm càng cũ và càng không rõ ràng về nguồn gốc, nhà xuất bản càng khó xác định tác quyền được trao cho tác giả chưa, tác giả còn sống không, tác quyền có được bán cho công ty nào khác không, hoặc thậm chí có nhà xuất bản nào sở hữu tác quyền đó và họ có ý định phục hồi hoặc scan nó không? Triển vọng tìm được tác quyền của 25 triệu đầu sách không rõ nguồn gốc thật sự là điều nan giải.

Điều này dẫn đến viễn cảnh nếu như các tác phẩm trên không được số hóa và phổ biến thì mãi mãi chúng sẽ bị lãng quên. Không ai có thể giải quyết được vấn đề hóc búa trên cho đến năm 2004, khi Google đưa ra hướng giải quyết. Cùng với việc số hóa 15% đầu sách hết hiệu lực bản quyền và 10% đầu sách đang được xuất bản, Google công bố họ sẽ số hóa 75% sách còn lại trong khoảng 25 triệu đầu sách. Google dự tính số hóa toàn bộ 10 triệu đầu sách ở 5 thư viện chính (Thư viện Đại học Stanford, Harvard, Oxford, Michigan và Thư viện công cộng New York).

Khi đó, đối với sách hết hiệu lực bản quyền, Google sẽ đưa toàn bộ nội dung. Đối với sách còn được xuất bản, Google sẽ đưa một phần tùy thuộc yêu cầu và thỏa thuận với nhà xuất bản. Còn đối với sách không rõ nguồn gốc, Google đưa ra một đoạn trích giới hạn (phòng khi tác giả nào đó công bố tác quyền). Như vậy, Google đem lại cơ hội để nhiều người có thể đọc hoặc thậm chí mua những quyển sách không rõ nguồn gốc từng khổ công tìm kiếm trong thời gian dài.

Đến nay, các thư viện (cũng như nhiều cá nhân) không có ý định từ bỏ việc xuất bản sách in bởi nhiều lý do khác nhau. Thật vậy, không cần thiết bị nào để sử dụng, sách in bền hơn và đáng tin cậy hơn so với thiết bị lưu trữ tài liệu như ổ cứng hoặc CD. Vấn đề của nó là mọt chứ không phải virus máy tính (có thể xóa sạch dữ liệu trong tích tắc). Tuy nhiên, rõ ràng, thời của sách điện tử đã thật sự đến rất gần và chắc chắn ảnh hưởng sâu sắc đến văn hóa đọc của loài người trong thời gian ngắn nữa…

4 ưu điểm của thư viện số

Điều gì sẽ xảy ra nếu tất cả sách trên thế giới đều trở thành bộ phận của hệ thống các từ và ý tưởng liên kết với nhau? Có bốn điều sẽ xảy ra: Thứ nhất, nó giúp các tài liệu ít phổ biến có nhiều độc giả hơn trước đây, vì khi tất cả sách được liên kết với nhau, độc giả có thể đọc được hầu như tất cả chủ đề liên quan mà có thể họ chưa từng biết tới. Thứ hai, thư viện số giúp tìm hiểu sâu hơn về lịch sử cũng như nguồn gốc của mọi vấn đề. Thứ ba, thư viện số mang lại nhiều kiến thức hơn. Thật vậy, nếu được cung cấp những kiến thức có sự kết hợp chặt chẽ giữa quá khứ, hiện tại và tương lai về bất kỳ lĩnh vực nào, ta sẽ cảm nhận rất rõ về lĩnh vực đó, ví dụ như một nền văn minh, một loài động vật mà ta đã biết hoặc chưa từng biết. Cuối cùng, một thư viện số đầy đủ sẽ cung cấp mọi kiến thức từng được viết trong sách vở ở tất cả thứ tiếng khác nhau...

Theo Sài Gòn giải phóng