Ngày càng nhiều các cơ quan mong muốn chuyển đổi nội dung truyền thống của mình sang định dạng số. Trong các dự án như vậy, giai đoạn số hóa và tạo lập siêu dữ liệu thường diễn ra không đồng thời. Bài báo này nhận dạng tầm quan trọng của sự kiểm tra chéo thường xuyên cả hai giai đoạn này. Chúng tôi đề nghị một quy trình số hóa theo một quy trình thống nhất, và một cách thực hành kỹ thuật để tự động hóa nó.

1. GIỚI THIỆU
Trong ngành công nghiệp giải trí, người ta đều hiểu rõ tầm quan trọng của việc đồng bộ hóa phần tiếng và hình ảnh (audio and video) của một bộ phim. Điều quan trọng rằng cả âm thanh và hình ảnh (cả phần phụ đề nếu có) cần chạy đồng bộ cùng với nhau. Nếu sự đồng bộ này không có thì kết quả là một sự trộn lẫn tín hiệu này sẽ trái ngược nhau. Tương tự như vậy, chúng ta cần giữ cho các phần siêu dữ liệu và dữ liệu trong quá trình số hóa nội dung để chúng được đồng bộ hóa, khi đó sản phẩm cuối cùng của chúng ta, một bộ sưu tập dữ liệu và siêu dữ liệu, sẽ trở lên có ý nghĩa.

Trước kia, sự thiếu đồng bộ hóa đã gây ra nhiều vấn đề cho các dự án số hóa tại thư viện Đại học Cambridge (Cambridge University Library). Trong những trường hợp như thế này, quy trình số hóa hoàn toàn tách rời với các chuyên gia tạo ra siêu dữ liệu cho những đầu mục tài liệu được số hóa. Chỉ đến khi cả hai phần dữ liệu và siêu dữ liệu cuối cùng được kết hợp lại với nhau, và khi đó các chuyên gia thường thấy sự không thống nhất giữa hai phần dữ liêu này.

Sự không đồng bộ này đã cho thấy rằng chúng ta phải tốn rất nhiều thời gian và sự phức tạp để giải quyết vấn đề: chúng ta cần sự can thiệp của nhân viên thư viện vào rà soát toàn bộ sưu tập để phát hiện và sửa lỗi cũng như các thiếu sót đã xảy ra. Chúng ta phải tốn nhiều thời gian để triển khai nhiều công việc hơn đối với bộ phận số hóa, và kết hợp lại những kết quả cuối cùng.

Trong bài báo này, chúng tôi cố gắng nêu lên những vấn đề và định hình một quy trình nhằm phát hiện lỗi trước khi tác động đến các công đoạn khác của quy trình hình ảnh hóa nội dung. Trong khi bài này tập trung vào việc hình ảnh hóa các bản thảo, thì chúng ta cũng có thể dễ dàng nhận thấy nó liên quan đến bất kỳ dự án nào mà sự tạo ra siêu dữ liệu và dữ liệu diễn ra tách rời nhau, như hình ảnh số hóa, đối tượng số theo kích cỡ 3 chiều, phần âm thanh hoặc hình ảnh analog (hình ảnh truyền theo công nghệ tín hiệu tương tự) số hóa.

Xem thêm tài liệu tại đây.