Với việc giới thiệu SLUBsemantics, một công cụ tìm kiếm Web ngữ nghĩa đa ngôn ngữ, được phát triển dựa trên giải pháp Primo tại Thư viện Saxon State (SLUB) của Đại học Công nghệ Dresden (Technische Universität Dresden), Đức, đã mở ra một khả năng tìm kiếm ngữ nghĩa mới. |
Vào đầu năm 2011, SLUB Dresden và công ty mới thành lập có tên Avantgarde Labs đã hợp tác phát triển mở rộng khả năng tìm kiếm đa ngôn ngữ dựa trên hệ thống Primo với tên gọi là SLUBsemantics.
Xem video giới thiệu hệ thống ở đây:
Trong giai đoạn đầu sự phát triển của công cụ tìm kiếm này, SLUBsemantics sẽ cho phép người dùng truy cập vào bốn triệu nhan đề trong vốn tự liệu của chúng tôi với sự giúp đỡ của các nhánh phân loại tự động tạo ra. Câu hỏi truy vấn sẽ được trình bày bắt đầu từ nguồn gốc khái niệm và phân loại dựa vào kiến thức theo ngữ cảnh. Câu hỏi truy vấn, với bất cứ ngôn ngữ nào được đưa vào, sẽ được trả lại kết quả tìm kiếm phù hợp từ mục lục của chúng tôi, bất kể văn bản được viết hay mô tả dưới ngôn ngữ nào.
Cách thức làm việc hấp dẫn của công cụ SLUBsemantics là kết quả của một nguyên tắc hết sức đơn giản: trình bày dựa trên những cấu trúc thông tin nối kết mạng khối lượng lớn, được duy trì tính xã hội với sự đóng góp từ người dùng tin, với mục tiêu tự động làm giàu và kết nối giữa mục từ trong mục lục. Để phục vụ mục tiêu này, trong sự lựa chọn giữa những công cụ khác, chúng tôi dựa vào Wikipedia, bách khoa toàn thư lớn nhất thế giới sẵn có trên mạng. Phần mềm nhận biết tự động các kết nối trong nội dung của các truy vấn tìm kiếm và tạo ra một danh sách kết quả theo cấu trúc. Ví dụ, nếu người dùng gõ vào chữ "Ngân hàng " (trong tiếng Đức, từ này có nghĩa là “ngân hàng” và “băng ghế”) , anh ta sẽ thấy mục danh mục kết quả trả về sẽ liên quan đến các tổ chức cá nhân ngân hàng, khủng hoảng ngân hàng và đồng Euro, cũng như thông tin về “chỗ ngồi” hoặc “bờ cát” . Nếu anh ta tìm kiếm từ khóa “thủ đô của Bỉ” , tất cả kết quả tìm kiếm có chứa từ “Brussels” sẽ được hiển thị. Nếu mục từ tìm kiếm là "Cuốn theo chiều gió", bạn đọc sẽ nhận được tất cả các kết quả tìm kiếm cho bộ phim "Cuốn theo chiều gió", kết quả tìm kiếm liên quan đến giám đốc Victor Fleming, Max Steiner-nhà soạn nhạc cho nhạc phim và Margaret Mitchell, tác giả của cuốn tiểu thuyết .
Một tìm kiếm chỉ mục thông thường của mục lục “SLUB Catalogue” với khả năng kiểm tra chính tả, tiêu chuẩn hoá từ vựng (từ vựng có kiểm soát) và tiêu chí phân loại có khả năng điều chỉnh là quá trình phát triển từ một trường tìm kiếm giống nhau duy nhất, song nó chỉ có thể tạo ra kết quả từ những tiêu chí được lọc ra từ những thông tin mô tả nhan đề. Hệ thống thường không chú ý tới nhan đề được viết với thông tin mô tả trong các ngôn ngữ khác, hoặc thông tin mô tả của nhan đề có sử dụng từ đồng nghĩa trong các cụm từ tìm kiếm. Mối quan hệ ngữ nghĩa khác giữa những thông tin mô tả nhiều khi cũng bị thiếu. Ngược lại, ngay cả trong giai đoạn đầu tiên của sự phát triển, SLUBsemantics bao gồm tất cả các mục từ của mục lục và cho phép các thuật ngữ tìm kiếm bằng ba thứ tiếng : Đức, Anh , và Ba Lan. Mối quan hệ ngữ nghĩa giữa các chủ đề được hiển thị như phân nhánh theo cấu trúc, và các thiết lập tiêu chuẩn cho hiển thị đồ họa được chuyển sang sự trình bày kết quả tìm kiếm theo hình cây. SLUBsemantics hiện đang trong giai đoạn thử nghiệm. Vì một kết quả tìm kiềm được trình bày rõ ràng ngày càng tăng, chúng tôi sẽ cho hiển thị tất cả các thuật ngữ tìm được làm giàu tự động đối với tất cả các mục từ trong mục lục của chúng tôi theo hình thức xem chi tiết số lượng kết quả tìm kiếm liên kết với các mục từ bên từ điển Wikipedia . Cuối cùng, chúng tôi đang có kế hoạch mở rộng công cụ SLUBsemantics cho tất cả các mục từ trong các mục lục của thư viện SLUB và tích hợp SLUBsemantics vào các tìm kiếm chuẩn của thư viện. Ngoài ra, các thuật ngữ làm giàu kết quả tìm kiếm sẽ được hiệu chỉnh và mở rộng.
Xin vui lòng giúp chúng tôi tiếp tục cải thiện công cụ SLUBsemantics và để tiếp tục phát triển nó xa hơn. Để đóng góp ý kiến, xin vui lòng sử dụng mẫu phản hồi thông tin về công cụ SLUBsematics trên trang web của chúng tôi.
Theo bản tin của thư viện SLUB/Đai học Công nghệ Dresden, Đức