Là một trong những thành tựu vĩ đại nhất của con người thế hệ Internet, Wikipedia hiện có hàng trăm ngôn ngữ đang lưu hành trong mục tiêu đúc kết toàn bộ tri thức của loài người. Thế nhưng rào cản lớn nhất của mục tiêu này nằm ở ngôn ngữ, khi sự hiện diện của quá nhiều ngôn ngữ khác nhau khiến website này như bị phân mảnh, rời rạc, thiếu đồng đều – một vấn đề không chỉ của riêng các nhà ngôn ngữ học.
Vậy rốt cuộc có bao nhiêu ngôn ngữ trên Wikipedia? Từ lúc ra đời 2001 tới nay, Wikipedia có 306 phiên bản ngôn ngữ, trên tổng số 7000 ngôn ngữ đang được sử dụng trên thế giới vào thời điểm hiện tại. Thế nhưng, hơn một nửa nhân loại sử dụng chỉ 23 ngôn ngữ trên tổng số nêu trên.
Để tạo ra phiên bản thuộc một ngôn ngữ khác, bách khoa toàn thư mở này thực ra không… mở dễ dàng như vậy, mà cần có một bản trình giải thích cho tổ chức Wikipedia, để xác định đó có phải là ngôn ngữ riêng hay chỉ là tiếng địa phương mà thôi. Tiếp theo, cần có nội dung và một cộng đồng nhất định tạo ra và duy trì các bài viết bằng ngôn ngữ đó, bằng không Wikipedia sẽ đóng phiên bản này – đã có 10 phiên bản bị khai tử, như tiếng Choctaw, Afar, Ndonga, nên chúng ta còn tổng cộng 296.
Tiếng Klingon, một ngôn ngữ do tác giả Marc Okrand “tạo ra” và sử dụng chỉ trong vũ trụ Star Trek cho giống người Klingon ngoài hành tinh, từng xuất hiện trên Wikipedia và sau đó, năm 2005, bị loại bỏ. Năm 2006, cộng đồng sử dụng Klingon, đa phần là những nerd khoa học giả tưởng, đã dời sang Wikia. Tuy nhiên, Wiki lại có trang cho các ngôn ngữ nhân tạo khác như Esperanto, quốc tế ngữ, và ngôn ngữ Volapük của thầy tu J. Martin Schleyer ở Đức tạo ra mà nay chỉ còn chưa tới 50 người có thể sử dụng.
Về số lượng, đương nhiên ngôn ngữ có nhiều trang hiện diện nhất trên Wikipedia là tiếng Anh, thế nhưng tốp 10 ngôn ngữ lại có nhiều thú vị. Tiếng Cebuano, một ngôn ngữ của quần đảo Visayas với 22 triệu người, thuộc Philippines, lại đứng thứ nhì với 5,38 triệu trang bài viết, thua tiếng Anh chỉ 0,5 triệu. Tiếng Thụy Điển, Đức, Pháp, Hà Lan, Nga, Ý, Tây Ban Nha và Ba Lan chiếm các vị trí còn lại trong danh sách – đồng nghĩa thiếu đi những nền văn hóa lớn của Châu Á như Trung, Nhật.
Càng thú vị hơn khi xem theo lượng người dùng, tiếng Cebuano nằm tận thứ 69. Đầu bảng đương nhiên tiếng Anh, với 37,5 triệu, nhì là Tây Ban Nha với 5,6 triệu, và ba là Pháp với 3,6 triệu. Tiếng Trung và Nhật, theo lượt người sử dụng, đứng lần lượt thứ 5 với 2,8 triệu và 10 với 1,55 triệu người dùng.
Ngay cả ở Philippines, ngôn ngữ chính và nhiều người sử dụng nhất là Tagalog chứ không phải Cebuano, nhưng từ cuối 2006, người dùng tiếng Cebuano lại gia tăng đột biến đóng góp bài viết cho Wikipedia. Lý giải vấn đề này, một tài khoản Quora đã chỉ ra một user đã tạo một con bot để dịch 50000 bài viết về cộng đồng người Pháp sang tiếng Cebuano, gây ra một cuộc chiến tranh… ngôn ngữ đến từ Philippines, khi ai cũng muốn có nhiều bài viết hơn được viết bằng thứ tiếng mình sử dụng.
Giải thích tương tự cho hiện tượng Thụy Điển ở trên cũng đến từ một bot khác, do anh chàng Thụy Điển Sverker Johansson tạo ra, tên gọi LSJbot từ mục đích tạo nền cho các thần dân Wikipedia có cái mà… làm việc. Tuy nhiên, số bài tạo ra đã vượt quá khả năng, và dịch bằng bot cũng không thể trôi chảy, lưu loát như văn phong của con người được – chưa kể, những bài được dịch có nằm trong sự quan tâm của người chỉ đọc và hiểu các ngôn ngữ kém phổ biến hơn hay không, như tiếng Cebuano chẳng hạn.
Tính năng interwiki, hay liên thông wiki, cho biết những chủ đề nào được con người quan tâm tìm kiếm nhất trên thư viện mở này. Nhưng hóa ra, người ta lại quan tâm nhiều hơn cả về các quốc gia, đứng đầu là Nhật và Phần Lan cùng với 295 interwiki, Thổ Nhĩ Kỳ thứ nhì với 290 interwiki và Mỹ thứ 5 với 287 interwiki. Mãi quá con số 50, chúng ta mới bắt gặp “con người” đầu tiên nhận được nhiều interwiki nhất, đó là cựu Tổng thống Mỹ Ronald Reagan với 249 interwiki, cao hơn Chúa Jesu với 245 interwiki. Barack Obama có 232 interwiki, kém Michael Jackson 2, và hơn Leonard da Vinci 17.
Và điều tối quan trọng, khi một đại từ điển tri thức vẫn luôn sống và hít thở như chính những biên tập viên của nó, là luôn luôn tìm đúng nguồn tham khảo để đối chiếu. Vì biết đâu được…
Tối đa: 1500 ký tự
Hiện chưa có bình luận nào, hãy là người đầu tiên bình luận