AI có thể lấp đầy những khoảng trống trong văn bản Hy Lạp cổ đại
Từ các sắc lệnh của triều đình đến các bài thơ của Sappho, hệ thống Ithaca có thể tìm các mẫu từ và gợi ý tuổi, xuất xứ của văn bản.
Tìm thấy 2 tượng nhân sư khổng lồ tại ngôi đền Ai Cập cổ đại / Vén màn bí ẩn máy tính cổ đại Antikythera
Chữ viết Hy Lạp cổ đại được đục đẽo trên đá. Ảnh: Getty Images / iStockphoto
Các nhà nghiên cứu mới đây đã phát triển một hệ thống áp dụng trí thông minh nhân tạo, giúp lấp đầy những khoảng trống trong các dòng chữ khắc Hy Lạp cổ đại, dù đó là các sắc lệnh hoàng gia cho đến bài thơ của Sappho. Bên cạnh đó, hệ thống còn giúp xác định thời gian và xuất xứ của văn bản.
Tiến sĩ Thea Sommerschield, đồng tác giả của nghiên cứu do Đại học Ca 'Foscari của Venice và Đại học Harvard phối hợp thực hiện, cho biết các bản khắc đóng vai trò quan trọng bởi chúng được chính người cổ đại viết nên và là bằng chứng sinh động về tư tưởng, ngôn ngữ, xã hội, lịch sử của các nền văn minh trong quá khứ. “Song qua nhiều thế kỷ, hầu hết các bản khắc còn sót lại đã bị hư hại. Do vậy các văn bản của chúng hiện nay đều rất rời rạc hoặc không tài nào đọc được", bà chia sẻ và nói thêm rằng rất có thể chúng đã bị đưa ra khỏi vị trí địa lý ban đầu, trong khi các phương pháp như xác định niên đại bằng carbon phóng xạ không thể sử dụng được trên các vật liệu như đá.
Sommerschield và các đồng nghiệp đã xuất bản một bài báo trên Nature, phân tích cách họ xây dựng một hệ thống AI mà họ đặt biệt danh là Ithaca, theo tên hòn đảo Hy Lạp, quê hương của Vua Odysseus huyền thoại. Nhóm nghiên cứu đã cung cấp cho Ithaca hơn 63.000 chữ khắc Hy Lạp cổ đại được phiên âm đầy đủ, cho phép nó chọn ra các mẫu câu theo thứ tự của các chữ cái và từ, cũng như các liên kết giữa các từ và cụm từ, tuổi và nguồn gốc của văn bản.
Nhóm nghiên cứu tiếp tục điều chỉnh hệ thống trước khi theo dõi xem liệu nó có thể gợi ý chính xác niên đại và xuất xứ của 7.811 chữ khắc khác, đồng thời đề xuất lựa chọn các chữ cái và từ để lấp đầy các khoảng trống hay không. Hệ thống sẽ lần lượt đề xuất các chữ cái mà nó cho là hợp lý với ngữ cảnh và thời đại của văn bản, xếp hạng theo xác suất mà nó cho là chính xác.
Kết quả cho thấy Ithaca đạt được độ chính xác 62% khi hoạt động độc lập để lấp đầy khoảng trống trong chữ khắc và độ chính xác 72% khi có sự tham gia diễn giải của một nhà sử học - cao hơn khoảng ba lần so với khi các nhà sử học làm việc một mình. Nhóm nghiên cứu cho biết, Ithaca có thể xác định niên đại của các bia ký với mức chênh lệch dưới 30 năm và xác định chính xác nguồn gốc của chúng với độ chính xác lên tới 71%.
Còn nhiều tiềm năng để khai thác.
“Cũng giống như kính hiển vi và kính thiên văn - những thứ đã giúp mở rộng phạm vi nghiên cứu của các nhà khoa học ngày nay, Ithaca nhằm mục đích tăng cường và mở rộng khả năng nghiên cứu một trong những giai đoạn quan trọng nhất của lịch sử nhân loại,” Tiến sĩ Yannis Assael của công ty AI Deepmind, đồng tác giả của công trình, cho biết.
Nhóm nghiên cứu cho hay phương pháp này có thể áp dụng với mọi phương tiện và bất kỳ ngôn ngữ viết cổ đại nào, từ tiếng Latinh cho đến chữ hình nêm (Cuneiform - một trong những hệ thống chữ viết sớm nhất trong lịch sử nhân loại), và có thể huấn luyện hệ thống “học" các văn bản văn học Hy Lạp được viết trên các mảnh giấy cói (papyrus), nó sẽ giúp làm sáng tỏ các tác phẩm của những nhà thơ như Sappho. Ngoài ra, nhóm nghiên cứu cũng có thể phát triển hệ thống theo hướng cung cấp thông tin chi tiết về tác giả của các văn bản.
Các nhà khoa học đã cho Ithaca đọc một loạt các sắc lệnh hầu hết được tìm thấy tại thành cổ Acropolis ở Athens. Trong đó, Ithaca dự đoán một sắc lệnh - đề cập đến việc thu thập các cống phẩm trên khắp đế chế Athens - có niên đại 424 TCN chứ không phải 448-7 TCN như các nghiên cứu lâu nay chỉ ra. Tưởng chừng như đó là sai số, nhưng điểm thú vị là con số do AI dự đoán lại trùng khớp với những đột phá mới gần đây liên quan đến giai đoạn lịch sử này. “Mặc dù đó chỉ là một khác biệt nhỏ, nhưng sự chênh lệch về mặt thời gian vẫn có thể thay đổi đáng kể những hiểu biết của chúng ta về lịch sử chính trị của Athens cổ đại. Đồng thời, chúng giúp ta hiểu hơn về nội dung các bản khắc - chẳng hạn như lời kể của sử gia Thucydides về những năm tháng và sự kiện trong quá khứ”, Sommerschield nói.
GS Peter Liddel, một chuyên gia về lịch sử và biểu tượng Hy Lạp tại Đại học Manchester, người không tham gia nghiên cứu, gợi ý có thể ứng dụng hệ thống để phân tích nguồn gốc bộ điêu khắc cẩm thạch do Huân tước Elgin mang về từ đền Parthenon. “Việc ứng dụng hệ thống Ithaca chắc chắn sẽ giúp các nhà sử học phân tích những văn bản cổ, từ đó hiểu hơn về quá trình cũng như sự phát triển của chủ nghĩa đế quốc hay bản chất của các nghi thức tế lễ.”
Tuy nhiên, Liddel cảnh báo rằng AI cũng chỉ là một công cụ giúp nhà khoa học đặt câu hỏi và so sánh với các bằng chứng hiện có, chứ không phải là chìa khóa vạn năng.
Giáo sư Melissa Terras, một chuyên gia về di sản văn hóa kỹ thuật số tại Đại học Edinburgh, cho biết điều quan trọng là phải tiếp tục đào tạo các chuyên gia về những phương pháp tiếp cận truyền thống để có thể kết hợp với các hệ thống AI như Ithaca, diễn giải các đề xuất của AI. Theo bà, AI có rất nhiều tiềm năng cho việc hỗ trợ giải thích sự tồn tại của các nền văn hoá trong quá khứ, bởi những văn bản cổ thường không nguyên vẹn và được sắp xếp theo cấu trúc lạ. “Điều này có nghĩa là phải thực hiện rất nhiều phép tính lặp đi lặp lại để tìm ra phương án khả thi nhất - và đó chính là điểm vượt trội của các hệ thống AI”, bà kết luận.
End of content
Không có tin nào tiếp theo
Xem nhiều nhất
Người Việt Nam duy nhất được xem là triết gia: Thế giới nể trọng, tên được đặt cho 1 con đường ở TP.HCM
Loại gỗ có giá trị gấp 10 lần vàng, 1 cây cũng có giá hơn 350 tỷ nhưng không ai dám trồng, lý do là gì?
Trường THPT chuyên lâu đời nhất Việt Nam: Nhiều lãnh đạo từng học, là niềm hãnh diện của cả đất nước
Đây là tên gọi đầu tiên của Hà Nội, người Hà Nội lâu năm chưa chắc đã biết, nó có ý nghĩa gì?
Khúc gỗ đen xì có giá hơn cả 'nghìn lượng vàng', tại sao lại đắt như vậy?
Mổ ‘xác ướp người ngoài hành tinh’, các nhà khoa học phát hiện ra 1 bí mật gây 'sốc'
Cột tin quảng cáo