Giấc mơ 'chủ quyền AI' và quyết tâm xây dựng mô hình ngôn ngữ lớn tiếng Việt của PGS Lưu Anh Tuấn
Bộ công cụ mới hỗ trợ phát triển trợ lý AI pháp lý tiếng Việt / Giáo dục đại học: Đổi mới để con người không bị AI thay thế

Khi AI ngoại "chào thua" trước sự phức tạp của tiếng Việt
Trong bối cảnh Việt Nam đang chuyển dịch mạnh mẽ từ quốc gia "sử dụng AI" sang "sáng tạo AI", PGS Lưu Anh Tuấn nhận định rằng việc phụ thuộc hoàn toàn vào các mô hình nước ngoài như ChatGPT chứa đựng nhiều rủi ro. Mặc dù các công cụ này đã hỗ trợ tiếng Việt, nhưng chất lượng vẫn chưa đạt kỳ vọng do thiếu sự thấu hiểu sâu sắc về văn hóa và ngữ cảnh bản địa.
Thách thức lớn nhất mà PGS Tuấn chỉ ra nằm ở sự phức tạp của tiếng Việt.
"Ngôn ngữ Việt Nam có nhiều điểm đặc biệt so với nhiều ngôn ngữ trên thế giới. Riêng chuyện danh xưng 'cô, dì, chú, bác' thôi thật ra cũng rất phức tạp, nên những hệ thống AI chung của thế giới không thể nào hiểu được" - PGS Lưu Anh Tuấn cho biết.
Bên cạnh đó, sự đa dạng phương ngữ giữa ba miền Bắc - Trung - Nam và các yếu tố lịch sử đặc thù cũng là những "vùng mờ" mà các mô hình quốc tế - vốn được đào tạo trên dữ liệu tổng quát - thường xuyên gặp vấn đề khi xử lý.
"Nếu chúng ta cứ hỏi ChatGPT rồi trả tiền thì chúng ta chỉ có thể dùng AI chứ không thể nào phát triển trí tuệ nhân tạo" - PGS Lưu Anh Tuấn nhấn mạnh.
Điều này đặt ra vấn đề cấp thiết về chủ quyền số, chủ quyền AI, buộc Việt Nam phải tự chủ công nghệ để không phụ thuộc vào nước ngoài.
Để xây dựng một mô hình ngôn ngữ lớn của riêng mình, thách thức lớn nhất của Việt Nam hiện nay là dữ liệu. PGS Tuấn thẳng thắn nhìn nhận: "Dữ liệu Việt Nam vừa ít mà vừa bị phân tán ở những chỗ khác nhau".
Hiện tại, việc xây dựng dữ liệu chủ yếu dựa vào các nhóm nghiên cứu tự thu thập từ Internet và lọc thủ công, chưa có các công ty chuyên biệt về xử lý dữ liệu quy mô lớn. Hơn nữa, Việt Nam cũng thiếu các bộ tiêu chuẩn đánh giá chuẩn mực để đo lường độ chính xác và an toàn của các mô hình ngôn ngữ trong bối cảnh văn hóa trong nước.
Trước thực trạng này, PGS Tuấn kiến nghị Chính phủ cần đóng vai trò "nhạc trưởng", thiết lập các trung tâm dữ liệu quốc gia để quy tụ nguồn dữ liệu từ các bộ ngành (y tế, luật pháp, giáo dục...), giúp tránh lãng phí nguồn lực và đảm bảo tính thống nhất. Ông cũng đề xuất cần có cơ quan thống nhất để xác nhận các danh sách dữ liệu “sạch”, tạo tiền đề cho các nhà phát triển sau này sử dụng an toàn.
Chiến lược "mã nguồn mở" và khát vọng cống hiến
Dù thách thức là rất lớn, nhưng niềm tin và quyết tâm của vị Phó Giáo sư từ Đại học Công nghệ Nanyang (NTU Singapore) là vô cùng mạnh mẽ. Sau 17 năm học tập và làm việc tại nước ngoài, PGS Tuấn quyết định nhận lời mời từ Giáo sư Dương Nguyên Vũ để trở về làm Giám đốc điều hành Trung tâm nghiên cứu AI tại VinUniversity.
Chia sẻ về lý do trở về, ông cho biết: "Thật ra người Việt Nam ở nước ngoài như tôi lúc nào cũng mong muốn quay về phục vụ đất nước". Ông coi đây là cơ hội để kết nối nguồn tri thức quốc tế về đào tạo nhân tài trong nước. Hiện tại, với cơ chế hợp tác linh hoạt giữa NTU Singapore và VinUniversity, ông đang nỗ lực xây dựng cầu nối đưa sinh viên Việt Nam ra nước ngoài tu nghiệp và ngược lại.
Chiến lược mà PGS Tuấn theo đuổi không phải là tạo ra một mô hình đóng kín, mà là mã nguồn mở.
"Việt Nam nên tập trung vào những mô hình mã nguồn mở để các công ty nhỏ, cộng đồng có thể kế thừa phát triển, tạo hệ sinh thái AI mạnh" - ông Tuấn nhận định.
Ông cũng đặt trọng tâm vào việc xây dựng "AI tin cậy" dựa trên 5 trụ cột: An toàn, Trách nhiệm, Riêng tư, Công bằng và Minh bạch.
“Lợi thế của Việt Nam là quốc gia đi sau, không bị vướng bận bởi các hệ thống dữ liệu cũ chứa nhiều tin giả, nên có thể thiết lập nền tảng đạo đức ngay từ đầu” - PGS Lưu Anh Tuấn cho biết.
Hành trình xây dựng một mô hình ngôn ngữ lớn "Make in Vietnam" không chỉ đơn thuần là cuộc đua về công nghệ, mà theo PGS Lưu Anh Tuấn, đó còn là câu chuyện về chủ quyền văn hóa và tri thức. Thay vì tiếp tục phụ thuộc vào những "hộp đen" đắt đỏ và thiếu thấu hiểu văn hóa của nước ngoài, Việt Nam đang đứng trước cơ hội vàng để xây dựng một hệ sinh thái AI tin cậy, minh bạch và mã nguồn mở. Với lợi thế của "người đi sau", cho phép thiết lập các chuẩn mực đạo đức ngay từ đầu, cùng sự chung tay của Chính phủ, PGS Tuấn tin tưởng rằng khát vọng đưa Việt Nam chuyển mình từ quốc gia "sử dụng AI" vươn lên thành "người kiến tạo AI" và dẫn đầu khu vực vào năm 2030 là hoàn toàn khả thi.
End of content
Không có tin nào tiếp theo




