Khoa học - Công nghệ

Meta AI gặp lỗ hổng, giới công nghệ nhìn lại ranh giới kiểm soát AI

DNVN - Một sự cố liên quan đến chatbot Meta AI đã làm dấy lên những tranh luận mới về độ an toàn của các hệ thống trí tuệ nhân tạo. Vụ việc cho thấy các mô hình AI không chỉ đối mặt với rủi ro kỹ thuật mà còn có thể trở thành mục tiêu của những hình thức thao túng dựa trên ngôn ngữ và ngữ cảnh.

Doanh nghiệp nông nghiệp công nghệ cao tìm động lực tăng trưởng từ chuyển đổi số / Doanh nghiệp Việt mang robot hình người đến ICRA 2026

Khi AI trở thành mục tiêu của các cuộc tấn công mới

Sự phát triển nhanh chóng của trí tuệ nhân tạo đang tạo ra những thay đổi sâu rộng trong lĩnh vực công nghệ và an ninh mạng. Trong khi AI được sử dụng để hỗ trợ phát hiện, ngăn chặn những mối đe dọa ngày càng hiệu quả hơn, chính các hệ thống này cũng đang trở thành mục tiêu của những phương thức tấn công mới.

TSự cố Meta AI và bài toán niềm tin đối với trí tuệ nhân tạo.

Mới đây, Meta đã khắc phục một lỗ hổng bảo mật liên quan đến chatbot Meta AI. Theo thông tin được công bố, lỗ hổng này có thể bị khai thác thông qua kỹ thuật prompt injection, một hình thức sử dụng các câu lệnh được thiết kế đặc biệt nhằm khiến hệ thống AI bỏ qua hoặc thay đổi những quy tắc hoạt động vốn có.

Khác với các cuộc tấn công truyền thống tập trung vào việc khai thác lỗi phần mềm hay hạ tầng kỹ thuật, prompt injection tác động trực tiếp đến cách AI diễn giải và phản hồi thông tin. Về bản chất, đây là phương thức khiến hệ thống thực hiện những hành động nằm ngoài mục đích ban đầu mà nhà phát triển đặt ra.

Trong vụ việc liên quan đến Meta AI, các đối tượng khai thác được cho là đã tìm cách thao túng chatbot để hỗ trợ quá trình đặt lại mật khẩu của một số tài khoản Instagram mà không cần trải qua các bước xác thực thông thường. Quá trình này được thực hiện thông qua chuỗi tương tác với trợ lý AI kết hợp các biện pháp che giấu vị trí truy cập.

Bình luận về sự cố, ông T.J. Marlin, CEO Guardrail Technologies, nhận định: “Tác nhân AI được trao quyền như con người nhưng lại không có khả năng phán đoán như con người. Nó đã đặt lại mật khẩu cho một người lạ đơn giản vì không có gì ngăn cản nó. Về bản chất, nó chỉ làm đúng những gì nó được yêu cầu. Vấn đề nằm ở chỗ con người đã giao cho AI một hành động có mức độ rủi ro cao mà không có bước xác minh, rồi lại coi đó là an toàn. Thực tế, không có gì bị hack theo nghĩa truyền thống cả, mà AI đã bị thuyết phục. Và đó chính là khoảng trống mà nhiều công ty vẫn chưa thực sự nhận ra.”

Bài toán kiểm soát khi AI ngày càng giống con người hơn

Sự cố của Meta AI một lần nữa đặt ra câu hỏi về mức độ tin cậy của các hệ thống trí tuệ nhân tạo khi chúng được trao quyền xử lý những tác vụ ngày càng quan trọng.

 

Trong nhiều năm qua, các hình thức lừa đảo dựa trên kỹ nghệ xã hội thường khai thác tâm lý và cách con người tiếp nhận thông tin. Điều đáng chú ý là những nguyên tắc tương tự đang được áp dụng đối với các mô hình ngôn ngữ hiện đại. Thay vì tấn công vào mã nguồn hay hạ tầng kỹ thuật, kẻ xấu tìm cách tác động vào chính quá trình xử lý ngôn ngữ của AI.

Điều này không đồng nghĩa với việc AI có cảm xúc hoặc suy nghĩ như con người. Tuy nhiên, các mô hình ngôn ngữ vẫn có thể bị ảnh hưởng bởi ngữ cảnh, cách diễn đạt và cấu trúc thông tin đầu vào. Đây chính là đặc điểm khiến các hệ thống AI cần được thiết kế thêm nhiều lớp kiểm soát và xác thực khi tham gia vào những tác vụ có mức độ rủi ro cao.

Ở góc độ dài hạn, mục tiêu của ngành công nghệ vẫn là phát triển các hệ thống trí tuệ nhân tạo có khả năng thực hiện nhiều nhiệm vụ phức tạp với mức độ tự chủ ngày càng cao. Tuy nhiên, cùng với sự gia tăng về năng lực là yêu cầu ngày càng lớn về tính minh bạch, khả năng kiểm soát và cơ chế bảo vệ an toàn.

Sự cố Meta AI cho thấy thách thức của trí tuệ nhân tạo không chỉ nằm ở việc làm cho hệ thống thông minh hơn, mà còn ở việc bảo đảm những hệ thống đó vận hành đúng giới hạn, đặc biệt khi ranh giới giữa công cụ hỗ trợ và tác nhân có khả năng ra quyết định ngày càng trở nên khó phân định.

Nguyên Bách
 

End of content

Không có tin nào tiếp theo

Cột tin quảng cáo

Có thể bạn quan tâm