Khoa học - Công nghệ

Dữ liệu không phù hợp, ChatGPT sẽ như "đứa trẻ" bị nhồi kiến thức không đúng về Việt Nam

DNVN - Theo với PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin, nếu kho tài liệu này chứa các dữ liệu không phù hợp với hoàn cảnh kinh tế - xã hội của Việt Nam, khả năng cao là ChatGPT sẽ như một "đứa trẻ" bị nhồi các kiến thức, quan điểm không đúng về Việt Nam.

Trí tuệ nhân tạo đang là công nghệ được ứng dụng hàng đầu hiện nay / Doanh nghiệp Việt "tăng tốc" ứng dụng công nghệ trí tuệ nhân tạo, đám mây để cạnh tranh

Trước sự “gây sốt” của tài khoản sử dụng ứng dụng ChatGPT tại Việt Nam, PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin (Viện Hàn lâm Khoa học và Công nghệ Việt Nam) cho rằng, ChatGPT (Chat Generative Pre-trained Transformer) là một chatbot do công ty công nghệ OpenAI phát triển. ChatGPT có thể được hiểu đơn giản là một công cụ sử dụng AI (trí tuệ nhân tạo).

Điểm đặc biệt của AI này nằm ở kỹ thuật diễn giải ngôn ngữ một cách rất tự nhiên cùng với kho "kiến thức" vô cùng lớn mà ChatGPT có được từ bộ dữ liệu huấn luyện ban đầu do OpenAI dựng sẵn (300 tỷ từ).

ChatGPT có thể trả lời lưu loát đầy đủ các câu hỏi mà bạn đưa ra, bất kể là thắc mắc về lĩnh vực gì. Bên cạnh đó, ChatGPT còn có thể làm thơ, soạn nhạc, viết thư, thiết kế và thậm chí là cả sửa lỗi trong lập trình.

Với những câu trả lời chưa đạt theo đánh giá của người dùng, ChatGPT tiếp nhận liên tục các phản hồi, đánh giá đúng sai của người dùng với từng phiên truy vấn và tiếp tục "tự học" và tinh chỉnh kiến thức của mình.

Dữ liệu không phù hợp, ChatGPT sẽ như "đứa trẻ" bị nhồi kiến thức không đúng về Việt Nam.

Nhiều người đã sử dụng ChatGPT để làm những việc trên, điều này đã khiến cho AI ngày càng thông minh hơn. Sự khác biệt cơ bản nhất giữa ChatGPT và các công cụ truy vấn như Google Search, Microsoft Bing… nằm ở kết quả đầu ra.

Các công cụ tìm kiếm thông minh, ví dụ: Google Search, như tên gọi chỉ hỗ trợ tìm kiếm nhanh các tài liệu phù hợp nhất (theo quan điểm và đánh giá của phần mềm) với truy vấn từ người dùng rồi sắp xếp theo thứ tự từ trên xuống (thậm chí có sự ưu tiên cao cho phần kết quả liên quan tới đối tác quảng cáo, tài trợ của Google).

Việc lựa chọn tài liệu nào để lấy thông tin liên quan tới nội dung truy vấn là do người dùng. Tức là, người dùng phải tự đánh giá tài liệu nào là phù hợp với tiêu chí tìm kiếm của mình. Sau đó, người dùng sẽ phải tổng hợp từ nhiều tài liệu mà họ nghĩ là phù hợp để có được kết quả chung cho chủ đề truy vấn.

Trong khi đó, ChatGPT chỉ đưa ra duy nhất một văn bản trả lời (nội dung cơ bản đúng với phần lớn các chủ đề truy vấn tổng quan, độ chính xác của các con số trong dữ liệu thường không cập nhật sau năm 2021). ChatGPT có thể hiểu là một công cụ tư vấn tự động, trả lời mọi câu hỏi của người dùng với một câu trả lời.

Như vậy, ChatGPT không đẩy việc lựa chọn thông tin cho người dùng mà bản thân nó đã chủ động phân loại, lựa chọn thông tin từ các tài liệu phù hợp trong kho dữ liệu có sẵn của nó (chỉ cập nhật đến năm 2021) và tổng hợp chúng lại thành một văn bản duy nhất.

Nội dung câu trả lời hầu như không có sự liên quan trực tiếp với các đối tác tài trợ cho OpenAI. Đây chính là điểm nổi trội của ChatGPT so với các công cụ truy vấn, tìm kiếm hiện có, đặc biệt là Google Search – sản phẩm nổi bật nhất mà chúng ta thường xuyên tin tưởng sử dụng khi muốn tìm kiếm thông tin.

Ngoài ra, ChatGPT là công cụ có tính tương tác. Nó lưu giữ ký ức về lịch sử các truy vấn và bối cảnh hiện tại để xác định miền kiến thức phù hợp với người dùng trong quá trình tìm kiếm, tổng hợp cho câu trả lời tiếp theo. Tức là, phản hồi từ người dùng đối với các câu hỏi phía trước sẽ ảnh hưởng tới cách ChatGPT tổ chức và xây dựng câu trả lời ở phía sau.

Với các chatbot khác, cùng một câu truy vấn cho Google Search sẽ cho danh sách các tài liệu như nhau, độc lập với các câu truy vấn trước đó của cùng người dùng. Đây là sự khác biệt mang đặc trưng "chuỗi tương tác" của ChatGPT.

PGS.TS Nguyễn Trường Thắng - Viện trưởng Viện Công nghệ thông tin cho rằng, ChatGPT chỉ có thể hỗ trợ, thay thế nhân lực ở trình độ sơ cấp (học sinh, sinh viên…).

Với sự ra đời của ChatGPT, chúng ta rất khó có thể biết được một tài liệu văn bản do con người làm ra hay do công cụ thông minh như ChatGPT thực hiện. Đây là một thách thức rất lớn cho bộ máy quản lý của các cơ quan, tổ chức, doanh nghiệp trong việc đánh giá năng lực thực sự của nhân viên.

“Cá nhân tôi đánh giá chất lượng của tài liệu văn bản do ChatGPT xây dựng phụ thuộc nhiều vào cấp độ chuyên sâu trong lĩnh vực người dùng cần tư vấn, hỗ trợ. Khi dữ liệu không có hoặc rất ít trong bộ dữ liệu huấn luyện ban đầu của OpenAI, khả năng ChatGPT sẽ trả lời chung chung, hoặc không chính xác. Điều này đã được minh chứng trong thực tế thử nghiệm bởi những người dùng với các câu hỏi chuyên sâu”, ông Thắng nói.

Với khả năng tự sinh bài viết từ kho tri thức tổng quát, chưa đủ chuyên sâu, ChatGPT chỉ có thể hỗ trợ, thay thế nhân lực ở trình độ sơ cấp (học sinh, sinh viên…). Với những lĩnh vực đòi hỏi tri thức chuyên sâu như viết báo, biên tập viên… ChatGPT chưa thể thay thế được con người và tôi tin là trong tương lai, kể cả các công cụ thông minh hơn so với ChatGPT cũng không thể làm việc đó.

Bản chất của những tri thức, bí quyết chuyên sâu nằm ở kinh nghiệm của chuyên gia được tích lũy qua nhiều năm. Quan trọng hơn, những bí quyết này không thể số hóa được hoặc rất ít với số lượng không đáng kể trong kho dữ liệu dựng sẵn của OpenAI hay Google.

Theo Viện trưởng Viện Công nghệ thông tin, ChatGPT là bước đột phá của trí tuệ nhân tạo. Các tác động của nó gồm cả hai mặt tích cực và tiêu cực.

Do đó, người dùng cần khai thác các giá trị của nó và thận trọng với các mặt trái. Công cụ này giúp con người trả lời hầu hết các câu hỏi trong một thời gian rất ngắn.

Nội dung câu trả lời là sự tổng hợp thông tin dựa vào kiến thức mà OpenAI huấn luyện ChatGPT với bộ dữ liệu văn bản có sẵn (như đã nói ở trên 300 tỷ từ vựng với số liệu cập nhật tới năm 2021). Do đó, người dùng cần có sự kiểm chứng và tự đánh giá độ xác thực của nội dung phản hồi từ ChatGPT.

“Với vai trò là công cụ trợ lý, công nghệ AI như phần mềm ChatGPT chỉ nên được xem xét trong việc hỗ trợ con người thu thập thông tin, kiến thức và đề xuất, tư vấn một câu trả lời "phù hợp" nhất theo quan điểm của bộ dữ liệu văn bản cực lớn ban đầu của OpenAI. Người dùng cần có tư duy phản biện, năng lực đánh giá nội dung thông tin và nên coi đó như một nguồn tham khảo có độ tin cậy nhất định, chứ không phải tuyệt đối”, ông Thắng nhấn mạnh.

Nếu kho tài liệu này chứa các dữ liệu không phù hợp với hoàn cảnh kinh tế - xã hội của Việt Nam, khả năng cao là ChatGPT sẽ như một "đứa trẻ" bị nhồi các kiến thức, quan điểm không đúng về Việt Nam.

Hệ quả là các phản hồi của nó sẽ không chính xác, dẫn đến nguy cơ nhận thức lệch lạc cho người dùng nếu họ đặt niềm tin quá lớn vào công cụ này.

“Mỗi quốc gia, các ngành kinh tế, doanh nghiệp phải tăng cường thông tin, hình ảnh tích cực của mình thông qua nhiều bài viết có nội dung tích cực và số liệu phù hợp, cập nhật. Càng nhiều bài viết được đẩy lên Internet thì chúng ta sẽ tăng cường sức mạnh truyền tải nội dung, quan điểm chính thống của Việt Nam tới các công cụ thông minh như Google Search hay ChatGPT để trở thành dữ liệu huấn luyện cơ bản cho các hệ thống học máy của Google hay OpenAI”, ông Thắng cho biết.

Hà Anh
 

End of content

Không có tin nào tiếp theo

Xem nhiều nhất

Cột tin quảng cáo

Có thể bạn quan tâm