Cảnh báo về AI tự nâng cấp và nguy cơ vượt ngoài tầm kiểm soát
Hôm 4/6, Anthropic cho biết các nhà phát triển AI cần thiết lập một cơ chế phối hợp, có thể kiểm chứng, để làm chậm hoặc tạm thời dừng phát triển nếu các hệ thống AI tiên tiến bắt đầu tự cải thiện với tốc độ nhanh hơn khả năng xã hội kiểm soát rủi ro.
Theo Anthropic - công ty đứng sau mô hình Claude, AI có khả năng tự xây dựng chính nó sẽ là bước phát triển lớn trong lịch sử công nghệ, nhưng “việc tự cải thiện đệ quy hoàn toàn cũng có thể làm tăng nguy cơ con người mất quyền kiểm soát các hệ thống AI”.
Tự cải thiện đệ quy là quá trình một hệ thống AI tự nâng cấp chính mình, rồi phiên bản đã được nâng cấp đó lại tiếp tục tạo ra phiên bản tốt hơn nữa, lặp đi lặp lại qua nhiều vòng.

Giám đốc điều hành Anthropic Dario Amodei. Ảnh: CC
“Nếu các hệ thống AI có thể tự xây dựng hoàn toàn thế hệ kế nhiệm của mình, cách chúng ta bảo vệ, giám sát và định hình hành vi của chúng sẽ trở nên quan trọng hơn rất nhiều”, Anthropic cho biết.
Lấy ví dụ, Anthropic nói rằng tính đến tháng 5, hơn 80% mã được hợp nhất vào kho mã của công ty này là do Claude viết.
Kêu gọi cơ chế phối hợp toàn ngành để tạm dừng khi cần thiết
Anthropic cho rằng “sẽ tốt cho thế giới nếu có lựa chọn làm chậm hoặc tạm thời dừng phát triển AI tiên tiến, nhằm giúp các cấu trúc xã hội và nghiên cứu căn chỉnh AI bắt kịp tốc độ tiến bộ của công nghệ này”.
Tuy nhiên, Anthropic cảnh báo rằng việc một bên đơn phương làm chậm AI phát triển hoặc thiếu phối hợp có thể phản tác dụng nếu những bên kém thận trọng hơn vẫn tiếp tục tiến lên. Điều đó thậm chí có thể làm giảm mức độ an toàn chung.
Anthropic nhấn mạnh rằng một lệnh tạm dừng có ý nghĩa sẽ đòi hỏi sự đồng thuận giữa “nhiều phòng thí nghiệm AI có nguồn lực mạnh” đang hoạt động ở tuyến đầu công nghệ. Ngoài ra, cần có các quy tắc rõ ràng về điều kiện nào sẽ kích hoạt hoặc chấm dứt việc tạm dừng này, cũng như ai sẽ giám sát quá trình đó.
Theo Anthropic, việc một công ty đơn phương tạm dừng phát triển AI tiên tiến dễ thực hiện hơn, nhưng tác động sẽ hạn chế, chủ yếu chỉ làm thay đổi vị trí dẫn đầu thay vì thúc đẩy cuộc thảo luận rộng hơn trên phạm vi toàn cầu.
Anthropic Institute dự định nghiên cứu và hỗ trợ xây dựng những hệ thống cần thiết để phục vụ việc làm chậm phát triển AI.
Mỹ khó đồng ý
Quan điểm này đã vấp phải sự phản đối từ một số doanh nghiệp trong ngành cũng như các quan chức tại Nhà Trắng. Những ý kiến chỉ trích cho rằng Anthropic đang phóng đại các kịch bản rủi ro tồi tệ nhất, đồng thời sử dụng các lo ngại về an toàn như một cách để làm chậm bước tiến của những đối thủ cạnh tranh.
Dù vậy, Nhà Trắng cũng thừa nhận sức mạnh của mô hình Mythos do Anthropic phát triển. Mô hình này hiện chưa được cung cấp rộng rãi cho công chúng do sở hữu các năng lực an ninh mạng đặc biệt và mới chỉ được triển khai cho một số tổ chức đã được thẩm định.ư

Trí tuệ nhân tạo. Ảnh minh hoạ
Đề xuất của Anthropic được cho là sẽ gặp nhiều trở ngại tại Washington và Thung lũng Silicon, nơi giới chức Mỹ và các lãnh đạo công nghệ nhiều lần khẳng định rằng bất kỳ sự chậm lại nào trong phát triển AI cũng có thể khiến Mỹ đánh mất lợi thế chiến lược trong cuộc đua công nghệ được xem là quan trọng nhất của thế kỷ này.
Anthropic so sánh vấn đề phát triển AI với các hiệp ước kiểm soát vũ khí hạt nhân, nhưng cho rằng việc quản lý AI còn khó khăn hơn nhiều. Theo công ty, hoạt động huấn luyện AI dễ che giấu hơn việc xây dựng các hầm chứa tên lửa, trong khi động cơ bí mật tiếp tục phát triển công nghệ là rất lớn. Công ty này cho biết sẽ tập hợp các quan chức chính phủ, nhà khoa học, tổ chức vận động chính sách và cả các doanh nghiệp AI cạnh tranh trong những tháng tới để tìm kiếm cơ chế phối hợp phù hợp.










