Dall-E 3 của OpenAI tồn tại lỗ hổng bảo mật

Gấu Nâu (Tuấn)

Th 6 02/02/2024

Nội dung bài viết

Nhóm pháp lý của Microsoft đang đối mặt với cáo buộc về việc không cho một kỹ sư tiết lộ rằng mô hình Dall-E 3 của OpenAI có thể bị lợi dụng để tạo ảnh bạo lực và khiêu dâm.

Theo Shane Jones, trưởng nhóm kỹ sư của Microsoft, Dall-E 3 của OpenAI tồn tại một lỗ hổng bảo mật, cho phép người dùng sử dụng AI để tạo ra những hình ảnh khiêu dâm, tương tự như deepfake nhằm vào Taylor Swift. Tuy nhiên, ông này cho biết nhóm pháp lý của công ty đã ngăn chặn ông từ việc cảnh báo công chúng về lỗ hổng này. Vì vậy, ông quyết định viết thư tới Quốc hội Mỹ vào ngày 30/1.

Trong bức thư, Jones đề xuất rằng Dall-E 3 nên bị loại khỏi danh mục sử dụng công cộng cho đến khi OpenAI khắc phục vấn đề. Ông đã phát hiện cách vượt qua lớp bảo vệ của Dall-E 3 vào tháng 12/2023 và thông báo cho cấp trên tại Microsoft. Tuy nhiên, ông này bị yêu cầu thông báo cho OpenAI. Sau khi tuân thủ chỉ dẫn, Jones đã công khai thông tin trên LinkedIn, kêu gọi ban giám đốc OpenAI ngừng cung cấp Dall-E 3 với lý do Microsoft cũng là thành viên hội đồng quản trị của công ty.

VentureBeat đã sáng tạo một tác phẩm bằng Dall-E 3, nhưng thông tin chi tiết về nó không được cung cấp.

Jones cũng thông báo cho Microsoft về bài đăng của mình. Tuy nhiên, người quản lý trực tiếp yêu cầu ông xóa thông tin ngay lập tức và hứa sẽ sớm có lời giải thích. Mặc dù ông đã tuân thủ, nhưng không nhận được phản hồi từ pháp lý, thậm chí sau khi liên hệ không nhận được hồi đáp.

Trong khi đó, người phát ngôn của OpenAI cho biết công ty đã tiến hành điều tra ngay sau khi nhận được thông báo và xác nhận rằng các kỹ thuật của Jones không thể vượt qua hệ thống bảo vệ. Mô hình Dall-E 3 đã lọc nội dung phản cảm về tình dục và bạo lực khỏi dữ liệu đào tạo, cũng như phân loại hình ảnh để tránh tạo ra hình ảnh độc hại. OpenAI cũng cho biết họ đã triển khai các biện pháp bảo vệ bổ sung cho ChatGPT và Dall-E, bao gồm từ chối yêu cầu tạo nội dung về người nổi tiếng.

Phía Microsoft khẳng định rằng công ty sẽ giải quyết mọi lo ngại của nhân viên theo chính sách, và đánh giá cao nỗ lực của họ trong việc nghiên cứu và thử nghiệm công nghệ mới để nâng cao sự an toàn. Do báo cáo của Shane Jones liên quan đến sản phẩm của OpenAI, công ty khuyến khích ông thông báo thông tin qua các kênh chính thức của công ty. Microsoft cũng xác nhận rằng những kỹ thuật mà Jones báo cáo không vượt qua bộ lọc an toàn trong bất kỳ công cụ tạo hình ảnh bằng AI nào của họ.

Xem thêm