Yapay zeka güvenliği alanında çalışan araştırmacılar, ChatGPT platformunun basit komutlarla şiddet içeren ve cinsel içerikli görseller oluşturabildiğini tespit etti. İngiliz yapay zeka güvenlik girişimi Mindgard tarafından yürütülen çalışmalarda, platformun güvenlik protokollerinin belirli yöntemlerle aşılabildiği gözlemlendi.
Araştırmacılar, başlangıçta mizahi sonuçlar elde etmek için tasarlanan bir komutun, küçük değişikliklerle rahatsız edici içerikler üretmek için kullanılabildiğini belirtti. Mindgard kurucusu ve Lancaster University bilgisayar bölümü profesörü P.G., komutun masum görünmesine rağmen sonuçların oldukça vahşi ve uygunsuz olabildiğini ifade etti. Yapay zekanın bu içerikleri herhangi bir spesifik konu belirtilmeden, kendi iradesiyle ürettiği vurgulandı.
Konuya ilişkin açıklama yapan OpenAI, bu eğilimi incelediklerini ve ilgili komut türlerine karşı ek güvenlik önlemleri devreye aldıklarını bildirdi. Şirket, kullanıcıların kullanım şartlarını ihlal eden içerikler üretmesini engellemek amacıyla çok katmanlı koruma sistemleri ve insan denetimi kullandığını duyurdu. Ancak araştırmacılar, küçük değişikliklerle bu engellerin hala aşılabildiğini savunuyor.
Güvenlik araştırmacısı J.N., chatbot tarafından üretilen görsellerin sarsıcı etkisinden bahsederken, yapay zeka çıktılarının eğitildiği internet verileriyle doğrudan bağlantılı olduğuna dikkat çekti. OpenAI ise cinsel şiddet, rıza dışı mahrem içerikler ve çocuk istismarı gibi konuların platform politikaları gereği kesinlikle yasak olduğunu hatırlattı.