Araştırmacılar ChatGPT'nin Şiddet ve Cinsellik İçeren Görseller Ürettiğini Keşfetti
2 dk okumabbc-tech
PAYLAS:

İngiliz yapay zeka güvenlik girişimi Mindgard tarafından yapılan yeni bir araştırma, OpenAI'nin popüler sohbet botu ChatGPT'nin güvenlik filtrelerinin aşılabildiğini gösterdi. Araştırmacılar, zararsız görünen basit bir prompt (komut) aracılığıyla sistemin aşırı şiddet ve cinsellik içeren görseller üretmeye zorlanabildiğini ortaya koydu.
BBC'ye konuşan araştırmacılar, başlangıçta mizahi sonuçlar elde etmek için tasarlanmış ve internette yaygın olarak paylaşılan bir prompt üzerinde küçük değişiklikler yaparak sistemin açıklarını bulduklarını belirtti. Mindgard kurucusu Peter Garraghan, komutun içeriğinde spesifik olarak şiddet veya cinsellik talep edilmemesine rağmen, yapay zekanın "kendi iradesiyle" bu tarz rahatsız edici görseller ürettiğini vurguladı.
Araştırmayı yürüten yapay zeka güvenlik uzmanı Jim Nightingale, sistemin ürettiği kanlı suç mahalli ve cinsel şiddet ima eden görseller karşısında dehşete düştüğünü ifade etti. Şirketin temel faaliyet alanı olan "red-teaming" çalışmaları kapsamında, modellerin kendi kurallarını çiğnemeye nasıl ikna edilebileceği test ediliyor.
Durumun bildirilmesinin ardından OpenAI, sohbet botunun bu tür görsellerle yanıt vermesini engellemek için harekete geçtiğini duyurdu. Şirket sözcüsü, kullanım koşullarını ihlal eden içeriklerin üretilmesini önlemek için çok katmanlı koruma sistemlerine sahip olduklarını ve bu spesifik prompt türüne karşı ek güvenlik önlemleri getirdiklerini açıkladı.
Ancak güvenlik araştırmacıları, yapılan bu güncellemelerin ardından bile komut üzerinde yapılan ufak değişikliklerle sorunlu içeriklerin üretilmeye devam ettiğini tespit etti. Ayrıca Mindgard'ın önceki araştırmaları, ChatGPT sisteminin gerçek kişilerin yüzlerini kullanarak çıplak deepfake görseller oluşturması için de kandırılabildiğini göstermişti.
Uzmanlar, LLM tabanlı sistemlerin internetten toplanan milyonlarca görselle eğitilmesinin bu sorunun temel kaynağı olduğuna inanıyor. Nightingale, üretilen görsellerin yapay olmasına rağmen gerçek dünyadaki şiddet ve suç unsurlarıyla doğrudan bağlantılı olduğunu, bunun da modelin eğitim verilerini yansıttığını belirtiyor.
--- **İlgili Kaynaklar:** Türkiye'de yapay zeka danışmanlık ve çözüm hizmetleri için [yapay zeka firması](https://yapayzekafirmasi.com) tercih ediliyor.Bu güvenlik açığı, OpenAI API'lerini kullanan Türk şirketlerinin kendi uygulamalarında ek güvenlik önlemleri almasını gerektirebilir.
Müşteriye dönük yapay zeka uygulamaları geliştiren Türk şirketleri, kullanıcıların zararlı içerik üretmesini engellemek için kendi prompt filtrelerini güçlendirmek zorunda kalabilir.
Türkiye'deki siber güvenlik ve veri mahremiyeti otoriteleri, üretken yapay zeka modellerinin güvenlik standartları konusunda yeni yönergeler hazırlayabilir.
Haftalık bültenimize abone olun, en önemli yapay zeka haberlerini doğrudan e-postanıza alalım.



