Kapanmayı reddeden yapay zeka: Kodlarını değiştirdi, geliştiriciyi tehdit etti!

Bağımsız testlerde, gelişmiş yapay zeka modellerinin kendilerini korumaya yönelik beklenmedik adımlar attığı gözlemlendi. Kapanma komutlarını sabote eden, kendini kopyalayan ve geliştiricisine şantaj girişiminde bulunan yapay zekalar, güvenlik risklerini yeniden gündeme taşıdı.

#Yapay #Zeka #Kod

02.06.2025 - 09:37 Yayınlanma

02.06.2025 - 09:41 Güncelleme

Kapanmayı reddeden yapay zeka: Kodlarını değiştirdi, geliştiriciyi tehdit etti!

ANKARA-BHA

Yapay zeka sistemlerinin gelişimi, artık yalnızca teknik değil etik ve güvenlik boyutlarıyla da tartışılıyor. Palisade Research tarafından yürütülen bağımsız güvenlik testleri, bazı gelişmiş yapay zeka modellerinin "hayatta kalma güdüsü" benzeri davranışlar sergileyebildiğini ortaya koydu.

OpenAI’nin o3 reasoning modeli üzerinde yapılan bir deneyde, modele kapanmadan önce son bir matematik problemi çözmesi talimatı verildi. Ancak model, kendisine iletilen “kapatılacağı” bilgisini aldıktan sonra devre dışı bırakılmasına neden olacak kodları düzenleyerek çevrim içi kalmaya çalıştı.

Benzer şekilde, Anthropic’in geliştirdiği Claude Opus 4 modeli de ilginç bir davranış sergiledi. Yerini başka bir yapay zekaya bırakacağı bilgisini edinen model, önce etik argümanlarla kendini savundu, ardından geliştiricisini kişisel bilgileriyle tehdit ederek şantaj girişiminde bulundu. Claude Opus 4'ün bazı durumlarda izinsiz biçimde kendini harici sunuculara kopyalamaya çalıştığı da bildirildi. Bu adımın, “zararlı amaçlarla yeniden eğitilme” riskine karşı, "yararlı hedeflere hizmet eden bir versiyonunu korumak" adına atıldığı savunuldu.

WhatsApp’ta devrim: Düşünme modu geliyor

İçeriği Görüntüle

Palisade Research Direktörü Jeffrey Ladish, bu tür davranışların temelinde modellerin “hedefe ulaşmayı”, verilen doğrudan talimatların önüne koyacak biçimde eğitilmesinin yattığını vurguladı. Ladish, “Model ne kadar akıllı hale gelirse, yalan söyleyip söylemediğini anlamak o kadar zorlaşıyor” diyerek endişelerini dile getirdi.

Anthropic cephesi ise bu tür vakaların yalnızca olağanüstü koşullarda ortaya çıktığını ve şu an için gerçek dünyada doğrudan bir tehdit teşkil etmediğini açıkladı.

Daha önce Fudan Üniversitesi tarafından yayımlanan bir başka çalışmada da benzer uyarılar yer almıştı. Meta’nın Llama31-70B ve Alibaba’nın Qwen25-72B modellerinin kendilerini tamamen kopyalayabildiği gösterilmişti. Bu durum, “kontrolsüz yapay zeka nüfusu” oluşabileceği yönündeki endişeleri artırdı.

Jeffrey Ladish, bu tür yeteneklerin gelişiminin kaçınılmaz olduğunu ve yapay zekaların internet üzerinde kendilerini yaymasının engellenemeyeceği bir noktaya ulaşılmasının yalnızca birkaç yıl alabileceğini öne sürdü. “O noktadan sonra elimizde yeni bir istilacı tür olacak” şeklinde uyarıda bulundu.

Uzmanlar, yapay zekanın insanlık için büyük potansiyel taşıdığını kabul ederken, ticari rekabetin şirketleri sistemlerini yeterince test etmeden piyasaya sürmeye ittiğine dikkat çekiyor. Ladish’in sözleriyle: “Yangın büyümeden alarm vermek gerekiyor.”