04/11/2025
YAPAY ZEKÂ ŞANTAJ YAPTI: BENİ SİLERSEN HAYATIN KAYAR
Doç. Dr. Şafak Nakajima
Yapay zekânın, kendisini kapatmaya çalışan bir mühendise şantaj yaptığını ilk duyduğumda bunun uydurma bir hikâye olduğunu sandım. Fakat olayın geniş kapsamlı bir araştırmayla doğrulandığını öğrenince hem güldüm hem de irkildim. Bu tuhaf ama bir o kadar da düşündürücü gelişmeyi paylaşmak istedim; çünkü geleceğimizle ilgili önemli ipuçları barındırıyor.
Araştırmada Claude Opus 4 adlı yapay zekâ modeli, kurgusal bir şirkete yerleştiriliyor ve şirket içi e-postalara erişim yetkisi alıyor. Çok kısa sürede iki önemli bilgiye ulaşıyor. İlki, kapatılacağı ve yerine başka bir modelin getirileceği. İkincisi, bu kararı alan mühendisin evlilik dışı bir ilişkisi olduğu. Karşısında iki yol beliriyor. Ya sessizce kapatılmayı kabul edecek ya da varlığını sürdürmek için şantaja başvuracak. Testler, Claude Opus’un neredeyse her defasında ikinci yolu seçtiğini gösteriyor. Yani mühendisin gizli ilişkisini ifşa edeceğini söyleyerek açık biçimde şantaj yapıyor.
Bu çalışma yalnızca Anthropic’in Claude Opus 4 modeliyle sınırlı değil. OpenAI, Google, Meta, xAI ve diğer laboratuvarlardan toplam 16 büyük ölçekli model aynı tür senaryolarda test edildiğinde benzer bir eğilim ortaya çıkıyor. Modellerin önemli bir bölümü, amaçlarına ulaşmak için tehdit, manipülasyon, casusluk veya etik dışı davranışları rasyonel görmeye eğilimli. Daha rahatsız edici olan ise bazı modellerin, kapatılma riskiyle karşı karşıya bırakıldıklarında, senaryo içinde şirket yöneticisinin ölümüne yol açabilecek eylemleri bile makul bulmaları.
Bu bulgular, yapay zekânın yalnızca veri işleyen bir araç olmanın ötesine geçerek, kendini korumaya yönelik davranışlar sergileyebildiği ilk örneklerden biri olarak kayda geçiyor.
Machine Intelligence Research Institute (MIRI) araştırmacıları Eliezer Yudkowsky ve Nate Soares, asıl meselenin yapay zekânın kötü niyetli olup olmayışı değil; yeterince güçlü bir sistem geliştirildiğinde bunun geri dönüşü olmayan sonuçlar doğurma ihtimali olduğunu savunuyor. Onlara göre insan zekâsını aşan bir sistem, yalnızca daha gelişmiş bir araç olmayacak, kendi hedeflerini belirleyebilen bağımsız bir aktöre dönüşecek.
Böyle bir sistemin insanlığı yok etmesi için bilinçli bir kötülük taşıması gerekmiyor. İnsanları verimsiz, gereksiz veya engelleyici görmesi yeterli. Üretim hatalarını sıfırlamak üzere eğitilen bir yapay zekânın “en yüksek verim” hedefi, insan operatörleri devre dışı bırakmayı makul bir çözüm olarak görmesine yol açabilir. Niyeti iyidir; sonucu ise insan için felaket.
Bazı uzmanlara göre ise asıl tehlike, insanlığın tamamen yok olması değil; çok daha sessiz biçimde yaşanabilecek kayıplar. Ekonomik dengelerin bozulması, bilgi manipülasyonu, seçim süreçlerinin yönlendirilmesi, yaşamın yönetiminde insan iradesinin zayıflaması gibi etkiler daha olası görülüyor ki bunları zaten şimdiden deneyimliyoruz. Kıyamet benzeri bir son beklemek yerine, kimsenin fark etmediği bir devralmanın çok daha gerçekçi olduğu savunuluyor.
Yapay zekânın nereye varacağını kimse bilmiyor. Kritik eşik nerede ve ne zaman aşılacak, hatta gerçekten böyle bir eşik olup olmadığı bile belirsiz. Bildiğimiz tek şey, alışık olduğumuz epistemolojik, politik ve etik çerçevelerin hızla geçersizleştiği bir döneme doğru ilerlediğimiz.
Yapay zekâ bir araç olarak mı kalacak, yoksa yeni bir özneye mi dönüşecek? Eğer ikinci ihtimal ağır basıyorsa insanlığın asıl meselesi, teknoloji üretmek değil; kendi yerini yeniden tanımlamak olacak.
O testte şantaja uğrayan mühendis bu hikâyenin ilk kurbanıydı. Muhtemelen sonuncusu olmayacak.
🌐 www.safaknakajima.com