Yapay Zeka Neden Saat Okuyup Takvim Hesaplamakta Başarısız?

Yapay zekalar kod yazıyor, şiir yazıyor, fotoğraf çiziyor ancak klasik bir duvar saatine bakınca ne saat olduğunu anlayamıyorlar. Bunu fark ettiğinizde insan beyninin ne kadar etkileyici çalıştığını daha güzel kavrıyorsunuz. Zira beşerler küçük yaşlarda bu hünerleri edinirken, yapay zeka hala çırak düzeyinde. Takvim yapraklarında gün bulmak ya da saatin kaç olduğunu söylemek, bizim için gündelik ancak onlar için hala karmaşık bir iş. Yeni araştırmalar da bu şaşırtan zayıflığı net halde ortaya koydu.
Kaynak 1, Kaynak 2
En zeki yapay zekalar bile saat ve tarih işlerinde neden bu kadar başarısız?

2025 Milletlerarası Öğrenme Temsilleri Konferansı’nda sunulan araştırmaya nazaran, GPT-4o, Gemini 2.0, Claude 3.5 Sonnet ve LLaMA 3.2 Vision üzere en gelişmiş yapay zekalar, analog saatleri gerçek okuma konusunda epey berbat performans gösterdi.
Araştırmacılar, bu sistemlere çeşitli saat görselleri ve takvim örnekleri sundu. Sonuçlar şaşırtıcıydı; yapay zekalar, saatleri sırf %38.7 oranında hakikat okuyabildi. Takvim hesaplamalarında ise bu oran %26.3’e kadar düştü.
Saat okumak, yapay zekalar için neden bu kadar karmaşık?

Edinburgh Üniversitesi’nden araştırmacı Rohit Saxena’ya nazaran sorun aslında çok temel bir bilişsel farktan kaynaklanıyor. Beşerler saat okurken açıları hesaplar, akrep ve yelkovanı ayırt eder, birtakım durumlarda Romen sayılarını yorumlar.
Yani işin içinde uzamsal düşünme, bağlamsal yorum ve matematiksel muhakeme var. Lakin yapay zekalar çoğunlukla örüntü tanıma üzerine çalışıyor. Onlar için ‘bu bir saat’ demek kolay fakat ‘saat kaç?’ sorusunu cevaplamak başka bir marifet gerektiriyor.
Takvim hesaplamaları neden sorun yaratıyor?

153. gün haftanın hangi gününe denk geliyor üzere sorular, temel matematik üzere görünse de yapay zekalar için o denli değil. Zira büyük lisan modelleri, tıpkı saat okumada olduğu üzere matematiksel süreçlerle değil, evvelki örneklerden varsayım yürüterek yanıt veriyor.
Bu nedenle verilen bir tarihi hakikat güne denk getirmede sık sık yanılgıya düşüyorlar. Araştırmacılar, hatta artık çok temel bahisler üzere görünen artık yıllar ya da büyük yıllık takvim formatlarında bile yüksek kusur oranları gözlemlediklerini belirtiyor.
Saat kurmak, randevu planlamak yahut hatırlatma ayarlamak üzere gündelik işler, vakit kavramını gerçek anlamayı gerektiriyor. Şayet bu alanda hala önemli zaafları varsa günlük hayatta meselesiz çalışmaları mümkün değil. Saxena, eksikliği gidermek için yapay zekaların daha fazla örnekle eğitilmesi ve uzamsal-akıl yürütme yetilerinin geliştirilmesi gerektiğini vurguluyor.