Yapay zeka modellerinin zaman yönetimi konusundaki eksiklikleri yeni bir araştırmayla ortaya çıktı. Edinburgh Üniversitesi’nde yapılan çalışmaya göre, büyük dil modelleri (LLM) analog saatleri okuma ve takvim verilerini anlama konusunda beklenenden düşük performans sergiliyor.
Araştırma, yapay zekanın zamanla ilgili temel görevlerde bile hatalar yaptığını ve bu durumun zaman bazlı otomasyon ve etkinlik planlaması gibi alanlarda sorun yaratabileceğini gösteriyor.
Hangi Yapay Zeka Modelleri Test Edildi?
Araştırmada farklı medya türlerini yorumlayabilen ve üretebilen yedi büyük dil modeli (LLM) test edildi:
- OpenAI GPT-4o ve GPT-o1,
- Google DeepMind Gemini 2.0,
- Anthropic Claude 3.5 Sonnet,
- Meta Llama 3.2-11B-Vision-Instruct,
- Alibaba Qwen2-VL7B-Instruct,
- ModelBest MiniCPM-V-2.6.
Bu modellerin, analog saatleri okuma ve takvim hesaplamalarını doğru yapma becerileri incelendi.
Roma Rakamlı Saatlerde Büyük Hatalar
Yapay zeka modellerinin analog saatleri doğru okuma oranı %25’in altında kaldı. Özellikle şu durumlarda hata yaptıkları görüldü:
- Roma rakamları içeren saatleri okuyamama,
- Saniye ibresi olmayan saatlerde açısal hesaplamalarda hata yapma,
- Saat ibresi ve kadran üzerindeki konumları yanlış yorumlama.
Özellikle Google’ın Gemini 2.0 modeli saat okuma testlerinde en yüksek başarıyı elde etti, ancak genel performans hala düşük kaldı.
Takvim Hesaplamalarında En İyi Sonuç: GPT-o1
Takvim verileriyle ilgili testlerde, GPT-o1 modeli %80 doğruluk oranına ulaşarak en iyi sonucu verdi. Ancak en başarılı model bile %20 hata oranına sahipti, bu da yapay zekanın zamansal hesaplamalarda hala eksiklikler gösterdiğini ortaya koydu.
“Basit Görevlerde Bile Zorlanıyor”
Edinburgh Üniversitesi Bilişim Okulu’nda doktora öğrencisi ve araştırmanın ortak yazarı Rohit Saxena, yapay zekanın insanlar kadar zaman konusunda temel becerilere sahip olmadığını belirtti:
“Çoğu insan zamanı kolayca söyleyebilir ve küçük yaşlardan itibaren takvim kullanabilir. Bulgularımız, yapay zekanın bu tür basit görevlerde bile zorlandığını gösteriyor.”
Yapay Zekanın Zaman Yönetiminde Gelişmesi Gerekiyor
Araştırmacılar, yapay zekanın metin üretimi, görüntü işleme ve veri analizi gibi alanlarda başarılı olsa da, basit zaman hesaplamalarında beklenen doğruluğa ulaşamadığını vurguluyor.
Bu eksikliklerin zamanlama, etkinlik planlaması ve otonom sistemler gibi alanlar için büyük bir zorluk oluşturabileceği ifade ediliyor.
Gelecekte, yapay zekanın zaman yönetimi ve otomasyon konularında daha güvenilir hale gelmesi için bu eksikliklerin giderilmesi gerekecek.