Özerk yapay zeka araçları geliştirme yarışı tüm hızıyla sürerken, OpenAI yeni bir adım attı. Şirket, alışveriş yapmaktan rezervasyon oluşturmaya kadar birçok görevi yerine getirebilen yapay zeka aracı Operator‘ı piyasaya sürdü. İşte bu yeni aracın özelliklerini 5 soruda inceledik.
OpenAI Operator Nedir ve Nasıl Çalışır?
Operator, OpenAI’ın yeni nesil yapay zeka modeli olan Bilgisayar Kullanan Aracı (Computer-Using Agent / CUA) ile çalışıyor. Kullanıcının verdiği görevi yerine getirmek için ekran görüntüsü alıyor ve GPT-4 modelinin görsel analiz yeteneklerinden faydalanarak görüntüyü inceliyor. Daha sonra ekrandaki işlemleri bir insan gibi gerçekleştiriyor.
En dikkat çeken özelliği ise API yerine doğrudan kullanıcıların arayüzünü kullanarak işlem yapması. Bu, insanların günlük hayatta kullandığı platformlarda daha geniş bir erişim sağlıyor. Örneğin, ekrandaki bir tuşa basabiliyor veya bir form doldurabiliyor.
Operator Neler Yapabiliyor?
OpenAI, Operator’ın şu anda bir “araştırma önizlemesi” olarak piyasada olduğunu ve kullanıcıların geri bildirimleriyle gelişeceğini ifade ediyor. Araç, internet sitelerinde gezinip alışveriş yapmak, restoran rezervasyonu oluşturmak ve kullanıcı tarafından verilen görevleri tamamlamak gibi yeteneklere sahip.
- Yemek tarifi bulmak ve malzemeleri alışveriş sepetine eklemek.
- Uygun restoranları listeleyip rezervasyon oluşturmak.
- Görevlerini yerine getirirken işlemleri detaylı bir şekilde raporluyor ve kullanıcının onayını alıyor.
Kritik işlemler sırasında (örneğin ödeme yapmak), kullanıcıdan manuel müdahale isteniyor. Ayrıca şifre veya kredi kartı bilgileri girilirken ekran görüntüsü alma işlemi durduruluyor.
Operator’ın Yapamadıkları Neler?
Her ne kadar güçlü bir yapay zeka aracı olsa da Operator, bazı sınırlamalara sahip:
- Karmaşık görevlerde yetersiz kalabiliyor. Örneğin, ayrıntılı slayt hazırlamak veya takvim yönetmek gibi görevleri güvenilir şekilde yerine getiremiyor.
- CAPTCHA gibi insanları makinelerden ayıran doğrulama sistemlerini çözme yeteneği yok.
- Günlük işlem limiti bulunuyor ve aynı anda yerine getirebileceği görev sayısı sınırlı.
OpenAI, bu eksikliklerin gelecekteki güncellemelerle giderileceğini belirtiyor.
Operator Güvenli Mi?
Operator, önceki yapay zeka araçlarına göre daha fazla özerklik sağladığı için OpenAI ek güvenlik önlemleri geliştirdi.
- Kullanıcının kişisel bilgileri (şifre, kredi kartı bilgileri) girilirken ekran görüntüsü almayı durduruyor.
- Kumar gibi içeriklere erişim kısıtlanıyor.
Bununla birlikte, uzmanlar hâlâ olası güvenlik risklerine karşı dikkatli olunması gerektiğini belirtiyor. Kullanıcıların, görevleri tamamladıktan sonra tarayıcı geçmişlerini temizlemeleri ve kimlik bilgilerine erişimi engellemeleriöneriliyor.
Operator Benzer Araçlardan Daha Mı İyi?
Google ve Anthropic gibi şirketler, benzer yapay zeka araçlarını piyasaya sürmüş olsa da Operator, bazı testlerde rakiplerini geride bırakmış görünüyor.
Massachusetts Teknoloji Enstitüsü (MIT) tarafından yapılan bir değerlendirmede, Operator’ın bağlı olduğu CUA modeli, tarayıcı görevlerini yerine getirme testinde %87 başarı oranı gösterdi. Google’ın Project Mariner aracı %83,5, Anthropic’in Computer Use modeli ise %56 başarı elde etti.
Ayrıca Operator, bulut sisteminde çalıştığı için birden fazla görevi aynı anda yerine getirebiliyor ve verimlilik açısından avantaj sağlıyor. Ancak sektördeki rekabetin artmasıyla bu üstünlüğün ne kadar süreceği belirsiz.