Yapay zeka tarafından üretilen sahte akademik makaleler, özellikle ChatGPT ve benzeri teknolojilerin yaygınlaşmasıyla birlikte bilim dünyasında büyük bir sorun haline geldi. Ancak New York Eyalet Üniversitesi‘nde araştırma görevlisi olan Ahmed Abdeen Hamed, bu duruma çözüm getiren bir algoritma geliştirdi. xFakeSci adlı makine öğrenimi algoritması, sahte makaleleri yüzde 94 doğruluk oranıyla tespit edebiliyor. Bu oran, mevcut veri madenciliği tekniklerinden neredeyse iki kat daha başarılı.
xFakeSci’nin Geliştirilme Süreci
Hamed, “Ana araştırma alanım biyomedikal bilişim, ancak tıbbi yayınlar, klinik deneyler ve çevrimiçi kaynaklarla çalıştığım için bilgi doğruluğu konusunda her zaman endişeliyim” diyor. Bu kaygıyla yola çıkan Hamed, Hefei Teknoloji Üniversitesi’nden profesör Xindong Wu ile iş birliği yaparak algoritmayı geliştirdi.
Araştırmalarında Alzheimer, kanser ve depresyon üzerine üç tıbbi konuda 50 sahte makale oluşturdular ve bu makaleleri aynı konularda yazılmış gerçek makalelerle karşılaştırdılar. xFakeSci, makalelerin yazım tarzını analiz ederek iki ana özellik üzerinde durdu: sıklıkla birlikte kullanılan kelime çiftleri ve bu kelimelerin metin içinde diğer sözcüklerle bağlantıları.
Yapay Zeka ile Gerçek Bilim Arasındaki Fark
Hamed’e göre, ChatGPT gibi yapay zeka modelleri, daha çok ikna edici bir dil kullanarak önemli kelimelerle argüman oluşturuyor. Buna karşın gerçek bilimsel makaleler, deney sonuçlarını dürüst bir şekilde raporluyor ve geniş bir perspektifte detaylara yer veriyor.
Bilimsel Araştırmalarda Güvenliği Sağlamak
xFakeSci gibi araçların geliştirilmesi, bilimsel literatürdeki yanlış bilgilerin engellenmesi ve kamu güveninin korunması açısından büyük önem taşıyor. Bu tür teknolojiler, bilimsel iletişimin güvenilirliğini koruma yolunda önemli bir adım olarak görülüyor.