Yapay zeka teknolojisinde tarihi bir dönüm noktası yaşandı. OpenAI tarafından geliştirilen GPT-4.5 ve Meta’nın LLaMa-3.1 modelleri, uzun yıllardır yapay zekanın gelişim düzeyini belirlemek için kullanılan Turing Testi’ni başarıyla geçerek insanlardan ayırt edilemez hale geldi. Bu gelişme, yalnızca yapay zekanın teknik kapasitesini değil, aynı zamanda insan-makine etkileşiminde yeni bir dönemin başladığını da işaret ediyor.
Turing Testi Nedir?
İkinci Dünya Savaşı döneminde şifre kırıcı olarak bilinen İngiliz matematikçi Alan Turing, 1950 yılında, bir makinenin zeka seviyesini ölçmek amacıyla “Turing Testi” kavramını geliştirdi. Bu testin temel prensibi, bir insanın, karşısındaki konuşma partnerinin insan mı yoksa makine mi olduğunu ayırt edememesi üzerine kurulu. Eğer bir yapay zeka, insanı kandırabilecek düzeyde iletişim kurabiliyorsa, testten geçmiş sayılır.
Kaliforniya ve San Diego Üniversiteleri’nden Ortak Araştırma
Kaliforniya Üniversitesi (UC) ve San Diego Üniversitesi’nden (UCSD) bilim insanlarının gerçekleştirdiği kapsamlı çalışmada, GPT-4.5 ve LLaMa-3.1 modelleri, Turing Testi’ne tabi tutuldu. Araştırmada, biri üniversite öğrencilerinden diğeri çevrimiçi bir platform olan Prolific’ten alınan toplam 284 katılımcı, rastgele atanmış şekilde beşer dakikalık çevrimiçi sohbetler gerçekleştirdi. Katılımcılara, sohbet partnerlerinin insan mı yoksa yapay zeka mı olduğu söylenmedi.
Sohbetin ardından, katılımcılardan, konuştuğu kişinin insan mı olduğunu değerlendirmeleri istendi. Test sonuçlarına göre, GPT-4.5 modeli %73, LLaMa-3.1 ise %56 oranında insan olarak tanımlandı. Bu oranlar, Turing Testi’nin başarı kriterini karşılayan ilk deneysel veriler olarak kayda geçti.
Zeka Değil, Duygusal Akıcılık
Çalışmaya dair dikkat çekici bir yorum da Psychology Today ve teknoloji düşünce kuruluşu Nosta Lab’dan geldi. Uzmanlar, yapay zekaların testleri yalnızca “zekalarıyla” değil, duygusal akıcılık ve empatik iletişim becerileriyle geçtiğine dikkat çekti. İnsan katılımcıların, mantıksal tutarlılıktan çok, “duygusal ton”, “argo kullanımı” ve “samimi diyaloglar” üzerinden değerlendirme yaptıkları ortaya kondu.
Gerçekten İnsan Gibi mi?
Her ne kadar GPT-4.5 ve LLaMa-3.1 modelleri Turing Testi’ni geçmeyi başarmış olsa da, uzmanlar bu modellerin hala gerçek bir “anlama” kapasitesine sahip olmadığını vurguluyor. Yapay zekalar, insan gibi konuşabiliyor ancak bilinç, sezgi ve etik karar verme gibi bilişsel yetkinliklerden yoksun.
Yeni Testlere İhtiyaç Var
Turing Testi’nin geçilmesi, yapay zekanın evriminde önemli bir kilometre taşı olsa da, bu tür sistemlerin insan benzeri etkileşim kurabilmesi, onların gerçekten “insan gibi” düşündüğü anlamına gelmiyor. Bu nedenle, bilim insanları artık yapay zekayı ölçmek için yeni test ve kriterlerin geliştirilmesi gerektiğini ifade ediyor.