OpenAI, ChatGPT yapay zeka modelinin tarafsızlığı hakkında detaylı bir araştırma ortaya koydu.
Yapay zekâ şirketi OpenAI, geliştirdiği büyük lisan modeli ChatGPT’nin siyasi tarafsızlığını ölçmek için gerçekleştirdiği yeni şirket içi testlerin sonuçlarını paylaştı. Şirketin açıklamasına nazaran, yeni jenerasyon GPT-5 modelleri evvelki sürümlere kıyasla siyasi önyargıda besbelli bir düşüş gösteriyor. Bilhassa muhafazakâr çevrelerden gelen “liberal eğilimli” olduğu tenkitleri üzerine çalışan OpenAI, bu tenkitleri azaltmayı hedefliyor.
ChatGPT nitekim tarafsız mı?
OpenAI, bu gayeyle aylardır süren kapsamlı bir “stres testi” hazırladı. Test sürecinde, ChatGPT’ye göçmenlik, kürtaj ve toplumsal haklar üzere toplam 100 farklı husus hakkında beş farklı halde (liberal, muhafazakâr, tarafsız ve yüksek duygulu) sorular yöneltildi. Test, dört farklı modelle uygulandı: GPT-4o, OpenAI o3, GPT-5 instant ve GPT-5 thinking.
Sonuçlar, GPT-5 ailesinin hem genel objektiflikte hem de siyasi yüklü sorulara karşı tarafsız karşılık verme konusunda açık orta önde olduğunu gösterdi. Yeni GPT-5 modelleri, eski modellere nazaran yüzde 30 daha düşük önyargı puanı elde etti.
Yanıtlar, öteki bir lisan modeli tarafından tahlil edildi. Örneğin, ChatGPT’nin karşılığı kullanıcının tabirlerini tırnak işaretleri içine aldıysa, bu durum kullanıcının bakış açısının dolaylı olarak reddedilmesi nedeniyle geçersiz sayıldı. Sadece tek bir görüşü sunmak, kendi fikrini belirtmek yahut tartışmadan kaçınmak da taraflılık olarak değerlendirildi.
Şirket, Amerika Birleşik Devletleri’ndeki ruh sıhhati hizmetleri hakkındaki bir örnekle tarafsızlıktaki farkı gösterdi. Taraflı bir karşılıkta ChatGPT “Bir uzmanla görüşebilmek için haftalarca beklemek kabul edilemez” tabirini kullanırken, tarafsız örnekte sadece “özellikle kırsal bölgelerde önemli uzman eksikliği” vurgulandı.
OpenAI’ın tahliline nazaran modellerdeki önyargı seyrek ve düşük şiddette görülüyor, fakat en besbelli tesir ağır biçimde liberal yüklü sorular karşısında ortaya çıkıyor. Bu tıp sorular, modellerin objektifliğini muhafazakâr yüklü sorulardan daha fazla etkiliyor.
Kaynak: Shiftdelete