DeepSeek V3.2 yayınlandı. GPT-5 ve Gemini 3.0’a rakip olan açık kaynaklı model, düşük maliyeti ve yüksek performansıyla dikkat çekiyor.
Çinli yapay zeka laboratuvarı DeepSeek, V3 model serisinin en yeni üyesi olan V3.2 sürümünü duyurdu. Pazartesi günü kullanıma sunulan bu yeni model, “Thinking” ve ondan daha güçlü olan “Speciale” olmak üzere iki farklı versiyonla geliyor. DeepSeek V3.2, açık kaynaklı yapay zekanın yeteneklerini daha da ileriye taşımayı hedeflerken, rakiplerine kıyasla çok daha düşük bir maliyet sunmasıyla dikkat çekiyor. Hugging Face üzerinden erişilebilen model, geliştiriciler için erişilebilir yapay zekayı rekabetçi tutmayı amaçlıyor.
Yapay zeka dünyasında yeni istikrarlar: DeepSeek V3.2 neler sunuyor?
Şirketin yayınladığı bilgilere nazaran, V3.2 Speciale sürümü, OpenAI’nin GPT-5 High, Anthropic’in Claude 4.5 Sonnet ve Google’ın Gemini 3.0 Pro gibi endüstri lideri kapalı kaynak modellerini birtakım akıl yürütme testlerinde geride bırakıyor. Bu performans artışına karşın maliyet farkı ise hayli çarpıcı. Örneğin, Gemini 3 API erişimi 1 milyon token başına 4 dolara kadar çıkarken, V3.2 Speciale için bu bedel yalnızca 0.028 dolar düzeyinde kalıyor. Ayrıyeten modelin Memleketler arası Matematik Olimpiyatı ve Memleketler arası Bilişim Olimpiyatı’nda altın düzeyinde performans gösterdiği belirtiliyor.
DeepSeek, açık kaynaklı modellerin performans sıkıntılarını çözmek ve süreç yükünü azaltmak ismine teknik altyapıda kıymetli değişikliklere gitti. Klasik “vanilla attention” düzeneğinin yarattığı yavaşlığı ortadan kaldırmak için DeepSeek Sparse Attention (DSA) ismi verilen yeni bir sistem geliştirildi. Bu sistem, datayı işlerken evvel süratli bir tarama yapıyor ve akabinde yalnızca ilgili kısımlara odaklanıyor. Bunu, aradığınız bir cümleyi bulmak için dağınık bir kitap yığınını tek tek incelemek yerine, sistemli bir kütüphanede direkt ilgili kısma giderek arama yapmaya benzetebiliriz.

Modelin sunduğu bu avantajlara karşın araştırmacılar kimi sınırlılıkların altını çiziyor. Yayınlanan makaleye nazaran, yeni modelin “dünya bilgisi” yani genel kültür kapsamı, önder kapalı kaynak modellere kıyasla daha hudutlu kalıyor. Ayrıyeten karmaşık vazifelerde bazen zorlanabiliyor ve rakipleriyle misal kalitede çıktı üretmek için daha fazla token tüketebiliyor. Yeniden de Çin merkezli bir şirketin geliştirdiği açık kaynaklı bir modelin, dünyanın en gelişmiş kapalı kaynak modelleriyle rekabet edebilmesi, daldaki “performans uçurumu” algısını değiştiriyor.
Bu gelişme, yüksek maliyetli kapalı sistemlerin gerekliliğini sorgulatırken, geliştiricilerin neredeyse fiyatsız olarak erişebileceği güçlü alternatiflerin yükselişini simgeliyor. Şayet açık kaynak modeller bu süratle gelişmeye ve ortadaki farkı kapatmaya devam ederse, kullanıcıların kapalı sistemlere yüksek fiyatlar ödeme motivasyonu önemli oranda azalabilir. Sizce açık kaynaklı ve düşük maliyetli yapay zeka modelleri, gelecekte fiyatlı teknoloji devlerinin yerini büsbütün alabilir mi?
Kaynak: Shiftdelete