DeepSeek, yeni büyük lisan modelini duyurdu. Huawei üzere Çinli üreticiler için optimize edilen model, NVIDIA CUDA bağımlılığını azaltıyor.
Çin merkezli yapay zeka şirketi DeepSeek, NVIDIA CUDA ekosistemine bağımlılığı azaltacak yeni bir adım atarak DeepSeek-V3.2-Exp modelini piyasaya sürdü. Model, Huawei’nin Ascend hızlandırıcıları ve şirketin CANN yazılım yığını için birinci günden itibaren optimize edilmiş halde sunuldu. Böylelikle Çin merkezli teknoloji firmalarının, ABD merkezli donanım ve yazılım ekosistemlerinden bağımsızlaşma süreci sürat kazandı.
DeepSeek, modeli 29 Eylül 2025’te duyurdu ve teknik raporla birlikte Hugging Face üzerinde kod ve denetim noktalarını paylaştı. Şirket, V3.2-Exp’yi “uzun bağlamlı çıkarımlarda maliyetleri düşürmek için tasarlanmış, yeni kuşak mimarimize geçişte bir orta adım” olarak tanımlıyor. Model, çıktı kalitesini korurken bellek ve süreç gücü ihtiyaçlarını azaltan seyrek dikkat (sparse attention) sistemiyle dikkat çekiyor.
Huawei’nin Ascend takımı ve daha geniş vLLM-Ascend topluluğu, modele süratli halde ahenk sağladı. Ascend NPU’lar üzerinde çalıştırılabilmesi için özel operatör heyetim adımları ve çekirdek paketleme yönergeleri yayınlandı. Ayrıyeten CANN grubu, Huawei donanımında direkt çalıştırılabilecek çıkarım tanımını kullanıcılarla paylaştı.
DeepSeek, Çinli üreticiler tarafından destekleniyor
Sadece Huawei değil, öbür Çinli yonga üreticileri de sürece süratle katıldı. Cambricon, kendi hızlandırıcıları için vLLM-MLU sürümünü güncelledi ve modelin seyrek dikkat yapısının uzun dizilerde maliyet avantajı sağladığını duyurdu. Hygon ise DCU hızlandırıcılarını DTK yazılım yığını aracılığıyla “sıfır gecikme” ile dağıtıma hazır hale getirdiğini açıkladı.
Aynı vakitte SGLang, Ascend dahil olmak üzere farklı donanımlarda V3.2-Exp takviyesini onayladı. DeepSeek’in GitHub üzerindeki notları, modelin vLLM ile muadil performans sunduğunu ortaya koyuyor. Şirket, hem TileLang hem de CUDA çekirdeklerinden bahsederek araştırmacıları TileLang’ı prototipleme için kullanmaya davet ediyor. Bu yaklaşım, tıpkı modelin sadece küçük değişikliklerle hem NVIDIA GPU’larda hem de Çinli hızlandırıcılarda çalıştırılmasını mümkün kılıyor.
Bu gelişmeler, Çin’in yapay zeka ekosisteminin NVIDIA donanımına erişimin garanti edilemeyeceği bir geleceğe hazırlanmakta olduğunu net halde ortaya koyuyor. CUDA hala global ölçekte hakimiyetini sürdürse de, DeepSeek’in yeni modeli birinci günden itibaren CUDA dışı platformlara optimize edilen az büyük ölçekli Çinli teşebbüslerden biri oldu.
Huawei, Cambricon ve Hygon’un eşgüdümlü çalışması, Pekin’in “teknolojik egemenlik” maksatlarının şirketler tarafından ciddiyetle benimsendiğini gösteriyor. Çinli üreticiler artık sırf NVIDIA tabanlı sistemlere ahenk sağlamakla yetinmiyor; kendi donanım ve yazılım platformlarını birinci sınıf maksatlar olarak konumlandırıyor.
Kaynak: Shiftdelete