reklam
reklam
reklam
reklam

DeepSeek Eğitim Maliyetlerini Nasıl Düşürüyor?

  • Konbuyu başlatan hepsigundem
  • Başlangıç tarihi
H

hepsigundem

Guest
deepseek-egitim-maliyetlerini-nasil-dusuruyor-0-cVagOy4j.jpg



Çinli yapay zeka teşebbüsü DeepSeek, 2026 yılına büyük bir teknik atılımla giriş yaptı. Şirket, büyük lisan modellerinin eğitimini daha kararlı ve uygun maliyetli hale getirmek maksadıyla geliştirdiği yeni bir derin öğrenme mimarisini duyurdu. Yayınlanan teknik makale, kesim gözlemcileri tarafından şirketin yakında piyasaya süreceği yeni büyük eserin habercisi olarak bedellendiriliyor.

DeepSeek yeni mHC mimarisi ile yapay zeka eğitim maliyetlerini düşürüyor

Hangzhou merkezli firma tarafından paylaşılan makale, Manifold-Constrained Hyper-Connections (mHC) ismi verilen yeni bir çerçeveyi tanıtıyor. Şirketin kurucusu Liang Wenfeng ve kıdemli araştırmacıların imzasını taşıyan bu çalışma, yapay hudut ağları büyüdükçe ortaya çıkan kararsızlık ve ölçeklenebilirlik sıkıntılarını çözmeyi hedefliyor. Araştırma takımı, mHC mimarisinin mevcut prosedürlere kıyasla somut performans iyileştirmeleri ve üstün ölçeklenebilirlik sunduğunu belirtiyor.

deepseek-egitim-maliyetlerini-nasil-dusuruyor-1-6GY98ubS.jpg


Bu yeni sistem, ByteDance araştırmacılarının 2024 yılında çağdaş lisan modellerinin temeli olan ResNet’i geliştirmek için sunduğu hiper-bağlantı (hyper-connections) mimarisinin üzerine inşa ediliyor. ByteDance’in orjinal yaklaşımı sinyal akışını iyileştirse de, çok büyük modellerde bellek kullanımı meselelerine yol açıyordu. DeepSeek ise bu irtibatları muhakkak bir matematiksel manifold üzerine yansıtarak sinyallerin kaybolmasını yahut çok büyümesini engelleyen özdeşlik eşlemesi (identity mapping) özelliğini sisteme geri kazandırıyor.

Geliştirilen mHC mimarisi; 3 milyar, 9 milyar ve 27 milyar parametreli modeller üzerinde test edildi. Elde edilen sonuçlar, sistemin bilgi süreç kapasitesi üzerinde büyük bir yük oluşturmadan tesirli bir biçimde ölçeklenebildiğini kanıtladı. Bu verimlilik, bilhassa yüksek maliyetli yapay zeka eğitim süreçlerinde şirketlere büyük bir avantaj sağlamayı vaat ediyor.

deepseek-egitim-maliyetlerini-nasil-dusuruyor-2-kQZun8Cr.jpg


DeepSeek’in bu teknik paylaşımları, çoklukla yeni eser lansmanlarının bir ön işareti olarak görülüyor. Kurucu Liang Wenfeng’in makaleyi şahsen arXiv platformuna yüklemesi, geçmişteki başarılı model lansmanlarıyla benzerlik gösteriyor. Uzmanlar, şirketin geçen yılki R1 modelinde olduğu üzere, 17 Şubat’ta başlayacak olan Bahar Festivali’nden önce yeni bir büyük model tanıtabileceğini öngörüyor.

Kantitatif risk fonu High-Flyer’ın iştiraki olan DeepSeek, eğitim maliyetlerini düşüren teknik buluşlarıyla tanınıyor. ABD’li rakiplerine karşı daha düşük bütçelerle rekabetçi performans sergileyen şirket, Çin yapay zeka ekosistemindeki şeffaf ve paylaşımcı kültürü de temsil ediyor. Giderek artan bu akademik paylaşımlar, şirketin global yapay zeka yarışındaki pozisyonunu güçlendiriyor.

Sizce DeepSeek’in maliyet odaklı bu yeni mimarisi, yapay zeka dünyasında istikrarları değiştirebilir mi? Bir sonraki büyük modelden beklentileriniz neler?



Shiftdelete

The post DeepSeek Eğitim Maliyetlerini Nasıl Düşürüyor? first appeared on HepsiGündem.COM " Gündem,Güncel Haberler Burada ".

Okumaya devam et...
 
reklam
reklam
reklam
reklam
Geri
Üst