Çin merkezli yapay zeka girişimi DeepSeek, R1 adlı akıl yürütme modelinin güncellenmiş sürümünü resmi bir açıklama yapmaksızın sessiz bir şekilde yayımladı. Yeni model, açık kaynak platformu Hugging Face üzerinden kullanıma sunularak, küresel yapay zeka topluluğunda dikkat çekici bir ilgi topladı.
Yüksek performanslı bu yeni sürüm, özellikle akıl yürütme ve kodlama alanlarında kayda değer gelişmeler sergiliyor. DeepSeek-R1-0528 kodlu model, yapılan testlerde OpenAI’nin o4-mini modeli ve Grok-3-mini gibi rakiplerini geride bırakırken, doğal dil üretimi ve uzun süreli düşünme yetkinliğiyle de öne çıkıyor. Model, 685 milyar parametre ile çalışmakta ve ticari kullanım için de uygun şekilde tasarlanmış durumda.
Güncellenmiş R1 modeli, yapay zeka sistemlerinin kıyaslandığı LiveCodeBench platformunda OpenAI’nin gelişmiş modellerinin hemen arkasında yer aldı. Bu konum, DeepSeek’in teknolojik yetkinliğini uluslararası düzeyde yeniden kanıtlamış oldu. Ayrıca modelin, bilgi tabanlı görevlerde Claude-3.5 Sonnet gibi önde gelen modellere yaklaştığı ifade ediliyor.
DeepSeek’in bu atağı, Çin menşeli yapay zeka şirketlerinin ABD’nin uyguladığı teknoloji ve çip kısıtlamalarına rağmen gelişimini sürdürdüğünü göstermesi açısından önem taşıyor. Şirketin kısa sürede geliştirdiği düşük maliyetli ve yüksek kapasiteli modeller, sektörün önde gelen isimleri Meta ve OpenAI ile doğrudan rekabet edebilecek seviyeye ulaşmış durumda.