2023 yılında Çin’in Hangzhou şehrinde kurulan ve kısa sürede tüm dikkatleri üzerine çeken yapay zeka girişimi DeepSeek, kısa sürede teknoloji dünyasındaki dengeleri alt üst etti. Açık kaynaklı, maliyet avantajlı ve yüksek performanslı bir yapay zeka modeli olarak sahneye çıkan DeepSeek-R1, ABD’li teknoloji devleri ve çip üreticileri için ciddi bir tehdit oluşturuyor.
DeepSeek Neden Gündemde?
DeepSeek, batılı rakipleriyle kıyaslandığında çok daha az veri ve işlemci gücü kullanarak aynı işlemleri gerçekleştirebilmesiyle dikkat çekiyor. Kullanıcılar DeepSeek’i ücretsiz olarak indirip kendi sistemlerinde çalıştırabiliyor ya da mobil uygulamalar üzerinden erişim sağlayabiliyor. Bu avantajları sayesinde, DeepSeek yalnızca bir günde Apple ve Google uygulama mağazalarında 51 ülkede zirveye yerleşti.
Piyasarlada Sert Düşüşlere Yol Açtı
DeepSeek’in başarısı, Nvidia gibi GPU üreticilerinin piyasa değerinde sert düşüşlere yol açtı. Nvidia hisseleri %17 değer kaybederken, ABD teknoloji hisselerinde Nasdaq genelinde %3’lük bir düşüş yaşandı. Uzmanlar, DeepSeek’in maliyet etkin yapısıyla Nvidia’ya olan bağımlılığı azaltabileceğini belirtiyor. Nvidia’nın liderlik pozisyonunu zayıflatan bu gelişme, ABD yapay zeka sektöründe de bir “uyandırma alarmı” olarak değerlendiriliyor.
DeepSeek’in düşük maliyetli üretim iddiaları sektör temsilcilerinden de tepki çekti. Elon Musk, Çin’in çip yaptırımları nedeniyle bu kadar düşük maliyetle üretim yapmasının şüpheli olduğunu savundu.
DeepSeek’in Farkı
DeepSeek’in başarısının ardında, sorgular sırasında yalnızca ilgili veri parçalarını işleyen yenilikçi bir mantık modeli yatıyor. Bu yaklaşım, enerji tüketimini ve maliyeti önemli ölçüde azaltıyor. Ayrıca, MoE (Mixture of Experts) isimli bir teknikle, OpenAI’ın ChatGPT’sine benzer sonuçları yalnızca 5,5 milyon dolarlık bir maliyetle elde etti. Bu rakam, OpenAI’ın harcamalarının çok altında.
OpenAI CEO’su Sam Altman, DeepSeek’i etkileyici bir model olarak nitelendirerek, rekabetin sektöre canlılık getireceğini ifade etti. DeepSeek ayrıca Janus-Pro adlı bir görsel üretim modeliyle DALL-E gibi uygulamalara da rakip olmayı hedefliyor. Bu model, açık kaynaklı ve ücretsiz olarak sunuluyor.