Yapay zeka alanındaki gelişmeler hızla ilerlerken, multimodal modellere yönelik açık kaynaklı bir alternatif olan BAGEL (Bayesian Aggregated Generalist for Efficient Learning), araştırmacıların ve geliştiricilerin kullanımına sunuldu.
BAGEL, metin, görsel ve diğer veri türlerini entegre biçimde işleyebilen birleşik bir mimarîye sahip. Bu yapı, modelin çok modlu görevlerde yüksek performans göstermesine olanak tanıyor. Açık kaynaklı ve modüler yapısıyla dikkat çeken BAGEL, kullanıcıların farklı uygulamalar için özelleştirme yapmalarına da imkân tanıyor.
Model, CLIP benzeri görsel encoder’lar ile büyük dil modellerini birleştiren bir mimarî üzerine inşa edildi. Hugging Face ve PyTorch gibi güncel açık kaynak ekosistemleriyle uyumlu olan BAGEL, düşük kaynak tüketimiyle verimli eğitim olanakları sunuyor.
Multimodal yapay zeka teknolojilerinin daha erişilebilir ve şeffaf hale gelmesine katkı sağlamayı hedefleyen BAGEL, akademik çevreler, endüstri paydaşları ve açık kaynak toplulukları için yeni fırsatlar barındırıyor.
Kaynak: https://bagel-ai.org/