Haberler

Google’ın VideoPoet’i ile Yapay Zekâ Devrimi: Video Üretiminde Yeni Bir Çağ

Google, VideoPoet adında yeni bir yapay zeka tabanlı video üretim aracı geliştirdi. VideoPoet, genellikle metin ve kod üretiminde kullanılan büyük/geniş dil modellerini kullanarak, uzun ve yüksek kaliteli videolar oluşturabiliyor. Bu, Google Araştırma ekibinin 270 milyon video ve 1 milyardan fazla metin ve görüntü çifti üzerinde gerçekleştirdiği kapsamlı bir ön eğitim sürecinin sonucudur. VideoPoet, hareketlerin bozulmaya başladığı kısa videolar yerine, daha uzun ve tutarlı hareketler içeren videolar üretebiliyor. Ayrıca, farklı kamera hareketlerini ve görsel stilleri simüle edebiliyor, seçilen video kliplerle uyumlu yeni sesler oluşturabiliyor ve metin, resim ve video gibi çeşitli girdileri kullanabiliyor. VideoPoet ayrıca dikey video üretimiyle de öne çıkıyor ve Google Araştırma ekibi, ilerleyen dönemlerde bu aracın yeteneklerini genişletmeyi hedefliyor. Şu anda VideoPoet genel kullanıma açık değil ve kullanıma sunulacağı tarih hakkında henüz bir açıklama yapılmadı.

Öne çıkan başlıklar;

  • Google, “VideoPoet” adında yeni bir yapay zeka tabanlı video üretim aracı geliştirdi. Bu araç, daha uzun ve yüksek kaliteli videolar oluşturma kapasitesine sahip.
  • VideoPoet, Google Research ekibi tarafından geliştirilen büyük/geniş bir dil modelidir. Bu model, özellikle video üretimi görevleri için tasarlandı ve 31 araştırmacı tarafından üretilmiştir.
  • Google Araştırma ekibi, yaygın olarak kullanılan difüzyon modelleri yerine, büyük/geniş dil modelleri kullanmayı tercih etti. Bu modeller, metin ve kod üretimi için kullanılan dönüştürücü mimarisine dayanır ve ChatGPT, Claude 2, Llama 2 gibi ürünlerde görülebilir.
  • VideoPoet, 270 milyon video ve 1 milyardan fazla metin ve görüntü çifti üzerinde ön eğitimden geçirildi. Bu eğitim sürecinde, yapay zeka modeli metin yerleştirmeleri, görsel ve ses belirteçlerine koşullandırıldı.
  • VideoPoet, difüzyon modellerinin aksine, daha uzun ve daha yüksek kaliteli video kesitleri oluşturabilir. Difüzyon modelleri, videolardaki hareketleri birkaç kare sonrasında bozulmaya başlarken, VideoPoet daha uzun videolarda daha büyük ve tutarlı hareketler üretebiliyor.
  • VideoPoet, farklı kamera hareketlerini ve görsel estetik stilleri simüle edebilir. Ayrıca, belirli bir video klibe uygun yeni sesler oluşturmak mümkün olup, üretim sürecinde metin, resim ve video gibi çeşitli girdileri kullanabilir.
  • VideoPoet, diğer yapay zeka video üretim araçlarından farklı olarak dikey video üretimiyle de öne çıkıyor. Google Research ekibi, ileride VideoPoet’in yeteneklerini genişleterek, metinden sese ve sesten videoya dönüştürme gibi seçenekler sunmayı hedefliyor.

Kaynak: https://blog.research.google/2023/12/videopoet-large-language-model-for-zero.html

Paylaş
Yasin Demirkaya

Son Gönderiler

OpenAI, Kodlama Performansını Artıran Yeni Modeli GPT-4.1’i Tanıttı

Yapay zeka alanındaki rekabetin hız kazandığı bu dönemde, OpenAI yeni nesil model ailesi GPT-4.1 ile… Devamı

2 hafta Önce

92. TRAI Meet-Up’ında Enerji Sektöründe Yapay Zeka Teknolojileri Konuşuldu

92. TRAI Meet-Up’ında Enerji Sektöründe Yapay Zeka Teknolojileri Konuşuldu Devamı

2 hafta Önce

Abu Dabi Yapay Zeka Tabanlı İlk Hükümet Olmayı Hedefliyor

Abu Dabi Hükümeti, "2025-2027 Abu Dabi Dijital Hükümet Stratejisi"ni duyurdu. Strateji, hükümetin tüm dijital hizmetlerini… Devamı

3 hafta Önce

Microsoft’tan Copilot’a Yeni Özellikler: Daha Akıllı, Daha Kişisel, Daha Etkileşimli

Microsoft, kuruluşunun 50. yıl dönümünü kutladığı özel etkinlikte, yapay zeka destekli asistanı Copilot’a entegre edilen… Devamı

3 hafta Önce

Yapay Zeka Girişimleri Haritası: Nisan 2025 Güncellemesi Yayında

Her çeyrek düzenli olarak güncellediğimiz Yapay Zeka Girişimleri Haritası, 2025 yılının ilk çeyrek verileriyle birlikte… Devamı

3 hafta Önce

Stanford Üniversitesi 2025 Yapay Zeka Raporunu Yayınlandı

Stanford Üniversitesi İnsan Merkezli Yapay Zeka Enstitüsü (HAI) tarafından hazırlanan 2025 Yapay Zeka Endeksi Raporu,… Devamı

3 hafta Önce