Metin Talimatlarından Karmaşık Sahnelere – Sora

Yapay zeka bir metni dinamik, gerçekçi bir videoya dönüştürebilir mi? ChatGPT yaratıcısı OpenAI, 15 Şubat Perşembe günü tanıttığı, metinden videoya üretim aracı Sora ile bu soruya bir cevap sunuyor.

Sora, ayrıntılı kullanıcı komutlarına, gerçekçi görselliğe, ve aynı zamanda nesnelerin fiziksel dünyada nasıl var olduğuna da bağlı kalarak bir dakika uzunluğunda karmaşık sahneler oluşturabiliyor. Sora ile oluşturulan bu karmaşık sahneler, canlı duyguları ifade eden birden fazla karakterleri, belirli hareket türlerini ve özne ile arka planın doğru ayrıntılarını içerebiliyor.

Yalnızca metin talimatlarından bir video oluşturabilmenin yanı sıra, model mevcut bir hareketsiz görüntüyü kullanarak video oluşturabiliyor ve görüntünün içeriğini doğrulukla ve küçük ayrıntılara dikkat ederek canlandırabiliyor. Ayrıca Sora, mevcut bir videoyu alıp genişletebilme veya eksik kareleri doldurabilme gibi tamamlayıcı yeteneklere de sahiptir.

Yayınlanan teknik rapor kısa ve genel olmakla birlikte, dil modellerine benzer şekilde, OpenAI’nin Sora’ya ne kadar fazla hesaplama gücü sağlarsa, çıktı kalitesinin de o kadar yüksek olduğunu gösteriyor – Bir yığın kürk parçası, 16 kat daha fazla kaynakla üretildiğinde fotogerçekçi, sevimli bir köpek yavrusu haline geliyor.

Henüz halka açık olmayan Sora’nın yalnızca OpenAI tarafından onaylanan seçkin bir grup güvenlik testçisi, görsel sanatçı, tasarımcı ve film yapımcısı tarafından kullanabildiğini, ve OpenAI ürünlerinde kullanılabilir hale getirilmeden önce yanlış bilgi, nefret dolu içerik ve önyargı gibi önemli konularda alanda uzmanlarla birlikte çalışıldığı biliniyor. Ancak şirketin CEO’su Sam Altman, Sora’ya gelen taleplerin sonuçlarını sosyal medya üzerinden meraklı takipçileri ile paylaşıyor.

kaynak: https://openai.com/sora

Yasin Demirkaya

Recent Posts

Hayallerimin Ötesinde

Mayıs 2017’de Türkiye Yapay Zeka İnisiyatifini kurduk, çok hızlı gelişince, diğerlerini bıraktık ve bu alana…

22 saat ago

Yapay Zekanın Yeni Akımı: Y Combinator’dan 144 Girişimlik Vizyon

Dünyanın en prestijli girişim hızlandırma programlarından Y Combinator (YC), 2025 Bahar dönemiyle birlikte yapay zekada…

1 gün ago

Türkiye’deki Yapay Zeka Girişimlerinin Sayısı 8 yılda 17 katına çıktı

2017’de başladığımız haritalama çalışmasıyla, Türkiye’de yapay zekâ alanında faaliyet gösteren girişimleri düzenli olarak takip ediyoruz.…

7 gün ago

Açık Kaynak Multimodal Zeka İçin Yeni Oyuncu: BAGEL

Yapay zeka alanındaki gelişmeler hızla ilerlerken, multimodal modellere yönelik açık kaynaklı bir alternatif olan BAGEL…

4 hafta ago

DeepSeek’ten Dikkat Çeken Hamle

Çin merkezli yapay zeka girişimi DeepSeek, R1 adlı akıl yürütme modelinin güncellenmiş sürümünü resmi bir…

4 hafta ago

Google I/O 2025’te Öne Çıkanlar

Google, I/O 2025 etkinliğiyle birlikte yapay zeka merkezli ürün ve hizmetlerinde kapsamlı bir dönüşüm sürecine…

1 ay ago