Google AI’dan 3 Boyutta Nesne Algılama İçin Yeni Veri Kümesi

Google AI’ın Objectron adını verdiği, toplam boyutu 4.4 TB’ı bulan bu yeni veri kümesi içerisinde 15000 işaretlenmiş video ve 4 milyonu aşkın işaretlenmiş fotoğraf bulunuyor.

Bilgisayarlı görü alanında oldukça iyi performans sergileyen yapay öğrenme modelleri, genel olarak 2 boyutta algılama üzerine odaklanıyor. Bu modeller eğitilirken fotoğraflar (2 boyutlu veri) kullanılıyor. Aynı zamanda 2 boyutta algılama sonucunda, algılanmış nesneyi çevreleyen 2 boyutlu bir kutu çiziliyor.

3 boyutta nesne algılandığında ise, nesnenin boyutu, pozisyonu ve oryantasyonu gibi çıkarımlar daha keskin şekilde yapılabilecek. Bu nedenle 3 boyutta nesne algılamada kaydedilecek gelişmeler robotikten, artırılmış gerçekliğe kadar birçok farklı alanda işlevsel olabilir.

Yapay zekanın diğer birçok alanında olduğu gibi, bu alanda da eğitim için kullanılan verinin miktarı ve kalitesi önem teşkil ediyor. 2 boyut için kullanılan birçok veri kümesi olsa da, 3 boyut için gerçek hayattan alınmış zengin bir veri kümesi bulmak oldukça zor. Google AI’ın Objectron adını verdiği, toplam boyutu 4.4 TB’ı bulan bu yeni veri kümesi içerisinde 15000 işaretlenmiş video ve 4 milyonu aşkın işaretlenmiş fotoğraf bulunuyor. Bu “işaretler” söz konusu nesnenin pozisyonu, yönü ve boyutları gibi bilgileri de içeriyor.

Google, aynı zamanda bu verilerin bir kısmı ile eğitilmiş bir modeli Mediapipe yapısı üzerinden yayınladı. Mediapipe, Google’a ait, açık kaynak bir model iş hattı aracı. Bir yerde üretilen bir modelin başka cihazlarda, başka kaynaklarla(örneğin canlı yayınlarda) ve başka donanımlarla çalışabilmesini sağlamak gibi hedefleri olan platform, yüz algılamadan iris takibine kadar birçok işlemi gerçekleştirmek için kullanılabiliyor.

Kaynak: Google AI

 

BAĞLANTILI HABERLER

39. TRAI Meet-Up’ında Yapay Zeka’nın Üretime Etkisi Konuşuldu

Yeni Yapay Zeka ve Otomasyon Merkezi Kuruluyor

Türkiye Yapay Zeka İnisiyatifi Ekosistem Haritası Yayınlandı

Atakan Erbas

Recent Posts

Meta, AI Tabanlı Sesli Çevirileri Açtı

Meta, sosyal medya platformlarında içerik üreticilerin küresel kitlelere ulaşmasını kolaylaştıracak yeni bir özellik duyurdu. Bu…

9 saat ago

Gemini’dan Yapay Zeka Sohbetlerine “Hafıza ve Gizlilik” Ayarı

Google, AI destekli sohbet asistanı Gemini’ye kişisel bağlam (personal context) özelliği ekledi. Bu sayede kullanıcı…

5 gün ago

Perplexity AI, Google Chrome’u Satın Alma Teklifi Verdi

Perplexity AI, Google Chrome tarayıcısını 34,5 milyar dolara satın almak için bir teklif sundu. Bu…

6 gün ago

OpenAI GPT-5’i Kullanıma Açtı

OpenAI, 7 Ağustos 2025'te GPT-5 modelini resmen tanıttı ve kullanıma sundu. Bu yeni model, önceki…

2 hafta ago

Fal.ai, 1.5 Milyar Dolar Değerlemeyle Unicorn Oldu

Türk girişimciler Burkay Gür ve Görkem Yurtseven tarafından kurulan Fal.ai, son yatırım turunda 125 milyon…

3 hafta ago

Meta, Yapay Zekada Yeni Bir Dönemi Başlatıyor

Meta CEO’su Mark Zuckerberg, 30 Temmuz 2025 tarihinde yayımladığı açık mektup ile şirketin yeni nesil…

3 hafta ago