Çoklu Nesne Takibine Derin Öğrenmeli Yeni İzleme Modeli

Fatma Nur Yokuş
Haberler
29 Temmuz 2021

Çoklu Nesne Takibine Derin Öğrenmeli Yeni İzleme Modeli

Bilgisayarlı görü son 10 yılda çok fazla gelişti ve hem akademik, hem de günlük hayat olmak üzere birçok ilgili uygulamanın içinde yer almaya başladı. Ancak bu alanda bilgisayarların bazı görevleri doğru ve hızlı bir şekilde yerine getirmesi çok zor. Mesela videolarda objeleri görünüşüne bakarak ayırt edip onların hareketlerini izlemeyi içeren nesne takibi buna örnek gösterilebilir. Bilgisayarlar insanlara göre daha fazla objeyi takip edebilse de farklı objelerin görüntüsünü ayırt etmede genelde yetersiz kalıyor. Bu problem ise algoritmanın bir video görüntüsündeki nesneleri karıştırıp sonunda yanlış takip sonuçları üretmesine sebep oluyor.

Güney Kore’deki Gwangju Bilim ve Teknoloji Enstitüsü’nde görevli Prof. Dr. Moongu Jeon liderliğindeki bir araştırma ekibi bu sorunu derin öğrenme tekniklerini çoklu nesne takibi ile birleştirerek çözmeye çalışıyor. Techxplore’un haberine göre, Prof. Dr. Moongu Jeon’un ekibi yakın zamanda Information Sciences’da yayımlanan bir araştırmasında “deep temporal appearance matching association (Deep-TAMA)” (Derin – geçici görünüm eşleme birliği) adlı bir tekniğe dayalı yeni bir izleme modeli geliştirdi. Bu teknik çoklu obje takibindeki en yaygın sorunlara yenilikçi çözümler getirmeyi amaçlıyor.

Kaynak: Gwangju Bilim ve Teknoloji Enstitüsü

Yeni İzleme Modeli Nasıl İşliyor?

Geleneksel nesne takibinde sınırlayıcı bir kutucuğun algılanan her objeyle ilişkilendirilmesi ve geometrik sınırlar koyulması ile objenin yörüngesi belirlenir. Ancak bu yaklaşımda var olan zorluk mevcut karenin içinde algılanan obje ile önceden izlenen objenin doğru bir şekilde eşleşme yapması. Algılanan objeleri ayırt etmek için kullanılan renk gibi özellikler aydınlatma koşullarındaki değişiklikler ve objelerin birbirine yaklaşıp birbirini kapatması gibi sebepler nedeniyle genellikle başarısız oluyor. Bu yüzden, araştırmacılar nesne takip modelinde algılanan objelerin bilinen özelliklerini doğru bir şekilde çıkarmaya, onları karedeki diğer objeler ve bilinen özelliklerin kaydedilmiş geçmişiyle karşılaştırmaya odaklandı. Bu amaçla, araştırmacılar “joint-inference neural networks (JI-Nets)” (Ortak çıkarım yapay sinir ağları) ile “long-short-term-memory networks (LSTMs)” (uzun – kısa dönem hafıza ağlarını) birleştirdi.

“Daha İyi ve Doğru Sonuçlar”

LSTMs kaydedilmiş görüntüleri mevcut karedekilerle ilişkilendirmeye yardımcı oluyor. JI-nets ise, bu yeni yaklaşımın en benzersiz yönlerinden biri olarak, algılanan iki objenin görüntülerini aynı anda sıfırdan karşılaştırmayı sağlıyor. Kaydedilmiş görünümleri bu şekilde kullanmak takip edilen nesnelerin kısa zamanlı birbirine yaklaşıp karışma sorununu algoritma yoluyla önlemiş oluyor. Prof. Dr. Moongu Jeon yeni modelle ilgili şu açıklamayı yaptı: “Her objeden bağımsız bir şekilde özellik çıkaran geleneksel metotlara kıyasla önerilen JI-Nets (ortak çıkarım) yöntemi kamu gözetim görevlerinde (yaya izleme vb) daha iyi ve doğru sonuçlar üretti.”

Ayrıca araştırmacılar derin öğrenmenin ana dezavantajlarından olan düşük hız sorununu indexing-based GPU parallelization (indexleme tabanlı GPU paralelleştirme)yöntemini işlem süresini azaltmak için kullanarak dengelemiş oldular. Kamu gözetim veri tabanları önerilen takip sisteminin teknoloji harikası bir doğruluk sunduğunu ve bu nedenle dağıtıma hazır olduğunu onayladı.

Çoklu obje takibi otonom sürüşten kamu gözetimine kadar suçla mücadeleye yardım veya kazaların sıklığını azaltma gibi çok sayıda uygulamanın kilidini açmış oldu. Dr. Jeon “Metotlarımızın diğer araştırmacıları nihayetinde kamu güvenliğini artırmak için yeni bir derin öğrenme yaklaşımı geliştirmeye yönelttiğine inanıyoruz.” diyerek sözlerini sonlandırdı.