Optik karakter tanıma, doğal dil işleme ve derin öğrenme yöntemleriyle bilgi çıkarılmasını sağlayan yapay zeka uygulaması SAFİR, evraktan elle veri giriş süresini yüzde 70 azaltıyor.
Finansal kuruluşlara faks, e-posta, tarayıcı gibi kanallar üzerinden her gün on binlerce müşteri işlem talimatı ulaşıyor. Bu talimatların operasyon ekipleri tarafından önce işlem tipleri belirlenip doğru ekibe yönlendirme, daha sonra gelen talimat görüntüsüne bakarak işlem bilgilerinin sisteme elle girişi yapılmakta ve son aşamadaysa başka bir çalışan tarafından girilmiş işlem kontrol edilip onaylanarak gerçekleştiriliyor. Talimat görüntülerine bakarak yapılan doküman sınıflandırma ve veri giriş işlemi, operasyon ekiplerinin çok fazla zamanını almakta ve insan doğası gereği hata riski taşımaktadır. Orta büyüklükteki bir bankada bu operasyonları yürüten ekibin çalışan sayısı ~200 civarıdır.
SAFİR, Elle Veri Girişini Ortadan Kaldırıyor
Yapı Kredi Teknoloji’nin geliştirdiği “akıllı içerik çıkarım aracı” SAFİR ise, elle veri girişinin ortadan kaldırılmasını sağlayarak operasyonel verimliliği artırıyor. SAFİR, müşterilerin faks, tarayıcı gibi farklı kanallar üzerinden gelen işlem talimatlarını sınıflandıran, bu talimatlardan optik karakter tanıma (OCR), doğal dil işleme (DDİ) ve derin öğrenme yöntemleriyle bilgi çıkarılmasını sağlayarak elle veri girişini ortadan kaldıran bir yapay zeka uygulamasıdır.
SAFİR uygulamasının talimatlar üzerinden nasıl çalıştığı aşağıda detaylı olarak açıklanmıştır.
Doküman sınıflandırma ve belgeden bilgi çıkarımı problemleri doğal dil işleme literatüründe oldukça önemli yeri olan problemlerdendir. Doküman sınıflandırma, belgelerin içeriğine bakarak ait oldukları sınıfları tahmin etmeyi sağlarken, belgeden bilgi çıkarımı ise belge içerisinde yer alan bazı kritik bilgileri ayrıştırmayı hedefler. SAFİR projesinde doküman sınıflandırma adımı, talimat tipini (EFT, havale, kart ödemesi, fatura ödemeleri vb.) tespit etme ve işlemi yapmakta uzmanlaşmış operasyon ekibinin havuzuna iletilmesi amacıyla kullanılır. Ayrıca, bir sonraki adım olan bilgi çıkarımı adımında da çıkarılacak bilgiler talimat tiplerine göre belirlenir. Hem doküman sınıflandırma hem de bilgi çıkarımı işlemlerinde derin öğrenme yöntemlerinden faydalanılmaktadır.
Engeller ve Çözümler
Ancak, bu yöntemlerin başarılı sonuçlar ortaya koyabilmesi için birtakım zorluklar da bulunuyor.
- Derin öğrenme yöntemleri yüksek miktarda eğitim verisine ihtiyaç duyar. Bu nedenle, özellikle bilgi çıkarımı için, piyasadaki ücretli ve ücretsiz etiketleme ürünleri incelenerek istenilen yetkinlikte bir ürün bulunamadığı için yeni baştan bir etiketleme aracı geliştirildi. Böylece etiketleyiciler daha verimli ve doğru şekilde etiketlemeler yapabilmeye başladı.
- Literatürdeki çalışmaların aksine SAFİR projesinde belgelerin metin bilgisi optik karakter tanıma adımıyla elde edildiği için kirli metin (noisy text) olarak ifade edilmekte ve dolayısıyla temiz metinler üzerinde eğitilmiş dil modelleri ile doküman sınıflandırma ve bilgi çıkarımı modelleri yeterli performansı gösterememektedir. Bu sebeple bankacılık dokümanlarından oluşan bir veri kümesi ile Türkçe kirli metin dil modelleri eğitilerek sistem başarımının artırılması sağlandı.
- Talimat belgelerinde bilgi çıkarımı adımı tek başına yeterli değil. Çıkarılan bilgilerin işlem formatına dönüştürülmeleri de gerekiyor. Bunun için bir ilişki çıkarımı (relation extraction) adımı tasarlanıp geliştirildi. Böylece, sistem girdisi olarak iletilen ıslak imzalı talimat görselinin işlenerek, banka uzman sistemine girilecek işlemler formatında çıktı üretmesi sağlanabilmiştir.
Örneğin, aşağıdaki para transferi talimatı bankaya ulaştığında operasyon ekibinin önüne düşmeden önce yukarıda bahsedilen aşamalardan geçirilir. Kullanıcı önüne düştüğünde ise kırmızı çerçeve ile işaretlenmiş bilgiler ekrandaki ilgili bölümlere doldurulmuş olarak sunulur. Böylece, operasyon yetkilisi yalnızca talimat görseli ile ekrandaki bilgilerin uyumluluğunu kontrol ederek işlemi onaycıya iletir.
Serbest Metinden de Bilgi Çıkarımı Yapabiliyor
SAFİR ürününün en önemli özelliklerinden bir tanesi yalnızca formlar halindeki belgelerden değil, yukarıdaki gibi serbest metinli (dilekçe formatındaki) belgelerden de bilgi çıkarımı yapabiliyor. Bu yeteneğin kazandırılması için binlerce sayfadan oluşan bir veri kümesi etiketlenmiş ve yapay zeka bu veri kümesi ile eğitilmiştir.
Bir diğer ayırt edici özellik işe bilgi çıkarımı aşamasının sonunda elde edilen bilgilerin işlem formatına getirilmesidir. Bu özellik, talimat belgelerindeki yapı temel alınarak SAFİR ürünü için özel olarak tasarlanmıştır ve ticari veya açık kaynak kodlu herhangi bir üründe muadili bulunmamaktadır. Yine örnek üzerinden incelemek gerekirse, yukarıdaki talimat için aşağıdaki gibi bir işlem yapısı çıkarılmaktadır.
Bu özelliğin en önemli faydası, gönderici ve alıcı bilgilerinin net bir şekilde ayrıştırılabilmelerini sağlamasıdır. Böylece, hem gönderici hem de alıcı bilgilerinde yer alan banka ve şube adları doğru şekilde adreslenerek işlemin sorunsuz bir şekilde tamamlanması mümkün olmuştur. Bu özellik bir talimat sayfası içerisinde birden fazla işlem olduğu durumlarda daha fazla önem arz etmektedir. Kullanıcı eğilimi genellikle gönderici bilgilerinin 1 defa, alıcı bilgilerinin ise işlem sayısı kadar tekrarlandığını göstermektedir. Dolayısıyla belge içerisinde bir defa yer alan gönderici bilgilerinin her işlem ile ilişkilendirilmeleri gerekmektedir. Bu yeteneğin kazandırılması için bilgi çıkarımında olduğu gibi binlerce doküman tasarlanan formatta yine proje bünyesinde geliştirilen etiketleme aracı ile etiketlenmiş ve yapay zekanın bu veri ile eğitilmesi gerekmiştir.
İşlem Süresi Yüzde 70 Kısaldı; Yüzde 59 Onaylama Eforuyla Tamamlandı
Türkiye’de bu hizmeti sunan ilk ve öncü ürün niteliğini taşıyan uygulama, ilk kez Yapı Kredi bankası tarafından kullanıldı. SAFİR sayesinde elle veri girişleri azaltılarak işlem sürelerinde ortalama yüzde 70 oranında kısalma sağlandı. Ayrıca belgelerin yüzde 59’unda sadece onaylama eforuyla işlem tamamlanabilmiştir.
Bugün SAFİR’in sadece bankacılık belgelerinde değil farklı sektörlerde kullanılan serbest formatlı dijital dokümanlar üzerinde de kullanım imkânı mevcuttur. Akıllı içerik çıkarım aracı olarak finanstan turizme kadar farklı sektörlerde ürünün satışı söz konusudur.
Not: Bu içerik Yapı Kredi Teknoloji tarafından Türkiye Yapay Zeka İnisiyatifi için yazılmıştır.